96SEO 2026-02-23 14:13 16
可以指代使用计算机模型或算法生成虚假的感知或幻觉。

这是指通过对输入数据进行处理和转换模型可以生成看起来像是真实幻觉的信息。
大语言模型如GPT-3是基于机器学习技术的通过从大量文本数据中学习语言模式和上下文来生成文本回复。
尽管它可以生成合理的、连贯的回答但它并不具备真实的感知能力也不会产生真实的幻觉。
本文讨论了如何用知识图谱提示LLM作为一种补救措施让LLM掌握最新知识并结合内隐知识和检索的外部知识进行推理。
此外还研究了从LLM中引出推理路径。
具体来说建立了一个提示管道使LLM能够理解KG的输入并结合内隐知识和检索的外部知识进行推理。
此外还研究了引出mind
map展示了基于知识本体论的LLM推理路径从而为LLM推理在生成中的预测和衡量带来了前景。
map提示带来了惊人的经验收益。
还证明了通过从KG中检索结构化事实Mind
Map可以优于一系列文档检索方法的提示受益于KG更准确、简洁和全面的知识。
将LLM扩展到十亿个参数和万亿个单词在各种任务中都能获得令人惊讶的表现。
预训练的LLM可以通过微调适应领域任务或者在结构调整中与人类偏好保持一致。
尽管如此LLM存在以下缺陷
预训练的LLM知识过时对参数的更新不灵活。
因为收集高质量的指令数据和构建训练管道成本可能高昂或者持续微调LLM会带来灾难性遗忘的风险微调LLM可能很棘手。
LLM因其黑盒性质缺乏透明度收到批评。
知识隐含地存储在LLM的参数中因此不可能进行验证。
此外深度神经网络中的参考过程难以捉摸无法解释。
知识图谱是构建大规模结构知识库的经典方法由三个实体和关系构成{headrelationtail}。
KG可以提供明确的知识表示和可解释的推理路径。
此外KG还可以不断修改以调整现有知识或添加新知识。
由于其灵活性、精确性和可解释性KG成为LLM缺点的一种很好的补充。
例如将KG三元组添加到LLM的训练中或者将KG编码器与LLM层缠绕在一起以对图形和文本数据进行联合推理和优化。
相比之下本文工作集中在KG和固定LLM的推理上这使用与强大的预训练LLM。
一般来说这个领域的现有技术可以分为以下两种类型
研究人员试图检索文档以增强LLM推断同时又面临检索不准确和文档冗长的问题。
最近有几次尝试将提取的KG三元组合并到LLM的提示中以回答与KG相关的问题。
然而这种方法将KG输入视为纯文本并忽略其图形结构这导致生成的响应很难验证并且容易产生幻觉。
也有人试图促使LLM理解图形输入而他们主要试验图形挖掘任务例如边缘检测和图形摘要。
在需要基于KGs的多个证据图进行复杂推理的文本生成任务中很少对其进行探索。
这项工作的目标是建立一种即插即用的提示方法以引出LLM中的思维图推理能力。
我们称我们的方法为Mind
框架的概念演示如图2所示。
具体来说MinaMap激发了LLM的思维图1整合从KGs中检索到的事实和LLM中的隐含知识
在三个数据集上进行了实验以表明MindMap在很大程度上优于其他一系列尝试方法。
这项工作主要研究LLM如何学会与KG进行协同推理将内隐和外显知识相结合形成透明可靠的干预。
“预训练、提示、预测”范式已经成为少量或零样本方式进行自然语言处理的最佳方式。
核心是LLM能够通过上下文内学习适应输入上下文和指令后的新任务尤其是指令调整和对齐检索增强生成是为LLM推理提供额外证据的一种动态方式。
通常做法是查询密集数据库找到输入用户问题的相关文档然后将检索到的语料库放回提示输入。
然而文档可能很长因此不符合LLM的上下文限制。
而且及时可以构建长文档做为提示LLM通常无法在提示中间捕获信息并会产生幻觉。
另一条研究路线旨在提示引发LLM在链和树中间的推理步骤尽管如此本文的工作还是探索了在图输入上激发LLM的推理重点是与内隐和外显知识的联合推理。
对于1通过将KG实体和关系放入训练数据中来设计知识感知训练对象是一种常见的做法或应用KG检测任务例如链接预测作为附加监督。
然而当阿静预先收集的数据扩展到具有三个单词的网络规模语料库时难以找到或创建具有近似规模的KG。
跟重要的是尽管这些方法通过监督将KG知识直接压缩到LLM的参数中。
它们并没有减轻LM在可修复性、可靠性和透明度方面的基本限制。
对于2早期的工作集中再通过注意力将KG三元组融合到LLM的输入中或将图编码器链接到LLM编码器已处理KG输入。
后续研究进一步采用了与LLM并行的图神经网络进行联合推理并在LLM的中间层添加了文本标记和KG实体之间的交互。
看到最近预训练LLM的成功研究范式正在转向用图形输入来提示固定的预训练LLM。
这一行的重新搜索包括提示KG实体链接前缀的LLM、图形挖掘和KG问答。
虽然这些方法允许LLM理解图形属兔但它们要么专门针对KG任务要么回忆检索到的事实并将其翻译为纯文本而忽略了KG的结构。
Gq证据图聚合接下来LLM被提示理解并聚合检索到的证据子图以构建推理图
map上的LLM推理最后提示LLM整合所构建的推理图及其隐含知识来生成答案并构建解释推理过程的mind
实体识别首先通过上下文学习提示LLM从问题查询Q中提取关键实体。
构建了一组样例{
Mk组成。
将样本作为内容预先发送到候选查询Q并要求LLM生成实体集M。
由于提取的实体M可能不都属于G中的实体集所以需要进一步执行实体链接。
具体来说用BERT编码器将G中和M内的所有实体分别编码为密集嵌入
HM。
将M中的每个实体与G中与其最近的相邻实体通过比较它们的余弦相似性联系起来
通过定义资源知识图谱其中代表了实体集、关系集和文本集。
本阶段的目标是基于抽取的实体
通过基于路径和基于邻居的探索来探索源KG以构建证据子图的过程如图4所示。
b检查Vcand是否为空。
如果它不为空则迭代a以查找路径的下一段。
如果它为空则连接所有段以构建一组子图并将它们放入
基于邻居的证据图探索目的是将更多与查询相关的证据纳入Gq。
分为两步
a通过1跳到它们的邻居节点{v’}来扩展每个节点v∈Vq以将三元组{
b检查每个v’是否在语义上与该问题相关。
如果相关进一步扩展v’的一跳邻居在Gneiq中添加三元组
pathway中所有新添加的中间节点更新Vq。
经过探索对Gpathq和Gneiq进行了调整以减少头上的信息同时保持多样性
a按照它们的头实体对所有子图进行聚类在探索之前从原始查询中提取并填充Vq
在这一步骤中提示LLM来将不同的证据子图Gq聚合到合并的推理图Gm中以便为步骤3中的输出生成带来所有证据子图的全局视图。
添加了结构来提示LLM用自然语言描述每个证据子图G*q的结构指令。
生成证据路径集Gq{cq(1),cq(2),…,cq(n)}其中每个c*q表示一个结构路径例如“疲劳恶心-
-肝脏问题”。
分别对所有基于路径的子图Gpathq和所有基于邻居的子图Gneiq进行提示生成推理图Gm{GpathmGneim}。
这种设计提示有两个优点
在这一步骤中LLM会被合并的两个证据图GpathmGneim提示以产生最终输出。
map并找到最终结果本文提供了一个由五个组件组成的prompt系统指令、问题、证据图Gm、Graph-of-Thought指令和模板。
具体来说Graph-of-thought指令要求LLM在a理解输入的证据图b建立自己的推理mind
map以及C用证据图建立的基础时一步一步地思考以产生最终结果。
附录D的表8中提供了使用的提示模板。
最后的计划是在思维导图上提供详细的图形推理路径其中图形中的每个实体都以输入证据图Gm为基础如图3中的右框所示。
先前的检索增强了LLM倾向于重新表述检索到的事实而忽略了LLM本身的知识。
然而Mind
Map鼓励LLM在自己的知识范围内丰富检索到的证据图从而实现协同推理。
据推测LLM是通过1语言理解实现的因为LLM可以理解并从自然语言描述的Gm中提取知识边缘2知识推理因为LLM在产生基于Gm构建的Mind
Map的最终答案时利用了其隐含的边缘知识。
如图2所示LLM可以识别连接现有节点和文本图信息的新链接从而启用graph-of-thought并产生新的见解。
针对一系列需要复杂推理和领域知识的问题答案任务并将其与基于检索的基线进行比较。
选择普通的GPT-3.5和GPT-4作为仅使用隐含知识进行推断的基线。
然后添加了三个检索增强基线BM25检索器、Text
使用GenMedGPT-5k测试LLM如何处理医学领域的问题回答LLM需要回答疾病诊断、药物推荐和测试建议。
使用BERTScore和GPT-4评分来定量评估所有方法的性能。
BERTScore可以测量生成的答案与参考答案之间的语义相似性。
2在四个轴上对两种选择方法的答案进行配对比较反应多样性和完整性、总体情况的正确性、疾病诊断的正确性以及用药建议的正确性。
Map显示出比其他方法的边缘改进这意味着所有方法都产生了与真实答案相似的答案。
这可能是由于所有反应的语气相似与临床医生常用的语言相似但BERTSCore只测量整体语义的相似性。
然而我们发现当按GPT-4排名时Mind
Map比其他方法有明显的进步平均排名为1.8725。
相比之下vanilla
baseline香草基线GPT-3.5和GPT-4的答案最差分别排名4.85和4.17。
主要原因是回答医学问题需要对领域知识进行全面的探索和理解而在GPT模型的实例知识中进行推理可能会导致看似合理但错误的答案。
相比之下本文方法对外部KG进行了彻底的探索并提供了基于证据的答案。
从更精细的方面深入探讨这些方法的配对比较。
结果如表3所示。
可以观察到与其他基线相比Mind
Map在四个方面的平均得分分别为88.21%和82.97%。
这进一步强调了引入外部知识以减轻LLM幻觉的重要性。
此外还发现Mind
基线从与MindMap相同的KG中检索事实是不值得的。
尽管如此Mind
Map的优势在于KG知识和简化LLM知识的协同推理以及对KG来源的全面探索从而产生准确多样的答案。
然而其他检索器基线存在检索不准确、知识库探索不足或输入过长的问题。
在CMCQA数据集上进行了实验其中长对话需要更复杂的推理来涵盖答案所需的所有事实。
ChatGPT-4的排名结果如表4所示。
其中MindMap的排名仍然优于大多数基线但是与KG检索器相似。
表5进一步说明了成对获胜率结果其中MindMap在GPT-4判断中始终优于基线。
具体来说与公认的GenMedGPT-5K相比MindMap方法与基线之间差距缩小了。
这是因为所使用的KG没有涵盖回答CMCQA中问题所需的所有事实。
尽管如此MindMap仍然优于所有基于检索的数据库包括KG检索器。
据推测以前的基于检索的方法倾向于只根据检索到的外部知识进行推断来回答问题然而这种简单的提示策略破坏了LLM利用其隐含知识理解复杂逻辑和复杂对话的能力。
相反MindMap在图推理过程中结合了外部知识和内部知识从而从两者中获得更准确的答案。
研究了MindMap在仅从部分涵盖explainCPE中回答问题所需知识的KG检索时的性能。
至关重要的是LLM需要通过结合其隐含知识和检索知识来得出答案这在生产中很常见。
根据生成的选择的准确性和生成的解释的质量来评估所有方法。
为了评估解释质量还使用了BERTScore和GPT-4排名。
具体来说我们要求GPT-4评分器优先考虑解释的正确性而不是帮助性或完整性。
表6中显示了所有方法的准确性。
发现MindMap比大多数基线都获得了更好的准确性这进一步验证了MindMap相对于文档检索提示方法的优越性。
还发现简单地将检索到的知识放入程序有时会破坏答案的质量。
因为KG检索器和BM25检索器的性能都比普通GPT-3.5模型差。
通过检查错误的答案发现检索到的事实只能部分回答问题因为使用的外部知识库和问题之间不匹配。
这一发现将LLM的显式和隐式知识相结合以实现具有鲁棒性的推理。
还发现GP1-4比GPT-3.5MindMap更好。
据推测从国家执业药剂师考试中提取的试题在GPT-4的预训练语料库中并存储在GPT-4的内部记忆中。
对指令提示的设计进行了消融分析。
删除明确指示LLM“与您现有的知识相结合”的提示P1可将模型的性能提高8.2%。
此外表7表明MindMap在生成答案的理由方面表现出色在GPT-4中排名2.98。
MindMap进一步对案例进行了深入分析重点讨论了以下几个方面。
附录E中图5中的解释充分问题包含多个症状事实其中一些具有误导性。
在这个方案中某些事实例如“我眼睛里的黄疸”在检索相关证据时提供了不正确的信息。
例如文档检索器等基线模型在搜索证据时检索到与“眼睛”相关的知识导致无法获得正确的疾病。
推荐的药物和测试也与肝脏疾病无关。
相比之下我们的模型MindMap准确地将这种疾病识别为“肝硬化”并建议进行适当的测试即“血液测试”证明了其健壮性。
类似“阴道炎”和“萎缩性阴道炎”在不同的证据子图中出现但它们在本质上是相同的。
MindMap使LLM能够消除歧义并合并相同的证据图进行推理。
h-nal思维导图输出还将实体定位到输入证据图。
此外图6显示了GPT-4评分者对所有方法的总体事实正确性和疾病诊断事实正确性的偏好。
对于所有事实正确性来说GPT-4评分器指出MindMap提供了更具体的疾病诊断结果而基线只给出了模糊的提及缺乏治疗选择。
为了疾病诊断的事实正确性GPT-4评分器认为MindMap的诊断更符合常规。
图7展示了一个对CMCQA的完整的答案。
输出由三个部分组成摘要、推理过程和MindMap。
摘要从MindMap中提取了正确和具体的结果推理过程显示了从证据图Gm上提取的实体开始的多个推理链。
MindMap将所有的推理链同一到推理图中。
它提供了对每个推理步骤中涉及的知识连接以及证据查询子图的原始来源的直观理解。
问题a和d是与药品有关的问题需要深入的知识。
在这些任务中MindMap比其他方法显示出明显的优势。
问题b和f是疾病知识的问题。
在这些案例下这种检索方法获得了与MindMap相当的结果表明了外部知识的结合缓解了LLM的幻觉。
最重要的观察来自问题c该问题设计一般知识。
这种情况下想GPT-3.5这样的LLM模型表现更好而检索方法表现较差。
这表明检索方法在一定程度上忽略了LLM所学到的知识。
相反MindMap在处理一般知识问题方面的表现与GPT-3.5相当。
这表明MindMap有效的将LLM本身的知识与KG知识协同用于推理目的。
3研究了启发MindMapLLM执行推理并生成具有图中表示的原理来生成答案。
通过在三个QA数据集上进行广泛的实验展示了MindMap方法与普通LLM和检索增强生成方法相比有更为显著的时机效果。
作为专业的SEO优化服务提供商,我们致力于通过科学、系统的搜索引擎优化策略,帮助企业在百度、Google等搜索引擎中获得更高的排名和流量。我们的服务涵盖网站结构优化、内容优化、技术SEO和链接建设等多个维度。
| 服务项目 | 基础套餐 | 标准套餐 | 高级定制 |
|---|---|---|---|
| 关键词优化数量 | 10-20个核心词 | 30-50个核心词+长尾词 | 80-150个全方位覆盖 |
| 内容优化 | 基础页面优化 | 全站内容优化+每月5篇原创 | 个性化内容策略+每月15篇原创 |
| 技术SEO | 基本技术检查 | 全面技术优化+移动适配 | 深度技术重构+性能优化 |
| 外链建设 | 每月5-10条 | 每月20-30条高质量外链 | 每月50+条多渠道外链 |
| 数据报告 | 月度基础报告 | 双周详细报告+分析 | 每周深度报告+策略调整 |
| 效果保障 | 3-6个月见效 | 2-4个月见效 | 1-3个月快速见效 |
我们的SEO优化服务遵循科学严谨的流程,确保每一步都基于数据分析和行业最佳实践:
全面检测网站技术问题、内容质量、竞争对手情况,制定个性化优化方案。
基于用户搜索意图和商业目标,制定全面的关键词矩阵和布局策略。
解决网站技术问题,优化网站结构,提升页面速度和移动端体验。
创作高质量原创内容,优化现有页面,建立内容更新机制。
获取高质量外部链接,建立品牌在线影响力,提升网站权威度。
持续监控排名、流量和转化数据,根据效果调整优化策略。
基于我们服务的客户数据统计,平均优化效果如下:
我们坚信,真正的SEO优化不仅仅是追求排名,而是通过提供优质内容、优化用户体验、建立网站权威,最终实现可持续的业务增长。我们的目标是与客户建立长期合作关系,共同成长。
Demand feedback