EvoRAG：知识图谱也学会了进化~

张

张建站

2026/4/28 22:51:53

10分钟阅读

如果你用过 RAG 系统大概率遇到过这种情况明明知识库里明明有正确答案系统就是答不对。问题不在模型不够大也不在数据不够多——而是知识图谱里堆满了正确的废话。一篇来自东北大学的论文EvoRAG发现在 KG-RAG 的所有错误回答中不相关事实、推理路径过长和过时信息这三类问题加在一起占了总错误的一半以上。换句话说知识图谱不是没有知识而是有用的知识被淹没了。知识图谱 RAG 的三大致命伤先说清楚 KG-RAG 是什么。简单讲就是把外部文本构建成结构化的知识图谱实体-关系-实体的三元组网络然后当用户提问时从图谱里找出一条条推理路径喂给大模型帮它答得更好。听起来很美但现实很骨感。作者分析了现有最优方法 KRAG 在两个数据集上的错误归纳出三类主要问题不相关事实17.9%你问Bob 在哪里上班它把Bob 住在 Niva也检索出来了。语义相关但跟答案无关。推理路径太长20.7%正确答案需要 3 跳推理但检索策略只配了 2 跳关键路径直接丢失。过时信息11.9%知识图谱里还存着Bob 在 Zelo 上班但这公司 2020 年就倒闭了。这三类问题加起来超过 50%而且有一个共同特征它们都是知识图谱本身的问题不是模型的问题。你换 GPT-4、换 Qwen、加更多数据该错还是错。EvoRAG 的核心思路把反传搬进知识图谱EvoRAG 做了一件很巧妙的事借鉴了深度学习中反向传播的思想把用户反馈一层层传回知识图谱里的每一个三元组。整个过程分三步第一步收集反馈。用户提问后系统用 LLM 对生成的回答打分1-5 分或者用人工评分、与标准答案对比。这个分数就是反馈信号。第二步路径评分。反馈是给整个回答的但回答可能用了很多条推理路径。EvoRAG 用 LLM 从三个维度评估每条路径的贡献这条路径是支持了回答还是误导了回答Supportiveness、它对回答的贡献有多大Fidelity、它跟回答有没有矛盾Conflict。第三步梯度反传。这是最关键的一步。每条路径的效用分被反向传播到路径里的每一个三元组上更新它的贡献分数。经常出现在好答案路径里的三元组分数越传越高经常出现在坏答案路径里的分数越压越低。这个过程跟神经网络的梯度下降非常像——只不过优化的不是模型参数而是知识图谱里每个三元组的可信度权重。知识图谱怎么进化有了每个三元组的贡献分数EvoRAG 做了两件事来改造知识图谱关系融合如果一条多跳路径上的三元组贡献分都很高超过均值标准差就在起点和终点之间直接加一条捷径边下次检索就不用绕远路了。这解决了推理路径过长的问题。关系抑制贡献分持续偏低的三元组检索时会被降权。不是直接删除——如果其他查询需要它它还有机会翻身。这解决了不相关事实和过时信息的干扰。经过这样一轮一轮的迭代知识图谱就变成了一个越用越准的活系统。实验结果稳定且全面的提升作者在三个数据集RGB、MultiHop、HotpotQA上做了对比实验基线包括微软 GraphRAG、LightRAG 和当前最优的 KRAG以及各种知识图谱精炼方法。准确率提升EvoRAG 平均比现有 KG-RAG 框架准确率高 **7.34%**比加了精炼方法的版本高 **13.80%**。准确率ACC、精确匹配EM和 F1 分数在三个数据集上全面领先。而且好消息是大约 6 轮迭代后性能就稳定了。在 RGB 数据集上83% 的问题三元组被成功清理。不仅更准还更快因为低质量三元组被过滤掉了喂给大模型的 prompt 变短了。EvoRAG 的 prompt 长度平均只有其他方法的1/4.6这意味着推理更快、成本更低。一个真实案例以 HotpotQA 数据集里的一个问题为例在原始检索中一条包含事实错误的路径因为语义相似度高排名靠前导致正确路径被压制。经过 8 轮反馈迭代后EvoRAG 逐步压低了错误三元组的贡献分同时抬高了正确路径的权重最终系统给出了正确答案。## 学AI大模型的正确顺序千万不要搞错了2026年AI风口已来各行各业的AI渗透肉眼可见超多公司要么转型做AI相关产品要么高薪挖AI技术人才机遇直接摆在眼前有往AI方向发展或者本身有后端编程基础的朋友直接冲AI大模型应用开发转岗超合适就算暂时不打算转岗了解大模型、RAG、Prompt、Agent这些热门概念能上手做简单项目也绝对是求职加分王给大家整理了超全最新的AI大模型应用开发学习清单和资料手把手帮你快速入门学习路线:✅大模型基础认知—大模型核心原理、发展历程、主流模型GPT、文心一言等特点解析✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑✅开发基础能力—Python进阶、API接口调用、大模型开发框架LangChain等实操✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经以上6大模块看似清晰好上手实则每个部分都有扎实的核心内容需要吃透我把大模型的学习全流程已经整理好了抓住AI时代风口轻松解锁职业新可能希望大家都能把握机遇实现薪资/职业跃迁这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

如何使用Layerdivider将单张图片转换为分层PSD文件：3步快速上手指南

如何使用Layerdivider将单张图片转换为分层PSD文件：3步快速上手指南【免费下载链接】layerdivider A tool to divide a single illustration into a layered structure. 项目地址: https://gitcode.com/gh_mirrors/la/layerdivider 你是否曾面对一张复杂的插…...

2026/4/28 22:51:22 阅读更多 →

避坑指南：解决VS2022连接SQL Server最常见的‘登录失败’与连接字符串问题

避坑指南：解决VS2022连接SQL Server最常见的‘登录失败’与连接字符串问题在开发基于SQL Server的应用程序时，连接数据库是最基础也是最重要的一环。然而，即使是经验丰富的开发者，也常常会在VS2022与SQL Server的连接配置上遇到各…...

2026/4/28 22:47:25 阅读更多 →

具身智能行业应用-生活服务业

具身智能将在生活服务场景中发挥巨大的作用。在家庭中化身全能管家，自主完成洗衣做饭、清洁照护，实时守护老人儿童安全；在餐饮零售场景变身为智能店员，提供从食材加工、个性化推荐到货架管理的全链条服务；在教育陪伴领…...

2026/4/28 22:38:51 阅读更多 →

Arm Cortex-A520AE核心架构与优化实战解析

1. Arm Cortex-A520AE核心架构深度解析在汽车电子和工业控制领域，处理器的高效性与可靠性同样重要。Cortex-A520AE作为Armv9.2-A架构下的安全增强型核心，采用独特的双发射流水线设计，在保持低功耗的同时实现了可预测的实时性能。我曾参与过基…...

2026/4/28 1:18:38 阅读更多 →

015、使用AutoGen框架搭建多Agent对话系统

015、使用AutoGen框架搭建多Agent对话系统告别单打独斗，让多个智能体通过协作与对话，共同解决复杂任务。前言在上一篇《多Agent系统入门：协作与竞争的基础模型》中，我们探讨了多智能体系统的核心概念、基础架构以及简单的协作模式。你可能已经意识到，手动协调多个Agen…...

2026/4/28 3:08:33 阅读更多 →

大模型量化实战评测：GPTQ、GGUF、AWQ 在显存、速度与精度上的真实表现

1. 大模型量化技术入门：为什么我们需要量化？ 如果你尝试在消费级显卡上运行大语言模型，大概率会遇到显存不足的报错。比如用16GB显存的RTX 4080直接加载Qwen1.5-7B模型时，系统会无情地提示"CUDA out of memory"。这就是…...

2026/4/27 23:58:30 阅读更多 →

Display Driver Uninstaller终极指南：彻底清理显卡驱动的专业工具

Display Driver Uninstaller终极指南：彻底清理显卡驱动的专业工具【免费下载链接】display-drivers-uninstaller Display Driver Uninstaller (DDU) a driver removal utility / cleaner utility 项目地址: https://gitcode.com/gh_mirrors/di/display-drivers-u…...

2026/4/26 0:08:05 阅读更多 →