KAG开源了，知识增强掀翻RAG，性能翻倍

科技 2024-10-31 09:15 北京

KAG（Knowledge Augmented Generation）框架早在9月份就已经发布，近期终于开源了，它的核心在于提出了：

一种LLM友好的知识表示方法
知识图谱与原始文本块之间的相互索引
逻辑形式引导的混合推理引擎
以及基于语义推理的知识对齐

归功于在构建更有效的索引、知识对齐和混合解决库方面的创新，KAG框架在多跳问答任务中相比于现有的RAG方法有显著的性能提升，2wiki、MuSiQue数据集上的EM指标直接翻倍。此外，KAG框架在蚂蚁集团的电子政务问答和电子健康问答场景中也表现出了更高的准确性。

KAG构建器流水线的示例

LLM友好的知识表示方法

KAG框架提出了一个针对大型语言模型（LLMs）友好的知识表示框架，称为LLMFriSPG。这个框架的目的是为了让知识图谱（KG）更好地支持LLMs的应用，并提高两者之间的协同效果。

LLMFriSPG：一个对大型语言模型（LLMs）友好的知识表示框架。通过概念将实例和概念分开，以实现与LLMs更有效的对齐。在本研究中，除非另有说明，实体实例和事件实例统称为实例。SPG属性被划分为知识和信息领域，也称为静态和动态领域，它们分别与具有强模式约束的决策专长和具有开放信息表示的文档检索索引知识兼容。红色虚线代表从信息到知识的融合和挖掘过程。增强的文档块表示为LLMs提供了可追溯和可解释的文本上下文。

数据结构定义：LLMFriSPG定义了一个数据结构M，包括实体类型（T）、概念类型（C）、归纳关系（ρ）和可执行规则（L）。实体类型包括预定义的属性，这些属性与LPG语法声明兼容。概念类型包括概念类、概念及其关系，每个概念树的根节点是一个与LPG语法兼容的概念类型类。
实例和概念的分离：LLMFriSPG将实例和概念分离，以实现与LLMs的有效对齐。实体实例和事件实例统称为实例。每个实例可以与一个或多个概念类型相关联，以表达其语义类型。
属性和关系：对于每种类型，属性和关系包括领域专家预定义的部分、临时添加的内容以及系统内置的属性，如支持块（supporting_chunks）、描述（description）、摘要（summary）和归属（belongTo）。
层次化的知识表示：LLMFriSPG支持从数据到信息再到知识的层次化表示。知识层（KGcs）遵循SPG语义规范，支持在严格的模式约束下构建知识体系和定义逻辑规则。信息层（KGfr）通过信息抽取得到实体和关系等图数据。原始块层（RC）则是经过语义分割处理后的原始文档片段。

知识和信息的层次表示

相互索引机制

KAG框架介绍了一种相互索引机制，旨在构建知识结构和文本块之间的索引，以增强知识表示和检索的效率：

语义分块（Semantic Chunking）：基于文档的结构层次和段落间的逻辑联系，实现语义分块，生成符合长度限制且语义连贯的文本块。
信息提取与描述性上下文：使用大型语言模型（LLMs）提取实体、事件、概念和关系，并构建KGfr与RC之间的互索引结构，实现跨文档链接。
领域知识注入和约束：通过迭代提取方法，将领域概念和术语及其描述存储在KG存储中，并通过openIE提取文档中的所有实例，执行向量检索以获得与领域知识对齐的集合。
预定义知识结构：对于具有标准化结构的专业文档，如药品说明书和政务文件，可以预定义实体类型和属性，以便于信息提取和知识管理。
文本块向量与知识结构的互索引：KAG的互索引机制遵循LLMFriSPG的语义表示，包括共享模式、实例图、文本块和概念图等核心数据结构，以及KG存储和向量存储两种存储结构。

领域非结构化文档的KAG构建器的流程。从左到右，首先，通过信息提取获得短语和三元组，然后通过语义对齐完成消歧和融合，最后，构建的知识图谱被写入存储。

逻辑形式引导的混合推理引擎

KAG框架介绍了一个基于逻辑形式的混合推理和求解引擎，它能够将自然语言问题转化为结合语言和符号的解题过程。

逻辑形式执行的示例。在这张图中，左侧显示了知识图谱（KG）构建过程，而右侧是整体的推理和迭代过程。首先，基于用户的总体问题执行逻辑形式分解，然后使用逻辑形式引导的推理进行检索和推理。最后，生成器判断用户的问题是否得到满足。如果没有，就提供一个新的问题，进入新的逻辑形式分解和推理过程。如果确定问题得到满足，生成器直接输出答案。

逻辑形式规划：通过逻辑函数来定义执行动作，将复杂问题分解为可以推理的子问题。这些逻辑函数包括检索（Retrieval）、排序（Sort）、数学计算（Math）和推理（Deduce）等。
逻辑形式推理：使用逻辑形式来表达问题，以便能够清晰地描述语义关系。这种方法可以处理涉及逻辑推理过程的问题，如“与”、“或”、“非”以及交集和差集等。
逻辑形式检索：在传统的RAG中，检索是通过计算问题与文档片段嵌入之间的相似度来实现的。KAG框架提出了一种结合稀疏编码器和密集检索器的方法，以提高检索的准确性。

知识对齐策略

详细介绍了KAG框架中的知识对齐（Knowledge Alignment）策略，旨在解决基于信息抽取构建知识图谱（KG）时在知识对齐方面遇到的挑战：

知识对齐的必要性：传统的基于向量相似度的信息检索方法在知识对齐上存在缺陷，如语义关系的错位、知识粒度不一致、与领域知识结构不匹配等问题。这些问题导致检索结果不精确，无法满足特定领域的专业性需求。
概念图的利用：为了增强离线索引和在线检索的语义推理能力，KAG框架利用概念图来提升知识对齐。通过概念图，可以增强知识实例的标准化、概念与实例之间的链接、概念间关系的完整性，以及领域知识的注入。
语义关系的分类：文中总结了六种常用于检索和推理的语义关系，包括同义词（synonym）、属于（isA）、是部分（isPartOf）、包含（contains）、属于（belongTo）和导致（causes）等。
增强索引（Enhance Indexing）：通过使用大型语言模型（LLMs）预测索引项之间的语义关系或相关知识元素，包括知识实例的消歧和融合、实例与概念之间的关系预测、概念及其关系的完整性补充。
增强检索（Enhance Retrieval）：在检索阶段，利用语义关系推理来搜索KG索引，结合语义关系推理和相似度检索，以提高检索的专业性和逻辑性，从而获得正确的答案。

KAG框架核心模型

详细介绍了KAG框架中的核心模型，这个模型旨在通过优化大型语言模型（LLMs）的三个关键能力——自然语言理解（NLU）、自然语言推理（NLI）和自然语言生成（NLG），来提升知识增强生成的性能：

自然语言理解（NLU）：NLU包括任务如文本分类、命名实体识别、关系提取等。为了提升NLU能力，KAG通过大规模指令重构，创建了一个包含超过20,000个多样化指令的NLU指令数据集，用于监督式微调，从而增强模型在下游任务中的表现。

自然语言推理（NLI）：NLI任务用于推断给定短语之间的语义关系，包括实体链接、实体消歧、分类扩展等。KAG通过收集高质量的概念知识库和本体论，构建了一个包含8,000个概念及其语义关系的概念知识集，用于提升模型的语义推理能力。

自然语言生成（NLG）：为了使模型生成的文本更好地符合特定领域的逻辑和风格，KAG提出了两种有效的微调方法：K-LoRA和AKGF。K-LoRA通过预训练和基于LoRA的微调，使模型能够识别知识图谱中信息的格式，并习得领域特定的语言风格。AKGF则利用知识图谱作为自动评估器，提供对当前响应知识正确性的反馈，引导模型进一步优化。
单次推理（Onepass Inference）：为了减少系统复杂性、建设成本以及模块间错误传播导致的级联损失，KAG引入了一种高效的单次推理模型（OneGen），使任意LLM能够在单次前向传递中同时进行生成和检索。

备注：进群，进入大模型技术群

id：duibai997，记得备注呦

你好，我是对白，硕士毕业于清华，大厂算法工程师，拿过8家大厂算法岗SSP offer

创业做过无人机、机器人和互联网+教育，保研清华后开始系统接触AI。

我每周至少更新一篇原创，分享AI算法、技术干货和职场感悟。下方关注可加我私信交流，点击蓝字查看我的算法学习之路。

期待你关注我的公众号，一起交流与进步。

您的“点赞/在看/分享”是我坚持最大动力

坚持不易，卖萌打滚求鼓励 (ฅ>ω<*ฅ)

在看

对白的算法屋

清华大学硕士，大厂算法工程师。写过书，创过业，做过产品，分享技术、快乐、财富与职场。

最新文章

腾讯开源宇宙最强MoE大模型Hunyuan

LLaMA系列一直在假装开源...

姜萍造假实锤！阿里数赛出结果。。。

KAG开源了，知识增强掀翻RAG，性能翻倍

复现 OpenAI o1 的一小步：Steiner 开源模型解析

字节大模型搞推荐，有业务收益了

OpenAI-O1之下，我们技术该何去何从

VB-LoRA高效登顶！仅需0.4%参数量，极限超越LoRA！

万字长文梳理LLM+RLHF的脉络

Google DeepMind最新研究成果来了！模拟人类的思考

大模型算法岗，Kaggle金牌和CCF A一作哪个更有用？

OpenAI终于open了，开源多智能体框架Swarm~

谷歌科学家万字长文：《改变你职业生涯的一篇文章，我如何运用人工智能完成工作》

字节用大模型做推荐了！！

微调大模型前，重写SFT数据？

国产AI大模型登顶全球TOP 1！

现代LLM基本技术整理

红杉专访OpenAI O1团队全文记录

多模态大模型技术点总结

清华微软最新力作：用物理学革新Transformer注意力，精度暴涨30%！

诺尔贝物理学奖，为何授予Hinton？

和Boson李沐等大佬们进行了一场对话！

算法工程师修炼之路

30 天 52% 回报：GPT-4o 量化交易机器人

顶会卷到中学了！人大附中高中生入选NeurIPS

成人站 OnlyFans，42 名员工，创造 66 亿美元营收，超过所有 AI 公司

上交所P0故障

好好聊一聊做Pretrain的经验

山寨版 OpenAI o1 实验记录

突发！高通拟全盘收购 intel 。。。

OpenAI o1 self-play RL 技术路线推演

Qwen2.5感觉成了，热泪眼眶

大模型千卡训练-经验指北

聊一聊大模型六小虎生存现状

字节三面被问 RAG 原理了，要凉…

2024大模型面试八股（含100道答案）

2024年大模型Alignment偏好优化技术PPO,DPO, SimPO,KTO,Step-DPO, MCTS-DPO,SPO

浅谈Role Play：从当红炸子鸡到无人问津

关于 GPT5 训练失败的思考

Yann LeCun：建议学生不要在大模型方向工作？

2024大模型秋招面试被锤大赏！

大模型是一场泡沫？

入坑大模型18个月的反思与贩私

这段时间搞大模型的血和泪

大模型SFT的局限性

天呐! AI 之王 GPT-6 猎户座来了！

大模型的基本功

李沐：大模型发展趋势与个人职业选择

《黑神话·悟空》是用什么编程语言开发的？

黑神话悟空，电脑与 PS5 的画质差别有多大？

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉