IM-RAG：解锁AI内心独白，多轮检索增强生成新突破！

文摘 2024-10-27 07:40 新加坡

尽管检索增强生成（Retrieval-Augmented Generation, RAG）方法能够利用外部知识和大型语言模型（Large Language Models, LLMs）输出来增强生成质量，从而减少幻觉和应对静态知识库的局限性，但其在应用中仍面临多项挑战：例如，与不同能力的信息检索（Information Retrieval, IR）系统集成的灵活性有限、多轮检索的可解释性不足、以及缺乏端到端优化机制。

为了解决这些问题，我们提出了IM-RAG——一种以LLM为核心的新型方法。IM-RAG通过学习内部独白（Inner Monologues, IM）来连接IR系统与LLMs，从而支持多轮检索增强生成。

在内部独白过程中，LLM作为主要推理模型（推理器），通过提出查询以从Retriever中收集更多信息，或基于对话上下文提供最终答案。此外，我们引入了Refiner模块来提升Retriever的输出质量，有效桥接了推理器与IR模块之间的能力差距，增强了多轮信息交换的效果。

整个IM过程通过强化学习（Reinforcement Learning, RL）优化，其中包含进度跟踪器以奖励中间步骤，并在答案预测环节进行监督微调（Supervised Fine-Tuning, SFT）。在HotPotQA数据集上的实验结果表明，IM-RAG不仅实现了业界领先的性能，还在内部独白中展现出更高的灵活性和出色的可解释性。

这张图展示了 IM-RAG（内心独白-检索增强生成）系统的处理流程。图中，一个用户提出了一个复杂的问题，IM-RAG的核心组件“推理器（Reasoner）”首先尝试回答。如果推理器认为当前信息不足以得出答案，它将作为一个“提问者（Questioner）”生成查询，并交由“检索器（Retriever）”去知识库中查找相关信息。

在检索到的文档返回后，“精炼器（Refiner）”会进一步过滤和提升信息的相关性，将最重要的信息标注后再传回推理器。推理器会检查信息是否足够充分，不足时会继续迭代，生成新的查询并再次检索。整个流程会持续数轮，直到推理器认为信息足够齐全，最终转为“回答者（Answerer）”，提供最终答案。

此外，图中还展示了一个“进度跟踪器（Progress Tracker）”，帮助记录每一步的进展和中间步骤，为用户提供解释性线索，使人类能够清晰了解系统推理过程及其结论的依据。

这张图展示了 IM-RAG 框架的概览，包括四个主要组件：推理器（Reasoner）、检索器（Retriever）、精炼器（Refiner） 和 进度跟踪器（Progress Tracker）。每个组件在多轮检索增强生成中各司其职，协同完成复杂问答任务。

过程描述：

推理器（Reasoner）：负责主要的推理任务，在不同阶段切换角色。作为“提问者（Questioner）”，它生成查询并调用检索器，获取相关的外部文档；作为“回答者（Answerer）”，它基于对话上下文和文档生成最终答案。
检索器（Retriever）：根据推理器的查询从数据库中检索相关文档，并将结果传递给精炼器进行进一步处理。
精炼器（Refiner）：对检索到的文档进行重排序和改写，以提高信息的相关性，并将前几条最相关的文档（Top-K）返回给推理器，帮助推理器在后续推理过程中使用。
进度跟踪器（Progress Tracker）：通过打分系统来跟踪任务进展。在强化学习（Reinforcement Learning，RL）阶段，进度得分用作奖励，帮助推理器调整检索和回答策略。最终回答的生成则在监督微调（Supervised Fine-Tuning，SFT）阶段完成，使用真实答案和优化的 IM（内部独白）查询-回答对作为微调样本。

学习过程：

RL 阶段：推理器在生成查询时使用进度跟踪器的分数作为反馈，帮助优化查询策略。
SFT 阶段：推理器在提供最终答案时基于对话和相关文档生成预测，并进一步利用真实答案微调模型。

通过这种架构，IM-RAG 能够在多轮对话中逐步收集和精炼信息，实现高效的多轮检索，并增强生成内容的准确性和解释性。

IM-RAG 是一种创新方法，灵感来自于“内心独白”机制，将大型语言模型（LLM）和信息检索（IR）系统紧密结合，通过上下文感知的多轮交互式检索实现复杂推理。

在多轮对话中，LLM 作为核心推理引擎，根据对话上下文提出新的查询，或在收集足够信息后生成最终响应。检索到的文档经过精炼器的优化处理（如重排序、过滤等），以更贴合 LLM 的推理需求。

整个过程通过强化学习实现端到端优化，进度跟踪器的反馈和最终答案的准确性作为奖励信号。在 HotPotQA 上的实验表明，IM-RAG 在多步推理任务中达到了最先进（SOTA）的性能，使 RAG 系统具备类人般的多轮推理与检索能力，并拥有更高的灵活性和可解释性。

虽然 IM-RAG 作为 LLM 与检索系统间“内心独白”整合的初步尝试已取得显著进展，但也存在一定局限性。当前的数据集可能不足以反映人类复杂且有时非线性的内心独白，可能限制模型在处理高度复杂、抽象或创造性推理任务方面的学习和应用潜力。

参考：https://simg.baai.ac.cn/paperfile/97ca2b53-c61d-40e3-bb41-040904f89c78.pdf

http://mp.weixin.qq.com/s?__biz=MzA4NzA4NjAxOA==&mid=2452971675&idx=1&sn=62acc4e33c7e1bb555847e79019f30c2

AI技术研习社

专注分享人工智能、大模型、算法、大数据开发、数据分析领域的技术干货和落地实践！

最新文章

检索增强生成（RAG）：解密AI如何融合记忆与搜索

揭秘汽车语音助手：从语音识别到智能回复的全流程解析！

RAG 和 RAU：自然语言处理中检索增强语言模型的调查

RAG 驱动的 NER：构建自定义模型的入门指南

基于BERT的对话意图和槽位联合识别模块

GLM-4-Plus上线：杀进“世界前三”，它真的好用吗？

揭秘RAG背后的人机对话流程：从语音识别到智能生成

揭秘RAG：全方位解析RAG检索中的意图识别，如何助力智能问答

Agent智能大揭秘：企业如何利用AI代理驱动高效增长！

LLMs+SQL：用自然语言轻松搞定数据查询，彻底解锁数据库潜能！

秒懂LLM流式输出的SSE原理！一文带你搞定SSE实现和Python实战案例

RAG实战：打造可扩展的智能文档系统：终极 RAG 管道全解析

RAG工具：FlashRAG用于高效 RAG 研究的 Python 工具包

重磅上线！ChatGPT引入Search功能，秒查秒懂新体验！

RAG评估：RAGChecker重磅发布！精准诊断RAG系统的全新细粒度框架！

RAGFlow重磅开源！基于深度文档理解的智能检索神器！

从零开始，用万行代码打造专属向量数据库！

揭秘RAG神器！如何通过上下文检索与混合搜索打造超强生成效果

IM-RAG：解锁AI内心独白，多轮检索增强生成新突破！

Agent实战：基于大模型的Agent技术框架开发实战

重磅发布！Claude 3.5 Sonnet上线，首个能像人类操作电脑的AI，官方提示词全解密！

多模态RAG-ColPali：使用视觉语言模型实现高效的文档检索

LightRAG：创新双级检索系统，整合图形结构，实现更强大信息检索！

颠覆传统生成方式！Adaptive RAG：实时学习、智能调整的下一代检索增强技术

颠覆传统RAG！Corrective-RAG引入自我反思与自我评估，让文档检索更智能更精准！

国内首部以“生成式人工智能”为应用背景的知识产权标准，诚邀参编！

揭秘Self-RAG：引领大型语言模型生成质量的新潮流！

初识 OpenAI 的 Swarm：轻量级、多智能体系统的探索利器

MemoRAG重磅登场：彻底革新AI问答的长期记忆功能！

颠覆RAG性能！揭秘多头RAG的强大优化秘诀

解锁RAG架构：必知的6种提升AI内容生成的检索增强技术（二）

解锁RAG架构：必知的6种提升AI内容生成的检索增强技术（一）

可控 Text2Image：打造您想要的完美图像生成神器

揭秘RAG多模态应用：Text2Image检索开源项目

揭秘顶级 RAG 技术，不可错过的关键知识！

重磅上线！大模型面试题库，助你轻松拿Offer！

零基础快速构建你的LLM Agent框架，掌握AI的未来！

大模型技术揭秘：普通开发者如何轻松快速掌握原理与架构

如何精准计算：大型语言模型（LLM）部署到底需要多少GPU内存？

大模型时代：AI引领企业创新升级的全面爆发

中国金融大模型产业全揭秘：从技术到应用的深度解析

揭秘RAG中的幻觉检测：多种方法全面基准测试，找出最优解！

Autogen快速上手指南：解锁Multi-Agent协作的高效工作流程

揭秘Agent框架：如何打造智能高效的AI应用核心

RAG深度优化：全面掌握多种ReRanker实现方法与技巧

RAG优化神器：rerankers重新排名模型的终极方案，提供轻量级统一API

ChatGPT-5没等到，o1-preview 和 o1-mini强势登场，揭晓它们的独家优势！

大模型时代：解锁自媒体爆款内容运营的秘密武器！

用ClickHouse实现极速向量搜索，性能爆炸提升的秘密！

大模型微调： SFT 经验分享

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉