RAG 架构设计三阶段演进之路

科技科技 2024-08-30 08:18 北京

▼最近直播超级多，预约保你有收获

—1—

第一阶段：Naive RAG 架构设计

大型语言模型（LLMs）虽然展现出卓越的性能，但在处理特定领域或知识密集型任务时，存在一些挑战，比如：产生虚假信息、知识陈旧以及推理过程的非透明性和不可追溯性。RAG 技术作为一种有希望的解决方案，通过融合外部数据库的知识，有效应对了这些问题。它显著提升了生成内容的准确性和可靠性，尤其在知识密集型任务中表现突出，并支持知识的持续更新及特定领域信息的整合。

大模型 Naive RAG 的运作可概括为以下两个关键阶段：

检索阶段：大模型首先在外部知识库中搜寻与输入文本相关的信息。该知识库通常是由大规模文本数据集经过索引处理后形成的数据库。

生成阶段：将检索到的信息送入生成模型（比如：GPT-4o）。该生成大模型会根据这些信息，生成最终的回答或文本内容。

—2—

第二阶段：Advanced RAG 架构设计

大模型 Advacned RAG 技术在企业应用中的落地全流程，涵盖了架构、模块、技术三大方面，形成了一套完整的框架，包含10个关键模块和36项技术要点！对于一些关键且复杂的模块，比如：分块、向量化、重排等，也进行了全面总结和概述。

Query 理解（Query NLU）：利用 LLM 作为核心引擎，对用户 Query 进行改写以提升检索效果，涉及意图识别、歧义消除、Query 分解、抽象等七个技术点。

Query 路由（Query Routing）：查询路由是 LLM 支持的关键决策环节，决定了用户查询的下一步行动，包含一项核心技术。

索引（Indexing）：作为 RAG 中的核心模块，索引包括文档解析（五种工具）、文档切块（五类方法）、嵌入模型（六种类型）、索引类型（三种分类）等，共计八项技术。

Query 检索（Query Retrieval）：除了 Naive RAG 向量检索外，还关注图谱和关系数据库检索（NL2SQL），共涉及三项技术。

重排（Rerank）：不同检索策略的结果需要通过重排来优化，包括重排器类型（五种）和自训练领域重排器等，共计三项技术。

生成（Generation）：在企业应用中，生成环节可能会遇到重复、幻觉、流畅性、美化、溯源等问题，涉及 RLHF、偏好打分器、溯源 SFT、Self-RAG 等七项技术。

评估与框架：RAG 需要一个全链路的评价体系，作为企业上线和迭代的依据，包括三项技术。

RAG 新技术：探讨 RAG 未来的发展方向及实现路径，共提出三项潜在的新技术。

—3—

第三阶段：Agentic RAG 架构设计

最终，大模型 RAG 问答终章是 Agentic RAG！

向Lv2-智能体提出一个问题。while (Lv2-智能体无法根据其记忆回答问题) {    Lv2-智能体提出一个新的子问题待解答。    Lv2-智能体向Lv1-RAG提问这个子问题。    将Lv1-RAG的回应添加到Lv2-智能体的记忆中。}Lv2-智能体提供原始问题的最终答案。

比如：Query：“与第五交响曲创作于同一世纪的交通工具是什么？”，Agent 通过规划能力分两个子问题来解决：

第一个子问题：“第五交响曲是在哪个世纪创作的？”
第二个子问题：“19 世纪发明的交通工具是什么？”

—4—

直播课免费预约

为了帮助同学们彻底掌握大模型的 RAG、向量数据库、Agent、微调等的应用开发、部署、生产化，今天会开2场直播，请同学们点击以下预约按钮免费预约。

—5—

加我微信

有很多企业级落地实战案例，不方便公开发公众号，我会直接分享在朋友圈，欢迎你扫码加我个人微信来看👇

⬇戳”阅读原文“，立即预约！

END

http://mp.weixin.qq.com/s?__biz=MzIzODIzNzE0NQ==&mid=2654451683&idx=1&sn=f4772265181b8547b7708ad2c6a32705

玄姐聊AGI

5年连续创业者，融资超亿元｜ AI 大模型资深应用专家｜前58集团技术委员主席｜前百度资深工程师｜大厂 MVP｜毕业浙江大学

最新文章

中秋限时特供！独家资源大放送，错过再等一年！

通俗易懂理解知识图谱+大模型

知识图谱与大模型的深度结合策略剖析

15种先进的检索增强生成（RAG）技术

2024，裁员根本停不下来！

GPT-5 训练失败的4点思考

阿里P8们全面溃败。。。

15年过去了，TA依旧还是这样？

如何利用RAG+Agent轻松解决企业复杂问题？

一台MacBook搭建商用级RAG知识库

形势越来越严峻了，到处都在降薪或延发工资...

一文剖析AI大模型技术架构的全景视图：从基础实施层、云原生层、模型层、应用技术层、能力层、到应用层

9.6K Stars！这款超实用的 AI 知识库问答系统：MaxKB

比裁员更侮辱人的事发生了。。。

一文搞懂大模型、RAG、函数调用、Agent、知识库、向量数据库、知识图谱、AGI的区别和联系！！

一台MacBook搭建商用级RAG知识库

RAG 架构设计三阶段演进之路

一个人，一年 300W 美元...

57K Stars！这款轻量级Web服务器成为Nginx的理想替代者，实现自动HTTPS功能。

许多公司，已经发不出工资了！尽早做好准备吧

提升 RAG 系统的回答质量：构建高效的 Prompt

大厂今年的薪资。。。

一台MacBook搭建商用级知识库

GraphRAG + Ollama 本地部署全攻略：避坑实战指南

IntelliJ IDEA 2024.2 正式发布，内置 AI，新款默认 UI 太震撼了！

揭秘AI大模型独家福利！你绝不能错过的宝藏资源！

又是删库跑路？传疯了，知名 App 最新回应

一个更小、更快、更干净的 GraphRAG！！

大模型RAG架构落地的十大挑战

全新GPT-4o mini发布！大模型杀疯了！

基于Llama 3.1和一台MacBook搭建商用级知识库

GraphRAG 项目升级！现已支持 Ollama 本地模型接入，打造交互式 UI 体验

一个好朋友的经历，大家也做好准备吧。。。

记我的百万年薪：一竿子到底，相信时间的复利！

Transformer 动画揭秘：数据处理的四大关键技术

大佬吴恩达，yyds！！

腾讯宣布全员调薪了。。。

一文彻底理解大模型 Agent 智能体原理和案例

裁员了，很严重，大家做好准备吧。。。

7K Stars！这款文本转语音（TTS）的效果太震撼，网络上的声音评价真是不能轻信啊！！

聊聊蚂蚁开源多 Agent 框架 muAgent 的架构设计

重磅！LangChain 官方发布 Agent IDE！！

4.5K Stars！为 RAG 而生的数据工程神器！！

赔偿金额高达2N+12！裁员赔偿的新纪录再次被刷新？

RAG 的尽头是 Agent？

RAG 开发四大痛点及解决方案

基于Llama 3.1和一台MacBook搭建商用级知识库

阿里终于开源数字人技术！！

大厂今年的薪资。。。

公司裁员为何总是先从技术人员下手？

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉