沙丘智库《“大模型+RAG”最佳实践报告》发布：RAG应用指南与18个典型案例

文摘科技 2024-10-31 07:30 浙江

作者｜沙丘智库研究团队

来源｜沙丘社区（www.shaqiu.cn）

自2022年底OpenAI发布ChatGPT以来，大模型受到市场广泛关注，各行各业积极探索大模型的应用。但从企业实践来看，将大模型无缝集成到企业工作流中存在较多挑战，包括大模型的幻觉、开发和维护大模型的高成本以及由于大模型知识库的局限性而导致的准确率不满足业务需求。

RAG（Retrieval-Augmented Generation，检索增强生成）是一种人工智能框架，旨在利用大语言模型（LLM）进行跨外部知识源的自然语言查询。RAG的核心思想是通过外挂知识库的方式给大模型提供更可靠的知识来抑制模型产生幻觉，通过定期迭代知识库的方式解决大模型知识更新慢和训练成本高的问题。

在实践RAG的过程中，企业会发现RAG走通很容易，但实际落地生产的难度非常大。基于对企业RAG落地实践的调研与研究，沙丘智库发布《2024年“大模型+RAG”最佳实践报告》，为企业提供一份全面的RAG应用指南，以及18个典型案例作为参考。

完整报告：《2024年“大模型+RAG”最佳实践报告》（43页PPT）

“大模型+RAG”应用指南

为了使RAG能够应用于更加复杂、更具价值的场景，企业需要创建一个完整的RAG系统链路，以便能够通过工程化的技术手段对链路上的不同部分进行实验和优化。RAG链路可分为三个部分：数据准备、知识检索和答案生成。

在数据准备环节，RAG的典型问题包括数据质量差、多模态信息、复杂的PDF提取等；在知识检索环节，RAG的典型问题包括内容缺失、错过排名靠前的文档、不在上下文中等；在答案生成阶段，RAG的典型问题包括未提取、不完整、格式错误、模型幻觉等。

基于对多家企业RAG落地实践的调研与研究，沙丘智库总结了如下六点RAG优化建议：

第一，构建完整的数据准备流程；

第二，采用多种分块方式；

第三，通过查询转换澄清用户意图；

第四，采用混合检索和重排策略；

第五，改进提示词模板；

第六，实施动态防护栏。

“大模型+RAG”典型案例

在《2024年“大模型+RAG”最佳实践报告》中，沙丘智库精选了18家企业的RAG技术实践，例如：

在数据准备环节，阿里云考虑到文档具有多层标题属性且不同标题之间存在关联性，提出多粒度知识提取方案，按照不同标题级别对文档进行拆分，然后基于Qwen14b模型和RefGPT训练了一个面向知识提取任务的专属模型，对各个粒度的chunk进行知识提取和组合，并通过去重和降噪的过程保证知识不丢失、不冗余。最终将文档知识提取成多个事实型对话，提升检索效果；

在知识检索环节，哈啰出行采用多路召回的方式，主要是向量召回和搜索召回。其中，向量召回使用了两类，一类是大模型的向量、另一类是传统深度模型向量；搜索召回也是多链路的，包括关键词、ngram等。通过多路召回的方式，可以达到较高的召回查全率。

在答案生成环节，中国移动为了解决事实性不足或逻辑缺失，采用FoRAG两阶段生成策略，首先生成大纲，然后基于大纲扩展生成最终答案。

* 以上内容节选自沙丘智库《2024年“大模型+RAG”最佳实践报告》

///

完整报告：沙丘智库《2024年“大模型+RAG”最佳实践报告》（43页PPT）

报告目录

第一部分：“大模型+RAG”应用指南

· RAG定义与分类

· RAG系统的六个设计原则

· RAG系统建设的常见问题与六个最佳实践

· 企业级RAG系统的参考架构

· 企业级RAG系统建设路线图

第二部分：“大模型+RAG典型案例”

· 案例1：阿里云基于RAG的智能问答实践

· 案例2：中国三峡基于RAG的水电运维智能问答

· 案例3：AWS 对RAG知识召回效果差的7种应对策略

· 案例4：PingCap自托管Embedding模型

· 案例5：字节跳动基于大模型的答疑机器人

· 案例6：哔哩哔哩强化RAG模型的数据准备工作

· 案例7：360集团利用知识图谱增强RAG问答全链路

· 案例8：蚂蚁集团复杂文档处理策略

· 案例9：哈啰出行优化RAG，将知识问答准确率从40%提升到83%

· 案例10：百度智能云基于大模型的知识库智能问答系统

· 案例11：作业帮写作大模型RAG优化实践

· 案例12：众安保险通过RAG使大模型具备企业知识

· 案例13：火山引擎基于大模型的智能问答实践

· 案例14：华为云RAG知识库自我优化策略

· 案例15：中国移动RAG优化实践

· 案例16：联想使用GraphRAG实现Agent动态工作流

· 案例17：腾讯云ES RAG实现微信读书“AI问书”

· 案例18：去哪儿提高RAG知识检索准确率

*更多生成式AI研究可前往“沙丘智库”小程序查阅

*有任何需求可咨询客服微信：zimu738

http://mp.weixin.qq.com/s?__biz=MzkyMzM0NzEwNg==&mid=2247487675&idx=1&sn=56b6edd6c96c45141caa6b1202663023

沙丘社区

数字化研究与服务机构

最新文章

大模型先锋案例年度评选已正式启动

提升NL2SQL准确率的3点建议与实践参考

企业如何从0到1构建RAG系统？

大模型在自动化测试的突破：蚂蚁、华为等头部企业应用实践

沙丘智库《大模型应用跟踪月报（10月）》发布，洞察大模型最新落地进展

迈进智能客服3.0时代：大模型引领互联网公司客户服务升级

沙丘智库《“大模型+RAG”最佳实践报告》发布：RAG应用指南与18个典型案例

9个“大模型+智能投顾”案例，洞察财富管理未来

大模型赋能销售，头部企业销售助手、数据洞察、培训等场景应用实践

揭秘Agentic AI，万字解读OpenAI Agentic AI实践报告

寻找时代的领航者，第二届大模型先锋案例榜单评选正式启动！

《2024中国AI Agent最佳实践案例》榜单评选进行中，欢迎参与！

政务大模型落地超预期：14城27部门领跑数字政府建设

大模型如何提升智慧办公效率？8家头部企业实践案例

基于大模型的Multi-agent在客服、销售等场景的落地实践

突破传统RAG局限：GraphRAG如何提升大模型问答能力？

多模态大模型有哪些落地场景？贝壳、海尔等4家头部企业实践

大模型赋能理赔，保险公司加强“主动式服务”

优化RAG系统的四种工程化手段

51个证券大模型案例，沙丘智库发布《2024年中国证券业大模型案例跟踪报告》

智能测试时代来临，大模型如何赋能测试设计环节？

如何“选”大模型？3家头部企业大模型评测体系建设实践

证券公司如何应用大模型？17个落地场景评估

代码采纳率达30%，多家头部银行上线智能编码助手

如何利用大模型+RAG构建知识问答助手？

央企布局大模型背后，优先建设哪些场景？

22家国内券商拥抱大模型，引领金融科技新浪潮

AI Agent带来哪些安全风险？如何应对？

沙丘智库发布《2024中国证券业大模型应用场景评估报告》

标杆研究：8家国资央企“AI+专项行动”布局与大模型实践

股份行积极布局大模型，哪些应用场景值得投入？

大模型赋能新型电力系统：6家电力企业大模型实践

财产险公司如何应用大模型？平安、太保等4家产险大模型实践

36%的国资央企组建大模型团队，沙丘智库发布《2024年国资央企大模型应用跟踪报告》

大模型+RAG如何提高问答准确率？5家互联网大厂RAG落地实践

工业大模型市场图谱：53个工业大模型全面梳理

大模型提升测试质量和效率：8家头部企业“大模型+软件测试”落地实践

大模型革新智能客服体验：10个“大模型+智能客服”落地实践

基于大模型的知识助手：7家头部企业“大模型+知识管理”落地实践

工业大模型落地跟踪：降本增效为第一目标，生产制造应用占比44.8%

银行半年报揭开大模型进展，19家上市银行大模型应用现状

证券大模型赋能投研提效：4家头部券商“大模型+智能投研”落地实践

城商行大模型应用进展如何？北京银行、上海银行等5家头部城商行大模型实践

大模型如何重塑电力知识管理体系？国家电网、南方电网落地实践

工业大模型加速落地：94家头部工业企业大模型应用调研

大模型如何助力投研提效？7家头部金融机构“大模型+智能投研”实践

标杆研究：三大运营商如何构建大模型体系？

股份制银行大模型进展如何？招商、中信、兴业、浦发等6家股份行大模型实践

大模型加速能源行业智能化升级，电力、油气、煤炭等7家企业大模型实践

六大国有银行正在落地哪些大模型应用场景？

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉