首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

大模型+RAG如何提高问答准确率？5家互联网大厂RAG落地实践

文摘科技 2024-09-18 07:30 浙江

作者｜沙丘智库研究团队

来源｜沙丘社区（www.shaqiu.cn）

RAG（Retrieval-Augmented Generation，检索增强生成）是当前最流行的基于大模型的系统架构，很多大模型应用几乎完全基于RAG构建。RAG的本质是在大模型交互之前提前进行搜索，召回正确的上下文给到大模型，决定了大模型生成的天花板。

RAG方法使用搜索引擎来快速定位和检索构建提示所需的任何信息，具体流程如下：

· 使用大模型来重构原始的用户提示，使其与后续步骤中搜索引擎所要求的格式兼容；

· 根据重构后的提示进行搜索，这种搜索可以基于多种知识表示或方法，包括知识图谱、向量数据库等；

· 将大模型用于总结修改过的提示中包含的信息，并生成流畅的、类似人类语言的回复；

· 在最终用户看到由大模型生成的响应之前，“响应验证”会对其准确性和安全性进行监控和检查。

当前，从使用场景上看，RAG主要使用的场景有两种——聊天机器人和智能检索。其中聊天机器人是会话场景、一问一答聊天交互，而智能检索更像是copilot场景，基于搜索结果进一步解读和分析，辅助工作场景。智能检索相较于chatbot对大模型幻觉问题的容忍程度更高。

沙丘智库长期跟踪调研大模型技术的发展，旨在帮助企业快速了解大模型最新、最全面的落地情况。沙丘智库通过研究火山引擎、阿里云、字节跳动、哔哩哔哩、蚂蚁集团基于“大模型+RAG”的智能问答系统建设实践，旨在为其他企业提供参考。

▎案例1：火山引擎基于大模型的智能问答实践

火山引擎基于RAG技术实现智能问答，RAG通过从外部知识源动态检索信息，并使用检索到的数据作为组织答案的参考，显著提高响应的准确性和相关性，有效解决大模型中存在的幻觉问题。

RAG方案实现的核心在于两点，一是在检索阶段做到比较高的topk召回率，分为两路召回，一路是通过倒排索引检索召回，另一路是通过向量化方式召回，两路召回需要混排；二是支持比较大的context window，并能从较多相关信息中总结出正确答案。

完整内容：火山引擎基于大模型的智能问答实践

▎案例2：阿里云基于RAG的智能问答实践

阿里云通过RAG技术，解决了智能问答中遇到的幻觉问题、知识更新缓慢、隐私数据泄露和高昂的训练成本等挑战。RAG方案通过外挂知识库提供可靠知识，优化了知识检索和答案生成流程，提高了智能问答的准确性和效率。

完整内容：阿里云基于RAG的智能问答实践

▎案例3：字节跳动答疑机器人场景大模型实践

研发基建部门日常需要安排答疑值班，回答用户关于基建相关的咨询，字节跳动将研发答疑场景作为切入点，利用大模型构建答疑机器人，并联动研发领域沉淀多年的知识积累，答疑机器人充分利用RAG和FineTuning两种建设思路的优势。

完整内容：字节跳动答疑机器人场景大模型实践

▎案例4：哔哩哔哩智能客服场景大模型实践

哔哩哔哩通过大模型升级智能客服系统，优化RAG链路和检索机制，提升了对话的时效性和准确性。构建了全面的领域知识库，实现了高效知识检索和准确安全的回答。实践结果显示，智能客服拦截率提升了近30%，显著改善了用户体验。

完整内容：哔哩哔哩智能客服场景大模型实践

▎案例5：检索增强在知识搜索场景的应用实践

蚂蚁集团采用检索增强技术，通过知识库分层构建、复杂文档处理、混合搜索策略和总结模型优化，有效提升了大模型在知识搜索场景中的应用效果，这项技术在企业内部多个场景中得到应用，相比传统搜索，答案获取效率提高了约20%。

完整内容：检索增强在知识搜索场景的应用实践

更多研究：

大模型将如何影响对话式AI应用？

知识图谱增强在文档知识问答中的应用

PingCAP大语言模型问答助手构建实践

江西移动大小模型协同的企业级私域知识检索平台

勃小智RAG医学资料检索增强

...

*更多生成式AI研究可前往“沙丘智库”小程序查阅

*有任何需求可咨询客服微信：zimu738

http://mp.weixin.qq.com/s?__biz=MzkyMzM0NzEwNg==&mid=2247487585&idx=1&sn=fb3f293502648bd89a35173146917168

数字化研究与服务机构

最新文章

22份大模型深度报告：涵盖场景评估、趋势预测、最佳实践等企业最关心的问题

必看！大模型驱动IT运维智能化升级，7家头部企业率先落地

工业大模型落地加速，哪些场景将率先获益？

大模型赋能保险代理人已成趋势：揭秘9家保险公司新进展

中国大模型技术采纳现状调研：渗透率达52.3%，但正式投产不及预期

15种典型LLM+RAG框架大盘点

直播预告｜金融机构如何实现监管报送全链路自动化数据质量保障？

大模型先锋案例年度评选已正式启动

提升NL2SQL准确率的3点建议与实践参考

企业如何从0到1构建RAG系统？

大模型在自动化测试的突破：蚂蚁、华为等头部企业应用实践

沙丘智库《大模型应用跟踪月报（10月）》发布，洞察大模型最新落地进展

迈进智能客服3.0时代：大模型引领互联网公司客户服务升级

沙丘智库《“大模型+RAG”最佳实践报告》发布：RAG应用指南与18个典型案例

9个“大模型+智能投顾”案例，洞察财富管理未来

大模型赋能销售，头部企业销售助手、数据洞察、培训等场景应用实践

揭秘Agentic AI，万字解读OpenAI Agentic AI实践报告

寻找时代的领航者，第二届大模型先锋案例榜单评选正式启动！

《2024中国AI Agent最佳实践案例》榜单评选进行中，欢迎参与！

政务大模型落地超预期：14城27部门领跑数字政府建设

大模型如何提升智慧办公效率？8家头部企业实践案例

基于大模型的Multi-agent在客服、销售等场景的落地实践

突破传统RAG局限：GraphRAG如何提升大模型问答能力？

多模态大模型有哪些落地场景？贝壳、海尔等4家头部企业实践

大模型赋能理赔，保险公司加强“主动式服务”

优化RAG系统的四种工程化手段

51个证券大模型案例，沙丘智库发布《2024年中国证券业大模型案例跟踪报告》

智能测试时代来临，大模型如何赋能测试设计环节？

如何“选”大模型？3家头部企业大模型评测体系建设实践

证券公司如何应用大模型？17个落地场景评估

代码采纳率达30%，多家头部银行上线智能编码助手

如何利用大模型+RAG构建知识问答助手？

央企布局大模型背后，优先建设哪些场景？

22家国内券商拥抱大模型，引领金融科技新浪潮

AI Agent带来哪些安全风险？如何应对？

沙丘智库发布《2024中国证券业大模型应用场景评估报告》

标杆研究：8家国资央企“AI+专项行动”布局与大模型实践

股份行积极布局大模型，哪些应用场景值得投入？

大模型赋能新型电力系统：6家电力企业大模型实践

财产险公司如何应用大模型？平安、太保等4家产险大模型实践

36%的国资央企组建大模型团队，沙丘智库发布《2024年国资央企大模型应用跟踪报告》

大模型+RAG如何提高问答准确率？5家互联网大厂RAG落地实践

工业大模型市场图谱：53个工业大模型全面梳理

大模型提升测试质量和效率：8家头部企业“大模型+软件测试”落地实践

大模型革新智能客服体验：10个“大模型+智能客服”落地实践

基于大模型的知识助手：7家头部企业“大模型+知识管理”落地实践

工业大模型落地跟踪：降本增效为第一目标，生产制造应用占比44.8%

银行半年报揭开大模型进展，19家上市银行大模型应用现状

证券大模型赋能投研提效：4家头部券商“大模型+智能投研”落地实践

城商行大模型应用进展如何？北京银行、上海银行等5家头部城商行大模型实践

分类

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉