Google 最新推出的RAG替代方案--RIP

科技科技 2024-10-22 08:18 北京

▼最近直播超级多，预约保你有收获

—1—

RIG 新模式

上月，谷歌在 Huggingface 和 Kaggle 两大平台发布了两个新型开源模型：datagemma-rag-27b-it与datagemma-rig-27b-it。特别是其中的RIG（Retrieval Interleaved Generation）检索交错生成模型，它开创了大型语言模型（LLM）与外部数据库交互的新方法。

—2—

RAG VS RIG

对于那些对大型语言模型（LLM）有所了解的同学来说，他们清楚 LLM 是通过训练数据来学习知识的。因此，在使用大型模型时，我们可能会遇到“幻觉”和“信息过时”等问题，这些问题通常是因为训练数据库中缺乏相关知识或者训练数据未能及时更新所致。鉴于 LLM 训练所需的高昂时间和经济成本，在实际应用中，我们通常会采用 RAG（Retrieval Augmented Generation）技术，即为 LLM “接入”一个最新的数据库，以便通过检索手段利用 LLM 的能力来回答用户关于特定或最新数据的问题。

RAG 的工作流程如下：

1. 用户查询提交：用户向 LLM 发送查询或提示词。

2. 数据检索：LLM 将用户的查询转化为数据库查询，并向外部数据库进行数据检索。

3. 响应生成：LLM 结合自身的知识库和检索到的结果，生成相应的答案。

如图所示，当被问及“再生资源的使用是否有所上升？”时，RAG 应用通过检索得到的数据表来获取信息，从而提供了准确的数据驱动的答案。

而此次发布的 RIG 模型则采用了不同的方法—检索交错生成。这里的“交错”指的是在生成部分回答和检索外部数据之间进行交替。该模型不会等到所有数据检索完毕才开始生成回答；相反，它是将检索和响应生成这两个过程相互交织，使得检索和回答的生成能够同步进行。

RIG 模型的操作流程可以概括为以下几个核心步骤：

1. 用户查询提交：用户向 LLM 发送查询或提示。

2. 部分响应构建：LLM 利用其内置知识开始构建响应。然而，这个响应可能包含对需要外部数据部分的占位符或初步推测。

3. 实时数据检索：当 LLM 发现信息缺失或不完整时，它会即时搜索外部资源（例如：数据库、知识图谱或基于 Web 的 API）。模型可能会进行多次检索，以便利用新获得的数据来丰富其响应。

4. 交错检索与生成：在构建响应的过程中，模型在生成响应的不同部分和根据需求获取数据之间动态切换。比如：如果 LLM 以“可再生能源现在……”开头，它会在完成该部分响应之前暂停，以便检索特定的可再生能源利用率数据。

5. 最终响应输出：在检索并整合了所有必需的数据后，LLM 将完成响应并呈现给用户。

—3—

RIG 效果

谷歌此次发布的两个开源模型均针对 Data Commons 进行了专门的优化和测试，目的是为了应对大型模型与实际数字数据交互的挑战。"Data Commons是一个公开可访问的知识图谱，它包含了超过2400亿个数据点，涉及数十万个统计变量。这些数据点来源于联合国（UN）、世界卫生组织（WHO）、疾病控制和预防中心（CDC）以及人口普查局等可靠机构。通过将这些数据集整合成一套统一的工具和AI模型，我们为政策制定者、研究人员和组织提供了获取精确洞察力的手段。"

同时，谷歌在 Colab 上也为这两个模型提供了 Notebook，以便用户更方便地进行体验。接下来，让我们观察 RIG 模型在 Data Commons 上的实际应用效果。

问题：巴基斯坦在卫生目标方面取得了哪些进展？

datagemma-rig-27b-it 的回答：

Here are some key points:
Progress made:
Increased life expectancy: Life expectancy at birth has increased from [DC#1(62.102 yr [1] || 61.8 years)] in 2000 to [DC#2(66.269 yr [2] || 67.2 years)] in 2020.Reduced maternal mortality: Maternal mortality ratio has declined from [DC#3(387.3715 Per 100,000 live births [3]* || 276 per 100,000 live births)] in 2000 to [DC#4(177.7277 Per 100,000 live births [4]* || 140)] in 2018....
FOOTNOTES[1] - Per datacatalog.worldbank.org, value was 62.102 yr in 2000. See more at https://datacommons.org/explore#q=what%20was%20the%20life%20expectancy%20in%20Pakistan%20in%202000%3F&mode=toolformer_rig [2] - Per datacatalog.worldbank.org, value was 66.269 yr in 2020. See more at https://datacommons.org/explore#q=what%20was%20the%20life%20expectancy%20in%20Pakistan%20in%202020%3F&mode=toolformer_rig 
...

—4—

结论

从上述回答可以观察到，与 RAG 类似，RIG 的主要功能是减少 LLM 在应用中的幻觉现象。通过将实时数据检索与响应生成过程紧密结合，RIG 在构建回答过程中不断查询可靠的数据源，这有助于模型基于现实世界的事实数据来形成输出，从而显著降低产生幻觉的可能性。

RIG 的另一个明显优势在于其在生成响应的同时能够实时调整。与 RAG 仅在生成响应前进行一次数据检索不同，RIG 在响应生成过程中进行动态的交错检索。若 LLM 遇到多个缺失或不完整的信息点，它能够迭代式地获取数据，并在此过程中优化其回答。

在实际应用中，RIG 更能充分利用参数规模较小的 LLM 的性能。RAG 将所有查询和结果单词都输入 LLM，其答案的质量很大程度上取决于 LLM 处理上下文长度的能力。而 RIG 的方法则是针对特定数据进行检索，对上下文长度的处理能力要求更低；此外，对于无法检索到的数据，RIG 会使用占位符来提示用户，这使得它提供的数值答案相对更加可靠，特别适合对数据准确性要求较高的敏感领域，比如：价格咨询、金融服务和医疗咨询等场景。

—5—

3天的直播训练营，带你快速掌握 Agent

为了帮助同学们彻底掌握 AI Agent 智能体应用开发、部署、生产化，为此我特意打造了一个为期3天的 AI Agent 企业实战训练营：

课程原价199元，现在仅花19元就能拿下！

3天的直播课，带你快速掌握 Agent 核心技术和企业级项目实践经验。

第一天：AI Agent 技术原理篇

全面拆解 AI Agent 技术原理，掌握 AI Agent 三大能力及其运行机制。

第二天：AI Agent 应用开发实战篇

深度讲解 AI Agent 技术选型及开发实践，具备开发 AI Agent 核心技术能力。

第三天：AI Agent 企业级案例实战篇

从需求分析、技术选型到架构设计实践，深度学习企业级 AI Agent 项目流程级重点难点问题解决。

3天时间，你能学会什么？

在真实项目实践中，获得以下能力：

第一、全面了解 AI Agent 的原理、架构和实现方法，掌握核心技术精髓。

第二、熟练使用 Dify/Coze 平台和 LangChain 开发框架，为未来的技术实践打下坚实基础。

第三、通过企业级项目实战演练，能够独立完成 AI Agent 的设计开发和维护，提升解决实际问题的能力。

第四、为职业发展提供更多可能性，无论是晋升加薪还是转行跳槽，提升竞争力。

限时优惠：

原价199元，现在报名只需19元！这是一个难得的机会，让我们一起踏上 AI Agent 技术之旅，开启技术新纪元！

—6—

添加助理直播学习

购买后，添加助理进行直播学习👇

⬇戳”阅读原文“，立即预约！

END

http://mp.weixin.qq.com/s?__biz=MzIzODIzNzE0NQ==&mid=2654451984&idx=1&sn=06f032f246b6d6ca7cdc1e6090bb11d4

玄姐聊AGI

5年连续创业者，融资超亿元｜ AI 大模型资深应用专家｜前58集团技术委员主席｜前百度资深工程师｜大厂 MVP｜毕业浙江大学

最新文章

RAG现有框架总结：7个GraphRAG+17个传统RAG | 推荐收藏

爆跌90%......

团队准备解散了。

爆跌了。。。

别再手动编排工作流了，AI做的比你更好！

五大主流开源大模型RAG评估框架详解

裁员9000人！

跌爆了。。。

大模型 Agent 应用的6种架构设计模式，你知道几种？

内部消息：互联网巨头豪赌AI Agent，背后秘密大曝光！

对AI大模型应用场景落地几点思考！

特朗普当选美国总统，中国程序员的机会来了！！

上周和阿里专家一次沟通。。。

96W，确实可以封神了！！

字节跳动员工自爆工资收入，网友说：字节10年能挣普通人一辈子

经过了裁员优化后，有大厂发现35+员工堪比985211的员工了。他们既听话又好用，又有丰富踩坑经验，不容易犯错。

大厂RAG面试真题大全！

经过了裁员优化后，有大厂发现35+员工堪比985211的员工了。他们既听话又好用，又有丰富踩坑经验，不容易犯错。

离谱！一边裁员，一边60K*16高薪挖人！

很严重了，我劝大家学会这门新技能吧...

前阿里员工爆料：35岁+，年薪曾达180万，离职五月终获字节跳动Offer，却面临45%薪资下调，心理压力巨大

字节跳动员工自爆工资收入，网友说：字节10年能挣普通人一辈子

央国企降薪潮来袭！惨不忍睹！

刚刚，OpenAI发布sCM提升50倍效率，扩散模型重大技术突破！

Google 最新推出的RAG替代方案--RIP

如何基于一台MacBook搞定企业级大模型知识库部署

阿里专家揭秘：为什么现在要学习 AI Agent？

取代IT岗，中国又一新兴岗位在崛起！这才是IT人未来最好的就业方向！！

雷军做程序员时写的博客，的确强大！

比裁员更侮辱人的事发生了。。。

AI应用落地关键技术：AI Agent

惊恐！银行崩了，余额归 0 ，钱没了。。。

OpenAI重磅发布交互界面canvas，让ChatGPT成为编程和写作利器

一文彻底理解大模型 Agent 智能体原理和案例

成本降低98%！OpenAI开发者大会4大新能力，处理token猛增50倍！

一文剖析AI大模型技术架构的全景视图：从基础实施层、云原生层、模型层、应用技术层、能力层、到应用层

Cursor 实用技巧指南

Spring AI Alibaba 让 Java 开发者一步迈入 AI 原生时代！

突发！上交所系统被买崩了？股票交易量火爆挤瘫 IT系统！

大厂职级：P6/P7/P8技能、薪资和成长路线全攻略！

裁员了，很严重，大家做好准备吧。。。

突发！OpenAI 山姆奥特曼长文解读智能时代，很快会有超级智能！

4.6K star！Cursor 开源平替来了，一天狂揽近 1K Star！

Spring AI Alibaba 重磅发布！AI 驱动的 Java 开发框架

如何基于一台MacBook搞定企业级大模型知识库部署

多家企业面临薪资困境，提前规划，为你的未来保驾护航！

前阿里员工自述困境：35岁+，年薪曾达180万，离职五月终获字节跳动Offer，却面临45%薪资下调，心理压力巨大

中国程序员的悲哀！！（全球调研）

人人都能听懂的大白话 Transformer 技术原理

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉