仅 4 个多月 RAG 就进化到“一个新时代”了：成本降低到 GraphRAG 的 0.1%

科技 2024-12-01 14:29 新加坡

编译 | 核子可乐、Tina

在质量和成本方面，将 VectorRAG 与 GraphRAG 相结合的新方案将为行业带来革命性的变革。

近日微软推出了一种“不同于以往的方法”，名为 LazyGraphRAG，追求的是以高效、低成本的方式实现图形 RAG 功能。

微软方面的研究人员声称，这种新型 RAG 方案“在成本和质量方面实现了天然可扩展性”，能够“在理想的成本和质量范围之内表现出强大性能”。此外，它还降低了整个数据集的全局搜索成本，并使得本地搜索更加高效。

有些朋友可能不太熟悉，GraphRAG 是“Graph”图形与 RAG（检索增强生成）的混合词。这项技术通过单一端到端系统利用文本提取、网络分析以及大模型提示 / 摘要的方式，深入理解基于单词的数据集内容。

今年 7 月，微软首次开源了 GraphRAG，仅 4 个多月的时间在 Github 已有 19.7k 颗星，成为目前最火的 RAG 框架之一。

在人工智能领域，RAG 系统对于文档摘要、知识提取和探索性数据分析任务至关重要。但现有系统的主要问题之一在于成本与质量之间的权衡。

传统方法（如基于向量的 RAG）在处理局部化任务时表现良好，例如从特定文本片段中检索直接答案。然而，当涉及需要全面理解数据集的全局性查询时，这些方法往往难以胜任。相比之下，图支持的 RAG 系统通过利用数据结构中的关系，可以更好地解决此类更广泛的问题。然而，与图 RAG 系统相关的高索引成本，使其难以被成本敏感的场景所接受。因此，在可扩展性、经济性和质量之间实现平衡，仍然是现有技术的关键瓶颈。

这次微软推出的 LazyGraphRAG 是一种全新系统，不仅克服了现有工具的局限性，还融合了它们的优势。LazyGraphRAG 通过消除对高成本初始数据摘要的需求，将索引成本降至接近向量 RAG 的水平。

后续，微软也会很快发布 LazyGraphRAG 开源版本并加入到 GraphRAG 库中。

开源地址：https://github.com/microsoft/graphrag

成本降低至 1/1000

LazyGraphRAG 代表了检索增强生成领域的突破性进步，微软称它是“适用于所有场景的低成本解决方案”。

为了评估 LazyGraphRAG 的性能，微软设计了三种不同的预算场景，观察其在多种条件下的表现。

最低预算（100 次相关性测试，使用低成本 LLM，与 SS_8K 成本相同），LazyGraphRAG 在本地和全局查询中显著优于所有条件，仅在全局查询时略逊于 GraphRAG 的全局搜索条件。
中等预算（500 次相关性测试，使用更高级的 LLM，查询成本为 C2 的 4%），LazyGraphRAG 在本地和全局查询上全面超越所有对比条件。
高预算（1,500 次相关性测试），LazyGraphRAG 的胜率进一步提升，展现出其在成本与质量平衡方面的优异扩展性。

也就是说，LazyGraphRAG 将 VectorRAG 与 GraphRAG 相结合，“同时克服了二者的各自局限性”。微软方面写道，“LazyGraphRAG 表明，单一、灵活的查询机制有望在本地全局查询范围之内大大超越各类专用查询机制，而且消除了大语言模型的前期数据汇总成本。”

“其极快且几乎免费的索引功能，使得 LazyGraphRAG 成为致病性查询、探索性分析以及流式数据用例的理想选择。与此同时，它还能够随着相关性测试预算的增加而平衡提高答案质量，这使其成为对其他 RAG 方法进行基准测试的重要工具。”

Vector RAG 也被称为语义搜索，根据微软方面的解释，这是一种“最佳优先搜索形式，使用与查询的相似性来选择最佳匹配的源文本块。”“然而，语义搜索仍有一大短板，即无法满足全局查询所需要考虑的数据集广度。”

研究人员写道，“GraphRAG 全局搜索则是一种广度优先搜索，它使用源文本实体的社区结构以确保查询结果中能充分考虑到数据集广度。但问题在于，它无法识别本地查询所需要的最佳社区。”

在回答关于整个数据集内容的全局查询请求时，后一项技术往往比传统向量 RAG 效果更好，其适合的问题包括“核心主题是什么？”或者“这些信息体现了 X 的什么特征？”等等。总之，GraphRAG 更擅长提供重视广度的问题。

在另一方面，Vector RAG 则更适合本地查询场景下，答案跟问题结构相似的情况。例如涉及“谁、什么、何时、何地”之类的问题，微软强调这也是所谓“最佳优先”这种算法形式的由来。

GraphRAG 与 LazyGraphRAG 之间的区别

LazyGraphRAG 以迭代深化的方式将最佳优先与广度优先两种搜索动态结合起来——首先在有限的深度上进行搜索，之后再通过迭代深入数据集内部。

微软公司表示，LazyGraphRAG 的数据索引成本与向量 RAG 相同，而仅为完整 GraphRAG 成本的 0.1%。

“在同等配置下，LazyGraphRAG 也表现出与 GraphRAG 全局搜索相当的答案质量，但全局查询的成本却降低至 1/700 以下。只需要相当于 GraphRAG 全局搜索查询成本的 4%，LazyGraphRAG 就能在本地和全局两方面表现出明显优于所有竞争方法的查询效果。”

微软是这样回答这个问题的：“与完整的 CraphRAG 全局搜索机制相比，这种方法在某种程度上确实更「懒」，因为它会推迟对大模型的使用，从而大大提高答案生成效率。其整体性能可以通过一条主要参数（相关性测试预算）进行扩展，该参考则以一致的方式把控成本与质量之间的权衡。”

因此，这种勤奋的 RAG 方法确有“懒”的一面，因为它只在绝对必要时才会应用大语言模型（LLM），由此优化了对大语言模型的使用。它不会预先处理整个数据集，而是先进行初始相关性测试，分析较小的数据子集以识别出潜在的相关性信息。

在完成这些测试之后，系统才会使用资源密集型的大语言模型开展更加深入的分析。虽然跟如今他的个人风格不尽相同，但这还是让我们想起比尔·盖茨当初执掌微软时说过的一句话：“我宁愿选个懒人去做困难的工作，因为懒人会找到一种更简单的办法来完成任务。”

参考链接：

https://www.thestack.technology/microsoft-lazygraphrag/

https://www.microsoft.com/en-us/research/blog/lazygraphrag-setting-a-new-standard-for-quality-and-cost/

适用于AI的“C语言”？卡内基梅隆大学又又又发明新语言了

C++ 的两个派系之争

成立两年用户突破1500万，全员工远程办公、以开源为首选的小团队如何颠覆社交界？

会议推荐

就在 12 月 13 日 -14 日，AICon 将汇聚 70+ 位 AI 及技术领域的专家，深入探讨大模型与推理、AI Agent、多模态、具身智能等前沿话题。此外，还有丰富的圆桌论坛、以及展区活动，满足你对大模型实践的好奇与想象。现在正值 9 折倒计时，名额有限，快扫码咨询了解详情，别错过这次绝佳的学习与交流机会！

InfoQ

为一线互联网公司核心技术人员提供优质内容。科技圈的观察者，前沿技术的传播者。

GPT-5 研发一年半进度堪忧！每轮 5 亿美金训练成本打水漂，还得雇人从头“造数据”

火山引擎边缘云全面升级智能边缘，推动 AI 应用场景拓展与技术创新

Apache Iceberg 赢得未来：2025 年如何前进

出于对 Perforce 的不满，社区计划分叉 Puppe

伪装“计算机工程师”窃取 TB 级数据勒索 25 万美元！前 FBI 特工解析 AI 时代安全危机

2025 年技术指引：让真实案例和经验为开发者开路 | QCon

3000+面试题，17小时专家课：程序员的求职加速包 | 极客时间

数据即将耗尽？大型 AI 公司中没有人会感到恐慌

百川智能发布金融大模型 Baichuan4-Finance，整体准确率领先GPT-4o近20%

机器比人靠谱！Meta 耗时4年半，将 Java 代码转成 Kotlin：进度刚过半，真正难搞的还没开始

资源节省超 50%！作业帮 Spark 全面替换 Hive 的技术实践

接受代码超 16 万行、补全采纳率约 20%，招商证券是如何打造智能化金融科技研发工具的？

软件架构与实验的艺术

Cloudflare 报告：Go 超越Node.js，成 API 客户端首选语言

Airbnb死磕React Native惨败，微软却玩出花！Office、Outlook全线接入，Copilot成最大赢家

开播 10 分钟 5w 观看，GMI Cloud、贾扬清与4 家媒体老板在“AI 出海”直播中聊了什么？

OpenAI 官宣 o3 系列王者模型：能解最难的数学题，单个任务最高花费数千美元，越贵越好用！

奈飞分布式计数器剖析：全球范围内可扩展、准确且实时的计数

AI 开始明抢人类饭碗了！公司全员 AI 化，只重用“工程”背景员工，是转型新风向还是烧家具取暖？

编码神器GitHub Copilot免费版上线！特朗普会见周受资；MiniMax的AI明星Talkie在美消失？| Q资讯

免费 o1 替代品来了！谷歌新发“王炸”推理大模型：思考速度碾压其他大模型，水平堪比理科博士

AWS 云开发工具漏洞可能导致 AWS 账户被彻底接管

曾经的“自动驾驶第一股”急速掉头 AIGC 游戏，CEO 亲述图森未来生死时速这一年

AI 驱动的智能化单元测试生成：字节跳动的实践与创新

作业帮基于 Apache DolphinScheduler 3_0_0 的缺陷修复与优化

豆包视觉理解模型正式发布：一元处理近 300 张高清图片，低于行业价格 85%

在 Lyft 创建 iOS 应用扩展的挑战

OpenAI“双喜临门”：ChatGPT 热线上线，员工“年终奖”最高可达1000万美元

人工智能赋能业务发展研讨：多行业探索 AI 如何驱动行业变革

学好 Prompt，和大模型双向奔赴！| 极客时间

从 CephFS 到 JuiceFS：同程旅行亿级文件存储平台构建之路

智谱完成新一轮三十亿元融资，2024 年商业化收入增长超过 100%

首款开发鸿蒙原生应用的 AI 辅助编程工具正式上线了

后开源时代：开源作者不再是乞求者，而是受益者

新旧交替：AI 时代架构师的进阶之路 |《架构师》电子书下载

首个科学计算基座大模型BBT-Neutron开源，助力突破大科学装置数据分析瓶颈

使用 Rust 重新实现 SQLite 以实现异步 I/O

阿里内部观点：智能化研发一年复盘，我们离真正的 AI 开发还有多远？

AI 重塑技术流程：下半场的破局之道

考虑了很久，还是决定转Go了！| 极客时间

刚刚，ChatGPT Search 向所有用户免费开放！三大升级加剧 AI 搜索竞争，网友：谷歌正式倒闭

Ruby on Rails 8.0 发布，引入 Kamal 2 以改进部署

2024 年度技术热词来袭，AI 如何在可控生成和降本增效中寻找平衡

Ilya Sutskever 在 NeurIPS 2024 的演讲：预训练时代已经结束了

ChatGPT 按提示词数秒完成游戏开发，程序员们该慌了

大型开发者调查结果：哪些 AI 助手最受欢迎？使用 VR 头显编程开始成为趋势

Cloudflare 在 11月发生重大故障，导致日志丢失

OpenAI 史上最长宕机：自研 K8s 成“拦路虎”，导致数小时无法修复

春节假期各大厂卷起来了？腾讯9天垫底；字节跳动在厕所推广“反黑话”运动！OpenAI吹哨人被证实死亡！年仅26岁｜Q资讯

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉