下一代RAG：MemoRAG

文摘 2024-10-07 12:03 湖南

MemoRAG是一个建立在高效、超长记忆模型之上的创新 RAG（Retrieval-Augmented Generation）框架，由智源研究院（北京人工智能研究院）与中国人民大学高瓴人工智能学院联合推出并开源。

MemoRAG：通过记忆启发的知识发现迈向下一代RAG，为 RAG 提供基于内存的数据接口，适用于多种用途的应用程序！

MemoRAG与主要处理具有明确信息需求查询的标准 RAG 不同，MemoRAG利用其记忆模型实现对整个数据库的全局理解。通过从记忆中回忆与查询相关的线索，MemoRAG增强了证据检索，从而产生更准确、更丰富的上下文响应。

在处理需要对整个数据库进行高级理解的查询时，标准RAG与MemoRAG之间的比较，以《哈利·波特》书籍作为数据库。左侧图，由于输入查询的隐含性质，标准RAG难以准确定位所需的证据，导致答案不够准确。右侧图，MemoRAG构建了覆盖整个数据库的全局记忆。当提出查询时，MemoRAG 首先回忆相关线索，使有用的信息得以检索，从而得到一个精确且全面的答案。

MemoRAG特点

全局记忆：在单个上下文中处理高达100万个token，为庞大的数据集提供全面的了解。
可优化与灵活：轻松适应新任务，仅需几个小时的额外训练即可实现优化性能。
上下文线索：从全局记忆中生成精确线索，将原始输入与答案连接起来，并从复杂数据中解锁隐藏的洞察。
高效缓存：通过支持缓存分块、索引和编码，将上下文预填充速度提高多达30倍。
上下文重用：一次性编码长上下文，并支持重复使用，提高需要重复数据访问的任务的效率。

在三个基准上测试了MemoRAG，使用了三种不同的生成器（Llama3-8B-Instruct-8K、Phi-3-mini-128K、Mistral-7B-Instruct-v0.2-32K），得出以下结论：

主要实验结果。每个版块中最好的结果以粗体显示。这些实验中使用的记忆模型是基于 Mistral-7B-Instruct-v0.2-32K 训练的，可在 HuggingFace 上获取。

MemoRAG 在所有数据集上的表现都超过了所有基线模型，展示了其强大的领域泛化能力。
直接将完整上下文输入到大型语言模型（LLMs）通常比其他 RAG 方法（BGE-M3、Stella-v5 和 HyDE）表现更好。这一发现揭示了标准 RAG 系统在处理长上下文和高级问题方面的困难。
相比之下，MemoRAG 一贯超越了直接使用完整上下文的性能，展示了其有效弥合处理超长上下文和解决复杂任务之间差距的能力。
MemoRAG 在三个领域内数据集上展示了卓越的性能，这表明其潜力可以通过更多样化的训练数据进一步增强。

MemoRAG使用

可以直接用 HuggingFace 模型初始化。通过该MemoRAG.memorize()方法，记忆模型可以在较长的输入上下文中构建全局记忆。

TommyChien/memorag-qwen2-7b-inst可以处理最多400K个token的上下文，
TommyChien/memorag-mistral-7b-inst可以管理最多128K个token的上下文。
通过增加参数beacon_ratio，可以扩展模型处理更长上下文的能力。例如，TommyChien/memorag-qwen2-7b-inst可以处理最多一百万个token beacon_ratio=16。

from memorag import MemoRAG
# Initialize MemoRAG pipelinepipe = MemoRAG(    mem_model_name_or_path="TommyChien/memorag-mistral-7b-inst",    ret_model_name_or_path="BAAI/bge-m3",     gen_model_name_or_path="mistralai/Mistral-7B-Instruct-v0.2", # Optional: if not specify, use memery model as the generator    cache_dir="path_to_model_cache",  # Optional: specify local model cache directory    access_token="hugging_face_access_token",  # Optional: Hugging Face access token    beacon_ratio=4)
context = open("examples/harry_potter.txt").read()query = "How many times is the Chamber of Secrets opened in the book?"
# Memorize the context and save to cachepipe.memorize(context, save_dir="cache/harry_potter/", print_stats=True)
# Generate response using the memorized contextres = pipe(context=context, query=query, task_type="memorag", max_new_tokens=256)print(f"MemoRAG generated answer: \n{res}")

运行上述代码时，编码后的键值 (KV) 缓存、Faiss 索引和分块段落都存储在指定的中save_dir。之后，如果再次使用相同的上下文，则可以快速从磁盘加载数据：

pipe.load("cache/harry_potter/", print_stats=True)

通常，加载缓存权重非常高效。例如，使用内存模型对200K令牌上下文进行编码、分块和索引大约需要35秒，但从缓存文件加载时只需1.5秒。

摘要任务

要执行摘要任务，请使用以下脚本：

res = pipe(context=context, task_type="summarize", max_new_tokens=512)print(f"MemoRAG summary of the full book:\n {res}")

https://github.com/qhjqhj00/MemoRAGhttps://arxiv.org/pdf/2409.05591

http://mp.weixin.qq.com/s?__biz=MzAwMDYzMDM5NQ==&mid=2247484689&idx=2&sn=3796aa8d2708c506f507ed6260414b6c

python爱好者大本营

python爱好者，从小白一同成长，记录学习，记录生活，我们还是天天happy的python工程师

最新文章

网传海尔被曝将收购汽车之家！将裁员30%，官方回应

为什么淘宝京东拼多多可以轻易的被搞定

复旦发布：最佳RAG方案

任正非:世界走向人工智能的潮流不可阻挡

曝阿里元境团队大裁员，真正的数字星球要来了

时代变了！英伟达纳入道琼斯指数，英特尔被取代

这几张图爆炸了，资本主义不仅有王炸，更有深入骨髓的疯狂

王炸已出，擒贼先擒王

马斯克为什么梭哈支持特朗普

1024程序员节，最后的救赎与疯狂

知乎：为什么有人说「百度全面降低了中国的互联网体验」

二十届三中全会以来，支持新质生产力进发展汇报20241020

长沙的公司大量倒闭才能迎来长沙经济的发展，为什么

国内互联网大厂月薪分布，拖后腿了！！！

下一代RAG：MemoRAG

真傻逼定律

MIT系初创打破Transformer霸权！液体基础模型刷新SOTA，非GPT架构首次显著超越Transformer

十一国庆，要烧香拜佛的国防科大智能科学学院院长后续，陈国强中将已任国防科技大学政治委员

火箭发射后，百度(那一伙资本界)再出新花招

知乎：为什么程序员总被认为是屌丝群体？

微信露出爪牙说要封号，吓得我一声尿

抖音七十二变成了九九八十一变，公开挑战二十届三中全会精神尺度越来越大越来越隐晦

谁在阻止人民进步的事业，谁就是当今的反动派

早起庸人说，中国为什么不能再发展庸人经济

天大的真相，我没进百度，我以为是我不行，结果是他们不行

为什么一定要改变这个社会基础，又为什么一定能够改变

说北京朝阳仲裁，朝阳仲裁也不靠谱呀，时间是这样浪费的？

基于大模型的智能精准搜索出现，百度搜索还有还能撑多久

北京法院审判信息网也崩了，资本主义不是盖的，内鬼需要尽快找出来

抖店这个大BUG，出奇得很

刚刚！阿里巴巴集团发布重要公告！我们会狭路相逢勇者胜吗

字节跳动张一鸣与CEO梁汝波共同向南开大学捐赠2亿,是作秀拜佛还是真心？

网传支付宝技术部负责人离职，新的经济体来得还太慢

各大厂支持新质生产力实录20240820,新变化需要新举措，李佩霞这样不行的

12个必须了解的机器学习模型评估指标

智算中心：AI产业化、产业AI化

一边是北京的大数据安全公司不尽快还钱，一边是朝阳区的税务就知道打电话催

中国的成功，离不开权利的支撑

清华状元打响反现代封建主义又一枪，举报明清至今的百年世家大族的局长的将去耶鲁读博士？

阿里大模型元老杨红霞入职香港理工大学，发展新质生产力不是杀富济贫，更不是修正主义

大厂只是一个概念，随时可能土崩瓦解

嘀嗒文库百度搜索之后，抖音商城公然挑战二十届三中全会精神

网传阿里云副总裁离职，网友回复亮了

阿里大模型技术骨干周畅被曝离职，投身AI创业

嘀嗒文库再次秒变百度文库，改革的深水区需要勇气和智慧并存

谁在堂而皇之的犯罪，谁在堂而皇之的视而不见

现在移动支付安全吗？长沙和包支付要接盘？

一元一个手机直接，和我同款，漂亮不漂亮你说了算，马上看图

黄铮回国了？电商大战再次一触即发？往后对拼多多的评价亮了

邀请前工信部出来的合伙人干事儿，他的反应亮了，韵达快递和地方是一个套路？

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉