ACL 2024中RAG论文整理和简析

科技 2024-11-08 13:46 北京

随着ACL 2024大会的圆满落幕，本文将重点介绍会议中涉及的与Retrieval-Augmented Generation（RAG）相关的论文，探索这一领域最新的研究成果和发展趋势。

Call Me When Necessary: LLMs can Efficiently and Faithfully Reason over Structured Environments

https://aclanthology.org/2024.findings-acl.254.pdf

文章首先介绍了LLMs在处理这类任务时的挑战，即需要进行多跳推理，将自然语言话语与结构化环境中的实例相匹配。

在推理路径生成阶段，LLMs根据问题和给定的主题实体生成初始推理路径。在实例化阶段，系统尝试将推理路径与结构化环境匹配，并在遇到错误时收集错误信息。最后，在编辑阶段，LLMs利用这些错误信息来修正推理路径。

LLM as Prompter: Low-resource Inductive Reasoning on Arbitrary Knowledge Graphs

https://aclanthology.org/2024.findings-acl.224.pdf

KG归纳推理的一个关键挑战是处理文本和结构信息都匮乏的低资源场景。为了解决这一挑战，作者提出了利用大型语言模型（LLMs）生成图结构提示来增强预训练的图神经网络（GNNs），从而为KG归纳推理方法带来新的方法论见解，并在实践中具有很高的通用性。

A + B: A General Generator-Reader Framework for Optimizing LLMs to Unleash Synergy Potential

https://aclanthology.org/2024.findings-acl.219.pdf

提出了一个名为“A + B”的框架，旨在优化大型语言模型（LLMs）以释放协同潜力。这个框架通过将生成器（generator）和阅读器（reader）的角色分开，以提高LLMs在知识密集型任务中的性能和安全性。

文章阐述了“A + B”框架，其中A代表生成器，B代表阅读器。生成器A负责产生与输入查询相关的上下文，需要高度的事实准确性；而阅读器B则负责解释生成的上下文以提供适当的响应，需要认知推理和与人类偏好的一致性。

Uncovering Limitations of Large Language Models in Information Seeking from Tables

https://aclanthology.org/2024.findings-acl.82.pdf

文章介绍了一个名为TabIS（Table Information Seeking）的新基准测试，旨在评估大型语言模型（LLMs）在表格信息检索（TIS）方面的能力。TabIS包含三种典型的TIS场景，并采用单选题格式以确保评估的可靠性。通过对12个代表性LLMs的广泛实验。

TEXT2DB : Integration-Aware Information Extraction with Large Language Model Agents

https://aclanthology.org/2024.findings-acl.12.pdf

文章将信息提取的输出与目标数据库（或知识库）进行整合。这项任务需要理解用户指令来确定提取内容，并根据给定的数据库/知识库架构动态适应提取方式。

设计的框架包括与数据库交互的观察者组件、生成基于代码的计划的规划者组件，以及在执行前提供代码质量反馈的分析器组件。

Graph Chain-of-Thought: Augmenting Large Language Models by Reasoning on Graphs

https://aclanthology.org/2024.findings-acl.11.pdf

Graph-COT的每次迭代包括三个子步骤：LLM推理、LLM-图交互和图执行。文章还包含了数据集的创建过程，包括数据收集、问题模板设计、使用GPT-4生成多样化的问题表达，以及如何从图中自动生成答案。

Citation-Enhanced Generation for LLM-based Chatbots

https://aclanthology.org/2024.acl-long.79.pdf

文章介绍了一种名为Citation-Enhanced Generation (CEG)的新型方法，旨在减少大型语言模型（LLM）聊天机器人在生成回答时可能出现的虚构内容。

Retrieval-Augmented Retrieval: Large Language Models are Strong Zero-Shot Retriever

https://aclanthology.org/2024.findings-acl.943.pdf

文章提出了一种名为“Large language model as Retriever (LameR)”的方法，它利用大型语言模型（LLM）来改善零样本（zero-shot）情况下的大规模信息检索性能。LameR的核心思想是通过提示（prompting）LLM，将查询及其潜在答案结合起来，以增强查询并提高检索质量。

ChatKBQA: A Generate-then-Retrieve Framework for Knowledge Base Question Answering with Fine-tuned Large Language Models

https://aclanthology.org/2024.findings-acl.122.pdf

文章提出了ChatKBQA，这是一个新颖的生成-检索KBQA框架，它首先使用微调的大型语言模型（LLMs）生成逻辑形式，然后使用无监督检索方法检索和替换实体和关系，以更直接地改进生成和检索。

Llama2Vec: Unsupervised Adaptation of Large Language Models for Dense Retrieval

https://aclanthology.org/2024.acl-long.191.pdf

Llama2Vec的核心思想是利用两个预文本任务：EBAE（基于嵌入的自编码）和EBAR（基于嵌入的自回归），来促使LLMs生成能够代表输入文本全局语义的嵌入向量。这种方法简单、轻量级，但非常有效。

MINPROMPT: Graph-based Minimal Prompt Data Augmentation for Few-shot Question Answering

https://aclanthology.org/2024.acl-long.16.pdf

文章介绍了一种名为MINPROMPT的新型数据增强框架，它针对少量样本问答（Few-shot Question Answering, QA）任务，旨在提高问答模型的效率和性能。MINPROMPT通过图算法和无监督问题生成技术，从原始文本中提取最有意义的问答训练样本。

句子图构建模块：利用句子图表示来结构化原始文本，通过图算法识别出覆盖最多信息的句子子集。
数据选择模块：应用近似最小支配集算法来确定最小的句子集合，以覆盖所有共享实体。
问题生成模块：将选定的事实句子转换成问答对，进一步转换成提示，为QA模型提供高质量、信息丰富的训练实例。
来源 | 包包算法笔记

http://mp.weixin.qq.com/s?__biz=MzIxNDgzNDg3NQ==&mid=2247549972&idx=3&sn=3d56ebfec52c24fa73d8542c0882da4d

深度学习与NLP

专注深度学习、NLP相关技术、资讯，追求纯粹的技术，享受学习、分享的快乐。

最新文章

教育部公布！25考研人数，再降50万！

大模型代肝，自动刷《崩铁》升级材料，Claude操纵计算机还能这么用！

一篇小型语言模型技术最新全面综述

M3DocRAG：文档问答用哪个多模态大模型效果最好？

已公示！“东方理工大学”，来了

聊一聊做角色扮演大模型的经验

绝对顶流！清华博导倾力编写的《图神经网络导论》pdf免费分享

最高9.0分！这16篇最高分ICLR2025论文必看！从生成模型到MOE等

ICLR 高分：深入研究多模态大模型的对齐策略

谷歌大佬编写，我唯一熬夜看完的机器学习神作pdf分享！

双非二战字节算法岗，拿下70k offer.....

猫猫运动方程，首次被物理学家破解！ |《美国物理学杂志》正经研究

o1的风又吹到多模态，直接吹翻了GPT-4o-mini

谷歌大佬编写，我唯一熬夜看完的机器学习神作pdf分享！

微调图像大模型的经验分享

昨夜， LLM 已经彻底凉凉了...

Karpathy后悔了：2015年就看到了语言模型的潜力，却搞了多年强化学习

微软开源角色Agents，直接模拟了整个世界~

2024最新神书-《大模型应用程序构建指南》免费pdf分享

2024最新,李宏毅深度学习教程pdf免费分享！绝对值得反复阅读的神书！

已注销！985新校区，不建了

RAG黑盒被打开了，可视化RAGViz闪亮全场

LLM性能优化中的一些概念扫盲

Nature:「人类亲吻难题」彻底难倒LLM，所有大模型全部失败！LLM根本不会推理，只是工具

Cursor一不小心把自家的底牌也放出来了~

[送5本]《动手学机器学习》上海交大ACM班总教头团队重磅新作，带你动手学机器学习！

传说中Ilya Sutskever精选论文清单：AI领域40大论文完整版「破解」完成

神书《从零构建大模型》分享，尚未发布，GitHub标星22k！！

LLM性能优化中的一些概念扫盲

暴跌94%，裁员9600人。。。

[送5本]《大语言模型：原理、应用与优化》大模型未来发展方向大揭秘！

多个中国团队斩获EMNLP'24最佳论文！UCLA华人学者中三篇杰出论文，明年顶会落户苏州

DRL2022新书-《深度强化学习》免费pdf分享

陶哲轩：计算机通用方法，往往比深奥的纯数学更能解决问题

中央批准：中央候补委员、教育部副部长，任C9大学书记

谷歌2024博士奖学金公布，KAN作者刘子鸣等数十位年轻华人学者入选

上交2024最新-《动手学大模型》实战教程及ppt分享！

考古OpenAI RLHF基石之作：探索RL和RM阶段的Scaling Law

【完整视频】黄仁勋对话软银孙正义：打造AI代理和物理AI，强调企业必须在AI浪潮中找准定位

2024最新版，人大赵鑫老师《大语言模型》新书pdf分享

上交2024最新-《动手学大模型》实战教程及ppt分享！

饶毅：全世界没有一个学校把博士后纳入“非升即走”

Scaling Laws终结，量化无用，AI大佬都在审视这篇论文

李飞飞等14位斯坦福微软大牛等撰写《AGENT AI: 综述多模态交互的前沿展望》免费pdf分享

一篇综述告诉你：如何用大语言模型设计算法

SFT洗数据，有多少细节？

LSTM+Transformer王炸创新，荣登Nature...

突发！三星7nm停供！

Ilya认错，Scaling Law崩了？自曝SSI秘密技术路线取代OpenAI

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉