ACL 2024中RAG论文整理和简析

文摘 2024-11-06 18:30 中国香港

随着ACL 2024大会的圆满落幕，本文将重点介绍会议中涉及的与Retrieval-Augmented Generation（RAG）相关的论文，探索这一领域最新的研究成果和发展趋势。

Call Me When Necessary: LLMs can Efficiently and Faithfully Reason over Structured Environments

https://aclanthology.org/2024.findings-acl.254.pdf

文章首先介绍了LLMs在处理这类任务时的挑战，即需要进行多跳推理，将自然语言话语与结构化环境中的实例相匹配。

在推理路径生成阶段，LLMs根据问题和给定的主题实体生成初始推理路径。在实例化阶段，系统尝试将推理路径与结构化环境匹配，并在遇到错误时收集错误信息。最后，在编辑阶段，LLMs利用这些错误信息来修正推理路径。

LLM as Prompter: Low-resource Inductive Reasoning on Arbitrary Knowledge Graphs

https://aclanthology.org/2024.findings-acl.224.pdf

KG归纳推理的一个关键挑战是处理文本和结构信息都匮乏的低资源场景。为了解决这一挑战，作者提出了利用大型语言模型（LLMs）生成图结构提示来增强预训练的图神经网络（GNNs），从而为KG归纳推理方法带来新的方法论见解，并在实践中具有很高的通用性。

A + B: A General Generator-Reader Framework for Optimizing LLMs to Unleash Synergy Potential

https://aclanthology.org/2024.findings-acl.219.pdf

提出了一个名为“A + B”的框架，旨在优化大型语言模型（LLMs）以释放协同潜力。这个框架通过将生成器（generator）和阅读器（reader）的角色分开，以提高LLMs在知识密集型任务中的性能和安全性。

文章阐述了“A + B”框架，其中A代表生成器，B代表阅读器。生成器A负责产生与输入查询相关的上下文，需要高度的事实准确性；而阅读器B则负责解释生成的上下文以提供适当的响应，需要认知推理和与人类偏好的一致性。

Uncovering Limitations of Large Language Models in Information Seeking from Tables

https://aclanthology.org/2024.findings-acl.82.pdf

文章介绍了一个名为TabIS（Table Information Seeking）的新基准测试，旨在评估大型语言模型（LLMs）在表格信息检索（TIS）方面的能力。TabIS包含三种典型的TIS场景，并采用单选题格式以确保评估的可靠性。通过对12个代表性LLMs的广泛实验。

TEXT2DB : Integration-Aware Information Extraction with Large Language Model Agents

https://aclanthology.org/2024.findings-acl.12.pdf

文章将信息提取的输出与目标数据库（或知识库）进行整合。这项任务需要理解用户指令来确定提取内容，并根据给定的数据库/知识库架构动态适应提取方式。

设计的框架包括与数据库交互的观察者组件、生成基于代码的计划的规划者组件，以及在执行前提供代码质量反馈的分析器组件。

Graph Chain-of-Thought: Augmenting Large Language Models by Reasoning on Graphs

https://aclanthology.org/2024.findings-acl.11.pdf

Graph-COT的每次迭代包括三个子步骤：LLM推理、LLM-图交互和图执行。文章还包含了数据集的创建过程，包括数据收集、问题模板设计、使用GPT-4生成多样化的问题表达，以及如何从图中自动生成答案。

Citation-Enhanced Generation for LLM-based Chatbots

https://aclanthology.org/2024.acl-long.79.pdf

文章介绍了一种名为Citation-Enhanced Generation (CEG)的新型方法，旨在减少大型语言模型（LLM）聊天机器人在生成回答时可能出现的虚构内容。

Retrieval-Augmented Retrieval: Large Language Models are Strong Zero-Shot Retriever

https://aclanthology.org/2024.findings-acl.943.pdf

文章提出了一种名为“Large language model as Retriever (LameR)”的方法，它利用大型语言模型（LLM）来改善零样本（zero-shot）情况下的大规模信息检索性能。LameR的核心思想是通过提示（prompting）LLM，将查询及其潜在答案结合起来，以增强查询并提高检索质量。

ChatKBQA: A Generate-then-Retrieve Framework for Knowledge Base Question Answering with Fine-tuned Large Language Models

https://aclanthology.org/2024.findings-acl.122.pdf

文章提出了ChatKBQA，这是一个新颖的生成-检索KBQA框架，它首先使用微调的大型语言模型（LLMs）生成逻辑形式，然后使用无监督检索方法检索和替换实体和关系，以更直接地改进生成和检索。

Llama2Vec: Unsupervised Adaptation of Large Language Models for Dense Retrieval

https://aclanthology.org/2024.acl-long.191.pdf

Llama2Vec的核心思想是利用两个预文本任务：EBAE（基于嵌入的自编码）和EBAR（基于嵌入的自回归），来促使LLMs生成能够代表输入文本全局语义的嵌入向量。这种方法简单、轻量级，但非常有效。

MINPROMPT: Graph-based Minimal Prompt Data Augmentation for Few-shot Question Answering

https://aclanthology.org/2024.acl-long.16.pdf

文章介绍了一种名为MINPROMPT的新型数据增强框架，它针对少量样本问答（Few-shot Question Answering, QA）任务，旨在提高问答模型的效率和性能。MINPROMPT通过图算法和无监督问题生成技术，从原始文本中提取最有意义的问答训练样本。

句子图构建模块：利用句子图表示来结构化原始文本，通过图算法识别出覆盖最多信息的句子子集。
数据选择模块：应用近似最小支配集算法来确定最小的句子集合，以覆盖所有共享实体。
问题生成模块：将选定的事实句子转换成问答对，进一步转换成提示，为QA模型提供高质量、信息丰富的训练实例。

备注：进群，进入大模型技术群

id：baobaogpt，记得备注呦

http://mp.weixin.qq.com/s?__biz=MzIwNDY1NTU5Mg==&mid=2247492950&idx=1&sn=0f0019f76dfb3be20efdf347ff53b17d

包包算法笔记

大模型技术和行业认知

最新文章

大模型对齐中的各种loss讲解

微调图像大模型的经验分享

人人都能看懂的RL-PPO理论知识

校招字节开奖，大模型50K*15！准备接了

个人从零预训练1B LLM心路历程

代码大模型OpenCoder技术报告解读

SFT洗数据，有多少细节？

LSTM依然能打！原作者带队最新开源成果吊打Transformer和Mamba

大模型中有哪些形式简单却很巧妙的上分方法？

智谱生成视频升级，告别默片Sora

FlashAttention算法之美：极简推导版

ACL 2024中RAG论文整理和简析

AI搜索的16个局限性和提升建议

图解大模型训练系列：序列并行2，DeepSpeed Ulysses

大模型SFT数据选择方法综述

图解大模型训练系列：序列并行

Perplexity CEO揭秘：不训大模型、关键在于检索、排序、编排

复现 OpenAI o1 的一小步：Steiner 开源模型解析

字节大模型搞推荐，有业务收益了

OpenAI 12月发布最新模型Orion？Altman又辟谣

LLM洗数据：怎么做Continue Pretrain的数据

LLM洗数据：数据或许比算法更重要？大模型剪枝中的校准数据

LLM洗数据：数据去重之Simhash&Minhash分析与实现

小红书用大模型搞推荐

NeurIPS'24｜大模型LoRA超级变体！仅需参数0.4%达微调效率巅峰！

Claude 3.5，学会了用电脑！遥遥领先openAI

Yann LeCun最新演讲：基本上不做LLM了

如何用一个统一的视角，分析RLHF下的各种算法？

终于被CCF A类会议AAAI录用了！！！

万字长文梳理LLM+RLHF的脉络

字节实锤大模型造实习生攻击？这下反而更...

大模型SFT暗藏陷阱？梯度累计有坑

手撕LLM+RLHF+VLM+o1推理，我全都要!!!

Anthropic分享RAG最佳实践：Contextual Retrieval

如何从头训练大语言模型: A simple technical report

Meta视频生成论文解读

写在Ph.D第0年：AI/CV科研菜鸟的进阶之路

KDD Cup 2024 Meta LLMs RAG挑战赛冠军方案开源

DPO的局限性讨论：理论和实践

字节用大模型做推荐。。

今年顶会这情况。。。大家提前做准备吧！

OpenAI o1技术详解3：让模型自我纠错

OpenAI o1 技术详解2：MCTS增强推理（代码级）

红杉专访OpenAI O1团队全文记录

大模型算法岗，Kaggle金牌和CCF A一作哪个更有用？

全是细节｜大模型SFT的100个关键点

也来猜猜 o1 实现方法

多模态大模型技术点总结

OpenAI o1 技术系列1：整体框架，利用Test-Time Scaling Law提升逻辑推理能力

一文讲明白大模型分布式逻辑（从GPU通信原语到Megatron、Deepspeed）

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉