LongCite:提升长上下文问答的细粒度引用能力

文摘   2024-11-07 07:45   福建  

LongCite是一项新研究,旨在增强长上下文大型语言模型(LLMs)的能力,使其能够生成细粒度的句子级引用,从而提高回答的可信度和可验证性。研究团队引入了LongBench-Cite这一自动化基准,以评估当前模型在长上下文问答中的表现,并提出了“从粗到细”(CoF)管道,利用现成的LLMs自动生成带有精确引用的问答实例。通过训练LongCite-8B和LongCite-9B模型,研究表明这些模型在生成准确回答和细粒度引用方面达到了领先水平,超越了包括GPT-4o在内的多种先进模型。


参考:

  1. https://github.com/THUDM/LongCite/tree/main



点个享、点赞在看,你最好看~


Halo咯咯
专注于技术知识整理,包含人工智能、大模型、机器学习、深度学习、大数据等多个领域的技术知识,以及各种开源的内容~
 最新文章