LongCite是一项新研究,旨在增强长上下文大型语言模型(LLMs)的能力,使其能够生成细粒度的句子级引用,从而提高回答的可信度和可验证性。研究团队引入了LongBench-Cite这一自动化基准,以评估当前模型在长上下文问答中的表现,并提出了“从粗到细”(CoF)管道,利用现成的LLMs自动生成带有精确引用的问答实例。通过训练LongCite-8B和LongCite-9B模型,研究表明这些模型在生成准确回答和细粒度引用方面达到了领先水平,超越了包括GPT-4o在内的多种先进模型。
参考:
https://github.com/THUDM/LongCite/tree/main
点个分享、点赞与在看,你最好看~