NeurIPS 2024｜杜克大学&谷歌提出SLED解码框架，无需外部数据与额外训练，有效缓解大语言模型幻觉，提高事实准确性

科技 2024-12-11 10:01 江苏

点击蓝字关注我们

关注并星标

从此不迷路

计算机视觉研究院

公众号ID｜计算机视觉研究院

学习群｜扫码在主页获取加入方式

论文地址：https://arxiv.org/pdf/2411.02433
项目主页：https://jayzhang42.github.io/sled_page/
Github地址：https://github.com/JayZhang42/SLED
作者主页：https://jayzhang42.github.io

计算机视觉研究院专栏

Column of Computer Vision Institute

此项研究成果已被 NeurIPS 2024 录用。该论文的第一作者是杜克大学电子计算机工程系的博士生张健一，其主要研究领域为生成式 AI 的概率建模与可信机器学习，导师为陈怡然教授。

大语言模型（LLM）在各种任务上展示了卓越的性能。然而，受到幻觉（hallucination）的影响，LLM 生成的内容有时会出现错误或与事实不符，这限制了其在实际应用中的可靠性。

针对这一问题，来自杜克大学和 Google Research 的研究团队提出了一种新的解码框架 —— 自驱动 Logits 进化解码（SLED），旨在提升大语言模型的事实准确性，且无需依赖外部知识库，也无需进行额外的微调。

研究背景与思路总结

近期相关研究显示，尽管用户在访问大语言模型（LLM）时可能无法得到正确的答案，但 LLM 实际上可能已经基于海量的训练数据和漫长的训练周期学到了正确的答案，并将其存储于模型内部某处。

研究者将这类无法直观从模型输出中获得的信息称为 “潜在知识”，并用图一精炼出了对应的 “三体问题”。

图一：Factuality Decoding 的 “三体问题”

图一中，考虑到每条问题的标准答案都已包含训练数据集中，因此可以说训练时，真实世界的事实分布是已知的。LLM 的训练正是为了缩小 LLM 输出分布和真实事实分布之间的差距。

然而，在 LLM 的推理阶段（inference time），真实的事实分布是未知的，因此这项研究的重点便是如何挖掘模型的潜在知识分布，并利用其进一步增强模型的输出。

概括来说， SLED 方法通过对比最后一层的和前面几层的，有效地挖掘了 LLMs 内部的潜在知识。

同时，研究者也指出 LLM 中的潜在知识虽然有价值，但可能并不完美。因此，SLED 不是简单地使用这些潜在知识替换原始输出，而是通过类似于对输出进行 “梯度下降” 的操作，将其整合到原始输出中，从而有效地平衡了两者，避免了过拟合等潜在的风险。

图二：SLED 框架的主要流程

方法设计

为了提高事实准确性，需要确保正确的 token，在输出分布中获得更高的概率。这一过程可以通过优化以下损失函数 L 来描述，其中。

研究者将这一优化过程称为 Logits 进化。有趣的是，这同时也为理解 LLM 的训练提供了新的视角 —— 不同于之前只关注训练中模型参数的更新，可以看到：

LLM 的训练实际上一个是由训练数据集作为外部驱动的 Logits 进化过程；
LLM 的训练为这个优化过程找到的解就是最后一层的输出。

从上面的理解出发，可以预期最后一层的输出的对应的，通常要比前面几层的输出对应的要更接近训练时的。这一点也在图三中得到了验证。

图三：研究者对三个不同规模的 LLaMA-2 模型计算了每一层对应的交叉熵损失。结果证实，就 KL 散度而言，最终层的 Logits 输出分布比所有早期层更接近真实世界的分布

因此，受到经典梯度下降算法的启发，研究者通过如下的近似来反向估计

这里对的估计，实际上也就是之前提到的潜在知识，因此用来表示。在此基础上，研究者通过类似梯度下降的方式，用估计出来的潜在知识，实现了对自驱动进化，

从而得到了一个更接近事实分布的最终输出。更细节的方法设计和讨论，请参考原文。

实验验证

作为一种新型的层间对比解码架构，研究者首先将 SLED 与当前最先进的方法 DoLa 进行了比较。实验覆盖了多种 LLM families（LLaMA 2, LLaMA 3, Gemma）和不同模型规模（从 2B 到 70B），还有当前备受关注的混合专家（MoE）架构。

结果表明，SLED 在多种任务（包括多选、开放式生成和思维链推理任务的适应性）上均展现出明显的事实准确性提升。

此外 SLED 与其他常见的解码方式（如 contrastive decoding，ITI）具有良好的兼容性，能够进一步提升性能。

最后，研究者发现，与以往的算法相比，SLED 在计算上几乎没有明显的额外开销。同时，在生成质量方面，SLED 显著抑制了以往方法中的重复性问题，进一步优化了输出结果。

引申思考：与目前流行的 inference-time 算法的联系

实际上，不难看出，SLED 为后续的推理时（inference-time ）算法提供了一个新的框架。与目前大多数 inference-time computing 方法主要集中于 sentence level 的输出或 logits 进行启发式修改不同，SLED 与经典优化算法衔接，如梯度下降法的结合更为紧密自然。

因此，SLED 不仅优化效率更高，同时有很多的潜在的研究方向可以尝试；另一方面，与 inference time training 方法相比，SLED 不涉及模型参数层面的修改，因此优化效率上开销更小，同时更能保持模型原有性能。

总结

本研究通过引入自驱动 Logits 进化解码（SLED）方法，成功地提升 LLM 在多种任务中的事实准确性。展望未来，可以探索将 SLED 与监督式微调方法结合，以适应其他领域的特定需求如医疗和教育领域。同时，改进框架设计也将是持续关注的方向。

© THE END

转载请联系本公众号获得授权

计算机视觉研究院学习群等你加入！

ABOUT

计算机视觉研究院

计算机视觉研究院主要涉及深度学习领域，主要致力于目标检测、目标跟踪、图像分割、OCR、模型量化、模型部署等研究方向。研究院每日分享最新的论文算法新框架，提供论文一键下载，并分享实战项目。研究院主要着重”技术研究“和“实践落地”。研究院会针对不同领域分享实践过程，让大家真正体会摆脱理论的真实场景，培养爱动手编程爱动脑思考的习惯！

往期推荐

🔗

计算机视觉研究院

计算机视觉研究院主要涉及AI研究和落地实践，主要致力于目标检测、目标跟踪、图像分割、OCR、模型量化、模型部署等研究方向。研究院每日分享最新的论文算法新框架，提供论文一键下载，并分享实战项目。研究院主要着重”技术研究“和“实践落地”！

最新文章

零样本通用分割框架（附源代码）

CRAS-YOLO：多类别船舶检测与分类模型

AI大模型落地不远了！首个全量化Vision Transformer的方法FQ-ViT（附源代码）

Drone-YOLO：一种有效的无人机图像目标检测

“空中城管”上岗丨城管无人机赋能城市精细化管理

CRAS-YOLO：多类别船舶检测与分类模型

YOLO界再起波澜！新一代目标检测器又有新突破！

QueryDet：级联稀疏query加速高分辨率下的小目标检测（代码已开源）

Yolov7实战，实现网页端的实时目标检测

训练好的深度学习模型原来这样部署的！（干货满满，收藏慢慢看）

目标检测干货 | 多级特征重复使用大幅度提升检测精度（文末附论文下载）

NeurIPS 2024｜杜克大学&谷歌提出SLED解码框架，无需外部数据与额外训练，有效缓解大语言模型幻觉，提高事实准确性

超Transformer模型实现SOTA性能！CoMamba或成实时协同感知最有前景的解决方案？

独自一人，怒发顶会！

除了Yolo的其他选择，轻量级检测网络层出不穷（框架解析及部署实践）

AI顶会ICML收了一篇论文：没算法没实验，全靠idea思路好

QueryDet：级联稀疏query加速高分辨率下的小目标检测（代码已开源）

YoloV：视频中目标实时检测依然很棒（附源代码下载）

图像自适应YOLO：恶劣天气下的目标检测（附源代码）

ResNet超强变体：京东AI新开源的计算机视觉模块！（附源代码）

最高加速9倍！字节跳动开源8比特混合精度Transformer引擎

水下检测+扩散模型：或成明年CVPR最大惊喜！

2024新技术：远距离的小目标也可以准确检测

轻量级模型，重量级性能，TinyLlama、LiteLlama小模型火起来了

欢迎加入“计算机视觉研究院”学习群

机场项目：解决飞行物空间大小/纵横比、速度、遮挡等问题引起的实时目标检测问题

视觉语言大模型新SOTA！高效微调方法性能碾压LoRA

YOLO-S：小目标检测的轻量级、精确的类YOLO网络

旋转角度目标检测的重要性！！！（附源论文下载）

245个目标检测开源项目合集，建议收藏！

新技术：高效的自监督视觉预训练，局部遮挡再也不用担心！

最近几篇较好论文实现代码（附源代码下载）

华科&字节提出目标感知基础模型GLEE，一统所有目标感知任务

比标准Attention提速5-9倍，大模型都在用的FlashAttention v2来了

NeurIPS 2024｜杜克大学&谷歌提出SLED解码框架，无需外部数据与额外训练，有效缓解大语言模型幻觉，提高事实准确性

ICLR'25 惊现满分论文！！！走对捷径，高分论文并不难

大改Yolo框架 | 能源消耗极低的目标检测新框架（附论文下载）

RTX 4090可跑、完全开源，最快视频生成模型问世，实测一言难尽

EdgeYOLO：边缘设备上实时运行的目标检测器及Pytorch实现

实用教程详解：模型部署，用DNN模块部署YOLOv5目标检测（附源代码）

半监督辅助目标检测：自训练+数据增强提升精度（附源码下载）

为什么制造业都在用低代码提效？

欢迎加入“计算机视觉研究院”学习群

从源头消除大模型“幻觉”，性价比吊打传统微调方法

Fast YOLO：用于实时嵌入式目标检测（附论文下载）

旋转角度目标检测的重要性！！！（附源论文下载）

YOLO-S：小目标检测的轻量级、精确的类YOLO网络

最后征稿+连续8届检索 | 第九届控制工程与人工智能国际会议(CCEAI 2025)会议地点已定！

智慧建筑：基于YOLOv7的建筑外墙缺陷检测

轻量级模型，重量级性能，TinyLlama、LiteLlama小模型火起来了

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉