首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

微软团队提出：结合知识图谱和两个解码器，能大大改善LLM的幻觉现象

科技 2024-12-05 00:04

微软团队提出：结合知识图谱和两个解码器，能大大改善LLM的幻觉现象。他们提出了一种名为TrustfulLLM的双解码器架构，两个解码器共享权重：一个处理用户输入，另一个则负责从检索到的信息中提取内容。

然后，将来自这两个解码器输出的结合知识图谱中的事实三元组（[主体，关系，客体]），确保模型生成的文本更加"扎实"，避免不相关或错误的内容出现。

具体设计如下图所示：

双解码器结构：

• 左侧模块（Prompt Decoder）：专门处理用户输入，完成自注意力机制（Self-Attention）和前馈网络的计算。用于理解用户的需求。

• 右侧模块（Guided Context Decoder）：专门处理从检索增强生成（RAG）等方法获取的背景信息（Guided Context）。这些信息可以是知识图谱或外部文档中的验证内容，作为生成的“依据”。

• 权重共享（Shared Weights）：两个解码器在核心网络层（如自注意力和前馈网络）中共享权重，从而提升一致性并减少模型训练负担。

注意力机制（Attention Mechanism）：

• 两个解码器都采用多查询注意力（Grouped Multi-Query Attention）策略，支持大规模的键值缓存（KV Cache），以提升推理效率。

• 特别引入了旋转位置编码（Rotary Positional Encodings），改进了模型在长文本上的表现。

矩阵运算（MatMul模块）：

• 通过矩阵计算（MatMul）将用户输入的查询（Query）与背景信息的键值对（Key-Value）匹配，生成相关性最高的输出。

后续处理（Post-Normalization）：

• RMS归一化（RMS Norm）和SwiGLU激活函数用于每个模块的输出标准化和激活处理，确保数值稳定性和非线性增强。

实验结果方面，研究团队在自家场景上做了测试，像微软产品客服这种要求高准确度的实际应用场景中，LLM的回复在流畅度、一致性和准确性上都有了显著提升。

参考文献：
[1] https://arxiv.org/abs/2411.07870

欢迎大家支持我的知识星球（NLP工程化）：Dify源码剖析及答疑，Dify对话系统源码，电子书籍报告下载，公众号所有付费资料。如果微信群二维码过期，可加个人微信（buxingtianxia21）进群。

NLP工程化知识星球

NLP工程化分享群

专注于对话系统领域的技术分享，重点写《Dify应用操作和源码剖析》专栏。

最新文章

Cherry Studio 是一款支持多个大语言模型（LLM）服务商的桌面客户端

5个开源的LLM构建RAG的方案

Agentarium：一个强大的Python框架，用于轻松管理和协调AI Agent

Alibaba LangEngine：基于 Java 的 AI 应用开发框架

基于Docling和Llama 3.2实现本地部署的一个Excel表格的RAG

Hugging Face正式发布smolagents新型agent框架

Hugging Face 的智能体分级

NeurIPS 2024 LLM推理教程代码：大型语言模型推理Tutorial

Harbor：一站式管理本地AI环境

AI赋能技术栈全景指南

Trend Finder - 全天候社交趋势捕手

Simple CSC：一款基于大型语言模型的中文拼写纠错工具

Resume Matcher 是一个基于 AI 的免费开源工具，用于优化简历

Termite：AI驱动的终端界面生成器

一款将模特穿着服装的图像还原成平铺商品图的工具：TryOffAnyone

计算帝国：1500年以来技术与权力谱系

华佗GPT-o1：一款专为复杂医学推理设计的人工智能模型

分享一款 GitHub 上开源的 LLM 应用评估框架：opik

Deepseek Artifacts，基于 Deepseek V3

一款不错的长故事可视化工具：Story-Adapter

5ire：一款跨平台的LLM桌面客户端

AI读书利器：PDF智能阅读与知识提取工具

AI模型接口管理与分发系统，支持将多种大模型转为OpenAI格式调用

ExtractThinker 是一个灵活的文档智能工具

Anki AI Utils：一套能让你的复习事半功倍的AI工具集

厦大和网易开源的一款统一的故事可视化AI模型：StoryWeaver

NuxtBase 为付费用户提供了一个免费的 Dify 应用模板

Python 项目工程化开发指南

Tiny LLM zh：从零开始的小参数量中文大语言模型

TTPlanetPig Comfyui_TTP_Toolset：提供了一个用于图像平铺和高级控制修改

RVC3-python：《机器人学、视觉与控制（第三版）》的Python代码实例库

南京大学的计算机问题求解课程wiki

讨论如何复现OpenAI的o1模型的论文

一款适合需要实时数据处理或构建AI应用场景的数据处理工具：Pathway

《算法（第4版）》一书中用现代C++实现的算法代码库

语音转博客工具：Robo Blogger，它会自动把你说的内容形成博客文章

LOTUS 数据处理神器：用大型语言模型（LLM）轻松处理数据

FastVideo，用于加速大型视频扩散模型的开源框架

一款在浏览器本地自动实时语音识别系统：Moonshine Web

LLM Confabulation Benchmark：减少产生不存在答案（幻觉或虚构）能力评估工具

一篇以浅显易懂地方式介绍图神经网络（GNNs）的文章

A Survey on LLM Inference-Time Self-Improvement

elizaOS agent-twitter-client：一款无需API密钥的Twitter客户端

《RAG-Driven Generative AI》随书代码

Parlant：面向客户服务的大型语言模型（LLM）智能Agent的行为控制系统

YuLan-Mini：数据高效的开源语言模型

Aria-UI：视觉定位GUI指令，一款能够理解和执行图形用户界面指令的智能工具

RAG应用的日志记录工具：RAG Logger

AIGC工具导航：AI工具大全，分类清晰，应有尽有

smol agents：让AI Agent变得超简单

分类

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉