11.24-4|大规模、超稀疏内存层，推理加速；SAE实体识别，自我认知与幻觉和拒绝回答

文摘 2024-11-24 08:01 浙江

语言模型的知识与记忆机制：大规模、超稀疏内存层，推理加速；SAE实体识别，自我认知与幻觉和拒绝回答

Ultra-Sparse Memory Network

2024-11-19｜ByteDance|🔺14

http://arxiv.org/abs/2411.12364v1
https://huggingface.co/papers/2411.12364

研究背景与意义

在自然语言处理（NLP）领域，随着大规模语言模型（LLMs）的发展，其性能与模型参数数量和计算复杂性呈指数关系。然而，尽管Mixture of Experts（MoE）等方法在一定程度上解耦了参数数量和计算复杂性，仍面临着高内存访问成本带来的推理效率问题。

本文提出的UltraMem架构，通过引入大规模、超稀疏的内存层，显著降低了推理延迟，同时保持了模型性能。该架构不仅展示了优越的扩展性，还在多个基准测试中超越了传统模型，具有重要的理论和实践意义。

研究方法与创新

UltraMem的核心创新在于其超稀疏内存层的设计。该方法通过引入两维逻辑地址和Tucker分解，优化了内存访问效率。具体而言，UltraMem在保持相同计算资源的情况下，能够实现比MoE快6倍的推理速度，同时在内存访问方面表现出更好的稳定性。此外，UltraMem采用了改进的初始化策略、共享查询机制以及隐式值扩展等多项技术，进一步提升了模型的整体性能。

方法创新详解

超稀疏内存层：UltraMem通过稀疏激活机制，减少了内存访问次数，从而降低了推理延迟。
Tucker分解：该方法在查询-键检索中引入了Tucker分解，优化了内存访问的计算复杂度。
共享查询机制：通过在多个键集中共享查询，UltraMem有效降低了查询生成的计算成本。
隐式值扩展：虚拟内存的引入使得模型能够在保持较低内存访问的同时，扩展内存表的大小。

实验设计与结果分析

在实验中，UltraMem在多个基准数据集上进行了评估，显示出其在推理速度和模型性能上的优势。实验结果表明，UltraMem在相同的计算预算下，能够在推理速度上达到最先进水平。通过与MoE和其他密集模型的对比，UltraMem在推理时间和内存访问效率方面均表现出显著的改进。

结论与展望

UltraMem架构的提出，为处理大规模语言模型提供了一种新的思路。通过优化内存访问和引入超稀疏结构，UltraMem在推理速度和计算效率上均优于现有的MoE模型。未来的研究可以进一步探索UltraMem在更大规模模型中的应用潜力，以及如何结合更多的优化策略来提升其性能与效率。

Do I Know This Entity? Knowledge Awareness and Hallucinations in Language Models

2024-11-21｜UPC, ETH Zürich|🔺5

http://arxiv.org/abs/2411.14257v1
https://huggingface.co/papers/2411.14257

研究背景与意义

在大型语言模型（LLMs）中，幻觉现象普遍存在，即生成的文本虽流畅却在事实性上存在错误。这一问题限制了它们在真实世界中的应用，尤其是在医疗等对事实准确性要求极高的领域。尽管已有研究关注于模型的事实回忆机制，但对导致幻觉的机制理解仍显不足。本文旨在填补这一空白，探讨通过稀疏自编码器（SAE）识别实体的能力，从而揭示模型的自我认知能力及其对幻觉和拒绝回答的影响。

研究意义：明确理解LMMs的幻觉机制对于提升模型的可靠性至关重要，能为未来的模型改进提供理论基础。
目标：通过SAE探究模型对已知与未知实体的认知差异，进而分析其在生成回答时的行为。

研究方法与创新

本研究采用稀疏自编码器（SAE）作为主要方法，旨在揭示模型在处理已知和未知实体时的自我认知机制。具体方法包括：

稀疏自编码器的应用：
- 利用SAE分析模型的表示空间，识别出与实体识别相关的方向。
- 这些方向能够指示模型是否能够回忆起特定实体的事实。
实验设计：
- 构建包含不同类型实体（如电影、城市、运动员等）的数据集，使用SAE分析模型对这些实体的认知。
- 通过对比已知和未知实体的反应，评估模型在生成回答时的拒绝行为与幻觉生成的倾向。
创新点：
- 发现SAE中存在的方向不仅影响模型的知识拒绝行为，还能调节模型对实体的注意力。
- 提出通过操控这些方向可以有效减少幻觉生成的概率。

实验设计与结果分析

本研究设计了一系列实验，以验证SAE对模型行为的影响。研究主要分为以下几个部分：

实验设置：
- 使用Gemma 22B和9B模型，设计包含已知和未知实体的查询，记录模型的回答情况。
- 通过SAE分析激活模式，观察模型在不同实体类型下的表现。
结果分析：
- 结果表明，SAE识别的方向对模型的知识拒绝行为有显著影响：增强已知实体的激活会减少拒绝回答的频率，而增强未知实体的激活则会导致几乎100%的拒绝率。
- 通过激活补丁技术，发现模型在处理已知实体时的注意力明显高于未知实体，表明模型的注意力机制在实体识别中起着关键作用。

结论与展望

本研究通过稀疏自编码器揭示了大型语言模型的自我认知机制，具体贡献包括：

识别出影响模型知识拒绝行为的关键方向，提供了对模型行为的深入理解。
发现模型在处理不同类型实体时的注意力机制差异，为改进模型的生成能力提供了新的思路。

未来的研究可以进一步探索如何利用这些发现优化模型的训练过程，降低幻觉生成的风险，并提升模型在实际应用中的可靠性。同时，深入分析这些机制如何在不同类型的任务中发挥作用，将为理解和改进语言模型提供更多的理论支持。

AI研究前瞻

欢迎来到AI研究前瞻 - 您的人工智能研究前沿指南！我们致力于为您提供最新、最前沿的AI研究论文解读和分析，并以通俗易懂的方式呈现其核心思想和潜在影响。一起探索AI的无限可能,共同见证人工智能改变世界的每一步!

11.30-2|自动T2I，prompt生成，模型自动选择，参数自动生成

11.30-3|VTOFF，虚拟试穿，高保真重建

11.30-4|长文本多领域关键词提取；大规模泛非洲英语多专业医学问答数据集

11.30-5|无位姿信息的3DGS重建，自监督

11.29-1|ROICtrl，多实例生成，区域控制；

11.29-2|单目视频生成4D场景；不同视觉层次的高保真文本-3D数据集；3D凸点云，3D表示；3D角色绑定、蒙皮

11.29-3|交错文本-图像生成评估，场景图结构，一致性评估

11.29-4|大模型GUI自动化、GUI智能体综述，人机交互

11.29-5|无需微调的个性化图像生成；VAR解码加速；身份一致性保留视频生成；自动驾驶生成式扩散决策；T2I图像细节层次控制

11.28-1|GUI视觉智能体，操作自动化；草图绘画过程模拟；图像区域感知，区域密集描述

11.28-2|长序列高效推理注意力；免训练多模态无效 token 剔除

11.28-3|UV空间的3D纹理生成；自监督点云表示学习；3D对象生成与理解

11.28-4|多模态大语言模型评估综述；视觉-语言生成奖励模型评估

11.28-5|使用视频生成完成图像编辑；图片对象插入，身份保持，在插入时进行编辑

11.27-1|材质，纹理生成，自由光照高保真渲染；3DGS生成与编辑

11.27-2|T2I零样本ID保持；视觉token因式量化

11.27-3|LLM作为评估者综述；跨模态知识迁移；多头MOE；从GPT-O1中提取长推理链

11.27-4|医疗多模态模型；多模态推荐系统

11.27-5|RAG参与故事视频生成，高一致性；扩散模型ID保持，图像编辑

11.26-1|TÜLU 3，开放后训练全过程；LLM越狱，数据无关的守卫

11.26-2|SNR采样器，T2I风格控制；DiT 图像生成控制；高质量VQA数据集构建框架；降低长视频token数量

11.26-3|SAE解构LLM多义神经元；用游戏评估VLLM复杂推理，空间理解与规划；基于SVD的新视角合成

11.26-4|面部年龄变换，面部衰老合成；机器人真实环境模仿学习与规划；云层分割

11.24-1|多模态混合偏好优化；长链多模态推理数据合成

11.24-2|自回归预训练，生成模型达到判别模型性能；Transformer和SSM头融合的小型语言模型；自动化文献检索和问答

11.24-3|DIT的不同层功能识别与图像编辑；基于DIT的复杂街景数据生成，自动驾驶

11.24-4|大规模、超稀疏内存层，推理加速；SAE实体识别，自我认知与幻觉和拒绝回答

11.24-5|Marco-o1，o1思路实验，蒙特卡罗树搜索，推理树微调；自然语言强化学习

11.24-6|低资源语言与Common Crawl数据集，自动抓取，适配器方法

11.22-1|SageAttention2，4-bit量化，硬件加速；注意力加速

11.22-2|人类感知的视频生成质量评估；文本与视频生成不一致的幻觉，错误分析与纠正

11.22-3|开放式视频分析竞技场，ELO评分；LLM智能体策略树预测

11.22-4|SAM2用于运动追踪；base64风格编码；RGBA图像生成，多层生成策略

11.22-5|BF16对RoPE负面影响，数值稳定性；不同数据分布的scaling laws

11.22-6|器官区域信息驱动的放射报告生成，多模态融合；

11.21-1|LLaMA训练数据集，高质量数据

11.21-2|连续值自回归图像生成，推测解码扩展到连续空间；增强Clip语义分割；感兴趣区域无参考图像质量评估

11.21-3|文本引导的草图动画；软体机器人转笔，自监督学习，手部模拟

11.21-4|AI安全测试，AI透明度；SUTRA分词器，印度语言分词器性能评估

11.15-1|长上下文推理自我改进，最小贝叶斯风险；特征级约束偏好优化，高效偏好优化

11.15-2|大规模第一人称视频数据集；可控动作的T2V生成

11.15-3|新版法语CamemBERT，更新知识；稀疏自编码器解释激活引导向量，大模型控制与调整

11.15-4|长结构，富有表现力符号音乐生成，多尺度注意机制

11.20-1|移动设备多模态大模型，vivo，BlueLM-V-3B；移动设备推理能力测试；MOE缓解多任务混合冲突

11.20-2|生成式世界探索，信念更新；参考视角视频生成；top-nσ采样策略，平衡准确多样；DiT缓存推理加速；视频高斯表示

11.20-3|：验证器工程，后训练范式，监督信号；从零训练的德语1B语言模型

11.20-4|Reranker模型的局限性；医学RAG评估框架

11.14-1|指令微调模型，更大模型悖论，兼容性调整奖励；校正流与自回归结果，多模态理解与生成；高质量图像文本描述数据集

11.14-2|SAMPart3D，分割3D物体不同结构；基于小波的紧凑 latent 编码方法，高压缩倍率表示

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉