NeurIPS 2024 | 解锁大模型知识记忆编辑的新路径

创业 2024-11-19 08:23 北京

在当前人工智能的迅猛发展中，大模型的知识记忆能力成为了提升智能系统理解和推理能力的关键。然而，与人类记忆相比，机器记忆缺乏灵活性和可控性，难以在动态环境中实现有效的知识更新与编辑。人类的大脑拥有高度适应性的记忆机制，能够根据外部环境变化及时进行信息的筛选、修正与增强。这种能力不仅使得我们能够精准地获取信息，还可以根据任务需求高效地调用相关知识。
相比之下，现有的大模型主要依赖固定的参数和数据来存储知识，一旦训练完成，修改和更新特定知识的代价极大，常常因知识谬误导致模型输出不准确或引发「幻觉」现象。因此，如何对大模型的知识记忆进行精确控制和编辑，成为当前研究的前沿热点。
本文借鉴认知科学和人类记忆的机制，探讨了大模型终身知识编辑问题，提出了一种基于双重记忆机制的大模型知识编辑方法 WISE, 旨在持续更新大语言模型的世界知识和纠正其幻觉性输出。此工作结合参数化长期记忆和工作记忆，在保持语言模型通用能力的同时可成功对模型进行数千次连续编辑。

论文题目：
WISE: Rethinking the Knowledge Memory for Lifelong Model Editing of Large Language Models
论文链接：
https://arxiv.org/abs/2405.14768
代码链接：
https://github.com/zjunlp/EasyEdit

一、背景与挑战

随着大模型（LLMs）的广泛应用，持续更新其世界知识和纠正幻觉性输出成为一个关键问题。过去的方法在长期模型知识编辑中往往无法同时实现可靠性、泛化性和局部性，这被称为「不可实现三角」（如下图）。

图 1 可靠性、泛化性和局部性之间的度量三角

二、理论基础

2.1 终生模型知识编辑定义

终生模型知识编辑问题专注于对 LLMs 进行连续的、大量的编辑操作，目的是使模型的输出能够与人类预期保持一致，同时保留模型先前的知识与能力 (如图 2 所示)。具体来说，就是通过一系列时间序列上的编辑操作，逐步改进模型对特定查询的处理能力，这些编辑操作由一个不断变化的编辑数据集来驱动 [3,16,17]。

图 2 终生模型编辑任务示意图

终生模型编辑的目标是实现以下三个关键特性：

可靠性（Reliability）：模型能够在顺序编辑后记住当前和之前的编辑操作。
泛化能力（Generalization）：模型不仅仅记住查询-目标对，而是能够理解并泛化到不同类型的查询。
局部性（Locality）：模型编辑操作不会影响与编辑知识无关的预训练知识。

其过程可以描述为：给定一个已经在上预训练的模型 , 当模型需要纠正错误或注入新知识时会使用一个随时间变化的编辑数据集来进行编辑操作。在第 T 个编辑步骤中，模型知识编辑器（Model Editor, ME）接收第 T 个编辑样例和 T-1 步的的模型，并产生修正后的 LLM 模型。遵循以下等式：

是当前编辑步骤的输入，是期望输出；同时保留对过去编辑步骤中输入的记忆，并维持对不相关数据的处理能力。

注意，使用终生模型知识编辑技术并非必须一直编辑大模型，如积累大量新数据后可通过全量微调继续更新大模型的知识。终生模型知识编辑技术适用于小数据持续知识更新和谬误修正。

2.2 语言模型中的知识记忆

在人类认知中，工作记忆为生物大脑提供了暂时保存信息的能力，以便以适应不断变化的环境的方式执行对话、推理和数学等任务。相似地，过去的文献 [8, 9, 10] 表明语言模型的记忆可分为长期（情节性的）记忆和工作记忆（短期）：工作记忆可能存储在神经元的持续激活（推理时的 Activation）中，长期记忆可能存储在模型参数（Weight）中。

我们发现更新的知识驻留在记忆中的位置会影响编辑性能，现有方法可以大致分为两类：编辑长期记忆和编辑工作记忆。长期记忆是通过直接编辑模型参数来更新通用的参数化知识，这种方法会与之前的预训练知识产生冲突，导致局部性较差 (例如 FT-EWC [1]、ROME [2])；而工作记忆则是在推理时通过检索替换神经网络的激活/表征，不修改模型参数。尽管工作记忆方法在可靠性和局部性上表现优异，但其检索到的表征难以实现泛化，导致编辑的知识无法有效推广（例如 GRACE [3]、SERAC [4]）。这些揭示了长期记忆和工作记忆对于终身模型编辑都有缺点。

此外，尽管有一些针对 LLM 架构的特殊记忆设计，如 MemorryLLM [6] 和 Memoria [7]，它们改变了模型架构（大部分 Train from scratch）且不能直接应用于不同的 LLMs。

图 3 当前模型编辑方法的比较

这启发我们提出一个关键科学问题：如何设计适配大模型的知识记忆更新机制，以打破终生知识编辑中的不可能三角？

三、WISE 方法介绍

人类大脑的左右半球在不同任务中的分工给了我们灵感，这启发我们设计了 WISE，一个具备双参数记忆机制的框架。WISE 通过主记忆存储预训练知识，并引入侧记忆来专门存储编辑后的知识。侧记忆可以被视为一种中期记忆，它结合了长时记忆的泛化能力和基于检索的工作记忆的可靠性与局部性。我们仅在侧记忆中进行编辑，并训练一个路由器来决定在处理查询时应使用哪种记忆。

为了实现连续编辑，WISE 还设计了一种知识分片机制，将不同的编辑集合存储在独立的、正交的子空间中，最后将这些编辑合并为统一的侧记忆。主记忆存储模型在预训练阶段学到的知识：

侧记忆（Wv’） 作为一个副本，记录模型在编辑后的更新信息。

知识分片：将侧记忆划分成不同的随机子空间来存储编辑信息。具体来说，对于第 i 个编辑碎片，我们为其生成一个随机梯度掩码 Mi。这些掩码确保了每次编辑都仅在侧记忆的特定子空间中进行，从而实现了编辑的局部化和正交化。

自适应 Gate：采用基于激活的门控策略来决定在给定查询时使用主记忆还是侧记忆。门控激活指示器的计算方式是比较侧记忆和主记忆的激活差异（如下列公式所示）。我们设计了基于边界的损失函数，确保编辑查询的激活指标比无关查询大，具体目标是：编辑查询的激活值应大于无关查询，且两者之间的差异超过设定的阈值 γ

知识合并：通过 Ties-Merge [5] 技术将各个子空间的知识合并为一致的表征，实现参数的高效利用。

四、实验结果

实验结果表明，直接修改模型权重会覆盖预训练的知识，导致新旧知识冲突，破坏局部性，影响模型对非编辑领域的保留。

WISE 在多个任务（如问答、幻觉修正、分布外数据）上表现出色，尤其是在 LLaMA、GPT 等架构中，WISE 大幅超越现有编辑方法。通过评估可靠性、泛化性和局部性三项指标，WISE 在长期编辑中能够有效解决模型冲突问题，并展示了优异的稳定性和扩展性。

五、实验分析

处理长序列持续编辑的潜力

WISE 在 3K 次编辑下表现出色，尤其是 WISE-Retrieve 通过高效的子空间组织和路由机制，能够在较少性能下降的情况下应对大量编辑。

路由激活可视化

WISE 通过激活指标准确区分编辑查询与非相关查询，确保编辑的局部性，并成功将相关查询路由到侧记忆，避免干扰预训练知识。

在 LLM 中的引入位置

应在 LLM 的中间到后期层引入侧记忆。这些层被认为能够更好地处理高级语言现象，并且通过残差连接保持了较低层次的语义信息，使得编辑操作能够更有效地影响模型的输出。

WISE 的额外开销

在编辑次数 3K 时，仅增加了 0.64% 的参数量和 4% 的 GPU 显存需求，且推理时间开销较小，具有较高的计算效率。

六、总结与展望

本文为长期模型知识编辑提供了一种新颖的解决思路，通过侧记忆设计和知识分片技术，在不牺牲模型性能的情况下，实现了知识的有效更新。未来的研究可以进一步优化路由策略，提升侧记忆的检索效率；探索更好的记忆架构，以应对更加复杂的编辑场景。

当前阶段，针对事实和实例记忆等类型的知识编辑，通常采用以下几种方法：外部记忆更新（如 RAG、Memory 等 [12][13]）、局部参数更新（如 ROME [2]、AlphaEdit [11]）或全局参数更新（如微调或对齐）。而对于更抽象的知识类型，如安全性、人格或自我认知等，还可使用运行时干预（Steering [12][13]）或慢思考方法（如借助 o1 思想进行错误修正）。

不断提升大模型的知识处理能力，进而实现通用人工智能（AGI），是学术界与工业界的共同目标。大模型知识编辑技术的突破，不仅能够促进大模型对新知识和新技能的快速、永久习得，还可以实现神经与符号知识之间的高效转换与处理。此外，当大模型出现致命错误或安全隐患时，基于知识编辑技术可以快速定位问题根源，并实现及时的干预和控制。这种技术对确保大模型的可信与安全至关重要。

此外，大模型的知识编辑技术不仅能有效优化模型的表现，还能促进对大模型知识机理的深入研究。通过对参数进行干预与分析，研究人员可以进一步解构并理解「电子大脑」的运作原理。

参考文献

[1] Overcoming catastrophic forgetting in neural networks.

[2] Locating and Editing Factual Associations in GPT.

[3] Aging with GRACE: Lifelong Model Editing with Discrete Key-Value Adaptors.

[4] Memory-Based Model Editing at Scale.

[5] TIES-Merging: Resolving Interference When Merging Models.

[6] MEMORYLLM: Towards Self-Updatable Large Language Models.

[7] Memoria: Resolving Fateful Forgetting Problem through Human-Inspired Memory Architecture.

[8] FROST: A Distributed Neurocomputational Model of Working Memory Maintenance.

[9] Large Language Models with Controllable Working Memory.

[10] Adaptive semiparametric language models

[11] AlphaEdit: Null-Space Constrained Knowledge Editing for Language Models

[12] Retrieval-augmented generation for large language models: A survey

[13] Towards LifeSpan Cognitive Systems

[14] Word Embeddings Are Steers for Language Models

[15] Steering Llama 2 via Contrastive Activation Addition

[16] Enhance Lifelong Model Editing with Continuous Data-Adapter Association

[17] WilKE: Wise-Layer Knowledge Editor for Lifelong Knowledge Editing

作者：王鹏
来源：公众号【ZJUKG】

llustration From IconScout By IconScout Store

-The End-

扫码观看！

本周上新！

“AI技术流”原创投稿计划

TechBeat是由将门创投建立的AI学习社区（www.techbeat.net）。社区上线500+期talk视频，3000+篇技术干货文章，方向覆盖CV/NLP/ML/Robotis等；每月定期举办顶会及其他线上交流活动，不定期举办技术人线下聚会交流活动。我们正在努力成为AI人才喜爱的高质量、知识型交流平台，希望为AI人才打造更专业的服务和体验，加速并陪伴其成长。

投稿内容

// 最新技术解读/系统性知识分享 //

// 前沿资讯解说/心得经历讲述 //

投稿须知

稿件需要为原创文章，并标明作者信息。

我们会选择部分在深度技术解析及科研心得方向，对用户启发更大的文章，做原创性内容奖励

投稿方式

发送邮件到

melodybai@thejiangmen.com

或添加工作人员微信（yellowsubbj）投稿，沟通投稿详情；还可以关注“将门创投”公众号，后台回复“投稿”二字，获得投稿说明。

关于我“门”

▼

将门是一家以专注于数智核心科技领域的新型创投机构，也是北京市标杆型孵化器。公司致力于通过连接技术与商业，发掘和培育具有全球影响力的科技创新企业，推动企业创新发展与产业升级。

将门成立于2015年底，创始团队由微软创投在中国的创始团队原班人马构建而成，曾为微软优选和深度孵化了126家创新的技术型创业公司。

如果您是技术领域的初创企业，不仅想获得投资，还希望获得一系列持续性、有价值的投后服务，欢迎发送或者推荐项目给我“门”:

bp@thejiangmen.com

点击右上角，把文章分享到朋友圈

点击“阅读原文”按钮，查看社区原文

http://mp.weixin.qq.com/s?__biz=MzAxMzc2NDAxOQ==&mid=2650515468&idx=2&sn=e8106a858829315e04c649f93fb39b44

将门创投

将门是一家以专注于数智核心科技领域的新型创投机构，也是北京市标杆型孵化器，由前微软创投在中国的创始团队于2015年底创立。公司致力于通过连接技术与商业，发掘和培育具有全球影响力的科技创新企业，推动企业创新发展与产业升级。

最新文章

Talk预告｜澳门大学田春霖：小参数大作为，揭秘非对称LoRA架构的高效性能

NeurIPS 2024 | 解锁大模型知识记忆编辑的新路径

ECCV 2024 | 南洋理工人体动作生成新范式：统一多模态的动作生成大模型

NeurIPS 2024 | 类脑智能与黎曼图学习：黎曼脉冲神经元初探

Talk预告｜UT-Austin樊志文：端到端从多视角图片解析3D与全景3D生成

NeurIPS 2024 | 让大语言模型使用代码解决图分析推理任务

Talk预告｜中国科学院大学教授高林：高真实感三维建模与生成研究进展

活动报名 | 探秘自主机器人领域：19 位青年报告嘉宾集结，ARTS 2024研讨会震撼来袭！

MoA：混合稀疏注意力加速长文本生成，实现最高8倍吞吐率提升

Talk预告｜香港科技大学叶汉荣：X-VILA - 大语言模型的跨模态对齐

ECCV 2024 | 利用函数映射优化图像对应关系：零样本推理的新方法

Talk预告｜北京大学余旺博：探索视频扩散模型在3D生成和重建中的应用

EMNLP 2024 | 解锁Apple Intelligence：用AppBench一键评测你的手机智能

NeurIPS 2024 | 自监督湍流分析，减少99%标注数据需求

HazyDet：利用深度线索的雾天无人机目标检测开源基准

将门月报 | 文远知行正式登陆纳斯达克、智谱与中国三星宣布战略合作、帷幄与永旺在印尼达成紧密合作......

Talk预告｜香港中文大学汪福运：Rectified Diffusion - 一般扩散模型的ODE轨迹修正

ICML 2024 | 知识感知的强化学习优化的蛋白质定向进化方法

Talk预告｜西安电子科技大学曾泽群：CLIP是否有能力做零样本的图像描述生成？

NeurIPS 2024 | MoGU：用于增强模型安全性并保持其可用性的框架

将门创投早期项目「文远知行」正式在纳斯达克挂牌上市

NeurIPS 2024 | AdaptiveDiffusion - 为每个prompt量身定制的扩散加速方案

ECCV 2024 | 推动纯视觉自动驾驶落地，单目三维检测实时泛化

Talk预告｜南开大学李政：视觉语言模型CLIP的提示学习方法研究

贝联珠贯完成Pre-A轮数千万元融资，将门创投领投

Talk预告｜香港中文大学邵昊：LMDrive - 大语言模型加持的闭环端到端自动驾驶框架

NeurIPS 2024 | VFIMamba：基于状态空间模型的视频插帧新SOTA

业内首个突破十亿参数的时序大模型，引领预测性能新高峰!

活动报名 | 将门横琴科技创新日暨人工智能加速器开业仪式

EMNLP 2024 | 从特征解耦角度重新审视单义神经元及其在对齐算法中的作用

图少样本学习综述：从元学习到预训练和提示学习

Talk预告｜香港科技大学高深远：构建通用可泛化的自动驾驶世界模型

NeurIPS 2024 | 结构信息原理指导的高效智能体探索

Talk预告｜香港中文大学王鸿儒：工具学习 - 杂谈 apple intelligence 和 o1 的异同

ICML 2024 | 论扩散模型采样轨迹的规律性及快速采样算法

ECCV 2024 | 研究残差及跳跃连接的可解释性，层相关性传播LRP在ResNet网络中的适配

北大对齐团队独家解读：OpenAI o1开启「后训练」时代强化学习新范式

Talk预告｜香港科技大学黄华健：高写实三维数字化时代下的在线同时定位和建图

CoRL 2024 | InstructNav：通用指令导航大模型系统

Talk预告｜普渡大学倪瑞祺：基于物理信息机器学习的运动规划

ICLR 2024 | BioBridge：通过知识图谱桥接生物医学基础模型

将门月报 | 格灵深瞳携手北京铁路局、文远知行与Uber达成战略合作、帷幄与华为云建立战略合作伙伴关系......

清华、北大等发布Self-Play强化学习最新综述

ECCV 2024 | 代码开源&方法简单，探索基于相机RAW图像的High-level视觉任务：RAW-Adapter

ICML 2024 | 从拓扑视角出发，10行代码提升类别不平衡图节点分类

Talk预告｜慕尼黑工业大学翟光耀：SG-Bot - 基于场景图生成式模型的机械臂操作和物体重排

300篇文献！大模型走向物理世界：TeleAI发布大模型驱动的具身智能综述

Talk预告｜北京航空航天大学阮受炜：探索视觉感知的3D视角鲁棒性

ECCV 2024 | EchoScene：通过场景图扩散生成3D室内场景

一张图搞定3D视效！深度解读北大、港中文、腾讯等联合开源项目ViewCrafter

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉

NeurIPS 2024 | 解锁大模型知识记忆编辑的新路径

论文题目：WISE: Rethinking the Knowledge Memory for Lifelong Model Editing of Large Language Models 论文链接：https://arxiv.org/abs/2405.14768代码链接：https://github.com/zjunlp/EasyEdit

图 1 可靠性、泛化性和局部性之间的度量三角

二、理论基础

2.1 终生模型知识编辑定义

图 2 终生模型编辑任务示意图

2.2 语言模型中的知识记忆

图 3 当前模型编辑方法的比较

四、实验结果

六、总结与展望

参考文献

论文题目：
WISE: Rethinking the Knowledge Memory for Lifelong Model Editing of Large Language Models
论文链接：
https://arxiv.org/abs/2405.14768
代码链接：
https://github.com/zjunlp/EasyEdit