机器遗忘：为什么教人工智能忘记至关重要

文摘科技 2024-09-18 00:00 山东

机器遗忘学习允许 AI 模型擦除选定的训练信息片段，而不会对模型性能产生负面影响。

译自Machine Unlearning: Why Teaching AI To Forget Is Crucial，作者 Kimberley Mok。

一旦你学会了某件事，就很难忘记它。可以想象，机器也是如此，尤其是那些在数十亿个参数上训练的大型语言模型(LLM)。在一个大型语言模型在处理语言或生成令人毛骨悚然的图像（这些图像看起来越来越逼真）方面展现出强大力量的时代，许多未解决的伦理问题正在不断涌现。这些问题从 OpenAI 因使用受版权保护的新闻文章训练其 AI 模型而被起诉，到艺术家指责科技公司在未经许可的情况下非法使用他们的艺术作品作为训练数据，不一而足。

当前的 AI 开发状况无疑是一个伦理雷区，这导致了人们对“机器遗忘”的兴趣激增。

“本质上，像 ChatGPT 这样的机器学习 (ML) 模型是在海量数据集上训练的，”Meghdad Kurmanji，华威大学机器学习和数据系统研究助理，博士候选人，向我们解释道。“机器遗忘就是让训练好的模型‘忘记’这些数据中的特定部分。这个概念有几个应用。例如，它可以帮助保护隐私，让个人在 AI 时代行使他们的‘被遗忘权’。想象一下，一个明星的肖像在未经许可的情况下被用于人脸识别系统，可以从模型的记忆中删除。此外，遗忘可以帮助保护版权和知识产权，正如最近涉及聊天机器人模型的诉讼所强调的那样，例如纽约时报与 OpenAI 之间的案件。最后，遗忘可以帮助解决 ML 模型中的偏差，引导我们走向更值得信赖的 AI 系统。”

为什么机器遗忘很重要——以及为什么它很难做到

自从2015 年的一篇论文首次提到以来，这个日益重要的 AI 研究子领域旨在开发能够让 AI 模型有效地“忘记”选定的训练信息片段的方法，而不会对它们的性能产生负面影响——最重要的是，无需从头开始重新训练它们，因为这可能既昂贵又耗时。

但是，从 AI 模型中选择性地删除数据并不像从计算机硬盘中删除文件那样简单。许多模型的功能就像难以解释的、复杂的“黑盒子”，这使得机器遗忘就像从已经烤好的蛋糕中移除一种成分一样容易。

尽管如此，随着围绕人工智能的伦理考量和法规不断发展，这种“遗忘”功能将变得越来越重要，尤其是在涉及安全或隐私问题、有害偏差、过时或虚假信息或不安全内容时。

为此，机器遗忘可以帮助 AI 满足未来数据隐私、公平性和合规性的目标，以及帮助减轻模型中的概念漂移，在这些模型中，数据中的潜在模式可能会随着时间的推移而发生变化，从而导致预测精度降低。

机器遗忘的类型

总的来说，机器遗忘可以分为两种方法：精确遗忘和近似遗忘。

精确忘却：也称为完美忘却，它需要从头开始重新训练 AI 模型，但不需要删除的数据。这种方法的优点是它确保了特定数据点的移除不会损害模型的性能，缺点是它通常需要大量的计算资源，并且最适合不太复杂的 AI 模型。

精确忘却的例子包括反最近邻 (RNN) 等技术，它通过调整与要删除数据点相邻的数据点来补偿数据点的移除。K 近邻是一个类似的技术，但它基于数据点与其目标数据点的接近程度来删除数据点，而不是调整它们。

另一种精确的遗忘方法是将数据集分成两个单独的子集，然后训练两个部分模型，之后可以在称为分片（sharding）的过程中合并它们。如果需要从集合中删除特定的数据点，那么可以修改该特定数据集，并在再次分片之前使用它来重新训练部分模型。

近似遗忘：又称有界或经过认证的遗忘，其目的是将未学习过的数据的影响最小化（而不是完全消除）至可接受的程度。近似遗忘方法在以下使用场景中可能更可取：受到计算资源和存储成本的约束，或者需要更加灵活的解决方案。近似遗忘方法的缺点在于，它们并不会完全消除未学习过数据的所有痕迹，并且很难验证或证明遗忘过程的有效性。

近似遗忘的一个例子是局部离群因子 (LOF) 技术，该技术在数据集中识别并清除离群数据点以增强模型性能。

类似地，诸如隔离森林 (IF) 之类的算法可用于创建决策树，这些决策树具有随机子抽样数据，这些数据基于随机选择的特征进行处理，目的是评估可被丢弃的任何明显异常。与确切的遗忘方法相比，这些近似的遗忘方法更容易适应大型模型，如 LLM。

遗忘并非万能药 - 至少现在还不是

目前，还没有一种万能的解决方案可以解决机器遗忘的不同应用，尽管像 Kurmanji 这样的研究人员正在努力开发更通用的遗忘工具。

在 Kurmanji 的案例中，他和沃里克大学和谷歌 DeepMind 的研究人员团队创建了一个名为 SCRUB 的工具，它有可能解决各种问题，从消除偏差，保护用户隐私到解决模型中由于数据标记错误而导致的混淆。

“SCRUB 的设计基于机器学习中的一种方法，称为‘师生’框架,” Kurmanji 说。“它的工作原理如下：一个预训练模型（‘老师’）指导新模型（‘学生’）的训练。SCRUB 将这个概念更进一步。在训练新模型时，SCRUB 使其对我们想要遗忘的数据‘不服从’老师模型，而对其他数据‘服从’老师。这种相互作用是通过最小化或最大化模型输出之间的相似性度量来管理的。但是，SCRUB 有时会过度遗忘数据点，使其变得明显。这就是[算法] SCRUB+R 的用武之地，它对遗忘过程进行微调，以控制遗忘的程度。”

机器遗忘仍然面临着许多挑战，无论是缺乏标准的评估指标，还是与兼容性和可扩展性相关的潜在问题。但随着更大、更复杂的 AI 模型出现在地平线上，机器遗忘的概念将成为该过程越来越不可或缺的一部分。也许这将促使 AI 专家与法律、数据隐私和伦理领域的专业人士更紧密地合作，以更好地定义未来的负责任的 AI实践和工具可能是什么样子。

http://mp.weixin.qq.com/s?__biz=MzIzMzcxMTUxOQ==&mid=2247494738&idx=3&sn=09492a6a244eea5dba00ba26ebfb9473

云云众生s

云原生践行者

最新文章

将CURSOR AI作为开发工作流程的一部分

NVIDIA AI应用平台NIM开发人员指南

机器遗忘：为什么教人工智能忘记至关重要

成为AI高级用户：AI领域的成功策略

JAVASCRIPT、PYTHON和JAVA位列语言排行榜前列

PYTHON中如何使用继承

在Python代码中使用JSON的方法

PYTHON TRY…EXCEPT的使用

用于DOCKER CI/CD的DAGGER和安全漏洞

向量数据库基础：HNSW

云应用文档质量差让你头疼？打破循环

共享服务平台是否过于限制？

两个减少DEVOPS摩擦的开源AI工具

你应该成为合同工吗？

功能标志无法阻止CrowdStrike停机

开发人员：网络安全的首道防线

KUBERNETES超越RBAC – 通过WEBHOOK自定义授权

REMOCAL开发：高效KUBERNETES工作流的未来

KUBERNETES上数据管理 (DOK)的四种解决方案

SUSE将STACKSTATE与RANCHER结合用于KUBERNETES可观测性

Cursor AI设置AI编码辅助标准的5种方式

Copilot自动修复：AI解决代码漏洞难题

AI编码助手的12个注意事项

英伟达硬件路线图及其对开发者的影响

学习LINUX？从这里开始

无处安放的代码-重读《企业应用架构模式》

GRAPHQL与OPENAPI：数据治理的优缺点

使用单一跟踪节省三个月的延迟

使用Cookie和Token处理程序保护单页应用程序

领域特定AI：AISERA对企业需求的答案

大型语言模型函数调用入门

解决POSTGRESQL逻辑复制的挑战

OPENTELEMETRY COLLECTOR简介

无需GPU运行AI的情况：一个“FARM FRESH”案例研究

JetBrains增强AI代码补全功能

大语言模型如何指引我们走向配置和编码的幸福之路

AI驱动的可观测性：从AIOPS的失败中汲取教训

与数据对话：大型语言模型正在改变AIOps

车辆互联领域的快速创新正在催生新的开发者角色

即使是数据驱动型公司也无法充分发挥数据的潜力

史蒂夫·沃兹尼亚克重聚历史悠久的家庭酿造计算机俱乐部

周五部署？暂停令无法实现令人钦佩的目标

一家公司重新思考Diff以缩短代码审查时间

使用数据库编程在POSTGRESQL上构建石头剪刀布游戏

ELASTIC意外回归开源背后的原因是什么？

GPU共享技术指南：VGPU、MIG和时间切片

使用JAVASCRIPT构建可扩展的实时应用程序

人工智能驱动的服务模型加速故障排除

Bechtle平台工程重塑软件开发

Supabase如何构建其平台工程策略

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉