AI安全大瓜！某互联网公司大模型训练时被员工投毒

文摘 2024-10-19 00:02 湖北

关注兰花豆，探讨网络安全

10月18日，微信群疯传某互联网大厂AI岗位员工因对计算资源分配不满而产生报复心理，疑似对大模型训练参数投毒，利用Hugging face中pickle.load()函数在反序列化过程中可以执行任意数据（包括恶意代码）来达到攻击目的，导致其训练成果无法达到预期，损失将超过千万美元。

Hugging face介绍

首先让我们了解一下Hugging face，号称机器学习领域的“GitHub”，是一家专注于自然语言处理（NLP）和机器学习模型的技术公司。它提供了一个广泛使用的开源库，特别是用于处理和部署基于预训练模型的解决方案。Hugging Face通过其模型库和工具、数据集，简化了NLP和其他机器学习任务的开发、训练、评估和部署流程。

Transformers介绍

Hugging Face Transformers是由Hugging Face创建的深度学习开源框架（注意Transformers和Transformer区别）。它提供API和工具来下载最先进的预训练模型，并进一步调整它们以最大限度地提高性能。这些模型支持不同模式下的常见任务，例如自然语言处理、计算机视觉、音频和多模式应用程序。Transformers支持在PyTorch、TensorFlow和JAX上的互操作性.，这给在模型的每个阶段使用不同的框架带来了灵活性。

.ckpt文件介绍

.ckpt文件通常是用于保存模型检查点（checkpoint）的文件。这些文件存储了模型的权重、优化器状态、训练状态等信息，以便可以恢复模型并继续训练或用于推理。.ckpt文件的作用如下：

保存模型的训练进度：当你在训练深度学习模型时，模型的权重和训练状态会被定期保存为检查点文件，以防止训练中断时丢失进度。

恢复模型状态：通过加载.ckpt文件，你可以从之前保存的状态恢复训练，而不是从头开始。它包含了模型的权重、优化器的状态、学习率调度器的信息等。

攻击过程分析

攻击者通过在.ckpt文件中植入恶意代码，当通过pytorch框架中的torch.load()函数加载进模型，当使用pickle.load()函数反序列化操作时，就会执行恶意代码，从而修改optimizer优化器参数，从而影响模型训练结果。该攻击正是忽略了对.ckpt文件内容的检验，从而导致在正常训练过程中进行反序列化操作时，pickle.load()函数的不安全性导致了可以远程执行任意代码。CVE公布的是Transformers库4.38之前受到影响。以下是漏洞详细信息。

解决方案

避免使用pickle.load()处理不受信任的文件或数据，可以改用更安全的反序列化方法，如果必须使用，确保在隔离环境中执行，并严格限制数据来源。

验证数据来源，仅从受信任的来源加载模型检查点文件，或者对文件内容进行审查，确保来源可靠。

打入安全补丁，升级Hugging Face发布的最新版本。

加强代码审计，对所有人员提交的代码和数据进行严格审计，避免被植入恶意代码。

做好网络隔离，在本地部署大模型进行训练，避免直接与互联网接触。

重视安全管理，在大模型训练的各个环节加强安全管理，强化运维审计。

总结

AI安全的重要性不容忽视，尤其在训练阶段出现问题时，可能导致严重的后果和巨大的经济损失。一旦模型受到攻击或发生偏差，生成的结果可能误导用户，造成信誉损失和法律责任。最近某厂商的AI安全事件正是一个典型的例证，突显了在AI系统开发、部署、训练、测试等过程中，确保安全和可靠性的必要性。为了避免类似事件的发生，企业应加强对AI安全的重视，实施严格的测试和监控措施，以确保模型在各种环境下的稳健性和安全性。只有这样，才能在推动AI技术进步的同时，降低潜在的风险和损失。

历史文章

http://mp.weixin.qq.com/s?__biz=MzI3NzM5NDA0NA==&mid=2247489538&idx=1&sn=9cb3927468a30b7ad932e3a442330cd8

兰花豆说网络安全

提供网络安全行业交流平台，促进网络安全行业思想观点的交流与碰撞。

最新文章

物理隔离网络真的安全吗？

突发！某网络安全公司再遭军队暂停采购

AI安全大瓜！某互联网公司大模型训练时被员工投毒

Intel即将跌落神坛，自主可控才是长久国策

答案揭晓！哪家测绘公司泄露了国家秘密？

不出海就出局！网安企业还是得抱团出海！

“没有绝对安全”这句话不应成为网安行业的“遮羞布”

火了！网络安全人士到底需要什么样的黄金证书呢？

广东省教育厅群发淫秽短信？API安全问题不容忽视！

企业数据安全离不开数据脱敏

细数30个与数据安全相关的技术和产品

数据安全防护中的常见数据泄露途径

行业内卷下的数据安全何去何从？

API已成为企业内部数据泄露的罪魁祸首

股市火爆！系统买崩了？网安人要救火呀！

网络安全从业人员必知的法律法规

网安股要起飞了吗？

暴露面、攻击面、脆弱面是什么？

软件开发安全中必知的开发模型知识

常见拒绝服务（DoS）攻击及其原理

安服到底要不要考渗透测试证书？

BP机爆炸事件与网络战的潘多拉魔盒

网安一哥服务器全部宕机？

祝网安打工人中秋节快乐！

网络安全从业人员必会的目录扫描工具Dirsearch

WordPress网站泄露7千万用户登录凭据，警惕账户接管攻击（ATO）

网络安全从业人员必知的虚拟化技术

网络安全行业的那些，草台班子做法

网络安全从业人员必知的云原生安全

数据库分类分级做完了，接下来怎么用

看完了零信任三大技术，才发现中国没有零信任厂商

从2G到5G，核心网，你到底经历了什么？

量子网络系统研究进展与关键技术丨中国工程科学

数据脱敏，不是你想脱，想脱就能脱

从没有这样一个时刻，大家都希望奇安信能赢

看懂云计算、虚拟化和容器，这一篇就够啦！

区块链和比特币，到底是什么？

网络安全公司将逐步走向分化迎来春天

脱离场景讲数据安全，多少有点耍流氓

关于卫星互联网的最强入门科普

到底谁是安全行业的屠龙少年？

出奇了！某安全公司开启岗位盲盒招聘

对数据安全的解释，得要人听得懂

网安一哥，奇安信凭什么？

对象存储，为什么那么火？

OpenStack入门科普，看这一篇就够啦！

网安企业到了必须要出海谋生的时候了

DevOps到底是什么意思？

到底什么是CDN？

冒充360公司员工诈骗翻车啦！

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉