360发布大模型安全警报：近40个漏洞易被利用，60美元即可投毒

科技 2024-11-26 18:59 北京

扫码订阅《中国信息安全》

邮发代号 2-786

征订热线：010-82341063

11月25日，360数字安全集团漏洞研究院发布了全球首份一份《大模型安全漏洞报告》，揭示了当前以大模型为核心的大量技术应用在计算机安全领域带来的诸多新风险和挑战。据报告统计，360安全团队在近期的研究中挖掘了近40个大模型相关的安全漏洞，覆盖模型层、框架层、应用层三大层面，甚至其中很多漏洞可以被攻击者轻易利用，仅需花费60美金就能毒害大模型数据集！

报告中指出，大模型作为人工智能（AI）中的重要一环，其能力随着平台算力的提升、训练数据量的积累以及深度学习算法的突破，得到了进一步的提升。然而，与此同时，大模型也带来了新的安全问题。攻击者可以通过对模型训练、验证等环节施加影响，使得模型无法正常完成推理预测，甚至操控模型执行未经授权的行为或生成不当内容。

在模型层安全方面，报告特别提到了数据投毒攻击。这种攻击方式通过恶意注入虚假或误导性的数据来污染模型的训练数据集，从而影响模型在训练时期的参数调整，最终破坏模型的性能或使其生成有害的结果。值得注意的是，数据投毒并非仅仅是理论上的攻击方式，而是已被证明会带来实际的风险。攻击者可以通过两种方式实施数据投毒：一是利用未经过有效清洗的开源第三方数据集或互联网内容形成的数据集；二是在模型周期性使用新数据进行重新训练的过程中进行投毒。有研究表明，仅需花费60美元，攻击者就能毒害0.01%的LAION-400M或COYO-700M数据集，而引入少至100个中毒样本就可能导致大模型在各种任务中生成恶意输出。这表明在可接受的经济成本范围内，攻击者已经可以有针对性的向开源数据集发起投毒。

除了数据投毒外，报告还揭示了其他多种模型层安全攻击方式，包括后门植入、对抗攻击和数据泄露等。后门植入攻击通过在模型中策略性地植入特定的“后门”，以便在特定条件下控制或操控模型的输出。这种攻击方式具有隐蔽性高、影响范围广等特点，并且可以通过数据投毒或修改存储在云平台中的模型文件等方式实施。对抗攻击则是对模型输入数据进行小幅度但有针对性的修改，从而使得模型产生错误预测或决策。在图像处理模型和大语言模型上，这种攻击方式都已被证明是有效的。数据泄露则是指模型在训练过程中可能接触到未经良好脱敏的隐私数据，并在特定诱导下泄露敏感内容，造成直接危害。

除了上述提到的模型层安全方面，在框架层、应用层安全方面都存在不少安全问题。针对这些威胁隐患，报告建议从多个方面加强大模型的安全性。首先，在模型层方面，需要加强对训练数据的清洗和验证，防止数据投毒和后门植入等攻击。其次，在框架层方面，需要加强对框架的安全审计和漏洞修复，提高框架的安全性和稳定性。最后，在应用层方面，需要加强对AI应用程序的安全开发和测试，确保应用程序的安全性和可靠性。

360漏洞研究院的这份报告揭示了当前大模型面临的安全挑战和漏洞风险，为构建更加安全、健康的AI数字环境提供了有益的参考。同时，也提醒了业界和广大用户在使用大模型技术时需要注意安全问题，加强安全防护措施。

分享网络安全知识强化网络安全意识

欢迎关注《中国信息安全》杂志官方抖音号

《中国信息安全》杂志倾力推荐

“企业成长计划”

点击下图了解详情

http://mp.weixin.qq.com/s?__biz=MzA5MzE5MDAzOA==&mid=2664230673&idx=2&sn=6b7f7b55158483f87608d00cc4d2ea5d

中国信息安全

《中国信息安全》杂志，介绍国内外最新网络安全动态，深度解读网络安全事件。

最新文章

招聘启事 | 中国信息安全测评中心招聘安全测评人员

发布 | 中共中央办公厅国务院办公厅关于数字贸易改革创新发展的意见

专家解读 | 鲁传颖：“十大议题”谋划全球人工智能治理的主要方向

解读 | ICANN前董事会成员解读《全球数字契约》

聚焦 | 2024AI数字安全发布会在上合示范区成功召开

前沿 | 人工智能热潮可能正遭遇瓶颈

评论 | 治理涉企谣言，落实数字平台“看门人”职责

报名近尾声！千余支队伍将竞争第二届“长城杯”铁人三项赛

发布 | 七部门联合印发《推动数字金融高质量发展行动方案》（附全文）

国家网信办网络法治局：筑牢网络暴力治理法治之基

专家观点 | 适应网络空间技术特征有效捍卫我国网络主权

前沿 | 深入探讨网络暴力违法犯罪行为的认定标准

国际 | 数据主权博弈与跨境管辖权冲突的法律困境

前沿 | 网络水军的发展演进及其特征研究

专题·网暴治理 | 在法治轨道上持续推进网络暴力治理

杂志征订 | 2025年《中国信息安全》杂志征订开始！

专家观点 | 李峥：科技强者恒强？AI可能例外

观点 | 坚持依法治网推进网络综合治理

评论 | 压实主体责任，规范算法技术

前沿 | 构建“全链路”数据质量管控体系，夯实数据应用底座

评论 | 让自动驾驶汽车行驶在法治轨道上

发布 | 四部门联合印发《电信网络诈骗及其关联违法犯罪联合惩戒办法》（附全文）

360发布大模型安全警报：近40个漏洞易被利用，60美元即可投毒

国家安全部：警惕深度伪造技术带来的安全风险

图说 | 《电信网络诈骗及其关联违法犯罪联合惩戒办法》

行业 | 系统复盘积极展望百家银行齐聚畅谈数字金融顶层设计与精准施策

评论 | 让算法更具向上向善的价值观

关注 | 网络婚恋诈骗手段翻新需提高警惕

全球视野 | 国际网安快讯（第38期）

行业 | 360发布全球首份《大模型安全漏洞报告》，曝光近40个大模型相关安全漏洞

关注 | 四部门开展“清朗·网络平台算法典型问题治理”专项行动

关注 | 建设100个以上可信数据空间，这份文件以可信安全促要素流通

前沿 | 推动构建网络空间命运共同体迈向新阶段

专家观点 | 法律监管+技术人工审核：提升AI内容输出可控性

国际 | 印度惊现“数字逮捕”电诈骗局

关注 | 多名网络主播被约谈！

发布 | 国家数据局印发《可信数据空间发展行动计划（2024—2028年）》（附全文）

专家解读 | 什么是可信数据空间？国家针对这一新型数据基础设施进行布局

一图读懂 | 可信数据空间发展行动计划（2024—2028年）

《中国信息安全》2024年第9期目录

聚焦乌镇 | 全球AI大模型攻防挑战赛乌镇收官：十强选手现场用AI对抗AI 保护大模型安全

警惕 | 针对我国用户的“银狐”木马病毒出现新变种！

通知 | 国家数据局就《国家数据基础设施建设指引（征求意见稿）》向社会公开征求意见（附全文）

重点防范！又公布一批境外恶意网址和恶意IP

关注 | 《2024中国数字银行调查报告》发布

关注 | 缅北规模化电诈园区全部被铲除

前沿 | 《密码法》颁布五周年：法治成效、实施难点与未来走向

聚焦乌镇 | 《中国互联网发展报告2024》和《世界互联网发展报告2024》蓝皮书发布

聚焦乌镇 | 2024年世界互联网大会乌镇峰会主论坛举行

外交部：中方愿与各方深化数据跨境流动领域交流合作

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉