随着人工智能技术的迅猛发展,其在带来巨大社会经济效益的同时,也带来了前所未有的安全挑战。数据泄露风险、算法偏见、模型被攻击等安全隐患,不仅威胁着企业和用户的利益,更可能对整个社会的稳定和安全造成严重影响。为了应对这些挑战,中国信息通信研究院(简称“中国信通院”)依托中国人工智能产业发展联盟(AIIA),经过深入研究与多年积累,推出了集多项实用工具于一体的人工智能安全“工具箱”,并于2024年12月20日在第五届中国人工智能大赛成果发布会上发布。
该工具箱集成了8项核心工具,每一项都针对人工智能安全的关键环节进行了专门设计,并相应构建起4道坚实的防线。第一道防线侧重于基础环境层的安全,通过代码安全扫描工具和基础设施安全扫描工具,在开发初期全方位保护代码完整性和基础设施资产安全。第二道防线聚焦于数据层的安全防护,运用数据安全管理工具如数据安全沙箱、数据合规扫描工具等,实现数据安全管理和应用,确保核心要素的安全性、完整性与可用性。第三道防线着重于模型构建与训练过程中的安全检测,通过构建AI Safety Benchmark大模型安全测试基准,从内容安全和模型自身安全两个角度,全面评估大模型应用的安全表现;同时,建设大模型安全自动化测试平台,从多个维度(如用户前端、中心服务端、大模型安全评估服务端等)实现对大模型安全性的深度评估,提升模型赋能应用前的安全性。第四道防线则致力于保障人工智能产品在面向用户交互过程中的安全性与稳定性。针对人脸识别等人工智能典型应用,建立人脸识别安全防火墙,开展多种攻击测试(如呈现攻击、注入攻击、对抗样本攻击等),确保应用为用户提供安全、可靠、精准的服务体验。同时,构建深度伪造人脸检测技术综合应用平台,从伪造人脸生成、鉴伪模型鲁棒性测试数据集、伪造人脸识别系统等3个维度,为人工智能应用提供全链路的安全防护。
此外,该工具箱还具备安全评估、监测和防护三大核心能力。安全评估能力依据科学严谨的标准体系,对人工智能系统在不同发展阶段的安全状况进行全面、客观的量化评价,为企业及时发现并解决安全隐患提供精准指导;监测能力将依托大模型风险应急响应平台,动态监测大模型的安全风险,及时发现并预警潜在的安全威胁;防护能力则根据大模型安全监测结果,提供大模型安全对齐方案和“信元令”隐式数字水印解决方案,实现对大模型的安全加固和生成/合成内容的安全管理。
中国信通院发布的人工智能安全工具箱,无疑为人工智能领域的安全防护提供了有力的支撑。后续,中国信通院将联合人工智能行业用户,探索典型行业对人工智能技术应用的安全风险监测、检测、防护方面需求,构建人工智能行业应用的生态,探索建立人工智能行业应用安全的服务范式,护航人工智能在行业落地应用。
未来,中国信通院将持续跟踪技术应用发展和产业关于安全方面的需求,依托工具箱完善安全服务能力,为人工智能技术产业发展提供更加全面、可靠的服务支持。
业务合作联系人:
陈文弢
18500022046(同微信)
chenwentao@caict.ac.cn
校 审 | 谨 言、珊 珊
编 辑 | 凌 霄
推荐阅读