让大模型推理更安全可信,蚂蚁集团这项解决方案获奖

企业   2024-11-29 18:28   浙江  




11月26日上午,由国家金融业密码应用研究中心、清华大学密码理论与技术研究中心指导,由中国密码学会支持,由中国金融电子化集团有限公司、江苏金服数字有限公司主办的“2024年‘金融密码杯’密码应用和技术创新大赛颁奖仪式”在苏州圆满落幕。


来自国内外的企业代表、金融投资机构负责人、专家学者、选手代表齐聚一堂,全力推动金融密码领域创新研究成果落地转化,为地方更好实现创新链产业链资金链人才链深度融合贡献力量。国家密码管理局相关领导、中国人民银行数字货币研究所副所长狄刚、苏州市副市长季晶、中国科学院院士王小云出席活动并致辞。苏州市委常委、常务副市长顾海东出席颁奖典礼。


蚂蚁密算联合蚂蚁数科、网商银行及山东大学共同提出的“AI推理场景下基于可信执行环境的零知识应用证明与加速”方案荣获本次大赛“创新赛团队三等奖”


以ChatGPT为代表的大模型推理场景在近两年获得了广泛的关注,然而大模型应用中所涉及的隐私问题也尤为突出。现有的隐私计算技术中,目前仅有TEE在大模型推理场景下有较好的性能表现,但单纯依赖TEE技术并不足以解决大模型推理场景下面临的所有隐私保护需求。


基于此,本次获奖方案主要提出了一种适合在大模型推理场景下进行GPU加速的TEE框架 HyperGPU,并在其基础上使用零知识证明 zkSNARK 算法强化对机密虚拟机中应用进行远程证明的功能,使推理服务的用户有对神经网络参数进行直接验证的能力。同时,提出了TEE 下使用多卡GPU加速ZKP证明生成的DistMSM 方案,以提升证明速度。


HyperGPU是基于蚂蚁密算开源的星绽TEE HyperEnclave设计的GPU TEE框架,可以实现对AI算力硬件最小化的修改,实现TEE环境下AI加速卡安全设备直通。通过HyperGPU的高兼容性灵活设计,可以在TEE环境下保护现有设备使用中安全,平衡AI加速和密码运算加速算力。


HyperGPU使用机密虚拟机技术,支持对虚拟机中的应用镜像进行可信证明,由用户通过远程证明来验证镜像的合法性。在应用证明中通过 zkSNARK算法增加零知识证明功能,实现用户可以对镜像中模型参数的质量进行直接验证,并且不泄漏关于模型参数的隐私信息


另外,通过蚂蚁集团与山东大学合作研发的多卡 GPU加速方案DistMSM,则可以针对 zkSNARK 中占用主要计算时间的MSM运算进行多卡加速,以实现将AI推理质量证明时间由原来的一个多小时缩短至3分钟,使得推理质量的证明时间得到数量级的提升


“AI 推理场景下基于可信执行环境的零知识应用证明与加速”方案,为使用推理服务的用户提供了更强的远程证明能力,同时降低引入 ZKP 对原有的 TEE 应用证明所产生的影响。在金融风控和营销场景等会涉及使用第三方模型对客户数据进行推理分析的场景中,本方案也可实现对客户数据进行更强的隐私保护和安全管控



未来,蚂蚁密算将持续在投入大模型各场景的隐私保护技术方案建设,不仅针对推理场景,还将在预测、微调等场景中,通过蚂蚁密算的隐私计算、机密计算等能力,保护各模型方与用户的隐私数据,逐步形成大模型全链路隐私保护方案。

蚂蚁技术AntTech
科技是蚂蚁创造未来的核心动力
 最新文章