字节回应大模型训练被实习生攻击

科技   2024-10-23 08:31   浙江  

转自:InfoQ

10 月 19 日,字节跳动商业化内部模型训练遭实习生攻击一事引发广泛关注。据多位知情人士透露,字节跳动某技术团队在今年 6 月遭遇了一起内部技术袭击事件,一名实习生因对团队资源分配不满,使用攻击代码破坏了团队的模型训练任务。

截图来源于网络

传言称,该实习生利用了 HF(huggingface)的漏洞,在公司的共享模型里写入破坏代码,导致模型的训练效果忽高忽低,无法产生预期的训练效果。

截图来源于网络

一开始,这名“投毒”的实习生被指认为北京大学的 S 某某。后 S 某某开始在社交媒体上辟谣,声称自己是被造谣的,相关内容未证实的情况下被发表,田某某或才是“真凶”。

随后,GitHub 上公开了田某某的录音,成为实锤证据。据凤凰网科技的报道,相关知情人士在 GitHub 上的表述,“你(指田某)在长达 2 个月的时间里对集群代码进行恶意攻击,对公司近 30 位各级员工造成巨大伤害,让你的同事近一个季度的工作白费。所有的记录和审查都证明这是不容狡辩的事实!”

在录音中,疑似田某承认自己通过更新使代码具有攻击性。他明确向问询人员表示,这样做是因为某些原因让他们感到非常不满。

针对近期“字节跳动大模型训练被实习生攻击”的传闻,字节跳动发布声明回应称,该涉事实习生恶意干扰商业化技术团队研究项目的模型训练任务,但并不影响商业化的正式项目及线上业务,也不涉及字节跳动大模型等其他业务。网传“涉及 8000 多卡、损失上千万美元”严重夸大。

字节跳动称,经核实,涉事人一直在商业化技术团队实习,并没有 AI Lab 实习经历。其社交媒体个人简介及部分媒体报道有误。另外,该实习生已在 8 月被公司辞退。公司也将其行为同步给行业联盟和所在学校,交由校方处理。


- EOF -

推荐阅读  点击标题可跳转

1、千万级数据的全表 update 正确姿势

2、发现一款JSON可视化工具神器,惊艳了!

3、京东:MySQL 中的 distinct 和 group by 哪个效率更高?太刁钻!

数据分析与开发
「数据分析与开发」分享数据分析与开发相关技术文章、教程、工具
 最新文章