转自:InfoQ
10 月 19 日,字节跳动商业化内部模型训练遭实习生攻击一事引发广泛关注。据多位知情人士透露,字节跳动某技术团队在今年 6 月遭遇了一起内部技术袭击事件,一名实习生因对团队资源分配不满,使用攻击代码破坏了团队的模型训练任务。
截图来源于网络
传言称,该实习生利用了 HF(huggingface)的漏洞,在公司的共享模型里写入破坏代码,导致模型的训练效果忽高忽低,无法产生预期的训练效果。
截图来源于网络
一开始,这名“投毒”的实习生被指认为北京大学的 S 某某。后 S 某某开始在社交媒体上辟谣,声称自己是被造谣的,相关内容未证实的情况下被发表,田某某或才是“真凶”。
随后,GitHub 上公开了田某某的录音,成为实锤证据。据凤凰网科技的报道,相关知情人士在 GitHub 上的表述,“你(指田某)在长达 2 个月的时间里对集群代码进行恶意攻击,对公司近 30 位各级员工造成巨大伤害,让你的同事近一个季度的工作白费。所有的记录和审查都证明这是不容狡辩的事实!”
在录音中,疑似田某承认自己通过更新使代码具有攻击性。他明确向问询人员表示,这样做是因为某些原因让他们感到非常不满。
针对近期“字节跳动大模型训练被实习生攻击”的传闻,字节跳动发布声明回应称,该涉事实习生恶意干扰商业化技术团队研究项目的模型训练任务,但并不影响商业化的正式项目及线上业务,也不涉及字节跳动大模型等其他业务。网传“涉及 8000 多卡、损失上千万美元”严重夸大。
字节跳动称,经核实,涉事人一直在商业化技术团队实习,并没有 AI Lab 实习经历。其社交媒体个人简介及部分媒体报道有误。另外,该实习生已在 8 月被公司辞退。公司也将其行为同步给行业联盟和所在学校,交由校方处理。
- EOF -