损失上千万美元?字节澄清“实习生破坏大模型训练”事件

文摘   2024-10-19 16:56   四川  

近日,字节跳动就近期流传的“实习生破坏大模型训练”事件发布了正式澄清说明。这一事件引发了广泛关注,以下是对该事件的详细梳理和分析。


传闻始于2024年10月18日,多个微信群流传消息称,某头部大厂的大模型训练被实习生入侵,注入了破坏代码,导致其训练成果不可靠,可能需要重新训练。据称,遭到入侵的代码注入了8000多张卡,带来的损失可能超过千万美元。随后,相关消息指出该头部大厂为字节跳动。

传闻显示,一名田姓实习生利用了HF(huggingface)的漏洞,在公司的共享模型里写入破坏代码,导致模型的训练效果忽高忽低,无法产生预期的训练效果,AML团队也无法核查原因。然而,在传闻曝出后,该实习生在某微信群里辟谣称,自己发完论文后就从字节跳动离职,是另一个人钻漏洞改模型代码,将责任推到了自己身上。


针对这一传闻,字节跳动于10月19日发布了事实澄清。经公司内部核实,确有商业化技术团队实习生发生严重违纪行为,该实习生已被辞退。但澄清说明中也指出了部分报道存在的夸大及失实信息:


涉事实习生恶意干扰的是商业化技术团队研究项目的模型训练任务,并不影响商业化的正式项目及线上业务,也不涉及字节跳动大模型等其他业务。

网传“涉及8000多卡、损失上千万美元”严重夸大。


经核实,涉事人一直在商业化技术团队实习,并没有AI Lab实习经历,其社交媒体个人简介及部分媒体报道有误。


此次事件虽然并未对字节跳动的商业化正式项目及线上业务造成直接影响,但也暴露出公司在技术训练安全管理方面存在的问题。一位技术安全专家指出,此事暴露了字节跳动技术训练既没做权限隔离,也没有做好共用代码的审计。正常情况下,每次大的代码变动必须做审计,无论谁做操作都有痕迹记录,一个人想动代码是不可能的。


字节跳动表示,已将此事同步给阳光诚信联盟和企业反舞弊联盟,以及该实习生所在的学校,交由校方处理。这一举措体现了公司对内部管理的重视和对违规行为的零容忍态度。



智汇Tech
致力于成为连接科技前沿与大众视野的桥梁。紧跟科技发展的步伐,聚焦人工智能、半导体、物联网、大数据、云计算等前沿科技领域,为读者带来最新的科技资讯。
 最新文章