昨日就看到宇宙厂的大瓜了,没想到今天早上直接上了微博热搜榜了。
事情是这样的,昨天在很多微信群爆料,“某头部大厂的大模型训练被实习生入侵,注入了破坏代码,导致其训练成果不可靠,可能需要重新训练。据称遭到入侵的代码注入了 8000 多张卡,带来的损失可能超过千万美元。”
根据相关媒体从知情人士处获悉,该头部大厂为字节跳动。此事发生在今年 6 月,起因是某高校的博士在字节跳动商业化技术团队实习,因对团队资源分配不满,使用攻击代码破坏团队的模型训练任务。
传闻显示,该田姓实习生利用了 HF(huggingface)的漏洞,在公司的共享模型里写入破坏代码,导致模型的训练效果忽高忽低,无法产生预期的训练效果,而且 AML 团队无法核查原因。
但传闻曝出之后,该实习生还在某微信群里辟谣称,自己发完论文后就从字节跳动离职,这个当口有另一个人钻漏洞改模型代码,把锅扣到自己头上。
字节跳动内部已经调查明确此事为田姓实习生所为。
目前,该实习生已被辞退,字节跳动同时把此事同步给行业联盟和该实习生所在的学校。
但这名实习生被辞退后到处 “辟谣” 甩锅,称是其他人所为。
以下是网络爆料的相关图片:
看爆料,不得不说,这哥们心理素质真好,还潜伏在 debug 群里,来了一场攻防大战。
不过,我想说:字节跳动大模型被自家实习生入侵,查了一个多月才查明。这波对字节伤害性不大,但侮辱性极强啊。
另外,字节跳动的安全系统有问题啊,一个实习生就有这么大的权限管理,是不是有问题呢?这件事再次证明,不管多大的厂,技术实力多牛的公司,世界依然是一个巨大的草台班子。
但是,字节的处理方式竟然没有报警,只是辞退 + 同步行业联盟 + 同步情况给学校。这波操作显得字节还挺大度。
毕竟,网传这波损失应该不小。
网友也让 ChatGPT 测算了一下成本损失。
但是,又有网传说其实损失没有那么大,因为受影响的业务不是该厂的大模型,而是商业化技术团队的模型训练任务,也就是影响了广告部门,损失没有传闻中的上千万美元。
不过,不管损失有多大,只要字节报警的话,也都够这哥们判刑的。虽然没报警,但是,这个哥们大概率在这个行业混不下去了。
现在 90 后,00 后整顿职场,不服就干的行为,还是要冷静啊,最起码不要超越违法的范畴啊。这就是杀敌一千,自损一生的的代价。