北大研究生投毒AI训练,耍的字节跳动工程师团团转,故事扑朔迷离,一波三折,真真假假,逼得字节跳动公开发声明。。。

科技   科技   2024-10-21 08:03   美国  


关注飞总聊IT,了解IT行业的方方面面。



最近在网上流的字节跳动发生的北大研究生,在字节跳动实习,攻击AI训练的GPU集群,以及由此展开的一系列真真假假的网络战的故事,可谓一波三折,真真假假,逼得字节跳动公开发声明,真的是一出大戏。


故事的主人是一个叫做田柯宇的实习生,北航本科,送北大研究生。


田柯宇可谓非常的牛逼,开挂一般。不仅仅有国际竞赛银牌这种奖,而且本科的时候就发表了NIPS论文。


简单来说,北大的在读博士表示,他本科的成绩,在北大博士毕业足够了。


这个主人公不但这么牛逼,后续的操作更是间谍一般的存在。


介绍了主人公,那么故事开始了。


最开始的谣言在微信群里面,大概的意思是有个叫田柯宇的,在字节实习,因为团队leader分配资源不公平,就开始利用了huggingface 函数漏洞注入代码,动态修改了别人optimizer的代码。


这个修改以后的代码会随机sleep一段时间,还修改参数梯度的方向。


所谓梯度就是优化的时候,需要向着local minimin去优化的向量方向,在gradient decent (梯度下降法)里面的标准做法。


而且更牛逼的是,这个代码只有GPU 256卡以上的时候才发作,256卡以下没事。


为什么这么做呢?因为平时训练做实验的时候规模小,256卡以下,production的训练规模大,上256卡。


所以平时没事情,上production才搞事情。


这事情,debug的字节跳动工程师死去活来,一个多月,直到恢复了一部分被删文件才搞明白。


更牛逼的是,实习生潜伏在集群调试群里,一旦群里发现了什么问题,他就迅速修改代码,极限攻防。确实是个间谍的好苗子。


这事情,被一些所谓知情人士写成文字放在了GitHub上。具体的信息可以如下网址看到:

https://github.com/JusticeFighterDance/JusticeFighter110


这个GitHub的信息里还包括了一个字节跳动审查实习生田珂宇的录音。

然后,这个事情发生以后,田珂宇在网上公开喊冤,表示事情不是自己做的。是有人陷害自己。


大概的意思就是,田发完论文从字节离职,然后有另外一个人改了模型,并且把锅扣在了田柯宇身上。


而且,网上还有去报警的微信聊天截图。


然后,网上又冒出了另外一个GitHub的网站,说上一个GitHub纯粹造谣,里面的文字一股ChatGPT的味道,具体的信息在这里:

https://github.com/william-sto/JusticeNeverTooLate


意思就是这些都是假的,田柯宇是被冤枉的。


最后,字节跳动因为这个事情,不得不官方出来说话了:


大体上有这么几点,网上流传的字节跳动大模型被实习生攻击,经查,确实有商业化技术团队实习生发生严重违纪行为,已经被辞退,但是网络报道也有夸大的地方:


首先,实习生恶意干扰了商业化团队研究项目的模型训练,但不影响目前的业务(画外音:因为是研究项目),也不涉及字节跳动自己的大模型等其他业务


第二涉及8000多卡,损失上千万美元严重夸大


最后,经核实,涉事人一直在商业化技术团队实习,并没有AI Lab 实习经历,其社交媒体个人简介以及部分媒体报道有误。


该实习生8月份被公司辞退,公司也将其行为同步给学校和行业联盟了。


这声明确实点出了很多事情。首先,损失到底多大之类的,也许真的有夸大成分,毕竟媒体唯恐天下不乱这事情,连我这种写自媒体的也不能免俗。


但是这个声明起码说明了一件事情,有实习生,搞了破坏。但是并没有说,有实习生,搞了破坏并嫁祸给了田柯宇。


还有,有实习生,其没有AI Lab实习经历,其社交媒体上却写了有。


所以,问题来了,到底是田柯宇自己干了这个事情,还是有人干了这个事情,并栽赃给了田柯宇。


在字节跳动官方声明出来之前,这个事情,因为网上我见过太多翻转了,所以我无从判断。


但是字节跳动的声明既然只说了有实习生攻击模型训练,却没有说有实习生攻击模型训练并栽赃给了另外一个著名的实习生,那么这本身也就说明了问题。


而且,字节跳动还非常肯定的强调,该实习生的社交媒体介绍不准确,其在商业化技术团队实习,没在AI Lab 实习。但是实习生社交媒体却说在AI Lab 实习。


问题来了,要不是田柯宇,又是另外一个什么人,社交媒体上面的介绍有问题,还能够顺顺利利栽赃给田柯宇呢?


无论如何,都必须有这样一个牛逼的人在吧。这个人得和田柯宇一样牛逼吧。


在字节跳动这个没有明确点名,却暗戳戳的通过指出只有攻击,没有栽赃,以及攻击者有社交媒体,并且社交媒体介绍不准确这么多信息以后,我想是是非非确实不难判断。


所以,问题来了,如此牛逼的田柯宇,耍得字节跳动工程师团团转,还能潜伏进debug 群里做间谍。


等事情爆发以后,还能够在互联网上发动一把反串,还有GitHub的洗白页面。这种种操作,实在都是太牛逼了。


这个北大学生,品德先不提,智商那确实是一顶一的高,无论搞学习,搞破坏,做间谍,洗地,都是一把高手。不服不行。


最后,用一句话结束这篇文章,聪明人在“努力,不要脸,努力不要脸”,笨蛋的你我还能怎么办?


文末推荐我写的飞总的职场宝典,揭露职场的规则和潜规则,解决码农职场发展的核心问题。有兴趣的可以订阅


飞总聊IT
聚焦互联网IT行业的最新信息,大数据与AI,职场进阶
 最新文章