大家好呀,我是苍何。
今天字节决定起诉实习生赔偿800万这事已经上了热搜了,直接就干到了 1276 万热度。大家都听说了吧?吃瓜的我决定来分析下事情的来龙去脉。
早在今年 9 月份,宇宙厂的某实习生因对团队资源分配不满,利用攻击代码对大模型训练集群进行投毒,破坏团队模型训练任务,而被爆出的时候,已经连续投毒至少 2 个多月🐶
据爆,这不仅仅是单纯的不满,而是恶狠狠的报复,谁知这位同学隐藏在集群的 debug 群里(解决问题的群),查到啥就立马改啥,做到极致攻防,合着这是要当成一项事业来做了😂。
具体怎么实现的呢?据说是利用了软件漏洞,直接往公用模型里写代码,并同时注入到 8000 多张卡,随机修改梯度来让模型训练不及预期。
说白了就是利用漏洞,让模型无法按照预期训练,合着白白训练了几个多月,我帮大家算算损失。
首先假设训练了 3 个月却因修改梯度导致模型无法收敛,这段时间的训练几乎等同于无效工作。还得人工排查问题、修复漏洞,并重新训练模型的时间损失。
其次 GPU 集群计算所需的算力资源损失,我们可以初步算下资源损耗:
假设每张卡平均计算成本为 3 美刀/小时(根据主流云服务商 GPU 定价)。
如果每天训练 24 小时,计算资源的日成本为:
8000卡×3 美刀/小时×24小时=576,000 美刀/天
3 个月的话就是:576,000 美刀/天 × 90天=51,840,000 美刀
最终损失可能是:数百万美元
但实际人字节自己承认,损失没这么大,好把,但估摸着损失也不是一笔小数目了。
于是宇宙厂直接将该实习生辞退,同步行业联盟和同步情况给学校。
本来这事也就这样了掀不起大浪,但同学被辞退后到处辟谣,说是他人做的,和自己无关。
后面在 10 月 19 日结合录音和视频,宇宙厂直接就通报了这件事,并结合 GitHub 的爆料信息,,就已经实锤了。
本来我猜字节是想冷处理了,毕竟辞退通报已经算是酌轻处理了,并没有让其赔偿相关损失。
谁知当事人一直在洗白,甩锅给别人,混淆是非,于是在近日字节就发起对实习生的起诉,要求赔偿公司侵权损失800万元及合理支出2万元,并公开赔礼道歉。
事情就是这么个事情,我们来看看网友总结出他的行为包括但不限于以下几点:
1 修改集群 pytorch 源码,包括随机种子,优化器,数据加载
2 随机kill 多机实验进程,导致大卡实验卡死
3 通过checkpoint打开登陆后门,自动发起攻击随机停止进程
4 参加集群故障排查日会,根据同事排查思路持续定向修改攻击代码 5 修改同事模型权重,造成实验结果无法复现
如果要往深的说,我想估计就得掏出《刑法》第286条:
违反国家规定,对计算机信息系统功能进行删除、修改、增加、干扰,造成计算机信息系统不能正常运行,后果严重的,处五年以下有期徒刑或者拘役;后果特别严重的,处五年以上有期徒刑。违反国家规定,对计算机信息系统中存储、处理或者传输的数据和应用程序进行删除、修改、增加的操作,后果严重的,依照前款的规定处罚。故意制作、传播计算机病毒等破坏性程序,影响计算机系统正常运行,后果严重的,依照第一款的规定处罚。
从这件事中,我们不难得出一些小道理:虽然你我都是打工人,每天和我一起并喷无情的资本家,吐槽公司的卷,但我们都得遵循最基本的职业道德。
什么该干,什么不该干,都得记在小脑袋瓜子里,最低的底线,就是对的起这份工资,不用多干一分,但也不能缺乏底线。
玛雅,又爹味了,对不起,对不起,总之吧,拿人钱财,替人消灾,我们都要做个守护正义的牛马。
好啦,关于字节的这波操作,你有什么看法?欢迎评论区讨论。
...
回归主题。
今天没有算法题,文章是晚上下班写的,而下班都已经九点多了,一个小时的车回家 10 点多,写完文章十一点多,狗命要紧,毕竟明天还要继续做个讨饭的牛马,可不能累坏了自己。
ending
你好呀,我是苍何。是一个每天都在给自家仙人掌讲哲学的执着青年,我活在世上,无非想要明白些道理,遇见些有趣的事。倘能如我所愿,我的一生就算成功。共勉 💪
点击关注下方账号,你将感受到一个朋克的灵魂,且每篇文章都有惊喜。
感谢大家一直以来的阅读、在看和转发,我会把流量主收益都用来发红包,大家可在公众号页面发送相关暗号关键词获取抽奖,每一篇文章会给到一个不同的暗号,对应的抽奖都是独立的,此篇暗号为【800】,在后台回复【800】,即可点击进去参与抽奖!抽奖内容、金额、个数等都无变化,在开奖前参与抽奖,操作均有效。
注意,后台(不是评论区,是后台)回复【800】即可参与抽奖。
后台回复(不是评论区,是后台)即可参与抽奖。
后台回复(不是评论区,是后台)即可参与抽奖。
就像大家之前回复【八股】一样。