距离秋招(冬招)结束也有一段时间了,周围的朋友们部分都收到了满意的offer。通过我和大佬们的交流,觉得他们能收到很高的of也并非偶然,在赛道越来越卷的大模型方向,每个即将校招的同学都想参与其中。对于Infra来说,我感觉拿到SSP,可以大体的用数据来进行衡量。以下均为纸面实力,不考虑面试表现且认为大家力扣都是150题达标水平
知乎:大润发杀鱼工(已授权)
链接:https://zhuanlan.zhihu.com/p/17809009204
编辑:「深度学习自然语言处理」公众号
学历(中科院院所可自行转换):
匹配实习:
一般以3个月为一个实习周期,考虑最优是前司与面试公司有相同推进的项目,这样面试过程往往会变成关于项目细节的询问。次优,则是实习与工作能用上相同的工具链,例如训练的框架,推理的框架,这样的面试往往会从框架层面来考察面试者的能力。最次,则是虽然在大模型的实习,但是没有接触到核心的内容,只承担边角工作的结果可能会导致面试变成八股考试。这里暂时不考虑大厂小厂,以实习内容质量为衡量标准。
高质量的学术论文
2.高质量的学术论文。一般来说,Infra的论文会通常与系统方向挂钩,但系统方向动辄12-13页双栏的要求,作为一个硕士是很难达到的。因此,直观理解,一篇系统A会的性价比远远小于一段3个月以上的对口实习。打分上,按照不对口对应扣1分,CCF A 系统一作,5分,AI类一作 3分(考虑大概率不会太对口)。B类系统一作,3分。C类系统一作,1分。
开源社区贡献
一般来说,开源社区的贡献也是非常值得注意的一点,因为大模型的场景实际非常新,无论是训练推理还是其他大模型方向,都有比较活跃的开源社区,例如OpenRLHF,SGlang,LLama-factory等。如果面试者在一些公司经常使用的框架下,有非常核心的贡献,其参照权重不亚于一段关键的实习经历。
其他公司的Offer(额外)
参加秋招确实能感觉出来,"offer都是A出来的",当你有了多家公司比较可观的offer之后,就有了资本去和目标的公司来讨价还价,甚至把所有的包都a成SSP。但最关键的一点应该是,你需要先有一个SSP的offer,才能帮助你在谈薪时,有更大的概率冲刺SSP。所以这一部分,暂时不计入SSP包的得分计算中。
总分合计
打分中我的设置里面头部效应明显,越是匹配的,能够获得的得分往往更高。并且计算分数只考虑普遍情况。
大厂和明星初创我认为暂时放在一个维度,主要是因为初创是一个高风险高收益的地方,薪资高,但风险也越大。综合的难度上就会和大厂接近。中厂比较好理解,规模比大厂略小。但非主营公司的意思,主要是例如车厂/手机厂,核心业务偏实体经济,可能存在大模型的落地场景。
PS:拿几个朋友的经历对了一下,还比较匹配。如果有不对应之处,可以评论区指正。