曾经在AI大模型布局上相对“佛系”的小米,开始加快步调了。最近,小米砸下了高昂年薪,招揽了一位AI行业大牛加入。
12月20日,据第一财经消息,DeepSeek开源大模型DeepSeek-V2的关键开发者罗福莉将加入小米,她或供职于小米AI实验室,领导小米大模型团队。
知情人士透露,雷军对小米在大模型领域发力太晚感到担忧,于是亲自下场挖人,罗福莉的薪酬水平或在千万元级别。
另据12月26日界面新闻报道,小米正在着手搭建自己的GPU万卡集群。而小米大模型团队在成立时已有6500张GPU资源。
种种迹象表明,未来一年,小米要对大模型大力投入了。
被雷军重金招募的罗福莉,在大模型圈内被冠以“95后天才少女”的头衔。
罗福莉硕士毕业于北京大学计算语言学研究所。2019年,因研二在NLP(自然语言处理)国际顶级会议ACL上发表了8篇论文,其中2篇为第一作者,曾登上知乎热搜。彼时,常在知乎下场回答问题的罗福莉,也一夜成为“知乎红人”。
硕士毕业后,罗福莉顶着“ACL8篇论文作者”的光环,加入了阿里达摩院机器智能实验室。这期间,她主导开发的多语言预训练模型VECO(同时支持多语言理解和生成的跨语言模型),被纳入阿里达摩院深度语言模型体系AliceMind。此外,她还主导了AliceMind的开源工作。
2022年,罗福莉离开阿里达摩院,加入幻方量化(量化对冲基金公司)从事深度学习相关策略建模和算法研究。此后,罗福莉加入DeepSeek,担任深度学习研究员,并参与了MoE大模型DeepSeek-V2的研发。
▲图源/罗福莉官方公号
罗福莉加入小米,不仅因其过硬的技术实力,她身上“天才AI少女”“95后AI萝莉”的标签,也很符合“营销天团”小米的调性。
今年5月,在DeepSeek-V2模型发布后,罗福莉在知乎上回答了如何看待该模型的问题。她称DeepSeek-V2与GPT4的价格相比,是“性价比之王”。这样“接地气”的互动,与小米的风格,可以说颇为契合。
罗福莉将加入小米的消息,印证了小米将在大模型领域加码的传闻。