点击上方蓝字关注我们
科技旋涡编辑|孙浩南
最近,国产大模型DeepSeek在全球火了,并带火了一个95后AI“天才少女”罗福莉。据证券时报报道,雷军亲自出手挖人了!据悉支付的薪酬,在千万元级别。
12月初,小红书博主AI Dance就曾透露,雷军近期亲自交流或面试了多家LLM(大型语言模型)公司的CTO和核心算法人才。
被雷军重金招募的罗福莉,在大模型圈内被冠以“95后天才少女”的头衔。罗福莉硕士毕业于北京大学计算语言学研究所。2019年,因研二在NLP(自然语言处理)国际顶级会议ACL上发表了8篇论文,其中2篇为第一作者,曾登上知乎热搜。彼时,常在知乎下场回答问题的罗福莉,也一夜成为“知乎红人”。
硕士毕业后,罗福莉先是进入阿里达摩院做人工智能研究,从事预训练语言模型相关的工作,负责阿里达摩院AliceMind开源项目,主导开发了多语言预训练模型VECO。2022年,罗福莉加入幻方量化从事深度学习相关策略建模和算法研究,后又跳槽到DeepSeek担任深度学习研究员,参与研发MoE大模型DeepSeek-V2。
在B站上,罗福莉的ID是“我不是AI小萝莉”,其简介为“一位95后从事AI研究的小萝莉,从北大硕士毕业,目前在阿里达摩院工作。”
但截至发稿前,该账号ID已经搜索不到。
罗福莉被重金招入小米,被认为是小米全面发力AI大模型的其中一个动作。2023年4月,小米正式组建了AI实验室大模型团队,并表示将不断挖掘AI相关的用户场景,发挥自身技术优势,并以开放的态度与合作伙伴开拓更多机会。
除了招募人才以外,近期小米正在搭建GPU万卡集群,规模较其大模型团队成立时的约6500张GPU大幅增加。这一计划已施行数月,由集团董事长雷军亲自领导。
雷军在公开演讲时曾表示,小米做大模型的思路和很多公司不太一样,选择主力突破的是轻量化和本地部署。对于小米这样无论在手机还是造车上都讲究“性价比”的公司而言,如何在烧钱的大模型业务中平衡成本,无疑是雷军考虑的核心问题。而这,或许也是拥有DeepSeek-V2研发背景的罗福莉被雷军看中的原因。
往期推荐
2024科技旋涡年度榜单评选征集开启
小米正搭建GPU万卡集群:加速AI大模型研发