谷歌Gemini再添猛将！GPA 5.0毕业即DeepMind高级科学家，开挂博士给科研新人7点建议

科技 2024-12-12 11:17 北京

新智元报道

编辑：LRS 好困

【新智元导读】薛复昭博士宣布即将加入Google DeepMind，分享了他在博士生涯中的七点心得，包括工程能力的重要性、与优秀人才合作、专注于重要论文、研究趋势的演变、换位思考以及博士学位的价值。

就在Gemini 2.0发布之前几天，一位新晋华人博士宣布加入Google DeepMind，作为高级研究科学家致力于Gemini预训练和多模态研究。

薛复昭，博士毕业于新加坡国立大学师从尤洋教授，2021年以5.0的GPA成绩硕士毕业于南洋理工大学，师从庄永聪教授和孙爱欣教授。

在新加坡国立大学攻读博士期间，曾在Google Brain与谷歌天才科学家Yi Tay和Mostafa Dehghani一起实习，并在NVIDIA GEAR与Jim Fan和Yuke Zhu一起实习。

读博3年的7点心得

工程能力是研究的基础

虽然工程能力普遍很重要，但在学术界似乎特别被低估。例如，在我几年前的经历中，人工智能博士招生很少进行编程面试。这很令人惊讶，因为实现是将人工智能想法付诸实践的关键步骤。许多人可能会广泛讨论研究概念，但无法将其转化为实际应用。

强大的工程能力不仅能让我们为大规模项目做出贡献（这是在大语言模型社区产生重要影响的常见方式），还能激发创新的研究思路。最近的进展，如Scaling Law, MoE, GQA, Flash Attention，往往源于对底层技术和社区面临挑战的深入理解。

与优秀人才共事对提升研究品味极其有帮助

什么是「研究品味」？在我看来，就是比他人更早识别出有前景的研究方向的能力。那么...该如何做？去问他们！就像我们在大语言模型中在强化学习之前进行监督训练一样，我们需要指导和引导来培养自己的「研究品味」。

在我博士早期，我有幸在谷歌与Yi Tay和Mostafa Dehghani合作，这段经历显著塑造了我的职业轨迹。我经历的文化冲击令人深省。受此启发，我主动寻求机会与其他杰出研究者合作，如Jim Fan (范麟熙)、朱玉可、Scott Reed、符尧等。

要真正理解他们的研究品味，我们需要在两个关键方面达成一致：

为什么这个问题在技术上很重要？
这个人是如何培养出这样的技能和思维方式的？

有趣的是，具有良好研究品味的人并不总能清楚回答这些问题，尤其是第二个问题。这就是为什么我认为与这些人密切合作能让我们深入了解他们的日常习惯、决策过程和解决问题的方法，尽管你也可以通过电子邮件等方式询问他们。

博士期间要致力于做出简洁而有见地的45分钟演讲，而不是追求长长的发表清单

人们攻读博士通常有两个主要原因，即享受科研乐趣和找到好工作。对于工作面试，有一个「还可以」的发表记录通常足以让你通过初选。

然而，在面试过程中真正重要的远不止论文清单和简历。通常会有研究演讲和几次一对一的研究面试（除了基础知识和代码）。虽然听众规模不同，但核心目标始终相同：做出引人入胜且连贯的演讲。

要在这些场合表现出色，要专注于创建一个扎实的整体演讲，并定期（如每5分钟）加入富有见地的观察，以保持听众的兴趣。

专注于少量重要论文并深入理解，而不是浅尝辄止地阅读很多文章

我通常会果断筛选掉arXiv上99%的论文，只关注有影响力的工作、知名作者和声誉良好的机构。

（我理解这种方法有其偏见——一些有价值的工作可能因各种原因被低估。但事实是，这种方法通常很高效。我认为最好的工作最终都会通过引用、讨论或他人推荐出现在我们面前。）

虽然你可能偶尔会错过一些被埋没的好论文，但更重要的是不要被杂乱的论文淹没。花太多时间在这些工作上可能会将你的研究品味拉向局部最小值，特别是当你刚进入这个领域缺乏甄别能力时，这可能需要相当长的时间和努力来纠正。

在接触新课题时，要按时间顺序阅读论文以研究研究趋势的演变

例如，你可以按照这个顺序来阅读和学习MoE-LLMs。这样，你可以更容易地识别和总结趋势，创建连接不同工作的「思维链」，比如Expert-Choice MoE解决了baseline MoEs中的什么问题。这个过程不仅加深了你的理解和推理能力，还能让你超越领域的当前状态进行推广。

有了这个更广阔的视角，你可能会发现有价值的未来研究方向。此外，人们自然倾向于更好地记住最近的信息。作为研究者，跟上最新发展至关重要，所以这种方法与我们处理和保留信息的方式很相符。

换位思考是提升写作和演讲的有效方法

我的写作仍有很大提升空间。不过，我发现换位思考在以下两种情况下特别有帮助：

写作时设身处地为读者着想。读者来自不同背景，而且时间有限。考虑到这些因素来撰写文稿很重要。关键是要让你的写作易于目标受众理解。保持简洁，既不要太长，也不要太浅或太深，专注于你想传达的最重要观点。考虑在读者的限制条件下，什么内容最有影响力。
阅读时想象作者写作时的所思所想。学术论文和演讲信息密度很高。作者通常花费大量时间精炼它们，但背后的原始数据或想法往往杂乱无章。在阅读他人的作品时，不要被动接收，要思考你会如何处理原始材料。如果你能接触到初始数据，你会讲述什么样的故事？你会画什么图来阐明观点？与你自己平时的写作方法相比，作者的思路的哪些部分更值得借鉴？这个练习让你有频繁的机会练习写作和演讲，而不是等花几个月完成整个项目后才有机会来练习。

博士学位有帮助但不是从事大语言模型研究的必要条件

攻读博士可以提供宝贵的学习经验。除了科研技能，学术界擅长的一个领域是教学模块——这在工业实验室中很少遇到。作为助教，你有机会设计讲座、作业、辅导和考试。这种经验与进行研究或指导初级研究人员不同，如果你的目标是成为教授，这是必不可少的。

然而，如果你的主要目标是直接为最先进的大语言模型做出贡献，直接加入研究实验室可能更有效。在工业实验室，你可能会有：

获取更强大的计算资源。
与实践经验丰富、技能出众且自我驱动的同事合作。
参与具有重大影响力的大型项目的机会。

在我的博士期间，我在工业实验室实习，但读者也完全可以作为研究工程师或AI驻地研究员加入这样的实验室。在我看来，这些职位可以成为成为大语言模型研究者的快速通道，让你有机会在实践性强、影响力大的环境中学习所需的大部分技能。

值得注意的是，像Google DeepMind，OpenAI这样的地方有许多杰出的研究人员并没有博士学位。这突显出虽然博士学位有益，但它并不是在大语言模型研究领域取得成功的唯一途径。

参考资料：

https://x.com/xuefz/status/1865998713459745057?s=46&t=tjvlw4CuMH3XP7tndXt8fw

https://xuefuzhao.notion.site/Dec-2024-From-PhD-to-Google-DeepMind-Lessons-and-Gratitude-on-My-Journey-157bde9e43df80168c86fed8c29cbdf8

https://xuefuzhao.notion.site/2024-12-Google-DeepMind-85cc012dc0b44af4b896c044ac77c9f2

新智元

智能+中国主平台，致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展，关注人机融合、人工智能和机器人革命对人类社会与文明进化的影响，领航中国新智能时代。

最新文章

27亿刀天价员工首个成果，谷歌版o1算出最难高考数学题！物理代码难题闪电秒解

刚刚，GPT开山一作被曝离职OpenAI！被Ilya感谢，ChatGPT无名英雄选择单飞

2025英伟达奖学金名单公布，7位华人入选！中科大浙大校友在列，人均6万美元

全球百模争霸，国产大模型拿下多个冠军！智源FlagEval全球评测榜单出炉

一键生成万字专利！中科院发布多智能体框架AutoPatent，含1933个「草稿-专利」数据对

Meta斯坦福全新多模态Apollo，60分钟视频轻松理解！7B性能超越30B

招人！新智元邀你勇闯ASI之巅

OpenAI开通ChatGPT热线了！美国电话就能打，老人机也能玩，15分钟免费

全球最强GPU订单曝光，TOP 1微软一年买爆近50万块！xAI晒首批GB200提前过年

28年数据枯竭？AI炼出数据飞轮2.0，智能体+多模态数据湖硬核掘金

AI改变数学的一年！黎曼假说、朗兰兹猜想，盘点2024年数学里程碑

全面超越CoT！Meta田渊栋团队新作：连续思维链

2025年，AI Agent还会是风口吗？11个问题揭秘智能体技术发展全貌

招人！新智元邀你勇闯ASI之巅

OpenAI圣诞第9天：满血o1 API放出，开发者大狂欢！实时API升级音频token暴降60%

Pika 2.0横扫Sora惊艳全网，一键颠覆广告业！上传自拍秒变好莱坞大片，和明星同框不是梦

用上AI，升职提前4年？清华等分析6790万篇论文：科学界收缩，不用AI的领域无人问津

稳定学习预后标志物，多种癌症生存曲线证实！清华最新成果登Nature顶级子刊

沃顿商学院教授发文解析o1：能力仍有短板，「人机协同智能」或成AGI最重要难题

招人！新智元邀你勇闯ASI之巅

谷歌逆风翻盘暴击OpenAI，90天王者归来！44页报告押注25年三大技术前沿

举报人「自杀」，OpenAI表示震惊！NYU教授发长文悼念：警钟仍在回响

谷歌版Sora来了，4K高清暴击OpenAI！视频生图新卷王，更理解物理世界

ChatGPT搜索，全球免费！Her动嘴实时搜，暴打谷歌边聊边搜

北大开源全新图像压缩感知网络：参数量、推理时间大幅节省，性能显著提升 | 顶刊TPAMI

语言游戏让AI自我进化，谷歌DeepMind推出苏格拉底式学习

招人！新智元邀你勇闯ASI之巅

视频一键拆分PS层！DeepMind新模型效果碾压同级，物体、背景完美分离，还能脑补

图像领域再次与LLM一拍即合！idea撞车OpenAI强化微调，西湖大学发布图像链CoT

Nature再发招聘调查：学术界和工业界大不同，帮你避坑从简历到面试的N个细节

招人！新智元邀你勇闯ASI之巅

MIT教授NeurIPS歧视言论炸雷，中国女学生霸气反击！AI大佬集体痛斥，道歉信来了

OpenAI官方爆料，长文开怼马斯克：靠打官司实现不了AGI！

Claude 3.5编程收入暴增10倍，抢走Cursor反杀OpenAI！估值180亿初创3年颠覆硅谷

招人！新智元邀你勇闯ASI之巅

「中美科技合作协定」终于续签！但AI半导体等关键技术却遭排除

Ilya向全世界宣布：预训练结束了！全球AI数据耗尽，超级智能才是未来

26岁OpenAI举报人疑自杀！死前揭ChatGPT训练黑幕

欧洲万亿美元科技巨头为0，被美国「泰坦」无情碾压！LeCun转评

招人！新智元邀你勇闯ASI之巅

ChatGPT「睁眼」了！OpenAI版「Her」满血上线，还有圣诞限定彩蛋

LSTM之父：我也是注意力之父！1991年就发表线性复杂度，遥遥领先Transformer 26年

再也不怕显存爆炸了！高效重建「几何精准」的大规模复杂三维场景，中科院提出CityGaussianV2

Meta公布黑科技：戴上腕带即可隔空打字，引领神经接口AR革命

招人！新智元邀你勇闯ASI之巅

ChatGPT崩溃4小时！DDL打工人、期末大学生全慌了

2024 ACL Fellow名单出炉！微软高剑峰等4位华人科学家入选

OpenAI深夜被狙，谷歌Gemini 2.0掀翻牌桌！最强智能体组团击毙o1

谷歌Gemini再添猛将！GPA 5.0毕业即DeepMind高级科学家，开挂博士给科研新人7点建议

超图计算+目标检测，性能新SOTA！清华发布Hyper-YOLO：用超图捕捉高阶视觉关联

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉