首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

卷疯了！美国AI博士生「人手10篇顶会」

学术 2024-10-22 23:10 浙江

Datawhale分享

来源：新智元，编辑：Datawhale

明明都是人，怎么美国的博士就人手 10 篇 AI 顶会，还有 5 篇是一作？

最近，欧洲博士的一篇质疑，在机器学习社区火了！

欧洲博士质疑，在机器学习社区火了

他说，自己正在欧洲大学攻读博士学位，研究方向是 AI/机器学习/CV 领域。

自己的博士学业为期 4 年。

第一年，主要就是学习怎样真正地搞研究，了解整个的学术运作机制。

第二年，自己就已经作为共同作者，在顶会 CVPR 上发表了首篇论文。

第三年，他已经能够管理研究项目，了解了如何申请资助，掌握了资金运作机制和其中的各种细节。

此时，他的简历中新增了两篇论文，一篇是期刊论文，一篇是会议论文，都是以一作身份发表的。

在此期间，他深度参与了产业界的事务，为和自己实验室有合作的公司写了大量跟AI、系统架构、后端、云计算、部署等相关的生产级代码。

看起来，自己应该算比较成功的博士了对不对？

然而，当他看到美国同背景的博士履历时，直接惊呆了！

他们几乎人手十篇顶会论文，全是 CVPR、ICML、ICLR、NeurIPS 级别的顶会，而且还有五篇是一作！

这位欧洲博士表示，自己受到相当大的冲击——

这些人究竟是怎么做到完成这么多工作，还能每年在 A 类期刊上发 3 篇论文的？他们难道不需要睡觉吗？

这位博士表示，我并不认为这些人比我聪明。

每当自己有了新 idea，就会去查找是否已经有人研究过。

他时常发现，某个斯坦福或者 DeepMind 的博士生刚好在一个月前发表了类似的研究，这就证明自己的思路是很前沿的，并不落伍。

然而如果要深入理解这些论文中的概念，就要需要投入的努力，再加上有获取所有必要资源的过程，会耗费大量时间，绝不可能是 2-3 个月的项目就能搞定的。

最后，这位博士发出了心底的疑问——

我真的很困惑，这帮人是如何做到这么高效的？他们是不是有什么特殊的研究方法和资源，让他们如此迅速高产高质量研究？

面对网友们的各种反应，他也澄清道：自己并不是喜欢拿自己和别人比较的人，因为每个人所处环境不同。

但是，对于仅有 3-4 年研究经验的人来说，短短一年内就源源不断地产出高质量研究和创新成果，这从人类角度来看是不可能的事！自己仿佛完全被蒙在鼓里。

背后到底有什么因素，导致了人和人之间的这种巨大差别？

自曝原因：每天工作超10小时，7天无休

有人现身说法表示，这是因为，美国大学里充满了卷王！

首先，美国学术界存在一种很卷的发表和工作文化。

曾在美国顶尖 CS 项目之一的实验室做过本科生的层主表示，自己亲眼目睹了研究生们的工作节奏——

一周七天都在工作，每天超过 10 小时，全年无休。

有一次，他无意中晚上 7 点去实验室，发现自己的研究生同学还在那里。

因为好奇他究竟会工作到多晚，层主干脆在实验室等他，结果是——直到凌晨 1 点，他才回家！

当然，这并非实验室的强制要求，每个人都可以和项目负责人约定自己的工作界限。

但在美国这个人才竞争如此激烈的领域，每个人都会感受到巨大的压力，没有谁能不受影响。

第二点，美国实验室的显著优势，就是吸引了来自世界各国的顶尖人才。

这里层主特意拿清华举了例子，据悉这个顶尖项目对于清华学生的录取率仅有 0.1%……

如果能吸引到中国和其他国家的顶尖人才，还让他们每天工作 10 小时，那你很难不产生一些疯狂的成果。

总之，全球顶尖人才，汇聚在了一个高强度的工作环境里，这就造成了美国研究生惊人的学术产出。

基于NeurIPS 2022被接收论文作者数据

的确，立马有人证实了他的说法。

他表示，在自己的实验室，每周工作六十小时简直是家常便饭。

在紧急时期，甚至可能飙到每周七十小时。

有一次几个本科生因为在晚上十一点来到实验室。当他们看到我们这些研究生还在埋头工作时，一个个满脸震惊。但说实话，对我们来说，这种情况再平常不过了。

另一位博士说，每天工作超过 10 小时，7 天无休是很常见的，很多博士都是这样的。

不过他也指出，研究团队的规模也是造成这种情况的一个因素。

在大学里，自己花了一年时间才完成一篇论文，而第二篇论文用了 6 个月，作者只有自己、导师和联合导师。

但最近，当自己在谷歌兼职实习时，那里的期望是让他 6 个月写出三篇论文……

因为那里有一个规模不小的研究团队，所以这种要求应该是常态。

总之，简单概括就是两点原因：

1. 他们很卷，卷到不可思议。

2. 全世界最顶尖的学生都去了美国，而不是欧洲。

而且，这种情况绝不仅仅是在AI领域存在，几乎所有的STEM（科学、技术、工程和数学）领域都是如此！

有人说，自己在读物理学博士的时候，也是这种状态：生活里根本没有除了学习以外的东西。

这种影响其实很残酷，不少在读博士的心理健康状态都不太好，已经有大量文章讨论这一现象了。

既不缺GPU和资源，还有大厂/大佬背书

GPU Rich vs GPU Poor

此外，帖子中还有人一语道破：大家都没提的一个重要因素，就是资源。

可能和大多数人一样，楼主也是「GPU 穷人」。而那些顶尖博士项目的资源，可是有着天壤之别！
他们拥有极其昂贵的 GPU 集群，因此能够快速训练或微调几乎所有的模型，甚至是超过千亿参数的大模型。
这种资源优势让他们能够大幅提升迭代速度，从而开展一些对其他人来说根本无法想象的研究。

的确，即使在美国的不同高校，手握 GPU 的资源也差别巨大。

他表示在自己读博期间，计算资源是主要瓶颈。如果能有更多高性能的 GPU，计算时间会显著缩短，研究进度也会快很多。

普林斯顿、哈佛这样的「GPU 豪门」，手上的 H100 至少以三四百块打底，但是连AI教母李飞飞的斯坦福自然语言处理（NLP）小组，也只有 64 块 A100 GPU。

在这种巨大的差异面前，出成果的速度自然也是一个天上，一个地下。

这篇文章，就被大佬戏称为「PR工作的典范」

这种情况下，每个人都知道是谁的工作，为什么这项工作很重要。

你敢说审稿人不会受此影响吗？

这种情况下，他们很可能不敢给出过于严厉的批评。

总之，这些顶尖机构拥有雄厚的资源，自然而然就吸引了最有抱负、最优秀的学生，可以快速推进各种项目。

而在这些机构中，也就培养出了一种跨越好几代学生和教师的机构文化——优先考虑如何在最短时间内，发表尽可能多的高影响力论文。

其实是幸存者偏差

楼主关注的都是美国顶尖的机器学习项目，他们的成果自然也是世界一流的。

但如果去了解一下普通大学里博士生的情况，就会发现他们作为一作在顶会上发论文的情况并不常见。

有人对这位博士表示，你所观察到的样本，并不具有统计学意义上的随机性和代表性。

被偶然看到的美国博士生的论文或简历，几乎可以肯定地说，代表了学术成就分布中最为 top 的那一波。

这些高产出的学生，往往会被他们所在的知名实验室和机构更多地推广。

他们的成功可能源于良好的科研环境、出色的个人能力、一定的运气成分、严格的竞争性选拔以及其他因素。

其实这就类似于社交媒体会导致人们焦虑和抑郁。

在社交平台上，人们倾向于展示自己最好的一面，这导致我们常常将自己与一个经过筛选、存在偏差且被美化过的样本进行比较。

在学术界也是如此，每个研究者都在某种程度上「推销」自己的研究成果，而那些最引人注目的成果，自然会得到更多关注。

也有人指出，虽然楼主的描述有些夸大了，但的确存在一个临界点，超过这个点之后，单纯增加数量和投入时间并不能等同于提高质量。

参考资料：

https://www.reddit.com/r/MachineLearning/comments/1g7dzkp/d_why_do_phd_students_in_the_us_seem_like/

一起“点赞”三连↓

http://mp.weixin.qq.com/s?__biz=MzIyNjM2MzQyNg==&mid=2247686143&idx=1&sn=4a8885ce48fce835e16cbc7234f2a361

一个专注于AI领域的开源组织，汇聚了众多优秀学习者，使命-for the learner，和学习者一起成长。

最新文章

上海交大教授建议：Datawhale给开源AI通识课新命名

火了！一份AI领域的经典论文清单！

2025 QS 亚洲大学排名公布！197所中国高校上榜！

谷歌2024博士奖学金名单公布

微软 AI CEO 清华演讲全文（建议收藏）

AI数学神话破灭！FrontierMath让LLM集体几乎“交白卷”：正确率不超过2%

线下百校联动，AI线下共学活动开放报名

2025冬季科创营报名启动

导师：自己每天科研工作近10小时，都觉得不够。研究生们：每天工作不够5小时，拿什么去竞争？

李飞飞团队新作：空间智能版ImageNet来了！

大模型2.0读书会来了！融合学习与推理的大模型新范式

教授何恺明在MIT的第二门课！

知名开源项目阿里官宣停更，太痛了

ACL 2024亮点：RAG技术进展与论文解析

组队学习首次开放许愿啦！下个月想学什么，听你的

报名开启 | 11月8日 Google活动来华师大了

实测讯飞智作，一张照片定制属于自己的数字人

十一月组队学习来了！

Datawhale公益组，帮孩子找到兴趣和热爱

《OPEN AI通识课》重磅发布！Datawhale 联合浙江大学智海 Mo 平台

刚刚，阿里全球数学竞赛决赛结果公布！姜萍违反预选赛规则未获奖

沈向洋在青年科学家50²论坛的演讲全文：关于大模型的10个思考

时代变了！英伟达纳入道琼斯指数，英特尔被取代

库克：我从乔布斯那里学到的

阿里、京东、鹅厂、小米不同职级薪资待遇一览表

Runway CEO喊话：我们不是一家 AI 公司

马斯克正在用他的方法「拯救世界」

神秘模型“小熊猫”一夜霸榜，疑似中国制造

本周六，北京中关村见！

Claude喜提清华物理特奖得主，学物理的都去搞大模型了？

薅优惠GPU算力机会来了！

一篇具身智能的最新全面综述！（下）

一篇具身智能的最新全面综述！（上）

开源一夜崩塌：Linux无理由除名俄罗斯开发者。我们该醒了？

今年的1024，一些有趣的AI观察

稚晖君玩了个大的：开源人形机器人全套图纸+代码！

论文发表难！OpenAI又有高管走了，还发了长篇离职信

10月29日，上海阿里见！

Datawhale AI+X高校行于复旦大学圆满举行！

值得去的20家IT公司及薪资（杭州篇）

实验室一块GPU都没有怎么做深度学习？

卷疯了！美国AI博士生「人手10篇顶会」

华为不同职级薪资待遇一览表

李飞飞最新访谈：AI十年，她所看见的世界

本周五，合肥见！

CCF 大模型安全挑战赛获奖队伍公示！

陶神回应：AI还无法达到他12岁时的水平

又一外企巨头在中国裁员了

4所高校、1000+师生受益，9月AI+X高校行圆满举行！

Yann LeCun最新万字演讲：致力于下一代AI系统，我们基本上不做LLM了

分类

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉