嗨!大家好!
Nature最近公布了一个AI领域学术研究涨势📈前十名的大学及研究机构,排名标准是2019年到2023年发表文章作者的挂名单位(不限于第一单位),从这个排名中可以看到两个信息:
🏆 第一名是中科院,第二名哈佛大学,第三名北京大学。
🏆 前十所中有6所来自中国🇨🇳,2所来自德国🇩🇪,2所来自美国🇺🇸。
2019年以来,以中科院为首的中国学术机构🚀迅速占领AI领域的文章发表引用高地。下图这一对比更是明显看出中国在过去几年的AI学术研究突飞猛进,从左图2019年不到美国的1/3, 增长到右图2023年的超过美国的1/2。
不过,先别欣慰,因为虽然AI属于新兴前沿领域,但很遗憾这一城池,科研学术界已经不再主导,甚至远远落后。
所以以上这些“引以为傲”的发表文章排名,有可能也只是「内部游戏」,因为工业界在发表文章和发表产品中间选择了后者。根据斯坦福大学发布的《2024 年人工智能指数报告》(Artificial Intelligence Index Report 2024),2003-2023年期间,企业界就推出了51个知名AI大模型,而学术界仅推出了15个,但是由公司发表的AI研究论文仅占据AI文章总数量的3.84%,就足以证明这一点。
企业界的知名产品比如Google的Gemini,Microsoft的co-pilot,OpenAI的GPT,Meta的Llama,月之暗面Kimi,智谱清言,而学术界推出的模型就较为少有人知了。
学术界在AI领域的失势,也并不意外,源于AI领域发展的三大要素的全面缺失:算力💻、数据库🌐、人才👥,我大胆降维一下,相当于资金💰、用户数据📑、行业工资💸。
算力💻
训练顶尖AI模型需要庞大的计算资源来处理大数据和复杂任务,学术机构和中小企业很难获得大公司早期不计成本投入的AI硬件GPU/TPU资源和数据中心,所以导致AI产品开发的集中化,迅速拉开工业界与学术界的差距。比如,
OpenAI的GPT-4的计算成本估计约为 7800万美元
Google的Gemini Ultra的计算成本则高达 1.91亿美元
此外,AI研发的烧钱程度,也能从近期英伟达股价创下历史新高超越苹果成为全球最有价值的公司就能看出来。
数据库🌐
AI模型训练需要海量的数据,这也是几家头部企业的天然优势。科技公司通过原本的商业平台产生海量用户数据,成为训练AI大模型的温床,比如训练语言模型中需要的海量文本数据就来自社交媒体📷和搜索引擎等平台。
相比之下,学术界受限制于用户隐私保护和各家公司商业机密,很难获取这样规模的数据,只能去寻找一些公开的数据资源用来分析和计算,巧妇难为无米之炊🤷。
人才流失💸
谷歌、Meta等科技巨头的AI研究员年薪轻松达到六位数美元,有些甚至高达数百万美元。而相比之下,一个非升即走的高校教师低薪职位,显然是留不住AI人才的。
2020年,约70%的北美AI博士毕业生选择进入公司,到今年估计是超过95%了(后半句我猜的)。
以上,
Have a nice week!
Reference 1.Nature 633, S6-S9 (2024)doi: https://doi.org/10.1038/d41586-024-02985-3 2. 斯坦福大学Artificial Intelligence Index Report 2024: https://hai.stanford.edu/research/ai-index-report 3. https://www.interviewkickstart.com/blogs/articles/ai-research-scientist-salary-top-companies
我是LabGirls,一线科研女性工作者。
探讨科研理念,分享科研干货,做有温度的博士。
后台回复各个关键字即刻获取惊喜干货与模板🎁【硕博申请合辑】【洪堡学者博士后申请指南】【科研圈八卦】【基金申请】【PPT科研绘图】【学术简历】【研究计划】【推荐信】【套磁信】【科研绘图色彩搭配】【CSC】【申博时间计划表】等
代表作:
点分享
点赞
点在看