传说中Ilya Sutskever精选论文清单：AI领域40大论文完整版「破解」完成

科技 2024-11-17 00:02 北京

来源 | 机器之心

今年 5 月，一份网传 OpenAI 联合创始人兼首席科学家 Ilya Sutskever 整理的一份机器学习研究文章清单火了。网友称「Ilya 认为掌握了这些内容，你就了解了当前（人工智能领域） 90% 的重要内容。」

据说这份论文清单是 2020 年 OpenAI 的联合创始人、首席科学家 Ilya Sutskever 给另一位计算机领域大神，id Software 联合创始人，致力于转行 AGI 的 John Carmack 编写的。

虽然清单准确性难以考证（John Carmack 本人回应说已经把列表搞丢了），而且 AI 领域发展日新月异，但其内容很快流传开来，甚至有人表示它是 OpenAI 入职培训内容的一部分。

当时，这份清单包含 27 项机器学习资料，包括论文、博客文章、课程和两本书的章节，均来自 1993 年至 2020 年。

但据称，受 Meta 电子邮件删除策略的影响，该清单并不完整，原清单中应该包含约 40 项阅读资料。

转发来转发去，一小半内容被挤掉了，这你受的了吗？

特别是，根据与资料清单一起共享的一项声明，整个「元学习」类论文列表都丢失了。元学习是机器学习的一个子领域，是将自动学习算法应用于机器学习实验的元数据上。

就像红楼梦缺失的 40 回，清单资料缺失的 13 篇论文引发了不少讨论，对于哪些论文足够重要而应该包括在内，人们提出了许多不同的想法。

最近，一位名为 Taro Langner 的网友根据 Ilya Sutskever 多年来演讲内容、OpenAI 共享的资源等，试图找出清单丢失的资料。最后补充完成了「覆盖 AI 领域 90% 知识」的 AI 论文名单。

与此同时，他还指出了一些你必须注意的额外内容，包括 Yann LeCun、Ian Goodfellow 等重要 AI 学者的工作，以及关于 U-Net、YOLO 目标检测、GAN、WaveNet、Word2Vec 等技术的论文。

让我们看看其中的内容，和论文推荐的理由。

缺失的「元学习」板块

现在的 AI 系统可以通过大量时间和经验从头学习一项复杂技能。但是，我们如果想使智能体掌握多种技能、适应多种环境，则不应该从头开始在每一个环境中训练每一项技能，而是需要智能体通过对以往经验的再利用来学习如何学习多项新任务，因此我们不应该独立地训练每一个新任务。

这种学习如何学习的方法，又叫元学习（meta-learning），是通往可持续学习多项新任务的多面智能体的必经之路。

Ilya Sutskever 担任 OpenAI 首席科学家时曾发布教育资源「Spinning Up in Deep RL」，并公开发表过几次关于「元学习」的演讲：

Meta Learning and Self Play - Ilya Sutskever, OpenAI (YouTube), 2017
OpenAI - Meta Learning & Self Play - Ilya Sutskever (YouTube), 2018
Ilya Sutskever: OpenAI Meta-Learning and Self-Play (YouTube), 2018

Taro Langner 据此推测原始清单应该包含以下几篇研究论文：

《Meta-Learning with Memory-Augmented Neural Networks》
论文地址：https://proceedings.mlr.press/v48/santoro16.pdf
《Prototypical Networks for Few-shot Learning》
论文地址：https://arxiv.org/abs/1703.05175
《Model-Agnostic Meta-Learning for Fast Adaptation of Deep Networks》
论文地址：https://proceedings.mlr.press/v70/finn17a/finn17a.pdf

值得注意的是，Ilya Sutskever 在上述「元学习」演讲中，还提到了以下几篇论文：

《Human-level concept learning through probabilistic program induction》
论文地址：https://amygdala.psychdept.arizona.edu/labspace/JclubLabMeetings/Lijuan-Science-2015-Lake-1332-8.pdf
《Neural Architecture Search with Reinforcement Learning》
论文地址：https://arxiv.org/pdf/1611.01578
《A Simple Neural Attentive Meta-Learner》
论文地址：https://arxiv.org/pdf/1707.03141

可以发现，强化学习 (RL) 在演讲中也占有重要地位，因为强化学习与元学习有着密切的联系。一个关键概念是竞争性自我博弈，其中智能体在模拟环境中进行交互以达到特定的目标。

Ilya Sutskever 提出了一种进化生物学观点，将竞争性自我博弈与社交互动对大脑大小的影响联系起来。根据他的判断，在模拟的「智能体社会」中快速获得能力最终可能会为某种形式的通用人工智能提供一条可行的道路。

考虑到他赋予这些概念的重要性，一些被引用的有关自我博弈的论文也可能被纳入阅读清单：

《Hindsight Experience Replay》
论文地址：https://arxiv.org/abs/1707.01495
《Continuous control with deep reinforcement learning》
论文地址：https://arxiv.org/abs/1509.02971
《Sim-to-Real Transfer of Robotic Control with Dynamics Randomization》
论文地址：https://arxiv.org/abs/1710.06537
《Meta Learning Shared Hierarchies》
论文地址：https://arxiv.org/abs/1710.09767
《Temporal Difference Learning and TD-Gammon ，1995》
论文地址：https://www.csd.uwo.ca/~xling/cs346a/extra/tdgammon.pdf
《Karl Sims - Evolved Virtual Creatures, Evolution Simulation, 1994》
论文地址：https://dl.acm.org/doi/10.1145/192161.192167
《Emergent Complexity via Multi-Agent Competition》
论文地址：https://arxiv.org/abs/1710.03748
《Deep reinforcement learning from human preferences》
论文地址：https://arxiv.org/abs/1706.03741

其他可能性

当然，原始的 40 篇论文名单上可能还有许多其他作品和作者，但从现在开始，证据越来越薄弱了。

总体而言，目前补充完整的论文名单在涵盖不同模型类别、应用和理论的同时，还涵盖了该领域的许多著名作者，端水端得已经挺稳了。但显然，还有很多重要内容值得注意。

我们似乎可以继续列入：

Yann LeCun 等人的工作，他在 CNN 的实际应用方面做出了开创性的工作 ——《Gradient-based learning applied to document recognition》
Ian Goodfellow 等人的工作，他在生成对抗网络（GAN）方面的工作长期主导了图像生成领域 ——《Generative Adversarial Networks》
Demis Hassabis 等人的工作，他在 AlphaFold 方面的强化学习研究获得了诺贝尔奖 ——《Human-level control through deep reinforcement learning》、《AlphaFold at CASP13》

在更多信息公布之前，这篇文章在很大程度上仍是推测性的。毕竟，原版的「Ilya 阅读清单」本身也从未得到官方证实是真的。尽管如此，你可以看出目前补充好的列表是绝对具有含金量的。总之让我们先填补好空白，用作者的话来说，这大致相当于当时缺失了「重要内容的 30%」。

参考内容：

https://tensorlabbet.com/2024/11/11/lost-reading-items/

https://www.reddit.com/r/MachineLearning/comments/1grti0x/d_the_lost_reading_items_of_ilya_sutskevers_ai/

http://mp.weixin.qq.com/s?__biz=MzIxNDgzNDg3NQ==&mid=2247550504&idx=3&sn=01b17edc0750fd68cf85981a37343f81

深度学习与NLP

专注深度学习、NLP相关技术、资讯，追求纯粹的技术，享受学习、分享的快乐。

最新文章

教育部公布！25考研人数，再降50万！

大模型代肝，自动刷《崩铁》升级材料，Claude操纵计算机还能这么用！

一篇小型语言模型技术最新全面综述

M3DocRAG：文档问答用哪个多模态大模型效果最好？

已公示！“东方理工大学”，来了

聊一聊做角色扮演大模型的经验

绝对顶流！清华博导倾力编写的《图神经网络导论》pdf免费分享

最高9.0分！这16篇最高分ICLR2025论文必看！从生成模型到MOE等

ICLR 高分：深入研究多模态大模型的对齐策略

谷歌大佬编写，我唯一熬夜看完的机器学习神作pdf分享！

双非二战字节算法岗，拿下70k offer.....

猫猫运动方程，首次被物理学家破解！ |《美国物理学杂志》正经研究

o1的风又吹到多模态，直接吹翻了GPT-4o-mini

谷歌大佬编写，我唯一熬夜看完的机器学习神作pdf分享！

微调图像大模型的经验分享

昨夜， LLM 已经彻底凉凉了...

Karpathy后悔了：2015年就看到了语言模型的潜力，却搞了多年强化学习

微软开源角色Agents，直接模拟了整个世界~

2024最新神书-《大模型应用程序构建指南》免费pdf分享

2024最新,李宏毅深度学习教程pdf免费分享！绝对值得反复阅读的神书！

已注销！985新校区，不建了

RAG黑盒被打开了，可视化RAGViz闪亮全场

LLM性能优化中的一些概念扫盲

Nature:「人类亲吻难题」彻底难倒LLM，所有大模型全部失败！LLM根本不会推理，只是工具

Cursor一不小心把自家的底牌也放出来了~

[送5本]《动手学机器学习》上海交大ACM班总教头团队重磅新作，带你动手学机器学习！

传说中Ilya Sutskever精选论文清单：AI领域40大论文完整版「破解」完成

神书《从零构建大模型》分享，尚未发布，GitHub标星22k！！

LLM性能优化中的一些概念扫盲

暴跌94%，裁员9600人。。。

[送5本]《大语言模型：原理、应用与优化》大模型未来发展方向大揭秘！

多个中国团队斩获EMNLP'24最佳论文！UCLA华人学者中三篇杰出论文，明年顶会落户苏州

DRL2022新书-《深度强化学习》免费pdf分享

陶哲轩：计算机通用方法，往往比深奥的纯数学更能解决问题

中央批准：中央候补委员、教育部副部长，任C9大学书记

谷歌2024博士奖学金公布，KAN作者刘子鸣等数十位年轻华人学者入选

上交2024最新-《动手学大模型》实战教程及ppt分享！

考古OpenAI RLHF基石之作：探索RL和RM阶段的Scaling Law

【完整视频】黄仁勋对话软银孙正义：打造AI代理和物理AI，强调企业必须在AI浪潮中找准定位

2024最新版，人大赵鑫老师《大语言模型》新书pdf分享

上交2024最新-《动手学大模型》实战教程及ppt分享！

饶毅：全世界没有一个学校把博士后纳入“非升即走”

Scaling Laws终结，量化无用，AI大佬都在审视这篇论文

李飞飞等14位斯坦福微软大牛等撰写《AGENT AI: 综述多模态交互的前沿展望》免费pdf分享

一篇综述告诉你：如何用大语言模型设计算法

SFT洗数据，有多少细节？

LSTM+Transformer王炸创新，荣登Nature...

突发！三星7nm停供！

Ilya认错，Scaling Law崩了？自曝SSI秘密技术路线取代OpenAI

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉