解密诺贝尔物理学奖为啥颁给AI？Hinton和Ilya 12年前对话，竟引发物理诺奖AI风暴！

科技 2024-10-09 15:19 北京

诺贝尔物理学奖公布第二天，争议依然未平息。诺奖官号都被愤怒的网友冲了：AI不是物理学！Hopfield网络和反向传播算法究竟与物理学有何关系？这要从Hinton和Ilya 12年前的那件事说起。

昨天的诺贝尔物理学奖一公布，瞬间炸翻了物理圈和AI圈。

Hinton的第一反应更是有趣：这不会是个诈骗电话吧？

如此出乎意料的结果，让各路针对诺奖物理学奖的严肃预测，都仿佛成了笑话。

而诺贝尔奖的官方账号，也被网友们给冲爆了。

他们纷纷高呼：这不是物理学！

「数据科学或神经网络是『用于』物理学，但绝对不『是』物理学。」

相比之下，AI圈则是一片其乐融融的景象。大佬们都开心地给Hinton送去了祝福。

左右滑动查看

AI教母李飞飞：AI的深远影响，如今才刚刚开始

MIT博士生Ziming Liu直言：「Physics (Science) for AI」是一个被严重低估的领域。规模化可以实现一对多的效果，但唯有科学才能带来从无到有的突破。

Jim Fan则做了一个非常有趣的「AI-物理学对照表」：

想冲击诺奖的AI学者们，你们学会了吗

言归正传，诺贝尔物理学奖，为何要颁给AI学者？

这就要从深度学习爆发的那一年讲起。

Geoffrey Hinton：2012年，深度学习的惊人革命

早在1986年，Geoffrey Hinton等人在Nature上发表的论文，就让训练多层神经网络的「反向传播算法」广为人知。

当时我们很多人都相信这一定是人工智能的未来。我们成功地证明了我们一直相信的东西是正确的。

可以说，神经网络在经历第一波寒冬之后，自此开始重新走向AI舞台。

1989年，LeCun率先使用了反向传播和卷积神经网络。他也同意Hinton的看法。

我毫不怀疑，最终我们在上世纪80-90年代开发的技术将被采用。

早期的图灵三巨头

不过，反向传播算法引发的热潮，随后又在1995年被统计机器学习盖过去了。

统计机器学习的风头兴盛了很多年，即使2006年Hinton在Science上首次提出「深度学习」，业内也响应寥寥。

直到2012年9月，一篇题为「用深度卷积神经网络进行ImageNet图像分类」的论文，让此前沉寂多年的AI领域热度骤起。

文中提出的AlexNet深度卷积神经网络，在当年的ImageNet比赛上以碾压之势夺冠，一举将top-5错误率降低到了15.3%，比身后的第二名（26.2%）足足高出10多个百分点。

ImageNet数据集，正是由斯坦福李飞飞团队在2007年创建。

AlexNet摧枯拉朽般的大胜，让研究人员惊叹于大型卷积深度神经网络架构的神奇威力，这篇论文也成为深度学习和人工智能自「AI寒冬」后重新成为热门领域的重要里程碑。

后来人们所讲的「深度学习革命」，也借此文以发端，直到十二年后的今天。

事后李飞飞这样回顾：自2012年以来，深度学习的发展堪称「一场惊人的革命，令人做梦都没想到」。

自此，人们开始相信：大数据、算力、深度模型，是走向通用人工智能的关键三要素。

而深度模型也从最早的卷积神经网络，迭代为递归神经网络、Transformer、扩散模型，直至今天的GPT。

从生理学、哲学到AI：大脑究竟如何思考

在年轻时，为了弄清楚人类的大脑如何工作，Hinton首先来到剑桥学习生理学，而后又转向哲学，但最终也没有得到想要的答案。

于是，Hinton去了爱丁堡，开始研究AI，通过模拟事物的运行，来测试理论。

「在我看来，必须有一种大脑学习的方式，显然不是通过将各种事物编程到大脑中，然后使用逻辑推理。我们必须弄清楚大脑如何学会修改神经网络中的连接，以便它可以做复杂的事情。」

「我总是受到关于大脑工作原理的启发：有一堆神经元，它们执行相对简单的操作，它们是非线性的，它们收集输入，进行加权，然后根据加权输入给出输出。问题是，如何改变这些权重以使整个事情做得很好？」

某个周日，Hinton坐在办公室，突然有人敲门。AI命运的齿轮从此转动。

敲门的正是Ilya。

当年青涩的Ilya

Hinton给了Ilya一篇关于反向传播的论文，约定两人一周后讨论。

Ilya：I didn't understand it.
Hinton：这不就是链式法则吗？
Ilya：不是，我不明白你为啥不用个更好的优化器来处理梯度？

——Hinton的眼睛亮了一下，这是他们花了好几年时间在思考的问题。

Ilya很早就有一种直觉：只要把神经网络模型做大一点，就会得到更好的效果。Hinton认为这是一种逃避，必须有新的想法或者算法才行。

但事实证明，Ilya是对的。

新的想法确实重要，比如像Transformer这样的新架构。但实际上，当今AI的发展主要源于数据的规模和计算的规模。

2011年，Hinton带领Ilya和另一名研究生James Martins，发表了一篇字符级预测的论文。他们使用维基百科训练模型，尝试预测下一个HTML字符。

模型首次采用了嵌入（embedding）和反向传播，将每个符号转换为嵌入，然后让嵌入相互作用以预测下一个符号的嵌入，并通过反向传播来学习数据的三元组。

当时的人们不相信模型能够理解任何东西，但实验结果令人震惊，模型仿佛已经学会了思考——所有信息都被压缩到了模型权重中。

AI如何「蹭」上物理学

讲到这里，你可能有一个疑问：这些跟物理学有什么关系呢？

诺奖委员会的解释是，人工神经网络是用物理学工具训练的。

Geoffrey Hinton曾以Hopfield网络为基础，创建了一个使用不同方法的新网络：玻尔兹曼机。在这个过程中，Hinton使用的是统计物理学的工具，来学习和识别数据中的模式。

就这样，AI跟物理学联系上了。

如果讲到此次另一位获奖者John Hopfield，倒是和物理学的关系更紧密一些。

一言以蔽之，Hopfield网络是按物理学上能量函数最小化来构建的，可以看作是物理学中「自旋玻璃模型」的扩展。

Hopfield网络利用了材料由于其原子自旋而具有特性的物理学——这种特性使每个原子成为一个微小的磁铁。整个网络的描述方式等同于物理学中发现的自旋系统中的能量，并通过找到节点之间连接的值来训练，使保存的图像具有低能量。

另外，Hopfield Network和玻尔兹曼机都是基于能量的模型。

统计力学原理，便是这两者的核心。它们都使用来自统计力学的能量函数，来建模和解决与模式识别和数据分类相关的问题。

在前者当中，能量函数被用来寻找与所存储的模式相对应的最稳定状态。后者中，能量函数通过调整节点之间连接的权重来帮助学习数据的分布。

至此，诺奖委员会就自圆其说了。

John Hopfield：一个想法，波及三大学科

20世纪80年代初，John Hopfield在加州理工学院创建了一个简单的计算机模型——Hopfield Network。

其行为方式不太像当时的计算机，而更像人脑。

这是因为，Hopfield Network模仿了人脑储存信息的结构。它由相互连接的节点组成，正如人脑中的神经元一样。

节点中的连接强度具有可塑性，可强可弱，而强连接进而形成了我们所说的「记忆」。

Hopfield学生，现Caltech计算机科学、计算与神经系统以及生物工程教授Erik Winfree解释道：

Hopfield Network是物理学中「自旋玻璃模型」（the spin glass model）的扩展。自旋玻璃有两种磁化状态，可以称之为它的「记忆」。

Hopfield扩展了这一模型，让其有了更复杂的连接模式。

简言之，他使用一个简单的规则，让每对单元（每个节点）之间有不同的连接强度，而不再局限于两种状态。

他的工作证明了，这种网络可以储存多种复杂的模式（记忆），而且比之前的方法更接近大脑运作方式。

Hopfield以一种跨学科的视角阐述这个模型，解释了人工神经网络与物理学之间的联系。

复旦大学计算机科学教授张军平认为，Hopfield Network与物理学领域的关联是，它的设计思路模拟了电路结构。

「假设网络每个单元均由运算放大器和电容电阻组成，而每个单元就代表着一个神经元」。

在普林斯顿大学新闻发布会上，Hopfield表达了同样的观点。他认为，长远来看，新科学领域通常产生于，大量科学知识的交叉点上。

你必须愿意在这些「缝隙」中工作，找出你的知识局限性，以及让这些学科更丰富、更深入、更好被理解而采取的行动。

来自MIT-IBM实验室物理学家Dmitry Krotov分享了，Hopfield Network一个想法至少对三大学科产生了巨大的影响。

它们分别是，统计物理学、计算机科学和人工智能、神经科学。

2023年，他曾发表了一篇Nature论文，对Hopfield Network在统计物理、神经科学和机器学习等多个学科中，进行了分析。

论文地址：https://www.nature.com/articles/s42254-023-00595-y

Krotov本人也与Hopfield合作过多篇研究，因此他对Hopfield Network工作的了解再熟悉不过了。

统计物理学

在统计物理学中，Hopfield Model成为最常被研究的哈密顿量（Hamiltonian）之一。哈密顿量在物理学中，描述了系统的总能量，是理解系统行为的关键。

这一模型已经催生了数以万计的论文、几本书籍。它为数百名物理学家进入神经科学和人工智能，提供了切入点。

就连诺贝尔奖官方给出了解释，机器学习模型，是基于物理方程式。

计算机科学和AI

在计算机科学中，Hopfield Network终结了AI寒冬（1974-1981），并开启了人工神经网络的复兴。

Hopfield在1982年发表的论文，标志着现代神经网络的开始。

论文地址：https://www.pnas.org/doi/10.1073/pnas.79.8.2554

就连如今的顶会NeurIPS，起源可以追溯到1984-1986年在加州理工学院举行的被称为「Hopfests」的会议。

这个名字直接致敬了Hopfield，彰显了他的早期工作在神经网络研究中的核心地位。

John Moody在1991年的NeurIPS论文集中记录了这段历史。

另外，Hopfield Network成为限制玻尔兹曼机（Restricted Boltzmann Machine）发展的主要灵感来源。RBM在早期深度学习中，发挥着重要的作用。

还有基于能量的模型（Energy Based Model），代表着人工智能领域中一个重要的范式。

它也是从Hopfield基于能量和记忆的模型发展而来。

神经科学

在神经科学领域，Hopfield Network成为后来许多计算记忆模型的基础。

它将记忆回忆概念化，即能量景观中滚下山坡的想法，已成为神经科学中的经典隐喻。

这次「诺奖风波」后，许多人也对如今的学科分类有了全新的思考。

不可否认的是，AI已经融入了全学科、全领域。

而这次诺贝尔物理学奖颁给AI，也是AI大爆发对于人类社会颠覆影响的一个真实写照。

参考资料：

https://x.com/Caltech/status/1843764971022495942

https://x.com/DimaKrotov/status/1843682498825564463

https://cacm.acm.org/opinion/between-the-booms-ai-in-winter/

https://x.com/DrJimFan/status/1843681423443800315

来源：新智元 https://mp.weixin.qq.com/s/cFe9plNsk8NBM1Zhi6a6BQ

关注我们了解更多资讯

《中国科技信息》杂志社

主管单位：中国科学技术协会

主办单位：中国科技新闻学会

在线投稿平台：www.cnkjxx.com

投稿电话：010-68003059

新媒体内容合作联系微信：cnkjxx1989

杂志收录情况：《中国知网》《中国期刊核心期刊（遴选）数据库》《中国学术期刊综合评价数据库（CAJCED）统计源期刊》《中国期刊全文数据库（CJFD）》《中国科协、中国图书馆学会（解读科学发展观推荐书目）》

http://mp.weixin.qq.com/s?__biz=MjM5MDUwOTg4NQ==&mid=2691944555&idx=2&sn=c5b76fcfe3027fdbfb49b66f21299c95

中国科技信息

主管：中国科学技术协会主办：中国科技新闻学会国内统一刊号：CN11-2739/N 国际标准标号：ISSN1001-8972 服务定位：媒体引领，元宇宙传播，协同创新，科技、金融、品牌一体化赋能者。 T：010-68003056/7/8

最新文章

工信部组织开展2024年度中小企业“揭榜”工作

新突破！中国新能源汽车首破年度1000万辆

封面人物 |得一微吴大畏：探索存储底层技术，细节是关键

工信部印发《重点工业产品碳足迹核算规则标准编制指南》

新一轮财政资金奖补政策接续推出促进专精特新中小企业发展壮大

中小企业看过来！工信部100门优质免费课程来了

低空产业“加速起飞”！预计明年民用无人机产业规模将超2000亿元

新增51家、通过复核307家！最新版符合环保装备制造业规范条件企业名单公告

科学技术普及法22年来首次修订！筑牢大国科普基石

工信部组织开展第一批先进适用技术遴选工作

两部门公告9个“无废园区”、19个“无废企业”典型案例

2024年实体经济和数字经济深度融合典型案例征集工作启动

10月我国制造业PMI为50.1% 重回扩张区间

工信部、财政部、国家数据局联合部署建设新材料大数据中心

全国数据标准化技术委员会2024-2025年拟制修订的重点标准项目清单

工信部等六部门部署开展2024年度智能工厂梯度培育行动

“5G+智慧教育”应用试点全国典型项目及通过验收项目名单公布

我国加快布局绿色产业化体系

习近平给中国海洋大学全体师生回信

2024年度智能制造系统解决方案“揭榜挂帅”申报工作启动

徐延豪会见世界科学记者联盟主席本·迪顿

我国将探索建立通感一体的低空经济网络设施

工信部组织开展第六批产业技术基础公共服务平台申报工作

中共中央、国务院：加强对产业工人主人翁地位的宣传引导

关于向社会公开征求《数据领域名词解释》意见的公告

“科技传播赋能农业强国建设”农业科技传播研讨会在京举行

2024 汽车芯片创新成果典型案例新鲜出炉，来看看他们都是谁

事关培育专精特新中小企业、打造独角兽企业、帮助企业拓展市场……工信部权威解读来了！

工信部征集先进计算赋能新质生产力典型应用案例

国家数据局关于向社会公开征求《公共数据资源授权运营实施规范（试行）》（公开征求意见稿）意见的公告

一图读懂 | 加快公共数据资源开发利用意见要点

两部委关于印发《新材料中试平台建设指南（2024—2027年）》的通知

国家发改委、国家数据局等部门联合印发《国家数据标准体系建设指南》

解密诺贝尔物理学奖为啥颁给AI？Hinton和Ilya 12年前对话，竟引发物理诺奖AI风暴！

40个场景打造智能制造“升级版”！工信部印发《智能制造典型场景参考指引（2024年版）》

国家数据局就促进数据产业高质量发展和促进企业数据资源开发利用公开征求意见

“中科绿通”全媒体智能审校平台入选新闻出版业人工智能大模型创新应用优秀案例

习近平就推进新型工业化作出重要指示

Gartner研究总监解读2024年中国AI技术趋势：复合式AI将引领未来

工信部发布2024年度中小企业特色产业集群名单及工作要求

工业和信息化部办公厅关于印发工业重点行业领域设备更新和技术改造指南的通知

中国科技传播论坛学会党建分论坛顺利举办

2024年度享受增值税加计抵减政策的集成电路企业清单制定工作要求明确

国务院办公厅关于践行大食物观构建多元化食物供给体系的意见

工信部发布方案筹建3个标准化技术委员会

工信部印发《关于推进移动物联网“万物智联”发展的通知》

五问+一图，读懂《关于推进移动物联网“万物智联”发展的通知》

工信部发布《中小企业数字化水平评测指标（2024年版）》

通信行业237项行业标准报批公示

中国科技馆科技成果科普化展品征集公告

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉