AI教父杨立昆分享自己从非顶尖院校迈向贝尔实验室的逆袭之路,阐述工业界为何是AI年轻科学家的成长沃土

文摘   2024-11-30 07:31   浙江  

👇关注公众号后设🌟标,掌握第一手AI新动态

本文访谈内容整理自图灵奖得主杨立昆在iSPIRIT的主题演讲,公开发表于2024年11月27日。原始内容参考:https://www.youtube.com/watch?v=w4KCLXiHtUI

图灵奖得主杨立昆在印度iSPIRT的主题演讲

内容导读

杨立昆访谈的主要观点可以总结如下:

  1. 学术路径并非唯一: 杨立昆的个人经历表明,通往科学研究的道路并非只有一条,并非必须进入顶尖学府,更重要的是对科研的热情和坚持。他强调了在非顶尖学校也能进行优秀研究的可能性。
  2. 机器学习领域的发展历程: 他描述了机器学习领域曾经的衰落和复兴,以及他本人在其中扮演的角色。他指出,感知器模型的兴衰以及学术界对神经网络研究的冷淡,都影响了该领域的发展。
  3. 工业界对科研人才的重要性: 杨立昆认为,吸引和培养年轻科学家,需要在工业界提供有吸引力的职业机会。学术界并非所有科学家的理想归宿,工业界的雄心勃勃的研发机构至关重要。他以法国和印度为例,指出工业研究实验室的缺乏制约了人才发展。
  4. 贝尔实验室的独特之处: 他高度赞扬了贝尔实验室的开放研究环境和雄心,认为其是吸引和培养顶尖人才的关键。他将自己在贝尔实验室的经历与欧洲和法国的科研环境进行对比,突出其差异。
  5. FAIR实验室的成功经验: 他分享了他在Meta创建FAIR实验室的经验,强调了FAIR实验室在吸引和培养人才,推动人工智能发展方面的成功,并将其成功经验与巴黎人工智能生态系统的繁荣联系起来。
  6. 对印度的建议: 他建议印度应该在工业界创造更多类似FAIR实验室这样的机构,为有抱负的科学家提供职业发展路径,从而提升印度的人工智能研究水平。这包括提供有竞争力的薪资和科研环境,改变将科研视为跳板而非职业道路的观念。
  7. 开放式研究的重要性:  他强调开放式研究的重要性,允许科学家发表论文,维护学术声誉,保证其职业生涯的持续性,从而吸引更多优秀人才。

演讲全文

杨立昆:  是的,我觉得一件轻便夹克在这里很合适,因为穿衬衫有点太冷了,穿厚外套又有点太热了。所以这刚刚好。好吧,我不习惯谈论自己,但查拉德真的坚持要我谈谈我的个人经历。我从小就对科学和工程感兴趣。我父亲是一位工程师。我从未想过自己有可能成为一名科学家,尽管我渴望成为一名科学家。我不知道该如何成为一名科学家。我不知道你必须去一所好学校,读博士等等。

我上了高中,数学和物理都很好,但是我高三的数学老师不太喜欢我。如果你想进入顶尖项目、顶尖学校、顶尖的科学院校(例如巴黎综合理工学院或巴黎高等师范学院),你多少需要你的数学老师喜欢你。我觉得自己做不到。你必须经过两三年的预科学习,基本上只学习数学和物理,其他什么都不学。然后你参加全国竞赛,根据你的排名,你可以选择你想要去的学校。我不喜欢这个主意,部分原因是我对工程和建造东西感兴趣。我认为在真正动手做任何事情之前,仅仅学习两年数学和物理也许不是最有趣的事情。所以我去了一个高中毕业后就能直接入学的学校。在法国,这些学校不被视为通往成功的最佳途径。这就像不去哈佛、麻省理工学院、斯坦福大学或耶鲁大学,而是去一所不太知名的学校。

然而,我发现自己对科研和科学充满热情。我学习了很多物理,我的专业实际上是超大规模集成电路设计(VLSI Design),说来也奇怪,因为我学的是电气工程。我与数学教授一起完成了一些项目,因为我对人工智能以及数学、逻辑等方面的基本问题感兴趣。通过这些独立项目,我培养了对研究的兴趣,并意识到我真的很想从事研究工作。毕业后,我告诉自己我不知道该如何去做,但我真的很想从事机器学习方面的工作。当时,它还不叫机器学习。我通过读一本哲学书偶然发现了这个领域的存在,这本书记录了语言学家诺姆·乔姆斯基和认知科学家让·皮亚杰之间的一场辩论。他们讨论了语言是先天性的还是后天习得的。

皮亚杰支持后天学习的观点,而乔姆斯基则认为语言本质上是大脑中一种硬性编码的器官。读完这本书后,我认为这场辩论中各方都在相互争论。我认为乔姆斯基的立场是荒谬的,因为我相信学习是智力的一个重要方面。在皮亚杰一方,有一位麻省理工学院的数学家西摩尔·帕普特,他描述了一个叫做感知器的模型。我以前从未听说过这个;我们说的是1980年,我当时读大二。帕普特谈到一个非常简单的系统,它能够学习令人惊讶的复杂概念,并且我对机器能够学习的想法感到震惊,这让我发现人们以前就研究过这个概念。

我对相关文献的探索表明,该领域的所有研究都在50年代和60年代初期达到顶峰,但在60年代后期却戛然而止。这种衰退部分是由于一本数学书籍,书中详细阐述了为什么这些简单的模型无法扩展以创造智能机器的理论。这本书的两位合著者之一就是西摩尔·帕普特,他与人工智能领域的传奇人物马文·明斯基一起,实际上扼杀了整个领域。令我惊讶的是,大约十年后,也就是70年代后期的辩论中,同一个人在为感知器的消亡做出了贡献之后,却赞扬了感知器。

在我进一步调查后,我发现除了日本的一些研究人员(他们拥有一个独立的研究生态系统,并且继续他们的工作,对西方的观点漠不关心)之外,法国或其他地方都没有人在研究机器学习。这个主题在西方已经成为禁忌,缺乏资金和兴趣。然后,我偶然发现巴黎的一个小型团体组建了一个独立实验室,由大学教授组成,他们占据了工业部空置的办公室。他们正在研究他们所谓的“自动机网络”,探索简单的互连元素如何产生涌现特性并表现出自组织——这是一个可以追溯到20世纪50年代的想法。当然,大脑就是这个概念的完美例子,我对此着迷,并想研究这个课题。

我和这个小组谈过话,虽然他们不像我那样专注于神经网络,但他们鼓励我报读研究生课程并与他们一起工作。我研究了神经网络,但我必须找到一位导师。实验室成员中有一位是正教授,可以正式指导博士生。我请他做我的导师,并向他保证我不需要资金,因为我的工程学校提供某种奖学金。他同意签署文件,但警告说他在技术上帮不了我,因为他对我的研究内容不熟悉。因此,我完成了博士学位,而没有直接咨询导师。

他是一个好人,在我毕业后开始研究神经网络,因为我的博士论文获得了一些认可——它是当时第一批评论神经网络的法语文献之一。因此,人们开始主动联系他,希望参与相关的项目。尽管我没有一位名气很大的导师,也没有来自顶尖的学校,但我相信某些想法非常重要。我相信人工智能不应该由设计智能系统的工程师来构建;相反,机器应该能够通过学习来自行设计,就像具有神经系统的生物系统能够学习和适应一样。

1985年,我遇到了杰弗里·辛顿等志同道合的影响力人物。这标志着一个新社区的出现。我于1987年毕业,辛顿当时正搬到多伦多大学,邀请我作为博士后加入他的新实验室。我还于1985年在一个研讨会上与贝尔实验室的几位人士会面,其中发生了一件值得一提的事情,尽管我不想用细节烦扰你们。有一位来自亚利桑那州的年轻物理学家,留着大鬓角,穿着牛仔夹克和牛仔靴,打扮得像个牛仔。他刚开始在贝尔实验室工作,每次演讲后他都会举手提出具有挑战性且常常尖锐的问题,无论演讲者的地位如何,都会削弱演讲者提出的要点。

所以我转向我的同事,问道,那些家伙是谁?他们说,哦,你知道,他们是贝尔实验室的。每当你对着贝尔实验室的人做演讲,他们首先会告诉你,这件事贝尔实验室十年前就做过了,其次,它根本行不通。好吧。

然后我不得不在这些人面前做演讲,其中有非常有名的人,例如刚刚获得诺贝尔物理学奖的约翰·霍菲尔德,以及发明了模拟退火技术的斯科特·柯克帕特里克。我在法国的一位英雄是一位非常著名的神经科学家让-皮埃尔·尚热。还有许多其他非常有名的人也在那里。我非常害怕,但我尤其害怕这个人。

我的演讲是用非常蹩脚的英语进行的。那是我第一次用英语做演讲,我讨论的是多层网络。当时,人们对我们现在所说的霍菲尔德网络感兴趣,而霍菲尔德本人就在现场。我认为那个模型并没有什么用。我坚信,要想在人工智能领域取得进展,就必须训练具有多层的神经网络。我当时真的对此着迷。

我提出了一种训练这些网络的算法,它与我们现在所说的反向传播非常相似,尽管略有不同——它更接近我们现在所说的目标传播。无论如何,我做了我的演讲,并假设没有人理解我在说什么,这在很大程度上是正确的。然后,那位留着大鬓角的贝尔实验室的家伙举起了手。

我整个人都紧张得不行了,你知道,所有东西都好像要融化了,对吧?你看过《天使爱美丽》这部电影吗?有一个场景是她看到了她爱的人,却不敢和他说话,然后她就紧张得不行了。好吧?这就是当时发生在我身上的事。所以他举起了手,但他并没有说些难听的话,他说,你知道,我很高兴地说,你让我理解了一些我不理解的东西。这真的很酷。我当时心想,什么?

两年后,他们给了我一份工作。这就是我被贝尔实验室录用的方式。到那时,他们已经决定在我毕业后录用我,但我还有几年时间要读。然后我在多伦多做博士后,他们推迟了,因为他们不想挖走学术界的人才。然而,当我还在多伦多做博士后时,他们邀请我去了新泽西,我做了一个演讲,然后他们给了我一份工作。

我刚才说的故事发生在我多伦多期间,他们为系里买了一台新电脑。这是一台Sun Microsystems的电脑,叫做Sun 4。这是一种新型的处理器,速度很快;你可以在上面训练神经网络。这台机器的浮点运算速度可能只有几百千次。我们甚至连兆次都谈不上。

几个月前,在我到达贝尔实验室之前,我的未来老板,部门主管,问我他们是否可以在我到来之前买一台电脑,这样我一来就能用。他们问我当时用什么电脑,我说我在多伦多大学用Sun 4。他们说,好吧。然后我第一天来到贝尔实验室,就有一台Sun 4在等着我。在多伦多,40个博士生共用一台Sun 4,但我却独享一台。

我说:“怎么回事?”他说:“你知道,在贝尔实验室,你不会因为省钱而出名。”我回答说:“真是个好地方。”我加入的原因是我不想留在北美;我想回法国。我妻子也想去法国,因为她是一名药剂师。在霍姆德尔贝尔实验室的面试中,他们带我参观实验室的每一个项目,我都在《科学美国人》或类似的出版物上读到过。我印象非常深刻。

很多向我展示的工作最终都获得了诺贝尔奖。例如,用激光和激光冷却进行离子阱方面做了大量工作。两项独立的诺贝尔奖都源于隔壁实验室的这项工作。我真被那个地方惊呆了,根本无法拒绝贝尔实验室的录用邀请。然而,我明确表示我只待两年,因为之后我需要回法国。

两年后,我在法国寻找类似的工作,并在一家名为汤姆逊-CSF(现称泰雷兹集团)的公司的工业研究实验室找到了一份工作。他们在巴黎南郊的巴黎高等师范学院附近有一个中央研究实验室。我相信这是我在法国能找到的最接近贝尔实验室的地方。

我去那里了,但贝尔实验室的人说,他们会为我留个位置,让我回来。事实上,我达成了一个协议,允许我兼职在汤姆逊-CSF工作,并在贝尔实验室度过夏天,因为我认为那是一个令人难以置信的环境。事实上,六个月后,我又回到了贝尔实验室,再也没有离开,因为我在那里找到的那种环境,在欧洲是找不到的。我在欧洲与之交谈过的公司,这与印度目前的状况有关,当时在法国拥有研究实验室的公司并不开放,也不雄心勃勃,也不那么引人注目。他们主要从事应用性课题的研究,并没有给科学家留下很大的空间去从事有雄心的项目。这也许对他们的业务有益,但这确实不是一个有着一些科学抱负的年轻科学家所渴望的。

所以我回到了贝尔实验室。我妻子放弃了她的事业,决定再生一个孩子。我们从未刻意决定留在美国,但事情就这么发生了。我认为这与印度目前的状况有一些共通之处。对于年轻有抱负的科学家来说,这非常困难,他们可能毕业于印度理工学院,名列前茅,在印度攻读博士学位,并在学术界之外获得一些职业前景。

进入学术界很好,但并非适合所有人。法国、美国和印度都存在部分薪资问题和类似因素。然而,这还关乎学术界的环境和教学文化,这可能并不适合所有人。当时,我不认为自己会在学术界从事研究工作。我以前从未想过这个问题。

我在法国没有像在美国那样,尤其是在贝尔实验室这样的地方,拥有类似的研究机会。当然,贝尔实验室有点例外。在美国,只有三四个实验室有类似的雄心勃勃的蓝天研究。这些包括贝尔实验室、IBM、施乐帕洛阿尔托研究中心,以及可能还有少数较小的实验室,例如通用电气在某个时期。

但这确实有限。你可以一只手数出这些雄心勃勃的工业研究实验室。欧洲没有真正的机会,当然在20世纪90年代也没有,因为大多数这样的实验室实际上都关闭了。我部分讲述这个故事的原因是,如果你想吸引年轻科学家和有抱负的科学家回到印度,你必须为他们在工业界提供职业机会。如今,机器学习、人工智能和计算机科学的大多数博士都不会进入学术界;他们中的大多数都进入工业界。

他们中的一些人成为企业家。他们中的一些人基本上成为工业界的工程师或研究工程师。他们中的一些人成为工业界的科学家。他们中的许多人都有这样一条职业道路:先攻读理论方面的博士学位,然后转向具有某些应用成分但仍然非常基础的研究,基础研究。随着时间的推移,他们往往会转向更应用性的工作,因为他们希望对世界产生影响。最终,他们可能会创业,或成为工程组织的负责人,或类似职位。

我在法国发现,当时在研究实验室,如果你在研究实验室工作超过五年作为一名研究科学家,你被认为在事业上失败了。你应该离开研究实验室,在公司的其他地方担任重要职位,做一些更实际的事情。因此,研究被视为跳板,而不是职业道路。

作为一名科学家和研究人员,我有许多机会转向成为工程师或企业家,但我总是选择留在科学领域并发表论文。

我认为印度已经有一些非常好的学术机构享有盛誉,正在进行着奇妙的研究。然而,你需要一个工业部门,为那些创新意识不在学术界运作的人服务。我们有很多这样的人在工业界的研究实验室工作。他们可能不具备在学术界取得成功所必需的成熟、全面的个性,但他们在某些领域非常出色,使他们在工业环境中富有影响力和生产力,并能有效地与他人合作。不幸的是,印度没有这样的结构。在我年轻的时候,法国也没有。

在我加入Meta(前身为Facebook)并创建FAIR(研究实验室)之后,我以一种使其成为享有盛誉且雄心勃勃的组织的方式来组织它,从事开放式研究。这种方法使我们能够通过向他们保证他们的研究人员职业生涯没有结束来吸引科学家。他们仍然可以发表论文,保持自己的名字和声誉,如果他们决定在五年后转到学术界,他们将拥有出色的出版记录。我们的目标是进行一流的研究并吸引最优秀的人才,而且它奏效了。

几年后,我意识到我们应该在欧洲建立一个实验室,以利用欧洲大陆上令人难以置信的人才。对于硅谷公司来说,本能是由于共同的语言和法律体系(加州律师很熟悉)而在英国开设实验室,而且英国和美国之间存在特殊关系。然而,事实证明这相当困难,因为DeepMind和谷歌将伦敦视为其受保护的后院,并尽其所能阻止我们在那里建立存在。很快我们就发现我们需要一个不同的策略,所以我改变了方向,并说服了Meta的领导层,包括马克·扎克伯格和首席技术官马克·施罗普弗,在巴黎开设一个实验室。

原因是在那里人才高度集中,我们将成为巴黎唯一的工业研究实验室。因此,我们将能够吸引所有最优秀的人才。而且它奏效了。这比我们最狂野的梦想还要成功。我们确实聘用了一大批真正优秀的人。我们在巴黎FAIR建立了这个非常成功的项目,让博士生驻扎在那里。

巴黎FAIR的存在为法国年轻有才华的学生提供了职业机会。现在,他们能做的最酷的事情,而不是去银行工作做金融,而是攻读人工智能博士学位。这是他们能做的最好的事情,也许有机会在巴黎FAIR找到工作,或者在那之前,在FAIR攻读博士学位。因此,我们吸引了法国乃至欧洲所有最优秀的学生。

我们现在每年在FAIR毕业十几个学生。这些人有助于汇集巴黎的整个生态系统。我不想替你说话,Hervé,但我认为巴黎FAIR的创建是将法国人工智能生态系统提升的关键因素,如今巴黎基本上是美国以外人工智能初创企业和人工智能科学最热门的地方。所以这产生了巨大的影响。

我认为这种影响可以在印度重现。你必须做的是为雄心勃勃的年轻科学家提供职业机会。好了,时间太长了。谢谢。

关注公众号后设🌟标,掌握第一手AI新动态

往期精选

  1. 黄仁勋专访:OpenAI在大模型混战中达到“逃逸速度”
  2. 李飞飞与Justin深度解读空间智能:数字世界需要三维表征,才能与现实世界融合
  3. PayPal创始人彼得·蒂尔:人类科技停滞源于原子方面的进展远慢于比特
  4. 谷歌联合创始人布林:巨头们打造的“上帝模型”几乎可以理解一切
  5. 马斯克:AI将使商品和服务的成本趋近于零
  6. Karpathy最新专访:人形机器人、特斯拉、数据墙与合成数据


瓜哥AI新知
紧追AI业界一手观点、访谈、动态,点滴构建AI底层认知
 最新文章