“现在该做什么?”
这个问题在我的科研和教学生涯中不断出现。每位科学家、学者、作家、艺术家……每天都会面临这样一个问题:今天该做些什么。
大多数人会选择继续昨天的工作,无论是延续某个研究方向、完成一些测量或是推进故事的情节发展。但如果被迫在更深层次上,或者是在一个长期项目中问自己“现在该做什么”,大多数人会尽量避免改变他们一直以来乐在其中的研究领域。
译丨王启隆
出品丨AI 科技大本营(ID:rgznai100)
约翰·霍普菲尔德(John Hopfield)是普林斯顿大学教授,他的研究生涯横跨生物学、化学、神经科学和物理学等多个领域,成就斐然。尤为重要的是,他以物理学家敏锐的目光审视了生物学这一复杂的领域。他最著名的贡献之一是提出了联想神经网络,即现在的 Hopfield 网络,这一理论是推动现代深度学习领域发展的早期思想之一。
随着 2024 年的诺贝尔物理学奖授予霍普菲尔德教授与“AI 教父”杰弗里·辛顿(Geoffery Hinton)教授,关于两位先驱者的深邃思想再次走进公共视野。
辛顿教授作为图灵奖和诺贝尔奖双料得主,许多人热衷于挖掘他和“ChatGPT 幕后英雄”伊尔亚·苏茨克维(Ilya Sutskever)之间的师徒关系感到好奇,同时也对“人工智能专家是否该获得物理学奖项”感到质疑。
但事实上,霍普菲尔德教授和物理学却有相当深厚的联系。他的父亲是“霍普菲尔德带”(氧气的光谱带)的发现者与“莱曼-伯奇-霍普菲尔德带”(氮气的光谱带)的共同发现者,母亲也是一位物理学家。从小在学术环境中耳濡目染的霍普菲尔德,在长大后获得了物理学博士学位,随即前往了知名的「贝尔实验室」,在理论组工作了两年。
离开实验室后,霍普菲尔德教授开始了漫长且“横跨多学科”的科研生涯。一览他的职教经历,会发现他曾在加利福尼亚大学伯克利分校教过物理学,在普林斯顿大学教过物理学,在加州理工学院教过化学和生物学,随后又回到普林斯顿大学教分子生物学。而至今的 16 年来,他一直担任物理学教授,并在普林斯顿神经科学研究所的建立中发挥了关键作用。
正如霍普菲尔德教授在 2018 年发表的文章《现在该做什么?》(Now What?)中所说,他的许多成就都是通过不断地问自己“现在该做什么?”并在很多时候通过改变研究方向来实现的。下文是对这篇经典文章的翻译,力求引领读者们走近这位驱动了人工智能发展的物理学家。
引言
《现在该做什么?》 (Now What?) [1]
John J. Hopfield,普林斯顿大学,2018 年 10 月
“现在该做什么?”(Now What?)
这个问题在我的科研和教学生涯中不断出现。每位科学家、学者、作家、艺术家……每天都会面临这样一个问题:今天该做些什么。
大多数人会选择继续昨天的工作,无论是延续某个研究方向、完成一些测量或是推进故事的情节发展。但如果被迫在更深层次上,或者是在一个长期项目中问自己“现在该做什么”,大多数人会尽量避免改变他们一直以来乐在其中的研究领域。
我获得 2019 年富兰克林物理学奖[2],是“因将理论物理学的概念应用于提供对多个领域(包括遗传学和神经科学)中的重要生物学问题的新见解,并对计算机科学领域中的机器学习产生了显著影响。” 这些成就的取得是因为我经常通过改变研究方向来回应“现在该做什么?”的问题。而富兰克林奖项的一个更为科学的引用指出,我的两篇研究论文才是我获得提名的关键。
本文将讲述我是如何偶然遇到这些论文所解决或澄清的研究问题的历史。我对“现在该做什么”的回答是,“这是一个不同寻常的、可能重要的、新颖的研究问题,我可以提出并可能因为我的物理学背景而解决”。这种情况不会被那些背景比我更相关的人员轻易识别为一个问题。
选择研究问题是科学领域中个人成就的主要决定因素。我在科学问题上通常注意力持续时间较短(注意博学者与浅尝辄止者之间的细微差别,我常常处于后者的位置)。因此,我一直都在寻找更有趣的问题,而这要么是在我目前的问题得到解决时,要么是在我根据自己的特殊才能判断它们无法解决时。
物理学是什么?
我在一个父母都是物理学家的家庭中长大,因此对我来说,物理学不仅仅是一门学科。原子、对流层、原子核、一块玻璃、洗衣机、我的自行车、留声机、磁铁——这些都是偶然的课题。
我核心的理念是:世界是可以理解的,你应该能够拆解任何东西,理解其组成部分之间的关系,进行实验,并在此基础上能够发展出对其行为的定量理解。因此,物理学是一种哲学上的观点(point of view),即我们周围的这个世界,通过努力、创新和适当的资源,可以以预测和合理定量的方式被理解。
广义上的教育
我在拆解事物、了解它们是如何工作的、修理自行车、在厨房(或更好的是在地下室)探索化学、建造飞行模型飞机、晶体收音机和简单无线电、玩电池和电线圈并学会用手思考和操作实物的过程中长大。
我最早的记忆之一是一把小螺丝刀,它被放在母亲使用的脚踏缝纫机抽屉里。它是用来微调缝纫机的,但允许我用它拆解家里的任何东西——只要我把它放回抽屉里。如果我偶尔不能重新组装我拆开的东西,我父亲会在晚上耐心地帮我重新组装。
然而,成为一名物理学家对年轻时期的我来说是一个较为神秘的想法,即在更抽象的层面上进行这种游戏般的探索。
在我父亲那一代,物理学并不会带来丰厚的报酬。我父亲在 1929 年凭借古根海姆奖学金去了柏林,计划在 1930 年返回美国接受一份学术工作。1929 年的华尔街崩盘干预了,取消了所有大学的招聘。相反,他接受了几个临时职位,包括在 1933 年芝加哥世博会设立物理展览——我就是在那里出生。
成为物理学家在经济上并不理想,所以我还是短暂地考虑过其他职业。我的高中化学老师非常出色,而我的高中物理老师(事后看来)甚至缺乏对基本力学和电学的理解。受此影响,在填写大学申请时,我列出了“物理或化学”作为可能的专业。
威廉·“比尔”·埃尔莫尔
但我还是必须选择一个具体的研究方向。因此,在斯沃斯莫尔学院学习的后期,我开始关注物理研究生院,着眼于我可能会专攻的方向。我的成长经历特别集中在对周围世界的物理学的兴趣上,而不是原子核或宇宙的物理学,而是日常世界及其技术的物理学。
最终我选择了去康奈尔大学而不是普林斯顿大学读研究生,因为在 1954 年,康奈尔大学似乎有一个部门对固体物理学领域感兴趣。它由几门带有固体字样的课程、一个固体物理研讨会、两位在这个领域进行理论研究的教师和大约四个实验方向定义。那个部门当时进行的实验问题包括低温热导率、碱金属卤化物中的色心、绝缘体的紫外光谱和 X 射线吸收。我还记得部门里有个人在研究 氦-4 的超流动性系,但那肯定不属于当时定义的固态物理学范畴。刚从伊利诺伊大学来的唐纳德·霍尔科姆拥有一台瓦里安核磁共振仪,并且他的研究处于主流之外。系里其他的主流研究方向则包括核物理与粒子物理、X射线以及宇宙学和天体物理学。
阿尔伯特·奥弗豪泽
幸运的是,我可以去解决奥弗豪泽悬而未决的一系列有趣谜题。这些谜题通常是形式上的悖论,比如:“固体物理学中某一现象的初步理论分析得出结果 A,而实验却给出了完全不同的结果 B”。还有个例子,奥弗豪泽作为作者引用最多的论文的前两句是:
“简单的经典理论对离子晶体的介电常数和压缩性的描述导致了两个关系,其中任意参数已被消除,称为Szigeti关系。这两者都不符合实验数据,表明这些简单理论存在不足。”(B. G. Dick 和 A. W. Overhauser, 1957)
在奥弗豪泽列出的悖论中,大多数情况下他自己也不知道是什么导致了理论分析与实验结果之间的矛盾。于是,我选择了一个关于晶体中激子辐射寿命的问题,因为这个问题在理论上存在矛盾。简单的理论根据应用方式得出零或无穷的结果,这都不合乎情理。这个问题成了我的研究焦点,而奥弗豪泽并没有在这方面的研究。
第一份真正的工作
手握理论固态物理学论文,我踏入了就业市场。是选择学术界还是工业界?从我听过的固态物理学研讨会演讲者那里,答案已经很明确了。AT&T 的贝尔实验室和通用电气在固态物理学领域有着比任何大学都更广泛、更有活力的研究项目。从这些实验室回来后,我对工业界所追求的这一领域以及这两个实验室相对自由的研究氛围感到非常兴奋。
最终,我选择了贝尔实验室,主要是因为它的实验室管理结构。他们重组了结构,使得有一个小型的理论物理组,不直接隶属于磁性或半导体等子领域。相比之下,通用电气在每个固态物理学主题子群中都有几个理论学家。当然,加入贝尔实验室的固态理论组,就像在那个时代加入洋基队(知名职业棒球队)成为投手一样。
理论学家们都在研究奥弗豪泽那种谜语般的课题。
菲利普. 安德森(Philip W. Anderson)彼时写完了他那篇关于“某些随机晶格中缺乏扩散”的论文。这篇论文将成为他后来获得诺贝尔奖的基础,其动机是为了解释费厄(Feher)在掺杂硅实验中观察到的一些悖论性的电子自旋弛豫结果。梅尔文·拉克斯(Melvin Lax)试图以不违反热力学第二定律的方式来阐述半导体二极管中的噪声问题。因为在一个简单的二极管-电阻电路中,很难写出一个理论,使得二极管的整流特性导致电容器上的平均电荷为零。康耶斯·赫林(Conyers Herring)发明了声子拖曳(Phonon Drag)来解释掺杂半导体中异常巨大的热电势。格雷戈里·万尼尔(Gregory Wannier)当时在研究斯塔克效应(Stark effect)及其在高电场下的可能观测。
现在回顾整个事业,让我印象深刻的是,研究主题都是固态物理学的普遍问题。理论工作常常基于详细的实验,但并不专门由 AT&T 的材料科学和器件需求驱动。当然,贝尔实验室的大部分工作都集中在后一类问题上,但理论组却不同。
赫林阅读了所有固态物理学文献,甚至亲自翻译了一些苏联文献。他主持每月一次的期刊俱乐部,从他的阅读中选择最有趣的内容,指派相关的实验室科学家进行演讲。很少有人拒绝这样做。这些充满争论的会议对我的延伸教育和作为介绍贝尔实验室极其多样化的社会环境都是极好的。
赫林也是理论组的负责人,他看到我在努力寻找下一个研究问题。他建议我去拜访实验学家,以获得对有趣谜题所在的自己的感觉,我仍然记得许多这样的拜访。阿瑟·肖洛(Arthur Schawlow)向我解释了 1958 年汤斯-肖洛(Townes-Schawlow)关于“光学激光器”可能性的理论论文。然后,他从桌子抽屉里拿出一根大约三英寸长的粉红色棒子,描述了使 Al2O3 成为红宝石的 Cr3+杂质的奇妙光谱细节。他结束讲话时说,不幸的是,R1 和 R2 光谱线完全不适合制造光学激光器。但两年后,在西奥多·梅曼(Theodore Maiman)展示了闪光灯泵浦红宝石的激光作用后,这种晶体被用于制造贝尔实验室的第一台光学激光器。可见制造脉冲激光的重要性并未被肖洛意识到。
比尔·博伊尔(Bill [Willard] Boyle)那时在测量半金属铋的低温磁热性质。乔治·费厄(George Feher)使用他开发的 ENDOR 技术(电子-核双共振)绘制了硅中磷施主的电子波函数图。伯恩德·马蒂亚斯(Bernd Matthias)则告诉在场所有愿意听的人,超导性不可能真的是 BCS 型的,因为在某些材料中没有同位素效应。罗伯特·科林斯(Robert J. Collins)倒是向我介绍了 CdS 中的“边缘发射”发光,这为我的第二篇论文提供了主题。
拜访吉姆·兰德(Jim Lander)的子部门让我成功认识了戴维·托马斯(David G. Thomas),我们随后的合作为我未来几年提供了必要的“谜题”。贝尔实验室黄金时代的神秘感以及其管理者和科学家的卓越远见使我想讲述这个团队的背景故事。这个部门完全致力于氧化锌(ZnO)研究,而在 1960 年之前,真空管是所有电话电子设备中的基本放大器。真空管需要来自热阴极的电子发射,但为了延长使用寿命和降低功耗,温度需要尽可能低。氧化钡(BaO)涂层阴极在这方面表现良好,因此贝尔实验室成立了一个研究氧化钡的小组。
我在工作前十年对“现在该做什么?”的回答
总而言之,我遇到化学家戴维·托马斯,并与他建立了一个理论与实验相结合的工作联盟,这个联盟最终涉及了许多不同的化合物半导体。它为我提供了多年来未预见的问题和悖论,为 AT&T 提供了化合物半导体和半导体光学的重要知识基础,并在 1969 年为我们赢得了美国物理学会颁发的“奥利弗·E·巴克利凝聚态物质奖(Oliver E. Buckley Condensed Matter Prize,通常简称巴克利奖)”。
离开舒适区
1968 年,我发现在凝聚态物理学中已经找不到适合我特殊才能的问题了。我获得了一个古根海姆奖学金(Guggenheim Fellowship,美国著名的学术资助项目),前往剑桥大学的卡文迪许实验室待了半年,希望找到新的有趣方向,但几乎一无所获。
从剑桥大学回到普林斯顿大学后,在贝尔实验室半导体组的咨询工作中,我遇到了罗伯特·舒尔曼(Robert G. Shulman),一位正在对血红蛋白进行高分辨率核磁共振实验的化学家。
罗伯特·舒尔曼
他是美国国家科学院院士和美国国家医学研究所院士。他后来放弃了生物分子结构研究,转而研究体内通路。
舒尔曼向我介绍了血红蛋白中四个铁原子在广泛分离的血红素组中心的协同氧结合。令人惊叹的是,各种物理学技术都被用来研究这个分子。核磁共振(NMR)、电子顺磁共振(EPR)、光谱学、共振拉曼散射、X 射线结构研究、中子散射、穆斯堡尔光谱学——所有这些固态物理学的巧妙实验技术似乎都与血红蛋白密切相关。有一段时间,血红蛋白成为物理学家理解蛋白质如何运作的“氢原子”。
了解自己的才能:生物学是我的好去处
在 1970 年代中期,我为一部关于化学、物理学和生物学交叉研究的教育片做了旁白。其中有一个短片,化学家莱纳斯·鲍林(Linus Pauling)回答了一个关于他“如何选择研究问题”的问题。鲍林的回答是:“我常问自己,我正在考虑的问题是否是我可能做出贡献的问题。”
鲍林本可能因首次理解可遗传的“分子疾病”而获得生理学和医学诺贝尔奖(如果他不是已经获得了化学/和平双料诺贝尔奖的话),但这种天才也一样会认为问题与自己才能的匹配很重要。
仅仅知道一个问题很重要,并不足以成为追求它的充分理由。
生物学为科学带来的独特概念贡献是“功能”(function)的观念;即存在一小部分对生物学极为重要的属性,而进化过程已经塑造了生物系统,使其功能完善。“功能”(function)这个词在生物学中特别常见,也出现在为了人类利益而发展的应用科学和工程学中,但在纯物理学、纯化学、天文学或地质学中并不相关。
我与舒尔曼的小组合作了几年,致力于理解导致血红蛋白平衡氧结合协同性的相互作用能量。贝尔实验室对这个新尝试表示理解。我的咨询工作从半导体组转移到了生物物理组,但有些幽默的是,实验室那年几乎无法提高我的咨询费,因为我相应的专业水平一下子从「世界专家」转移到了「一无所知」。但我们在用一个共同的框架解释各种实验方面仍然取得了一些成功。
这个小组中当时不太出名的成员之一是小川诚二(Seiji Ogawa),20 年后他因利用核磁共振和血红蛋白方面的专业知识发明了功能性磁共振成像(fMRI,Functional Magnetic Resonance Imaging)而成名。fMRI 可以成像展示大脑如何处理信息(即大脑如何“运作”)。
小川诚二
当时名不见经传的他,后来被誉为现代功能性磁共振成像(fMRI)之父。
舒尔曼的贝尔实验室小组随后将研究重点从血红蛋白蛋白质转向了被称为转运核糖核酸(tRNA)的核酸,他们可以从核磁共振中确定分子二级结构的某些方面。由于缺乏将这些实验与功能问题联系起来的方法,我对该小组关于 tRNA 的实验失去了兴趣。然而,我确实参加了许多外部演讲者的研讨会,他们描述了 tRNA 的功能生物学方面,尽管对其结构知之甚少。
45 年后,仍然留在我记忆中的是赫伯特·韦斯巴赫(Herbert Weissbach)关于蛋白质合成的演讲。演讲中充满了太多细节,以至于任何物理学家都难以记住,其中包括一部有趣的电影,学生们扮演氨基酸、RNA、蛋白质等角色,最后以一串连接的“氨基酸学生”生成而结束,同时“磷酸盐学生”和“tRNA 学生”消失在虚无中。我的整体印象只是,在蛋白质合成过程中似乎存在高能分子的奢侈浪费。演讲者专注于描述组装蛋白质的线性生化途径,并未提及我作为物理学家对能量浪费的看法。参加这个两小时的讲座是我加入贝尔实验室生物物理小组的部分“赎罪”。但它也让我清楚地看到生物化学家通常如何看待一个复杂的问题。
与此同时,我在普林斯顿大学开设了第一门为物理研究生设计的生物物理学课程。我花了过多的时间讲解血红蛋白。不幸的是,血红蛋白是生物学问题的糟糕引入,因为其最明显的物理问题是平衡问题。生物学的本质是远离平衡的驱动系统的动力学。大约在学期的第五周,我一天晚上下定决心要开发一个理论来处理生物动力学的任何问题。唯一的前提条件是需要以一种只需要基础量子力学和初级固态物理知识的水平和方式处理。
我很快意识到,从物理学的角度来看,生物学中最简单的化学反应是电子转移,几乎没有原子核运动和化学键重排。光合作用的早期阶段和氧化磷酸化中的一些重要过程就是这种性质。所以那天晚上,我确定了下周的主题,并粗略解决了电子转移速率问题。
为了稍作休息,我在电子转移讲座之后用三周时间进行了关于细胞膜和霍奇金-赫胥黎方程(描述神经冲动沿神经细胞轴突传播)的标准生物物理学讲座。我的讲解中完全没有原创性或创造性,但讲座准备开始为我打下了神经生物学的基础,这后来证明是无价的。
在课程的最后一周,我努力描述了一个涉及 tRNA 的动力学问题。选择这类分子主要是因为它是我除了血红蛋白之外唯一了解一些的生物分子系统。tRNA 在按照信使核糖核酸(mRNA)上的指令将氨基酸组装成蛋白质中起着核心作用。只需几分钟的物理学思考就得出结论,如何准确地完成这一过程在一定程度上是一个化学动力学问题。
尽管我对生物化学知之甚少,但在最后一周的讲座中,我转向了准确制造蛋白质的动力学问题。大多数描述蛋白质合成的生物化学研究和教科书都基于化学反应的“锁和钥匙”模型,也就是说,他们认为错误的反应是不可能的,因为“错误的氨基酸不适合”。同理,理解生物化学通常被视为绘制“发生什么”的问题,对于“不发生什么”并没有太多思考。
从物理学的角度来看,大多数生化反应在室温下都是可能的。类似但不同的反应只会有不同的能量,从而有不同的玻尔兹曼因子决定动力学速率。区分实际上是基于能量差异。在生物化学家的世界里,奥弗豪泽那种关于“A 发生而 B 不发生”的谜题,应该被替换为“A 以 exp(-EA/kT) 的速率发生,B 以 exp(-EB/kT) 的速率发生”。坏反应与好反应的速率比必须是 exp(-(EB-EA)/kT),其中 EB-EA 是区分能,是一个正数。
总之,我设法组织了几次讲座,展示了对于准确的生物合成,化学反应网络不应该被推动得太快运行。但这些讲座不涉及任何原创构想,只是课堂材料,而不是研究。在准备讲座的过程中,我对两种非常相似的氨基酸(缬氨酸和异亮氨酸,它们只在一个甲基基团上有区别)之间的区分能进行了粗略的固态物理学类型估计。我计算出任何(合理的)异亮氨酸结合位点错误使用较小分子缬氨酸的最大能力约为1/50。不幸的是,生物蛋白质合成中的实验数字约为 1/3000,而这点还是当时从物理学家罗伯特·洛夫菲尔德(R. B. Loftfield)于 1963 年的优雅工作中得知的。
我的能力在将估算技巧从一个领域转移到另一个领域上显然有限!作为对物理学家傲慢态度的一个警告,我后来把这个明显不准确的估计算法告诉了学生们。
学期结束后,这个问题仍然萦绕在我的脑海中。一个月后,我意识到这可能是一个真正的悖论。我的估计可能大致正确。但是洛夫菲尔德的观点也可能是正确的,而准确度可能不是由简单的辨别能量决定的。在宏观层面上,一个打字员可以校对文档,从而产生一份最终副本,其中原始打字中的大多数错误都已被纠正。解释这个准确度悖论的一种方法是,细胞生物学包含了一种在分子水平上校对生化反应的方法,从而从约五十分之一的内在基本准确度获得了五十分之一乘以五十分之一,即约二千五百分之一的准确度。
这甚至有可能是一个研究问题,即人体内的生化过程可能自动进行了这种「校对」(proofread),而我们(即生物化学家)只是没有注意到这一事实,因为我们不知道要去寻找。
奥弗豪泽效应:一个改变科学界的发现
我非常感谢许多人的帮助,尤其感谢我的论文导师阿尔伯特·奥弗豪泽。我通过发现悖论来识别研究问题的方法直接来自他。但是了解奥弗豪泽也让我从根本上思考他最伟大的研究论文《金属中核的极化》(A. W. Overhauser,1953 年)[3] 的含义。这个主题与生物学的紧密联系程度可以说是物理学所能达到的极限。这是一篇令人惊叹的论文。请让我引用他在 1979 年获得芝加哥大学荣誉理学博士学位时的几段话:
“奥弗豪泽提出了令人震惊的原创想法,如此不寻常以至于最初让部分科学界感到惊讶,但由于其深度和意义,开辟了广阔的新科学领域。”
“这一发现——被称为核奥弗豪泽效应(nuclear Overhauser effect,简称 NOE)——对核磁共振(一种用于研究物质结构的技术),以及通过核磁共振对化学、生物学和高能物理学的影响是巨大的。这个想法不仅产生了非常实际的后果,而且最初由于其意外性而遭到该领域权威的强烈抵制。直到 1953 年查尔斯·斯利切特(Charles P. Slichter)和马歇尔·卡弗(Marshall W. Carver)通过实验证明了其存在,它才被完全接受。”
基于奥弗豪泽论文的推论对核磁共振(NMR)在确定分子结构方面的应用产生了广泛影响。这篇论文是他获得国家科学奖章的基础。库尔特·维特里希(Kurt Wüthrich)在2002年获得的化学诺贝尔奖很大程度上便是基于奥弗豪泽的研究成果。
那么,让我简要说明一下为什么奥弗豪泽的论文对几乎所有听说过它的人来说都显得如此错误。
他的理论预测违背了所有物理科学家的基本直觉。假设有人试图向你推销一个可以在微波炉中制作冰咖啡的马克杯。你被告知这个普通的马克杯具有这样的特性:杯子的大部分会被微波加热,但神奇的是,杯中的咖啡会变冷。这正如同那些推销“包治百病”神药的商人的宣传,而奥弗豪泽似乎就是在做这样的事情。他声称,当一块金属暴露在强微波下时,样品的部分会变冷。
如今,我们常见的冰箱是一种由电源驱动的精巧设备,它能让冰箱的一部分变热,同时使另一部分变冷。所以,这样一个设计并非不可能实现。然而,让每一小块锂金属本质上都表现出一个精巧冰箱的功能似乎是荒谬的,即使你偶然想到了这种揭示奇异可能性的一般论证(当然这不太可能)。但事实证明这是正确的。
奥弗豪泽从未在这个总体领域再写过另一篇研究论文。(这篇洞察不是奥弗豪泽被引用次数最多的论文,这也突显了仅仅通过一篇论文被引用次数来衡量其对科学的重要性是多么无用。)但正是这篇文章在当时如此吸引我,以至于我为自己发展出了一种简单的理解,摆脱了主导奥弗豪泽论文的所有金属物理学细节。多年后,这种理解暗示,奥弗豪泽效应在生物化学领域的类比现象可能解释了生物如何达到高准确度,如果生化系统也涉及与化学能源的耦合。这种概括如此具有隐喻性,并远离生物化学,以至于我没有在 1974 年的论文中提到它,尽管它对我自己思考「校对」是极其重要。
近在咫尺
以上两段内容分别阐述了两种见解,但任何一种都没有详细描述任何特定的生化系统如何进行「校对」。这两种观点唯一明显的共同特征是,如何从固定的辨别能量中获得更好的准确度这两个概念都涉及将系统与能源耦合。蛋白质合成涉及无法解释的大量生化能量消耗。
在这一洞见之后的一个月里,更紧迫的事务占据了我的时间。但我现在知道得足够多,可以绝对确定,当我能够回到这个问题时,蛋白质合成中如何「校对」的细节将变得显而易见。
隐藏在生物化学细节中的「校对」
随后,在两个月内,我找到了基于已知生化细节的蛋白质合成中的可行「校对」方案,并描述了可以对是否发生校对进行关键测试的实验类型。为了将氨基酸添加到正在生长的蛋白质中,使用了一个含有一个 GTP 分子、一个 tRNA 分子和一个氨基酸的特定复合物。当时的范式会将这种 GTP 使用和添加的氨基酸之间的正确化学计量比(即反应物质的量的比例)描述为一比一。任何测量到的偏离这个整数比的情况都应归因于实验研究中的人为因素。
我的预测是,这个计量比不是整数:即使对于正确氨基酸的添加,也应该有滑移,计量比略大于一比一,而对于添加错误的氨基酸,这个比例应该很大——肯定大于十比一。但我不知道如何实际设计一个真实的实验来测试这个想法。
同样的基本校对反应方案似乎存在于 DNA 合成、tRNA 充电(即将氨基酸与其特定 tRNA 连接)和蛋白质组装中。我在 1974 年的研究论文[4]将这三个非常不同的化学过程的反应方案描述为以不同方式包含一个简单统一原理的方法。虽然在 1974 年这篇论文之前,人们已经理解了 DNA 合成中的“编辑”概念,但校对和辨别的一般统一能量和动力学方面尚未被认识到。
即使在发表两年后,这篇论文仍然没有很多分子生物学领域的读者。之所以还有读者,部分归功于布鲁斯·阿尔伯茨(Bruce Alberts,后来成为美国国家科学院院长)对最终稿的帮助。生物化学家通过细节来看待过程,如果描述中有任何细节错误就会拒绝一个想法,所以他仔细纠正了我在化学命名法中所有无知的错误。因为这是我第一次在论文里写“核苷”、“合成酶”、“异亮氨酸”甚至“GTP”这些词。
我偶尔被邀请做生物物理学研讨会。1976 年在哈佛医学院的一次演讲以简短介绍校对和我对蛋白质合成中非计量比的预测结束。演讲结束后的第二个问题来自罗伯特·汤普森(Robert C Thompson),一个我完全不认识的人。他只是问:“你想听听这样一个实验的结果吗?” 然后开始描述他的实验(当时尚未发表)和测量到的计量比,这些结果压倒性地支持了我关于「校对」的想法。他接着描述了链霉素如何通过消除校对来杀死细菌,导致蛋白质中有太多错误以至于细菌无法生存。1977 年,他发表了论文[5]。这是我科学生涯中最大的惊喜之一,也是最令人愉快的。
1974 年的那篇论文对我处理生物学问题的方法很重要,因为它引导我思考生物学中反应网络结构的功能,而不是分子本身结构的功能。一个网络可以“解决问题”或具有超出单个分子和线性通路能力的功能。六年后,我在思考神经元网络而不是单个神经元的特性时,推广了这一观点。
现在又该做什么?寻找一个真正的「难题」
1977 年的冬天,我在哥本哈根的玻尔研究所度过了漫长的时间,参与这间研究所零星但历史悠久的生物学推广活动的一部分。
我名义上的任务是举办一系列面向物理学家的现代生物学研讨会,并邀请来自全欧的杰出讲者。凭借玻尔的名声,我成功地召集了一群强大的讲者。在那个年代,人们仍然记得尼尔斯·玻尔(Niels Bohr)对生物学的兴趣。
尼尔斯·玻尔
1932 年,年轻的理论物理学家马克斯·德尔布吕克(Max Delbruck)结束假期后,急忙赶到哥本哈根参加国际光疗大会的开幕式,玻尔将在会上作一场名为《光与生命》的演讲。玻尔探讨了生命本身的深层解释与量子力学解释的哲学模糊性之间是否有内在联系。这场演讲对德尔布吕克来说是一次转变的经历,促使他后来从理论物理学转向最终获得诺贝尔生理学或医学奖的研究。
马克斯·德尔布吕克
原在哥廷根大学研读天文物理学,后来转向理论物理学。在和玻尔这位“对生物学感兴趣的物理学奖”相遇后,他开始注意起生物学,最终在 1969 年获得诺贝尔生理学或医学奖。
然而,在 1977 年,我邀请的生物学专家们强调了他们所掌握的知识,并回避了其理论框架和研究范式中的空白。他们显然没有把生物学描绘成需要(或欢迎)理论物理学家介入的状态。对我和其他人来说,听 1977 年的讲座并没有带来任何转折性的体验。略感失望,我回到了普林斯顿,没有任何新问题的苗头。
人们总是可以基于之前的论文提出变化和扩展,无论这些论文是自己的还是别人的。科学文献中充斥着这样的工作。但我当时寻找的是一道真正的「难题」,而不是一个小问题。
两者之间的区别在于什么?1970 年代初,我担任了某个极富创造力但行为有些怪异的化学研究生的导师。在完成了与我合作的理论化学论文后,这名学生又成为另一位导师詹姆斯·沃森(James D. Watson)在冷泉港实验室的实验博士后。大约九个月后,我偶遇了吉姆·兰德,并得知我的(前)学生还未找到具体的研究方向,因此我表达了歉意。
弗朗西斯·克里克
从成熟的后见之明来看,我当时是在寻找一个生物学的「难题」,而我独特的背景为此提供了独一无二的准备。
神经科学 / NRP
在我穿越普林斯顿校园,从贾德温物理实验室前往弗里克化学实验室准备 1977 年秋季学期生物化学课程的路上,我的办公室电话响了起来。顺带一提,化学系竟然允许我这样一个既没学过有机化学也没学过生物化学的人去教这门课,这完全是由于大学在最高管理层面上对化学与生物学交叉领域管理不善所致。
总之,我以为那是网球朋友打来的电话,于是匆忙接听,却发现来电者是弗朗西斯·施密特(Francis O. Schmitt)。他只说他是麻省理工学院神经科学研究所的负责人,下周三会路过普林斯顿,并希望我能抽出半小时的时间见一面。尽管我从未听说过施密特或这个研究所,但考虑到“半小时而已”,我还是答应了会面。
接下来的一周,弗朗西斯·施密特来访了。他描述了一个被称为神经科学研究项目(Neuroscience Research Program,后文简称 NRP)的实体,该项目主要在波士顿举办小型会议,参会人员包括 20 位固定的项目成员和 20 位访客。访客的选择范围很广,但通常是以特定会议的主题为重点。
施密特邀请我在下次会议上发言。而我建议让我的生物化学课程中的一位物理研究生来做一个演讲,因为他撰写了一篇关于神经编码的数学论文,可能会让听众更感兴趣,但施密特很快否定了这个建议。
我只能告诉他,自己对神经科学(neuroscience)一窍不通——神经科学这个词就是施密特多年前创造的。但他说没关系,“只管讲你感兴趣的内容”,于是我决定谈一谈关于「动力学校对」以及细胞内大分子合成精度的一般问题。
弗朗西斯·施密特
参会那天,听众中有神经学家、神经内分泌学家、心理学家、免疫学家、电生理学家、神经解剖学家和生物化学家,他们几乎听不懂我在讲什么。但这并不重要。因为施密特希望在团队中增加一名物理学家成员,希望引入一个具有多学科背景的人来与他的课题互动,也许可以帮助这门学科变得更加综合并具备更强的预测能力。
施密特是一个信徒,他怀着狂热的信念,相信科学总有一天能够弥合分子、大脑、心智和行为之间的鸿沟。他是通过普林斯顿的相对论专家约翰·惠勒(John A. Wheeler)了解到我的,而惠勒(出于我一直不明白的原因)一直是我的坚定支持者。惠勒也曾担任招聘委员会主席,因为我在固体物理学方面的研究将我带到了普林斯顿担任物理教授。总之,我其实算是中了他们的圈套。在弗兰克的领导下,小组投票决定接纳我为成员。
约翰·惠勒
随后,会议上的演讲迅速让我着迷。对我来说,心智如何从大脑中产生是我们人类所面临最深奥的「难题」。这绝对是个真正的「难题」,而 NRP 里的科学家们各自以其不同的才能和极大的热情,在狭窄的领域内追求这一问题的答案。但在我看来,这群科学家似乎不可能解决这个「难题」,因为它只能用适当的数学语言和结构来表述。而在 NRP 中,没有人能够轻松地进入这个领域。所以我加入了 NRP,希望能定义、构建或发现一些我可以在这个领域中做的有用的事情。施密特懂得如何举办一个足够优雅和有吸引力的会议,使得国际顶尖的科学家们愿意加入他的圈子,这自然也影响了我的决定。
我在参加 NRP 每半年一次的会议期间,坐在各领域的世界级专家旁边,他们会耐心地向我解释他们对该领域的理解。虽然施密特尽力让专家们广泛地讲解他们的主题,并以整合的方式描述神经科学,但他通常无法实现这个目标。因此,我的入门知识是由一系列断断续续的实验神经科学专家观点组成的,每个专家都来自神经科学的另一个角落。这些评论经常对其他子领域所研究的细节表示不满,但科学本来就是如此,无论如何,我所寻求的也不是细节。
大脑和机器通过追踪动态状态轨迹来进行“计算”
简单的数字计算机通过从机器的一种初始状态开始,这种状态隐式地由程序和一些数据描述,来获取答案。它们按照机器硬件芯片内置的简单规则,在每次计算机时钟周期时改变状态。最后状态改变停止。达到一个终点状态,在这种状态下规则不再产生进一步的状态改变。编程问题的答案,就是现在存储在几个特定内存寄存器中的信息。
细胞自动机(Cellular automata)则是非常特殊的数字计算机,在 20 世纪 70 年代末有过短暂的辉煌时期。它们由一组等效的“细胞”组成,就像跳棋盘的方格。每个“细胞”都有一个随时间确定性变化的内部状态,根据仅涉及该“细胞”的内部状态及其邻近“细胞”的内部状态的规则。所有细胞都是等效的,并且同时改变它们的内部状态。
我第一次听说细胞自动机,是在阅读《科学美国人》(Scientific American)杂志中关于约翰·康威(John Horton Conway)的“生命游戏”(Game of Life),并推测对这一基本思想的一般化或修改可能有助于理解大脑是如何运作的。
【编者注】
“生命游戏”是一种零玩家的游戏,其演化完全由其初始状态决定,不含随机因素。游戏在一个网格上进行,每一个格点在任意一代都是活的或是死的。下一个世代的每一个格点将根据周围八个邻居的状况来决定生死。规则如下:
1. 任何活细胞,若周围有少于两个活邻居,则因人口太少而死亡。
2. 任何活细胞,若周围有两或三个活邻居,则维持生存。
3. 任何活细胞,若周围有超过三个活邻居,则因人口过多而死亡。
4. 任何死细胞,若周围有恰好三个活邻居,则变成活细胞。
康威的生命游戏因其简单规则下产生的复杂行为而闻名,它可以展示出生、死亡、稳定结构、移动结构(如滑翔机)以及其他复杂的模式。这个游戏不仅是一个数学上的玩具,也启发了许多关于复杂系统的研究。
1978 年秋天,我开始尝试“生命游戏”的变体,使其稍微更接近神经生物学,希望看到它通过追踪状态轨迹来进行计算并得出答案。遗憾的是,我没有能够执行任何此类模型所需的数学来跟踪变化状态的轨迹。我需要编写一个数字计算机来模拟这样一个系统,并进行计算机实验以洞察各种这样的模型。
如今很难想象 37 年前大学计算机实验室的原始状态。机器很慢,机器时间很贵,输入计算机主要是通过穿孔卡片,输出打印在大型打印机上,电视类型的显示终端很少见。按照微处理器中的晶体管数量来衡量的计算能力,在过去 50 年里遵循“摩尔定律”,大约每两年翻一番。这使得在 1978 年到现在之间有了 18 次加倍。因此,我拥有的计算能力只是现在(本文写于 2018 年)的 1/250,000。
除了少数值得注意的例外(如麻省理工学院的人工智能实验室),计算机主要用于从可靠的程序和昂贵的数据中产生数值结果。如果你用计算机模拟一个模型,那是因为你有一个良好的信念认为该模型与现实良好对应。你不会对多种可能的模型进行实验——太贵了,浪费了宝贵的资源。没有强调易于编程的语言,而计算效率高的语言则使用不便。
普林斯顿通用计算组和普林斯顿高能物理组的计算机(物理系唯一的部门级计算机)都在数值计算模式下运行。猜测模型结构,快速而容易地在一个数字机器上探索这些猜测的后果,并希望找到有趣的神经活动演化模型的想法,在我所属的普林斯顿和贝尔实验室的计算设施和环境中是陌生的。
鉴于我的计算环境,我没有取得多少进展。我想追求的基本思想是,任何计算机,无论是数字机器还是大脑,都是通过从起点(程序和数据)到终点遵循一个动态轨迹来操作,并且轨迹需要稳定性以可靠地得出答案,尽管存在噪声和系统不完善。我在 NRP 上确实做了一次关于神经生物学作为一个利用动力吸引子计算的系统的演讲。但既没有计算机模拟也没有数学来支持这一观点。一位年轻的访问学者之后告诉我,这是一个精彩的演讲,但不幸的是与神经生物学无关。其他人则忽略了它。我讽刺地注意到,我在 2015 年从神经科学学会获得的 Swartz 奖(The Swartz Prize)实际上是基于这一基本思想。
当然,计算神经科学这一术语的存在本身就意味着如今有许多数学上精明的科学家在这一领域,而在 1979 年,这种情况极为罕见。
更好的环境
1978 年,被任命为加州理工学院校长的哈罗德·布朗(Harold Brown)辞职,去担任国防部长。加州理工只能再次寻找一位物理学家担任校长。他们找到了马文·戈德伯格(Marvin Murph Goldberger),一位杰出的理论物理学家,他曾任普林斯顿大学物理系主任。
在这件事的前一年,马克斯·德尔布吕克结束了他在加州理工学院生物系的教学任期,而他任职的三十年间,一直致力于加强生物学与物理学之间的联系。因此,戈德伯格注意到了我在普林斯顿大学物理系内努力从事生物物理学研究,并决定说服加州理工的教师们向我提供一个化学与生物学共同的终身教授职位。
然而,受到默里·盖尔-曼(Murray Gell-Mann)和理查德·费曼(Richard Feynman)思维的影响,加州理工学院物理系对生物化学方向上任命教职毫无兴趣。
瓦尔·菲奇
当我在 1979 年 10 月去找瓦尔,告诉他加州理工学院提供的职位时,他表示很遗憾,因为对我来说离开显然是最好的选择——从科学上对我最好,而且也简化了他在部门定位上的问题。于是,没有任何反提案。
时间来到 1980 年 2 月。加州理工学院的量子化学计算设施是一个尝试模型的绝佳环境。它支持多用户实时计算,配有 CRT 显示器和直接键盘输入,无需编译延迟。我的研究是对这个设施预期用途的偏离,但没有人注意。
最后的「难题」
放弃一个已经培育了一年时间的错误观念,比想象中要困难得多。因此,细胞自动机并没有被我彻底抛弃,而是转变成了一种随机的伪神经网络(quasi-neural network),细胞自动机原本的规则结构被放弃了,取而代之的是随机选择的连接。复杂的逻辑状态转换规则,被一个受生物学启发的新规则取代。
经过一年的模拟和数学分析后,我最终还是放弃了随机网络。相反,为什么不尝试一个具有特定结构的网络呢?这种结构是为了完成神经生物学迅速完成的某个简单但深刻的任务,而这任务对于生物学来说似乎是自然而然的,但对于计算机来说却并非如此。理论上最简单的这样的任务,同时也是自然地融入通过动力系统吸引子进行计算的基本计算范式的,就是联想记忆(associative memory)。
发表论文[6]
1981 年夏天,我同意参加凡尔赛生命研究所(the Institut de la Vie at Versailles)举办的题为 “从物理学到生物学 ”的研讨会。举办者莫里斯-马鲁瓦(Maurice Marois)是一位医学博士,他梦想加强不同科学家之间的联系。他对赞助商游说有方,对诺贝尔奖获得者则奉承有加,使会议成功在凡尔赛宫的镜廊举行,演讲者得以住在城堡旁边的特里亚侬宫酒店。于是,我欣然接受了邀请(虽然内心感到有点腐败),参加了这样一次全额付费的巴黎之旅。我放弃了之前选定的主题,转而根据那项神经网络的研究发表演讲。这也是我在凡尔赛的首次公开演讲。不过,我至今从未遇到记得听过这次演讲的人。
我就这项研究撰写的第一份手稿,其实是为计划出版的会议论文集所撰写的关于我当时研究及其知识背景的广泛论述。在主办方放弃出书计划后,我才开始将草稿改写成研究文章。
这篇文章有两个目标读者:物理学家和神经生物学家,因此我立即想到在《美国科学院院刊》(PNAS)上发表文章。神经生物学家通常阅读 PNAS,可能会看到这篇文章。虽然在那个时代很少有物理学家经常阅读 PNAS,但至少 PNAS 通常在物理图书馆都能找到。这并不理想,但已经是我能想到的最好办法了。作为学院会员,我可以发表这样一篇论文,而无需经过任何审查(现在已经不是这样了,所以我对科学出版和促进原创性感到悲哀)。为《美国国家科学院院刊》撰写论文是一项挑战,因为文章篇幅绝对不能超过 5 页,还要面对两大读者群体,而且还有很多话要说。
关于非虚构作品的写作,海明威曾说过这样一句话、
“如果一个散文作家对他所写的东西有足够的了解,他可以省略自己所知道的东西;而如果作家写得足够真实,读者对这些东西的感受就会像作家说出来一样强烈。” (海明威,1932 年)
由于 PNAS 的篇幅限制,我不得不对所写的内容和省略的内容进行严格筛选。如果海明威是物理学家,他一定会懂我这种风格。事后看来,省略几乎显而易见的内容可能会增加论文的影响力。未说明的内容成为了邀请他人补充这一主题的邀请函,从而鼓励了一批撰稿人致力于此类网络模型的研究。成功的科学总是一项群体事业。
这篇 1982 年的 PNAS 论文是我使用“神经元”(neuron)一词的第一篇论文。它为许多物理学家和计算机科学家提供了进入神经科学领域工作的途径,这些后来人进一步的工作将这些网络与联想记忆以外的许多重要应用联系起来。这也是我写过的被引用次数最多的论文(6800 次引用)。就连 AT&T 也很高兴(在这一时期,我一直在贝尔实验室兼职),因为这项研究还为他们的专利池带来了一项经常被引用的专利[7],并加强了贝尔实验室神经生物物理学与凝聚态物理学之间的联系。
接下来该做什么?
在引言中,我把选择研究方向描述为研究生涯中最重要的因素。本文其余部分描述了我如何通过经验和调查,找到了两个足以成为主要研究领域的「难题」。在每一个案例中,都有一个缓慢的个人积累过程,其中既有深思熟虑的步骤,也有塑造我看待科学世界方式的偶然事件。这种积累将决定我在下一个岔路口的选择。
英国剧作家大卫·哈雷(David Hare)曾在他 2015 年的采访中说过一句话:“后见之明往往能让一件事看起来顺理成章。所以我想写一本回忆录,来解释生命是多么纯粹地依赖于偶然”。哈雷接着讲述了他是如何在上世纪 60 年代末成为一名剧作家的故事。当时,他还只是一个具有强烈政治倾向的导演,从未想过自己会成为作家。
后来有一次,剧组内的作家未能按时交出剧本,哈雷便临危受命,在四天之内写出了《布罗菲成功了》(Brophy made good)这部戏,以确保演员们能够在接下来的一周排练,并在再下一周公演。
当我读到哈雷描述的这段文字时,内心不禁感叹:“这就是我!” 我在 1974 年发表的那一篇论文,就像我在一系列不可预测的事件中创作的“剧本”。从童年时期从物理学家父母那里了解到的“物理世界”,到后来求学期间涉足凝聚态物理,再到康奈尔大学和贝尔实验室转向蛋白质的化学物理,最终到教授一门我知识有限的普林斯顿大学生物化学课程,这一连串的经历让我对科学产生了独特的视角。就像哈雷急需剧本一样,我也迫切需要给学生们准备讲座内容。得益于之前在生物课上的偶然收获,以及凝聚态物理中的一些碎片知识,我有了撰写这篇“物理学家的剧本”的初步素材。但在我教书的那一年之前,我完全没有预料到会有这样的研究方向。