刚刚,2024年诺贝尔化学奖公布,一半授予大卫·贝克(David Baker),“以表彰在计算蛋白质设计方面的贡献”;另一半则共同授予德米斯·哈萨比斯(Demis Hassabis)和约翰·M·詹珀(John M. Jumper),“以表彰他们在蛋白质结构预测方面的成就”。
撰文 | 秦朗
● ● ●
2024年诺贝尔化学奖获得者:戴密斯·哈萨比斯(Demis Hassabis)、约翰·乔普(Jonh Jumper)、大卫·贝克(David Baker)
2010年,他与在伦敦大学学院读博士遇到的施恩·莱格(Shane Legg)共同创办了DeepMind并担任CEO。2014年,DeepMind被Google收购,在Alphabet旗下独立运营。2023年,DeepMind与“谷歌大脑”合并,Hassabis升任合并后的Google DeepMind团队CEO。
他还堪称蛋白质设计领域“鼻祖级”人物,比DeepMind更早提出了预测和设计蛋白质三维结构的方法,甚至设计出了一款比AlphaFold更早的蛋白结构设计算法——RoseTTA。
作为支撑人体基本生命活动的物质,蛋白质由20种氨基酸呈念珠状连接形成三维形状,而形状本身决定了蛋白质的功能,所以研究蛋白质形状一直是医学领域的热门方向。
在 AlphaFold 出现之前,这都需要通过实验来完成的。让蛋白质结晶是件非常困难的事情,有些蛋白质不能像膜蛋白那样结晶,必须使用昂贵的电子显微镜或X射线晶体分析仪,耗费数月、甚至几年,才能得到三维结构并将其结构可视化。无数博士都在研究单一蛋白质的折叠。
而AlphaFold2 能够直接从蛋白质的氨基酸序列中预测蛋白质的3D结构,并且达到原子级精度,被认为解决了困扰人类50年历史的蛋白质折叠挑战,迅速推进了人类对基本生物过程的理解,并促进药物设计。
2018年,DeepMind官宣了旗下AlphaFold。初亮相时,它在第13届“蛋白质结构预测奥运会”CASP比赛中,成功预测了43种蛋白质中25种蛋白质的最准确结构,力压其他97个参赛者。
基于初代版本,2020年,DeepMind又祭出了AlphaFold2。它能够在广泛领域进行蛋白质结构的预测,已经将两亿多蛋白的三维结构全部都预测出来,在结构生物学中是最重要的里程碑的贡献,对后续蛋白质结构及功能研究具有开创性意义。
该系统还在应用层面,特别是对生物制药的促进作用巨大。了解蛋白质的三维结构,对于设计针对性的药物分子也大有帮助。如今全球已有数百万研究人员将 AlphaFold 2 应用在疟疾疫苗、癌症治疗和酶设计等领域,有了不少新的发现。之后的 AlphaFold-Multimer 则推动了对蛋白质-蛋白质复合物的预测。
今年5月,由 Google DeepMind 和 Isomorphic Labs 研究团队推出的新一代 AlphaFold—— AlphaFold 3登上了 Nature。
据介绍,AlphaFold 3 以前所未有的精确度成功预测了所有生命分子(蛋白质、DNA、RNA、配体等)的结构和相互作用。与现有的预测方法相比,AlphaFold 3 发现蛋白质与其他分子类型的相互作用至少提高了 50%,对于一些重要的相互作用类别,预测准确率甚至提高了一倍。
研究团队认为,AlphaFold 3 可以将我们从蛋白质带入广泛的生物分子领域,这一飞跃有望开启更具变革性的科学——从开发生物可再生材料和更具抗逆性的作物,到加速药物设计和基因组学研究,进而开启人工智能细胞生物学的新时代。
作为AlphaGo背后的英雄,Google旗下人工智能企业DeepMind的创始人Demis Hassabis,也获得了全球的关注。
许多人认为围棋是世界上最复杂的棋盘游戏。当 DeepMind 团队在庆祝获胜时, Hassabis已经在考虑一个更大的挑战。他意识到该公司的技术已经准备好应对生物学中最重要和最复杂的难题之一:预测蛋白质的结构,这个 50 年来科研人员一直试图解决的难题。
在 Hassabis的心中,构建的 AlphaGo虽然与游戏相关,但最终目标不仅仅是破解游戏,而是使用它来引导通用学习系统,并应对现实世界的挑战,致力于像蛋白质折叠这样的科学挑战。
2016 年,AlphaGo 获得成功后的几个月内,DeepMind 雇佣了一些生物学家,并成立了一个小型跨学科团队来解决蛋白质折叠问题。
2018年,DeepMind官宣了旗下AlphaFold。初亮相时,它在第13届“蛋白质结构预测奥运会”CASP比赛中,成功预测了43种蛋白质中25种蛋白质的最准确结构,力压其他97个参赛者。
CASP竞赛成立于 1994 年,其旨在通过每两年让计算机化预测方法相互竞争来加快研究速度。然而,没有任何一种技术能达到实验室工作的准确性。到 2016 年,相关工作进展已经停滞了十年。
基于初代版本,2020年,DeepMind又开发了AlphaFold2。它已经能成功解决蛋白质折叠问题,在预测蛋白质结构上,和实验室生产模型的精度误差范围,首次缩小到只有一个原子的宽度。生物学家对它的出色表现感到震惊。AlphaFold 使用了蛋白质数据库中现有的蛋白质结构作为大数据基础。这是一个国际数据库,包含了生物学家几十年来不断增加的已解决的结构。
2021年7月,AlphaFold成功预测了近98.5%的人类蛋白质结构。而到了2022年7月AlphaFold预测了几乎“整个蛋白质宇宙”。
按照哈萨比斯接受媒体采访时的说法,多年来,他一直在断断续续地思考蛋白质问题。20 世纪 90 年代,当他还是剑桥大学的一名本科生时,他就接触到了这个问题。他表示:“我的一个朋友对这个问题很着迷,他会抓住任何机会(在酒吧里或者打台球的时候)跟我说,如果我们能破解蛋白质折叠,这将是生物学的变革。他的激情始终让我不能释怀。”
AlphaFold 的成功标志着 DeepMind 的发展方向已然发生改变,工作重点从游戏转向科学,以期对现实世界产生更大影响。
为了利用 AlphaFold 3 在药物设计方面的潜力,Isomorphic Labs 已经与制药公司合作,将其应用于现实世界的挑战,并最终为一些对人类造成最具破坏性影响的疾病开发出新的疗法。
据了解,Isomorphic Labs 将 AlphaFold 3 与一套补充的内部人工智能模型结合,正在为内部项目以及制药合作伙伴进行药物设计。
值得关注的是,Demis Hassabis 同时领导着生物技术初创公司Isomorphic Labs。它成立于 2021 年,同样由Google的母公司 Alphabet 投资,旨在将 DeepMind 在生物学方面的人工智能研究进一步带入制药行业,希望在药物发现领域带来一场 AI 革命,使用人工智能来加速药物发现,并最终找到治疗人类一些最具破坏性的疾病的方法。
很长一段时间以来,Demis Hassabis 一直在想,一旦人工智能足够复杂、足够强大,他最先想做的,是帮助治疗疾病和理解生物学。
从人工智能优先的角度进行药物发现,在计算机中完成大部分研究,并将实验室留给验证,是其中一个重要内容。
与分子发生反应,搭建通路,最终形成一个虚拟细胞,是他的一个梦想。这样,就可以在虚拟细胞上进行大量实验,最后阶段再进入实验室来验证。就发现新药而言,目前从确定目标到拥有一个候选药物大约需要10年时间,如果能在虚拟细胞中完成大部分工作,或许可以将时间缩短一个数量级。
DeepMind正与更多实验室合作,通过构建虚拟细胞进行大量实验,以大大缩短医学及药物方面的研究时间。
DeepMind 已经发布了该系统的详细工作原理,并发布了源代码。AlphaFold 开源之后,影响力逐渐扩大。在该公司还与欧洲生物信息学研究所(European Bioinformatics Institute)建立了一个公共数据库,该数据库正在填充 AI 预测的新的蛋白质结构,条目几乎是科学已知的所有蛋白质。
Google DeepMind 也基于AlphaFold 3 推出了免费平台AlphaFold Server,供全世界的科学家利用它进行非商业性研究,预测蛋白质如何与细胞中的其他分子相互作用。
只需点击几下,生物学家就可以利用 AlphaFold 3 为由蛋白质、DNA、RNA 以及选择的配体、离子和化学修饰组成的结构进行建模。
对此,Francis Crick 研究所 Uhlmann 实验室的研究科学家 Céline Bouchoux 评价道:
“AlphaFold 3 一经发布,有可能像 AlphaFold 一样具有开创性。有了 AlphaFold Server,其不再仅仅是预测结构,而是慷慨地提供访问权限:允许研究人员提出大胆的问题,并加速发现。”
这两年,AlphaFold成为了生物医药界的新贵,甚至获得了不少生物医药相关的科学大奖。世界各地的一些团队已经开始在抗生素耐药性、癌症和新冠病毒等研究中使用 AlphaFold。
另一个重大进展是,今年3月18日,David Baker在预印本BioRxiv上发文,首次使用生成式人工智能从头设计出了全新的抗体,这一重要发现未来有望让AI从头设计蛋白进入抗体药物市场。
鲜为人知的是,AlphaFold一直存在诸多竞争者,其中最为知名的莫过于华盛顿大学的David Baker团队。
Baker是预测和设计蛋白质三维结构方法的开创者,早在1998年由他主导设计的蛋白结构设计算法Rosetta就有了最初版本,远远早于AlphaFold。而这两年,Baker更是致力于超越AlphaFold,为此,Baker团队曾在Science杂志上连发3篇论文,介绍新算法ProteinMPNN。他认为,ProteinMPNN之于蛋白质设计,就像AlphaFold之于蛋白质结构预测一样。
在读博士期间,他梦想有一天创造出“人工智能科学家”,也就是说,创造一个比人类科学家还要聪明的“机器人科学家”。十多年来,DeepMind一直是推进人工智能技术前沿发展的先锋,通常是使用游戏作为开发通用目的学习系统的试验场。
Hassabis的想法是,通过AI,将科学加速到极致,并且认为自己已经发现了一种“让科学研究更有效率”的方法。在他眼中,人工智能系统正变得足够强大,可以应用于许多现实世界的问题,包括科学发现本身。他认为,有一天,人工智能系统可能会解决像广义相对论这样的问题。
“癌症、气候变迁、能源、基因组学、宏观经济学、金融系统、物理学等,太多我们想掌握的系统知识正变得极其复杂,如此巨大的信息量让最聪明的人穷其一生也无法完全掌握。如何才能从如此庞大的数据量中筛选出正确的见解呢?”他认为,未来超级智能机器将与人类专家合作解决一切问题,一种通用人工智能可以自动将非结构化信息转换为可使用知识,这是一种针对任何问题的元解决方法(meta-solution)。
虽然他的梦想听起来还有点遥远,在现实中,借助 AlphaFold,DeepMind 开启了新篇章。公司正投资一个名为“AI for Science”的团队,它已经发表了一系列出版物,涉及从天气预报到数学、量子化学和核聚变等领域。它们都没有 AlphaFold 的影响力,但雄心显而易见。
事实上,从根本上加快科学研究的步伐,尤其对医学、气候科学和绿色技术等领域的帮助,并非Hassabis或者DeepMind单个的梦想。
当前,在各个领域,应用人工智能方法分析数据、构建复杂生物现象的强大预测模型和生成模型,已然成为强大的科技创新潮流。例如,用AI识别新的抗生素、揭示希格斯玻色子,建模和分析星系形成,筛选粒子对撞机或机器人望远镜产生的大量数据、寻找其中的规律,识别具有电池或太阳能电池所需特性的材料,等等。
AI变革科学发现的历程,可能真的刚刚开始。