北京时间10月9日下午5点45分许,瑞典皇家科学院决定将2024年诺贝尔化学奖的一半授予大卫·贝克(David Baker),以表彰他在“计算蛋白质设计”方面的贡献,并将另一半授予戴密斯·哈萨比斯(Demis Hassabis)和约翰·M·詹伯(John M. Jumper),以表彰他们在“蛋白质结构预测”方面的贡献。
获奖理由:
大卫·贝克(David Baker)
表彰他在“计算蛋白质设计”方面的贡献。
“for computational protein design”
戴密斯·哈萨比斯(Demis Hassabis)和约翰·M·詹伯(John M. Jumper)
表彰他们在“蛋白质结构预测”方面的贡献。
“for protein structure prediction”
他们通过计算和人工智能揭示了蛋白质的奥秘
化学家们长期以来梦想着能够完全理解并掌握生命的化学工具——蛋白质。如今,这一梦想已触手可及。Demis Hassabis 和 John M. Jumper 成功利用人工智能预测了几乎所有已知蛋白质的结构。David Baker 则学会了如何掌握生命的构建模块,并创造出全新的蛋白质。他们的发现潜力巨大。
生命中充满活力的化学反应是如何实现的?答案是蛋白质的存在,它们可以被形容为精妙的化学工具。蛋白质通常由20种氨基酸构成,这些氨基酸可以通过无数种方式组合在一起。细胞内根据DNA中储存的信息作为蓝图,氨基酸被链接成长链。
接着,蛋白质的神奇之处开始显现:这条氨基酸链扭曲并折叠成一个独特的三维结构(图1)。这种结构赋予了蛋白质功能。一些蛋白质成为化学构建模块,形成肌肉、角或羽毛,另一些则成为激素或抗体。许多蛋白质形成酶,以惊人的精确度驱动生命的化学反应。细胞表面的蛋白质也至关重要,作为细胞与外界的沟通渠道发挥作用。
生命的化学构建模块——这20种氨基酸——所包含的潜力几乎无法夸大。2024年诺贝尔化学奖旨在全新的层面上理解和掌握这些氨基酸。奖项的一半授予了Demis Hassabis和John Jumper,他们利用人工智能成功解决了化学家们苦苦研究了50多年的难题:根据氨基酸序列预测蛋白质的三维结构。这使他们能够预测几乎所有已知的2亿种蛋白质的结构。另一半奖项则授予David Baker,他开发了计算机化方法,实现了许多人认为不可能的目标:创造以前不存在的蛋白质,这些蛋白质在许多情况下拥有全新的功能。
2024年诺贝尔化学奖表彰了两个不同的发现,但正如你将看到的,它们密切相关。要理解今年获奖者所克服的挑战,我们必须回溯到现代生物化学的开端。
蛋白质的首张模糊照片
化学家自19世纪以来就知道蛋白质对于生命过程至关重要,但直到1950年代,化学工具才变得足够精确,使研究人员能够更加详细地探究蛋白质。剑桥的John Kendrew和Max Perutz在1950年代末取得了突破性发现,他们成功地利用一种名为X射线晶体学的方法,展示了首个蛋白质的三维模型。为了表彰这一发现,他们于1962年获得了诺贝尔化学奖。
图1. 一个蛋白质可以由几十个到几千个氨基酸组成。这条氨基酸链会折叠成一个三维结构,而这个结构决定了蛋白质的功能。
后来,研究人员主要使用X射线晶体学,并常常付出巨大努力,成功地绘制了大约20万种不同蛋白质的图像,这为2024年诺贝尔化学奖奠定了基础。
一个谜团:蛋白质如何找到它独特的结构?
美国科学家克里斯蒂安·安芬森(Christian Anfinsen)早期做出了另一个重要发现。他通过各种化学手段使一种现有的蛋白质展开,然后让它再次折叠。值得注意的是,每次蛋白质都会折叠成完全相同的形状。1961年,安芬森得出结论,蛋白质的三维结构完全由其氨基酸序列决定。这一发现使他在1972年获得了诺贝尔化学奖。
然而,安芬森的逻辑中存在一个悖论,另一个美国科学家塞勒斯·莱文塔尔(Cyrus Levinthal)在1969年指出。莱文塔尔计算出,即使一种蛋白质只有100个氨基酸,理论上它也可以形成至少10^47种不同的三维结构。如果氨基酸链是随机折叠的,找到正确的蛋白质结构将比宇宙的年龄还要长。但在细胞中,这个过程仅需几毫秒。那么,这条氨基酸链究竟是如何快速折叠的呢?
安芬森的发现和莱文塔尔的悖论暗示,蛋白质折叠是一个预定的过程。而且,重要的是,关于蛋白质如何折叠的所有信息都必须包含在氨基酸序列中。
向生物化学的伟大挑战发起挑战
上述见解导致了另一项关键的认识——如果化学家知道蛋白质的氨基酸序列,他们应该能够预测蛋白质的三维结构。这是一个令人兴奋的想法。如果他们成功了,就不再需要繁琐的X射线晶体学,从而节省大量时间。他们还可以生成那些无法通过X射线晶体学获取结构的所有蛋白质的结构。
这些合乎逻辑的结论为生物化学的伟大挑战——结构预测问题——铺平了道路。为了推动这一领域的快速发展,研究人员在1994年发起了一个名为“蛋白质结构预测关键评估”(CASP)的项目,这个项目逐渐演变成一场竞赛。每隔一年,全球研究人员都会获得刚刚确定其结构的蛋白质的氨基酸序列。然而,这些结构对参与者是保密的。挑战在于根据已知的氨基酸序列预测蛋白质的结构。
CASP吸引了许多研究人员,但解决这一预测问题被证明极为困难。研究人员在竞赛中提交的预测结果与实际结构的对应关系几乎没有明显改善。突破仅在2018年出现,当时一位国际象棋大师、神经科学专家和人工智能的先驱进入了这一领域。
棋盘游戏大师闯入“蛋白质奥运会”
让我们简要回顾一下德米斯·哈萨比斯(Demis Hassabis)的背景:他在四岁时开始下国际象棋,13岁时达到了大师水平。青少年时期,他开始了编程和成功的游戏开发者职业生涯。他开始探索人工智能,并研究神经科学,在这个领域取得了一些革命性的发现。他利用对大脑的研究开发了更好的神经网络以用于人工智能。2010年,他共同创立了DeepMind,一家公司专门开发顶级的人工智能模型用于流行的棋盘游戏。2014年,该公司被谷歌收购,两年后,DeepMind凭借在世界上最古老的棋盘游戏之一——围棋中击败冠军选手的成就,吸引了全球的关注。
然而,对哈萨比斯而言,围棋并不是最终目标,而是开发更好人工智能模型的手段。在这次胜利之后,他的团队准备解决对人类更为重要的问题。因此,2018年他报名参加了第十三届CASP竞赛。
德米斯·哈萨比斯的AI模型带来的意外胜利
在此前的CASP比赛中,研究人员预测的蛋白质结构,精确度最多只能达到40%。然而,凭借他们的AI模型AlphaFold,哈萨比斯的团队将精确度提高到了接近60%。他们赢得了比赛,这一卓越的成果让很多人感到惊讶——这是出人意料的进展,但结果仍然不够理想。要取得真正的成功,预测结果与目标结构的精确度必须达到90%。
图2
哈萨比斯和他的团队继续改进AlphaFold——但无论他们多么努力,算法始终没有完全实现预期目标。一个严酷的事实是,他们走到了一个死胡同。团队已疲惫不堪,但一位相对较新的员工对如何改进AI模型有着关键性的想法:约翰·琼珀(John Jumper)。
约翰·琼珀接下生物化学大挑战的战书
约翰·琼珀对宇宙的迷恋让他开始学习物理和数学。然而,2008年,当他开始在一家公司工作,该公司利用超级计算机模拟蛋白质及其动态时,他意识到物理学的知识可以帮助解决医学问题。
琼珀将这一新获得的对蛋白质的兴趣带到了2011年,他开始攻读理论物理学博士学位。为了节省大学里稀缺的计算资源,他开始开发更简单、更巧妙的方法来模拟蛋白质的动态。不久后,他也接下了生物化学大挑战的战书。2017年,他刚刚完成博士学位,听到谷歌DeepMind正在秘密开展蛋白质结构预测的传闻后,他向其递交了求职申请。他在蛋白质模拟方面的经验让他有了一些关于如何改进AlphaFold的创造性想法,因此在团队进展停滞时,他得到了提升。琼珀和哈萨比斯共同领导了对AI模型的重大改革。
改革后的AI模型取得了惊人的成果
新的版本——AlphaFold2,受益于琼珀对蛋白质的深刻理解。团队还开始采用最近在AI领域取得的重大突破背后的创新:称为“变压器”(transformers)的神经网络。与之前的方法相比,这种网络能够更灵活地在海量数据中找到模式,并高效确定为达成特定目标应关注的关键点。
团队将AlphaFold2训练在所有已知蛋白质结构和氨基酸序列的庞大数据库上(见图2),新的AI架构在第十四届CASP竞赛前及时开始产生良好的结果。
2020年,当CASP的组织者评估结果时,他们意识到生物化学领域50年的挑战已经结束。在大多数情况下,AlphaFold2的表现几乎与X射线晶体学一样出色,令人惊叹。当CASP创始人之一约翰·穆尔特在2020年12月4日宣布比赛结果时,他问道:“接下来呢?”
我们会回到这个问题上。现在,让我们回到过去,聚焦CASP的另一位参与者,介绍2024年诺贝尔化学奖的另一半,它涉及从头设计新蛋白质的艺术。
一本细胞学教科书改变了大卫·贝克的方向
当大卫·贝克(David Baker)在哈佛大学开始学习时,他选择了哲学和社会科学。然而,在一次进化生物学课程中,他偶然读到了如今已成为经典的教科书《细胞的分子生物学》的第一版。这让他改变了人生方向。他开始探索细胞生物学,最终对蛋白质结构产生了浓厚的兴趣。1993年,当他在西雅图华盛顿大学担任研究组长时,他接受了生物化学的大挑战。通过精妙的实验,他开始研究蛋白质如何折叠。这为他后来在20世纪90年代末期开发预测蛋白质结构的计算机软件——Rosetta——提供了宝贵的见解。
1998年,大卫·贝克首次使用Rosetta软件参加CASP比赛,并取得了与其他参赛者相比相当不错的成绩。这一成功带来了一个新想法——贝克团队可以反向使用这款软件。与其输入氨基酸序列并得到蛋白质结构,他们应该能够输入所需的蛋白质结构,然后得到其对应的氨基酸序列的建议,从而创造出全新的蛋白质。
贝克成为蛋白质设计师
蛋白质设计领域——即研究人员创造具有新功能的定制蛋白质——在20世纪90年代末开始兴起。在许多情况下,研究人员会调整现有的蛋白质,使其能够执行新的功能,如分解有害物质或作为化学制造业中的工具。
然而,自然界的蛋白质种类有限。为了增加获得具有全新功能蛋白质的可能性,贝克的研究团队希望从零开始创造它们。正如贝克所说:“如果你想造飞机,你不会从改造一只鸟开始;相反,你要理解空气动力学的基本原理,并根据这些原理设计飞行器。”
一个独特的蛋白质诞生了
构建全新蛋白质的领域被称为de novo设计。研究团队绘制了一种全新的蛋白质结构,然后让Rosetta计算出哪种氨基酸序列可以产生所需的蛋白质。为此,Rosetta搜索了所有已知蛋白质结构的数据库,并寻找与目标结构相似的短片段蛋白质。然后,利用对蛋白质能量状态的基本认识,Rosetta优化了这些片段,并提出了一个氨基酸序列。
为了验证软件的成功性,贝克的研究团队将这个氨基酸序列的基因引入细菌中,让它们生产出所需的蛋白质。然后,他们使用X射线晶体学来确定该蛋白质的结构。
结果表明,Rosetta确实能够构建蛋白质。研究人员开发的蛋白质Top7几乎完全符合他们设计的结构。
图3. Top7——第一个完全不同于已知现存蛋白质的蛋白质。
贝克实验室的惊人创作
Top7的出现对蛋白质设计领域的研究人员来说如同晴天霹雳。之前那些尝试创建de novo蛋白质的研究者只能模仿现有的结构。而Top7的独特结构在自然界中并不存在。并且,Top7由93个氨基酸组成,比之前通过de novo设计生产的任何蛋白质都要大。
贝克在2003年发表了这一发现。这是可以被称为非凡发展过程的第一步。在贝克实验室创造的众多壮观蛋白质中,有几个示例见于图4。他还发布了Rosetta软件的代码,使得全球的研究社区能够继续开发这款软件,并找到新的应用领域。
现在是时候总结2024年诺贝尔化学奖的研究成果了。接下来是什么?
图4. 使用贝克的程序Rosetta开发的蛋白质。
曾经需要数年完成的工作现在只需几分钟
当德米斯·哈萨比斯和约翰·朱珀确认AlphaFold2确实有效后,他们计算了所有人类蛋白质的结构。随后,他们预测了几乎所有迄今为止研究人员在地球生物体中发现的2亿种蛋白质的结构。
谷歌DeepMind也已公开了AlphaFold2的代码,任何人都可以访问。这个AI模型已成为研究人员的“金矿”。截至2024年10月,AlphaFold2已被来自190个国家的超过200万人使用。过去,获得一个蛋白质的结构通常需要几年时间,有时甚至无法得到结果。现在几分钟内就可以完成。虽然该AI模型并不完美,但它会估算其生成结构的正确性,因此研究人员知道预测的可靠程度。图5展示了AlphaFold2如何帮助研究人员的众多示例之一。
2020年CASP竞赛后,当大卫·贝克意识到基于Transformer的AI模型的潜力时,他也在Rosetta中加入了一个此类模型,进一步加快了de novo蛋白质设计的进程。近年来,贝克实验室不断涌现出令人惊叹的蛋白质创作(见图4)。
图5. 使用AlphaFold2确定的蛋白质结构
令人目眩的发展造福人类
蛋白质作为化学工具的惊人多样性反映在生命的巨大多样性中。我们现在能够如此轻松地可视化这些微小分子机器的结构,令人叹为观止;这使我们能够更好地理解生命的运作方式,包括某些疾病为何会发生、抗生素耐药性是如何产生的,或者为什么某些微生物能够分解塑料。
创造具有全新功能的蛋白质的能力同样令人震撼。这可以带来新的纳米材料、靶向药物、更快速的疫苗开发、微型传感器以及更加环保的化学工业——这些仅仅是一些对人类最有益的应用。
They cracked the code for proteins’ amazing structures
The Nobel Prize in Chemistry 2024 is about proteins, life’s ingenious chemical tools. David Baker has succeeded with the almost impossible feat of building entirely new kinds of proteins. Demis Hassabis and John Jumper have developed an AI model to solve a 50-year-old problem: predicting proteins’ complex structures. These discoveries hold enormous potential.
The diversity of life testifies to proteins’ amazing capacity as chemical tools. They control and drive all the chemical reactions that together are the basis of life. Proteins also function as hormones, signal substances, antibodies and the building blocks of different tissues.
“One of the discoveries being recognised this year concerns the construction of spectacular proteins. The other is about fulfilling a 50-year-old dream: predicting protein structures from their amino acid sequences. Both of these discoveries open up vast possibilities,” says Heiner Linke, Chair of the Nobel Committee for Chemistry.
Proteins generally consist of 20 different amino acids, which can be described as life’s building blocks. In 2003, David Baker succeeded in using these blocks to design a new protein that was unlike any other protein. Since then, his research group has produced one imaginative protein creation after another, including proteins that can be used as pharmaceuticals, vaccines, nanomaterials and tiny sensors.
The second discovery concerns the prediction of protein structures. In proteins, amino acids are linked together in long strings that fold up to make a three-dimensional structure, which is decisive for the protein’s function. Since the 1970s, researchers had tried to predict protein structures from amino acid sequences, but this was notoriously difficult. However, four years ago, there was a stunning breakthrough.
In 2020, Demis Hassabis and John Jumper presented an AI model called AlphaFold2. With its help, they have been able to predict the structure of virtually all the 200 million proteins that researchers have identified. Since their breakthrough, AlphaFold2 has been used by more than two million people from 190 countries. Among a myriad of scientific applications, researchers can now better understand antibiotic resistance and create images of enzymes that can decompose plastic.
Life could not exist without proteins. That we can now predict protein structures and design our own proteins confers the greatest benefit to humankind.
附:
历史上获得两次诺奖的科学家只有5位,居里夫人(物理奖、化学奖)、巴丁(物理奖、物理奖)、鲍林(化学奖、和平奖)、桑戈(化学奖、化学奖)。2022年,美国科学家Karl Barry Sharpless成为第五位获得两次诺奖的科学家。
过去9年诺贝尔化学奖得主名单
2023年——蒙吉·G·巴文迪(Moungi G. Bawendi)、路易斯·E·布鲁斯(Louis E. Brus)和阿列克谢·伊基莫夫(Alexey I. Ekimov)获奖,表彰他们为“发现和合成量子点”作出贡献。
2022年——美国科学家卡洛琳·R·贝尔托齐(Carolyn R. Bertozzi)、丹麦科学家摩顿·P·梅尔达尔 (Morten P. Meldal)和美国科学家K·巴里·夏普莱斯 (K. Barry Sharpless)获奖,获奖理由是“对点击化学和生物正交化学的发展”。Sharpless教授、Meldal教授因在点击化学(click chemistry)研究中做出的卓越贡献获奖,Bertozzi教授则因开拓生物正交化学(bioorthogonal chemistry)领域而获奖。
2021年——德国和美国科学家Benjamin List和David W.C. MacMillan获奖,获奖理由是“在不对称有机催化方面的发展”。
2020年——法国和美国科学家Emmanuelle Charpentier、Jennifer A. Doudna获奖,获奖理由是“开发出一种基因组编辑方法”。
2019年——美国和日本3位科学家John B Goodenough、M. Stanley Whittlingham、Akira Yoshino获奖,获奖理由是“在锂离子电池的发展方面作出的贡献”。
2018年——美国科学家Frances H. Arnoid获奖,获奖理由是“研究酶的定向进化”;另外两位获奖者是美国的George P. Smith和英国的Sir Gregory P. Winter,获奖理由是“研究缩氨酸和抗体的噬菌体展示技术”。
2017年——瑞士、美国和英国3位科学家Jacques Dubochet、Joachim Frank和Richard Henderson获奖,获奖理由是“研发出冷冻电镜,用于溶液中生物分子结构的高分辨率测定”。
2016年——法国、美国、荷兰3位科学家Jean-Pierre Sauvage、J. Fraser Stoddart和Bernard L. Feringa获奖,获奖理由是“分子机器的设计与合成”。
2015年——瑞典、美国、土耳其3位科学家Tomas Lindahl、Paul Modrich和Aziz Sancar获奖,获奖理由是“DNA修复的机制研究”。
诺贝尔化学奖小知识
截至2023年,诺贝尔化学奖共颁发了115次,没有颁发的8年分别是1916、1917、1919、1924、1933、1940、1941和1942年。
1901年至2023年,共194人次获奖,实际获奖个人为192人,因为英国科学家Frederick Sanger于1958年和1980年两次获奖;美国科学家Karl Barry Sharpless在2001年和2022年两次获奖。
115次颁奖中,63次为单独获奖者,25次为2人共享,27次为3人共享。
最年轻的获奖者是法国科学家Frédéric Joliot,1935年因“合成新的放射性元素”与妻子Irène Joliot-Curie一起获奖,时年35岁。
图|约里奥-居里夫妇
最年长的获奖者是美国科学家John B. Goodenough,2019年因“在锂离子电池的发展方面作出的贡献”获奖,时年97岁。他也是迄今为止所有诺奖得主中获奖时最年长的一位。
图|约翰·古迪纳夫
190位诺贝尔化学奖得主中,有8位女性。分别是1911年的居里夫人(居里夫人另外还获得1903年的物理学奖)、1935年的Irène Joliot-Curie、1964年的Dorothy Crowfoot Hodgkin、2009年的Ada Yonath、2018年的Frances H. Arnold,2020年的Emmanuelle Charpentier和Jennifer A. Doudna,2022年的Carolyn R. Bertozzi。其中,Marie Curie和Dorothy Crowfoot Hodgkin独享当年的化学奖。
诺奖史上的“家庭”诺奖
居里夫人家庭是历史上最成功的“诺奖家庭”。居里夫妇1903年共同获得诺贝尔物理学奖;居里夫人自己1911年又获得诺贝尔化学奖;居里夫妇的大女儿Irène Joliot-Curie,与丈夫Frédéric Joliot一起获得1935年的诺贝尔化学奖;居里夫妇的小女儿Ève Curie,嫁给了Henry R. Labouisse,他在1965年代表联合国儿童基金会接受了当年的诺贝尔和平奖。
本文综合来源:
诺贝尔官网、ChatGPT、未来论坛及网络
相关链接:
2024年诺贝尔生理学或医学奖揭晓!两位科学家因microRNA相关工作获奖!
2024年诺贝尔物理学奖授予人工智能!神经网络奠基人Hinton和Hopfield获奖
交叉学科再受青睐?2024年颁出史上最意外的诺贝尔物理学奖,专家如何解读
10月30日-11月3日
2024未来科学大奖周
与你不见不散!
相关阅读
2022未来科学大奖获奖名单公布,李文辉、杨学明、莫毅明获奖 袁国勇、裴伟士、张杰、施敏获奖!2021未来科学大奖获奖名单公布 群星璀璨!全球最具智慧大脑齐聚2020未来科学大奖周 2020未来科学大奖举行云端颁奖典礼 | 科学之光 温暖世界 2020年未来科学大奖获奖工作视频 | Nature Research Custom Video 美翻了,2020未来科学大奖证书,每一张都是艺术品! 王振义:我现在唯一的职业就是“开卷考试”|获奖感言 彭实戈:数学的美就是“于无声处听惊雷”|获奖感言 专访 | 未来科学大奖“生命科学奖”得主王振义:没有基础研究,临床问题就很难解决 专访|未来科学大奖“数学与计算机科学奖”得主彭实戈:数学是一旦对了,到处都对 “难道是天上掉馅饼?” 96岁院士王振义:我为什么在获得未来科学大奖后觉得忧愁 获奖者为何是他们?2020未来科学大奖生命科学奖成果解读 9月6日,2020未来科学大奖获奖人即将揭晓! 未来科学大奖12位捐赠人邀您关注9月6日新闻发布会 盘点历届未来科学大奖生命科学奖获奖者,猜猜2020谁将折桂? 盘点历届未来科学大奖物质科学奖获奖者,猜猜2020谁将折桂? 盘点历届未来科学大奖数学与计算机科学奖获奖者,猜猜2020谁将折桂? 2019未来科学大奖获奖名单公布:邵峰、王贻芳、陆锦标、王小云获奖 未来科学大奖公布2018获奖名单,李家洋、袁隆平、张启发、马大为、冯小明、周其林、林本坚获奖 2017未来科学大奖获奖名单及完整获奖理由 2016首届未来科学大奖获奖者名单隆重揭晓&获奖者成就介绍