北京时间10月9日下午5点45分许,2024年诺贝尔化学奖揭晓。美国科学家David Baker获奖,以表彰其在计算蛋白质设计方面的贡献;另一半则共同授予英国科学家Demis Hassabis 和 John M. Jumper,以表彰其在蛋白质结构预测方面的贡献。
大卫·贝克
David Baker
美国生物化学家和计算生物学家,现为华盛顿大学西雅图分校教授,蛋白质设计研究所所长。
大卫·贝克近几十年来一直从事蛋白质设计研究,设计出自然界中不存在的蛋白质分子,使其具有更好的功能或新颖的结构。其开发了著名的Rosetta软件,使计算生物学取得了长足的进步。
戴密斯·哈萨比斯
Demis Hassabis
毕业于剑桥大学计算机科学专业,DeepMind创始人兼首席执行官、谷歌DeepMind首席执行官。
2010年,戴密斯在伦敦创立了DeepMind公司,专注于人工智能技术的研发,开发了多个具有创新性的AI系统,包括AlphaGo、AlphaZero等。
约翰·江珀
John M. Jumper
生物物理学家,诺贝尔化学奖获得者,谷歌深度思维(DeepMind)公司科学家、高级研究员。
约翰·江珀主要从事计算化学领域的研究,包括蛋白质折叠和分子建模的创新方法,蛋白质结构及其功能的复杂性。研发出一种利用人工智能和机器学习技术以预测蛋白质结构的算法,使研究人员能够了解蛋白质如何根据其氨基酸序列折叠。
一个蛋白质可以由几十个氨基酸到几千个氨基酸组成,氨基酸链折叠成一个三维结构
1
1838年
荷兰化学家莫伊尔德首次提出“蛋白质”这一术语,并对其化学性质进行了初步研究。
2
1902年
俄国科学家米尔·费舍尔发现了肽和肽键,认为蛋白质是由氨基酸通过肽键连接而成的,于1902年被授予诺贝尔化学奖。
3
1912年
波兰化学家弗雷德里克·桑格第一次测定了蛋白质的完整氨基酸序列,即胰岛素的B链,这标志着蛋白质序列分析的诞生,于1958年被授予诺贝尔化学奖。
4
20世纪50年代末
英国生物物理学家约翰·肯德鲁和马克斯·佩鲁茨成功地使用了一种称为X射线晶体学的方法,展示了蛋白质的首个三维模型,于1962年被授予诺贝尔化学奖。
5
1961年
美国科学家克里斯蒂安·安芬森成功地使一个现有蛋白质展开,然后再次自行折叠,得出蛋白质的三维结构完全由蛋白质中的氨基酸序列决定的结论,于1972年被授予诺贝尔化学奖。
6
上世纪70年代
美国人赛勒斯·莱文塔尔在1969年通过计算出得出结论,蛋白质如何折叠的所有信息都存在于氨基酸序列中。
7
1993年
大卫·贝克开发出了一系列能够根据氨基酸序列预测蛋白质结构的软件,取名为Rosetta,这套软件在国际蛋白质结构预测评估大赛上保持了多年的领先优势。
8
2001年
人类基因组草图完成,为蛋白质的氨基酸序列研究提供了大量数据。
9
2020年
DeepMind公司开发出了AlphaFold2,彻底碾压了此前所有的预测软件,其中就包括Rosetta。
10
2021年
AlphaFold2已经能够成功预测98.5%的人类蛋白质结构,其准确性和实验结果相差无几。
11
2024年
DeepMind团队推出了AlphaFold 3,以前所未有的精确度预测了几乎所有的生命分子,包括蛋白质、DNA和RNA的三维结构,以及它们之间的相互作用模式。
使用大卫·贝克程序Rosetta开发的蛋白质
2024年诺贝尔化学奖是关于蛋白质的,而蛋白质正是生命中巧妙的化学工具。David Baker成功地完成了一项几乎不可能完成的壮举——制造出了全新种类的蛋白质。Demis Hassabis和John Jumper则开发了一个人工智能模型来解决一个50年的难题——预测蛋白质的复杂结构。这些发现蕴藏着巨大的潜力。
使用AlphaFold2设计的蛋白质结构
蛋白质的重要意义
蛋白质是生命的基石,不仅组成了我们身体的器官组织等基本结构,还作为荷尔蒙、生物信号传递物质、抗体等广泛参与各种生命过程。
蛋白质由20个氨基酸排列组合成的长链折叠而成,就像同样的纸能折成纸鹤也能折成盒子,不同的折叠方式所形成的结构决定了蛋白质的功能。氨基酸链条在被细胞生产出来之后,会迅速自发折叠成具有特定结构的蛋白质。
颁给蛋白质结构,更是颁给AI
为何蛋白质研究没有获得生理学奖或医学奖而是获化学奖,而AI又能获得化学奖?
生命的问题本质上就涉及到交叉学科,而像AI这样的强力工具能帮助人们进行探索。生命的奥秘不是纯粹的生物学问题,它不是孤立的。要研究这样一个复杂生命过程,需要用到生物、化学、物理、数学、计算机等等。从这个角度上来说,蛋白质结构问题的研究颁生命科学、化学甚至物理奖,都是可以的。
而随着AI的出现,蛋白质预测的准确率和效率都得到了前所未有的提高,解决了困扰化学家多年的重大科学难题,并成为广大科研人员手中的得力工具,获奖实至名归。
AI预测存在的问题
AI在蛋白质结构预测领域还有很长的路要走。蛋白质结构预测的终极问题还未被解决,AI算法对我们彻底理解底层生物规律的帮助有限。AlphaFold一类的大模型本质是通过对已有的大量氨基酸序列和蛋白质结构数据的比对而形成概率预测,发现更有可能的结构,对于蛋白折叠过程背后的科学规律的认识还很有限。
虽然目前AI预测蛋白质结构的准确率很高,但也不是完全精确。此外,对于蛋白质的动态结构以及蛋白质的相互作用,AI的表现也差强人意。蛋白质在溶液中是动态的,彼此之间还会进行复杂的相互作用。
AlphaFold2的工作原理
蛋白质结构预测的突破是天时、地利和人和的共同结果。天时上,高速发展的人工智能和层出不穷的新方法是AlphaFold的理论基础,PDB中快速增加的蛋白质结构是深度学习的材料基础;地利上,背靠谷歌公司强大的运算能力;人和上,公司聚集了一批富有朝气和探索精神的年轻人,以及哈萨比斯与江珀卓越的领导才能和创新能力,成功也就水到渠成。
近年来,AI在如火如荼地快速发展,取得一系列重大突破,如ChatGPT、Sora等,其智能程度逐渐提升,正在改变着人类的生活方式和科研的研究模式。AlphaFold无疑是优秀代表之一,可看作是AI发展的一个缩影。
AlphaFold解决了困扰生命科学多年的一个重大难题,并有望为其他生物学问题解决提供借鉴。大数据已成为当前科学发展的重要特征,如基因组测序结果和海量论文等,借助AI工具解决生命科学问题已成为一个重要方向。AlphaFold成功的另一层意义在于激励年轻人要敢于挑战自我。
图文来源:部分来源网络,侵删
责任编辑:新媒体中心 朱乐娱
审核:刘晗 陈佳怡
校对:宛涛