AI 撬动生命科学:解读 2024 年诺贝尔化学奖

文摘   2024-10-10 00:01   美国  

2024 年诺贝尔化学奖授予了 David Baker,表彰他在计算蛋白质设计方面的贡献;另一半则联合授予了 Demis Hassabis 和 John M. Jumper,以表彰他们在蛋白质结构预测方面的贡献。 这些科学家对蛋白质(生命的巧妙化学工具)的研究取得了突破性进展。他们的发现具有巨大的潜力,为人类带来了巨大利益。

  • • David Baker 成功地利用组成蛋白质的基本单位——氨基酸——构建了全新的蛋白质。他的研究小组已经创造出了一种又一种富有想象力的蛋白质,包括可以用作药物、疫苗、纳米材料和微型传感器的蛋白质。

  • • Demis Hassabis 和 John Jumper 开发了一种 AI 模型 AlphaFold2 来解决一个存在了 50 年的问题:预测蛋白质的复杂结构。通过 AlphaFold2,他们已经能够预测几乎所有 2 亿个已经被研究人员识别的蛋白质的结构。自从他们的突破以来,来自 190 个国家的 200 多万人已经使用了 AlphaFold2。

他们的工作为生物化学和生物学研究开辟了新的纪元,我们现在可以用以前不可能的方式预测和设计蛋白质结构。

蛋白质:生命化学的奇迹

蛋白质可以由几十个氨基酸到几千个氨基酸组成

蛋白质是生命活动的主要承担者。从催化生物化学反应的酶,到传递信号的激素,再到构成细胞骨架的结构蛋白,蛋白质几乎参与了所有的生命过程。蛋白质之所以能承担如此多样的功能,是因为其拥有复杂而精妙的三维结构。

蛋白质的结构由其氨基酸序列决定。 氨基酸链会自发折叠成特定的三维结构,而这种结构决定了蛋白质的功能。因此,了解蛋白质的三维结构对理解生命过程、开发新药和生物技术至关重要。

AI 时代的蛋白质结构预测

长期以来,预测蛋白质的三维结构一直是生物化学领域的一项重大挑战。传统的实验方法,如 X 射线晶体学和核磁共振,不仅耗时且成本高昂,而且对很多蛋白质来说难以实现。计算蛋白质结构预测为解决这一难题提供了新的途径

1. CASP 竞赛与早期预测方法

为了促进蛋白质结构预测领域的发展,科学家们于 1994 年发起了 CASP 竞赛(Critical Assessment of protein Structure Prediction),该竞赛每两年举办一次,旨在评估各种蛋白质结构预测方法的准确性。

早期的蛋白质结构预测方法主要基于物理化学原理和统计学方法,例如利用氨基酸的理化性质、能量函数和已知结构的蛋白质数据库来预测蛋白质的折叠方式。然而,这些方法的预测精度有限,尤其是在面对 大型复杂蛋白质结构时,往往难以给出可靠的结构模型

2. AlphaFold 的出现与突破

2018 年,由 Demis Hassabis 领导的 DeepMind 团队开发的 AI 模型 AlphaFold 在 CASP13 竞赛中取得了突破,首次将蛋白质结构预测的精度提高到了接近实验水平

AlphaFold 的成功得益于深度学习技术的应用。深度学习是一种强大的机器学习技术,它可以通过训练多层神经网络来学习数据中的复杂模式。 AlphaFold 利用了大量的蛋白质序列和结构数据,训练了一个能够预测蛋白质结构的神经网络模型。

3. AlphaFold2:深度学习的胜利

2020 年,DeepMind 团队推出了升级版的 AlphaFold2,并在 CASP14 竞赛中再次取得了压倒性的胜利。AlphaFold2 采用了一种全新的神经网络架构,能够更有效地学习蛋白质序列和结构之间的关系。其预测结果的精度之高,让许多科学家惊叹不已

AlphaFold2 的出现,标志着蛋白质结构预测领域取得了革命性的突破。 现在,科学家们可以使用 AlphaFold2 快速准确地预测蛋白质的结构,这将极大地推动生命科学、医药研发等领域的发展。例如,科学家们利用 AlphaFold2 预测了新冠病毒刺突蛋白的结构,为疫苗和药物的开发提供了重要信息。

从头设计蛋白质:超越自然的创造力

除了预测蛋白质结构,科学家们还致力于从头设计自然界不存在的全新蛋白质,以满足各种需求,例如开发新药、酶和生物材料。

1. 蛋白质设计的概念与意义

蛋白质设计是指利用计算机模拟和生物化学技术,从零开始构建具有特定结构和功能的新型蛋白质。蛋白质设计为我们提供了前所未有的机遇,可以根据需要定制蛋白质的性质,以满足各种应用需求。

2. David Baker 和 Rosetta 程序的诞生

David Baker 是蛋白质设计领域的先驱之一。他在 20 世纪 90 年代末开发了 Rosetta 程序,该程序是蛋白质设计领域的一款重要工具。Rosetta 基于蛋白质结构和能量函数的原理,可以根据用户的需求设计出全新的蛋白质结构

Rosetta 程序的工作原理是模拟蛋白质折叠的过程,通过不断地调整蛋白质结构和氨基酸序列,寻找能量最低、最稳定的构象。Rosetta 程序不仅可以用于设计全新的蛋白质,还可以用于改进现有蛋白质的稳定性和功能

3. Top7:人工设计的首个独特蛋白质

2003 年,Baker 团队利用 Rosetta 程序设计出了首个与自然界所有已知蛋白质都不同的全新蛋白质 Top7。

Top7:首个与所有已知蛋白质完全不同的蛋白质

Top7 的结构非常独特,它由 93 个氨基酸组成,折叠成一个紧密的球状结构。Top7 的设计过程完全基于计算机模拟,没有任何参考的天然蛋白质结构。Top7 的成功设计证明了 Rosetta 程序的强大功能,也为蛋白质设计领域开辟了新的方向。

4. 蛋白质设计的广阔应用前景

蛋白质设计在生物医药、能源、环境等领域具有广阔的应用前景。例如,科学家们可以设计出能够特异性靶向癌细胞的蛋白质药物,或者设计出能够分解塑料的新型酶。 蛋白质设计还有望用于开发新型生物材料、 生物传感器和生物燃料电池。

使用贝克的Rosetta程序开发的蛋白质

展望未来:蛋白质科学的新纪元

AlphaFold2 和 Rosetta 的出现标志着蛋白质科学进入了一个全新的纪元。这两个突破性的成就,为我们理解生命过程、开发新药物和生物技术提供了史无前例的机会

1. AlphaFold2 和 Rosetta 的深远影响

AlphaFold2 和 Rosetta 的成功将极大地推动蛋白质科学的发展,大大加深了我们对生命过程的认知。这些技术也将加速新药和生物技术的开发,为人类健康和可持续发展做出贡献

2. 蛋白质设计与结构预测的结合

未来,蛋白质设计和结构预测技术将更加紧密地结合,形成一个良性循环。 结构预测可以为蛋白质设计提供更准确的结构信息,而蛋白质设计则可以为结构预测提供更多的数据和验证

3. 蛋白质科学的未来方向

随着人工智能、计算科学和生物技术的不断发展,蛋白质科学将在未来取得更加令人瞩目的成就。我们可以预见,蛋白质设计将更加精准和高效,科学家们将能够设计出更加复杂和精密的蛋白质机器,以解决人类面临的各种挑战

相关链接

  • • 诺贝尔奖官方网站:https://www.nobelprize.org/

  • • AlphaFold 官网:https://alphafold.ebi.ac.uk/

  • • Rosetta Commons 官网:https://www.rosettacommons.org/

子非AI
子非AI,焉知AI之乐:分享AI的有趣应用和创新案例,让你了解AI的乐趣。
 最新文章