在这个系列的文章中,我们将和大家一起了解全球各所顶尖AI计算生物学实验室以及他们的发展历程、科研成果等等。细数近年来AI在计算生物领域的重要突破,不得不提的便是大名鼎鼎的AlphaFold系列模型。因此,在本系列的第一篇,我们首先为大家介绍AlphaFold系列的研发团队——Isomorphic Labs。也就在最近,Isomorphic Labs的最新工作AlphaFold3发表在了Nature正刊,再一次引发了领域内的热烈讨论。话不多说,本期让我们一起揭秘AlphaFold背后的这个“神秘组织”吧~
Isomorphic Labs的成立与谷歌的DeepMind有着千丝万缕的联系。2010年, Demis Hassabis与几位同僚在伦敦共同创建了DeepMind,以解决通用人工智能为目标,并在2014年被谷歌收购。在随后的几年里,DeepMind公司陆续开发了赫赫有名、震惊一时的AlphaGo、AlphaZero等模型,在2016年一举击败围棋九段选手李世石。
从围棋到蛋白质
尽管DeepMind在围棋和其他竞技项目领域取得了前所未有的成功,其目标却远不止于此——2018年,DeepMind进军生物,参加了结构生物领域著名的第13届CASP比赛。
CASP(Critical Assessment of protein Structure Prediction,蛋白质结构预测关键评估)是一个国际性的盲测竞赛,旨在评估和推动各类蛋白质结构预测方法的发展,被誉为生命科学的“圣杯”。测定蛋白质结构通常有两种方法:实验测定或是运用计算模型模拟蛋白质的折叠。在CASP比赛中,参赛者会收到一些未公开实验结构的蛋白质序列,然后需要在规定的时间限制内提交他们的结构预测结果。这些预测结果会与之后实验确定的实际结构进行对比,从而评估各预测方法的准确性。
在2018年的这次比赛中,DeepMind团队凭借模型AlphaFold一举夺魁,在比赛中取得了58.9/100的成绩。可能这个分数看似不高,而相比之下,此前比赛中的最好成绩也很难过半。这使得人们看到了利用AI解决生物分子结构预测这一历史难题的机遇。
2020年,AlphaFold2再出江湖,在CASP14中又一次夺得冠军。相较于初代AlphaFold的58.9的准确度,AlphaFold2的准确度跃升到了92.4*,RMSD(原子级误差评价指标)也从6.6埃下降到了1.5埃。随后,团队将AlphaFold2在2021年将模型开源发表在Nature正刊,登上Nature、Science的封面,轰动一时。
图2:AlphaFold2登上顶刊封面。
2023年,Hassabis和AlphaFold2的第一作者Jumper获得了美国医疗科学的最高奖项Albert Lasker Basic Medical Research Award。由于至今已有90逾位Albert Lasker获奖者曾获得诺贝尔奖,这也使得不少人预测该团队成为诺奖的有力竞争者。
图3:Hassabis和Jumper于2023年获得Albert Lasker Award。由于AlphaFold2发表时Isomorphic Labs尚未成立,因此二人此时仍隶属于DeepMind。
Isomorphic Labs崛起
也正是在AlphaFold2发表的2021年,DeepMind将AlphaFold系列研究独立出来,由创始人Hassabis在伦敦成立Isomorphic Labs专攻AI与计算生物、药物研发等方向。
至于为何起名为Isomorphic(“同构的”),Hassabis在团队成立之初的博文中写道:
“说到底,尽管生物学(的研究对象)是极其复杂且动态变化的,我认为它可以被视为一种信息处理系统。如此看来,生物和信息科学之间有可能存在着一种相似的底层结构——一种两者之间的同构性。”
Hassabis的观点反映了他和团队对生物学和信息科学的深刻理解和创新视角——尽管生物系统的复杂性和动态性可能使其看起来难以捉摸,但如果从信息处理的角度来看,或许可以揭示出隐藏在其中的规律。这种跨学科的思维方式不仅推动了AlphaFold的成功,也为Isomorphic Labs的未来研究奠定了基础。
Isomorphic Labs的成立标志着一个新的研究方向,即利用人工智能和计算科学的力量,破解生命科学中的难题。通过整合AI技术与生物学,Isomorphic Labs致力于探索药物研发的新路径,加速医疗进步。他们的目标不仅是预测蛋白质结构,还希望在更广泛的生物分子研究中取得突破,推动精准医学的发展,最终造福人类健康。
核心人物
1997年:从剑桥大学毕业,获得计算机科学学士学位。 1998年:毕业后,Hassabis创立了一家电子游戏制作公司。 2005年:公司结束经营,而Hassabis则在此之后重返学术界,于2009年在UCL获得认知神经科学的博士学位。 2010年:联合创立了DeepMind,随后被谷歌收购。 2014年:AlphaGo(这或许也与Hassabis高超的围棋水平有关)。 2018年:AlphaFold(2018)、AlphaFold2(2020)、AlphaFold3(2024) 2021年:成立Isomorphic Labs。 2023年:与Jumper共同获得Albert Lasker Award。 2024年:因对AI的贡献而被封为爵士。 领导团队
除了Hassabis以外,Isomorphic Labs的领导团队还包括了来自各领域的顶级人才。其中包括
Chief Scientific Officer Miles Congreve(剑桥化学系93届的博士毕业生,说起来还是Hassabis的校友),曾经负责领导过20余种药物的研发设计,并创新性地提出了多种小分子药物设计的新方法,在团队中主要负责药物设计领域。
图4:大佬的领英不需要精修职业照和fancy的职业介绍
Chief AI Officer Max Jaderberg (牛津大学Visual Geometry Group 15届的毕业生,没错就是VGG那个组),Vision Factory创始人,后被DeepMind收购并加入谷歌,在团队中主要负责AI领域。
此外,团队还有着实力雄厚的顾问团队,其中包括四位诺奖得主Jennifer Doudna(CRISPR研究)、David McMillan(有机催化研究)、Paul Nurse(细胞分化机制研究)、Venki Ramakrishnan(核糖体结构研究)。
团队规模
Isomorphic Labs在伦敦总部和洛桑分部拥有一支由50-200人组成的多学科团队,包括机器学习、计算化学、生物信息等领域的专家。
目前,团队正在积极扩展,招募新的成员参与到新一代AlphaFold模型和药物设计的研发中。有兴趣的朋友们可以看看这里哦👉(https://www.isomorphiclabs.com/work-with-us)。
科研成果
Isomorphic Labs的研究大体上涵盖了两个方向:(1)以AlphaFold系列工作为代表的生物分子结构预测(2)基于AlphaFold工作进行新型药物的设计研发
正如前文所介绍的,AlphaFold系列工作所要解决的问题是蛋白质和其他生物分子的三维结构预测。我们都知道蛋白质由许多氨基酸组成的多肽链组成,而为了在细胞中行使正确的功能,这些多肽链需要折叠成复杂的三维结构。预测这种三维结构可不是一件容易的事,甚至成为了困扰结构生物学长达50年的“圣杯”。
从实验的角度出发,结构生物学家们会使用冷冻电镜等办法测出蛋白质的三维结构;而采用传统的计算方法,人们往往将一条未知结构的氨基酸序列和其他已知结构的序列进行比较,并结合专业知识推测出其三维结构。很明显,实验方法费时费力(更不要说几个实验室有冷冻电镜了),而随着序列变长、与其他分子相互作用变多,传统的计算方法也很难达到较高的准确度,且极度依赖人工的专业知识和已经验证的结构。而AlphaFold系列模型则利用了深度学习的方法,使用神经网络对多种生物信息进行编码,包括多序列对齐(MSA)、模版(template)等等,并用在大规模的数据集上进行训练。训练后的这些模型可以准确预测出给定的一条蛋白质序列的三级结构。
起初,AlphaFold和AlphaFold2专注于蛋白质结构预测。随后,越来越多的工作受到其启发,采用了相似的模型结构在RNA结构、RNA蛋白质/小分子相互作用预测等方向取得了一定的成果。最新发表的AlphaFold3应用扩散模型,将AlphaFold2在蛋白质结构预测上成果扩展到了其他的生物分子——一个模型既可以解决单体的结构预测,也可以预测多个生物分子相互作用下的结构。
药物设计
Isomorphic Labs在创立之初就明确了其初衷是为了设计药物。AlphaFold系列的工作可以说是解决了从序列到结构的问题。然而对药物设计而言,更重要的则是如何发现一条能折叠成某种特定结构的分子序列。
让我们试想一个简化的场景,假设我们知道某种疾病的通路中包括一个蛋白质与受体的不恰当结合。那么如果我们能设计出一条RNA或者蛋白质与目标蛋白结合,从而抑制其与受体的结合,是否就有可能减轻疾病的症状了呢?
Isomorphic Labs自成立以来,致力于将AI技术应用于药物设计领域,旨在通过精确的分子建模和预测,发现能有效干预疾病机制的新药物。其核心目标是开发通用的药物设计模型,以加速新药的发现和优化过程。
2021年,Isomorphic Labs将南美锥虫病和利什曼病作为第一批研究对象。这两种疾病均为危害一方的致命疾病,且现有的治疗方法有限。通过利用AlphaFold系列模型,Isomorphic Labs希望能够识别并设计出能够干预这些疾病通路的分子,从而提供新的治疗方案。
2024年初,Isomorphic Labs宣布与两家制药公司Eli Lilly and Company 和Novartis合作研究。这些合作旨在将AlphaFold3的技术优势应用于实际的药物研发过程中。通过结合制药公司的专业知识和资源,Isomorphic Labs能够更有效地推进从分子设计到临床试验的整个药物开发流程。
近日,DeepMind最新发布了AlphaProteo模型,可以基于蛋白质与其他生命分子的相互作用进行设计。在技术报告中,研究者们汇报AlphaProteo设计出了首个可与VEGF-A结合的蛋白序列。有趣的是,Isomorphic Labs似乎并未参与到这份工作中(或许在憋新的大招)。
药物研发的周期往往极长,且要通过多轮临床试验才能进入市场。因此,即便在计算模型的加持下,Isomorphic Labs和DeepMind能否成功设计出有效的药物乃至缩短研发周期仍然有待时间的检验。目前由于种种原因我们仍未知晓Isomorphic Labs在药物研发方面的进展,但相信我们都期待着这一天的早日到来。
从DeepMind到Isomorphic Labs,AlphaFold系列模型的发展历程展示了AI在计算生物学领域的巨大潜力和实际应用。通过不断突破蛋白质结构预测的准确度,AlphaFold不仅为科学家们提供了强大的研究工具,也开启了药物设计的新篇章。
Isomorphic Labs的成立标志着一个全新的研究方向——通过整合人工智能和生物科学,探索生命科学中的难题,加速生物和医疗研究的进步。尽管药物研发的道路漫长且充满挑战,但借助AI的力量,我们可以期待更多的科学突破,推动精准医学的发展,最终造福人类健康。
在未来的文章中,我们将继续带大家探索更多顶尖AI计算生物学实验室的前沿研究和创新成果,敬请期待!
回顾Isomorphic Labs的发展历程,其原身DeepMind初衷曾是像OpenAI一样研发通用人工智能,而如今却独立应用AI解决现代科学中的实际问题,这或许也是与通用人工智能发展并行不悖、相互辅佐的一条路。随着AI技术的不断发展,我们也许会发现除了结构预测以外,可以利用AI方法解决越来越多的生物问题或提供新的思考角度。
参考文献
[1]Jumper, John, et al. "Highly accurate protein structure prediction with AlphaFold." nature 596.7873 (2021): 583-589.
[2]Abramson, Josh, et al. "Accurate structure prediction of biomolecular interactions with AlphaFold 3." Nature (2024): 1-3.
[3]Zambaldi, Vinicius, et al. "De novo design of high-affinity protein binders with AlphaProteo." arXiv preprint arXiv:2409.08022 (2024).
[4]Isomophic Labs, https://www.isomorphiclabs.com/, Accessed: August, 2024
图片均源自网络,如有侵权,请联系作者。
【注意:转载请联系本公众号获得授权。】如果您对我们的内容有任何疑问需要咨询或想要联系作者,可以备注“AIMS”联系课代表。也欢迎大家投稿!
目前已有1000+人关注加入我们