AI构建的新蛋白质:科学突破还是空想?

文摘   2024-10-17 08:02   中国  


8月中旬的一个周六早晨,亚历克斯·纳卡(Alex Naka)在女友的厨房里发起了一场他称之为“小型黑客马拉松”的活动。借助笔记本电脑、咖啡,以及大约80个云端AI处理器,他生成了大量旨在阻断某些肿瘤中突变细胞受体的计算机设计蛋白质

纳卡是加利福尼亚州阿拉米达一家医疗技术公司的蛋白质工程师。他将自己最有前途的十个设计提交到新推出的蛋白质设计竞赛,并看到它们迅速登上了排行榜的前列。该竞赛由瑞士洛桑的生物技术初创公司Adaptyv Bio举办,是过去一年中至少五个类似竞赛之一。大多数参赛者都使用了人工智能工具,如AlphaFold和受聊天机器人启发的“蛋白质语言模型”,这些工具在最近大幅提升了功能和普及度。背后的一些研究人员因其贡献获得了今年的诺贝尔化学奖。这些荣誉部分归功于人们对新设计蛋白质的期待——这些蛋白质可能会成为更有效的药物、工业酶或实验室试剂。
然而,科学家们指出,蛋白质设计的快速发展也带来了混乱。蛋白质的生成速度远超实验室制造和测试的能力,因此难以评估哪些方法真正有效。
历史上,竞赛曾推动了蛋白质结构预测等领域的重大科学进步。最新一批竞赛通过降低参与门槛,吸引了来自全球的研究者投身蛋白质设计领域。这种趋势还可能加速验证和标准的制定,并有助于培养社区。西班牙巴塞罗那基因组调控中心的计算生物学家Noelia Ferruz Capapey表示,“它将推动该领域更快发展,并加速方法的测试”。
不过,科学家们也提醒,竞赛必须克服一些挑战,例如明确要解决的问题以及如何客观地评选获胜者。设定合适的规则至关重要。德国慕尼黑工业大学的计算生物学家Burkhard Rost指出,如果竞赛执行不当,“它们可能会对整个领域产生负面影响”。
蛋白质设计竞赛在一定程度上受到了一个已有30年历史的竞赛启发,这场竞赛为生物人工智能的革命奠定了基础。自1994年以来,结构预测关键评估(CASP)挑战科学家根据蛋白质的氨基酸序列预测其三维结构。该竞赛由马里兰大学罗克维尔分校的计算生物学家John Moult和加州大学戴维斯分校的Krzysztof Fidelis创立,参赛者通过将计算预测与未发表的结构模型进行比较,来确定获胜者。
2018年,伦敦的DeepMind(现为Google DeepMind)凭借其第一版蛋白质结构预测工具AlphaFold赢得了CASP。其后续版本AlphaFold 2在2020年表现尤为出色,Moult甚至宣布,预测简单蛋白质结构的问题已基本解决。此后,竞赛的重点逐渐转向了其他新兴挑战,例如预测复合物中多种相互作用蛋白质的结构。
如今,许多人希望这些竞赛能像CASP推动蛋白质结构预测那样,推动蛋白质设计领域的发展。正如Burkhard Rost所说:“如果没有CASP,就不会有AlphaFold。我们需要这些竞赛来激励研究者并推动工作的发展。”
今年6月,Rost和他的几位同事赢得了由国际开放科学非营利组织Align to Innovate举办的蛋白质工程锦标赛。该赛事分为两部分,首先参赛者预测不同酶变体的特性,随后表现最好的团队重新设计了一种能够分解淀粉的酶,最终通过实验室测试确定最佳设计。2025年的锦标赛目前正在筹备中。
4月,加拿大基奇纳的生物技术公司Liberum Bio与Rosetta Commons共同举办的冬季蛋白质设计游戏大赛公布了获胜者。Rosetta Commons是一个由主要学术科学家组成的合作组织,负责维护蛋白质建模工具。该竞赛要求参赛者重新设计一种现有的植物病毒酶,这种酶广泛应用于蛋白质纯化,目标是提高其效率。
此外,还有两场比赛要求参赛者设计全新的蛋白质。Adaptyv正在寻找能够与生长激素受体EGFR结合的蛋白质,EGFR在许多癌症中过度活跃。共有90名参赛者提交了700多种设计。
在“从比特到粘合剂”项目中,研究人员竞相开发可用于T细胞癌症治疗的小蛋白质。该项目由德克萨斯大学奥斯汀分校的研究生团队领导的BioML协会运营,吸引了来自42个国家的64支队伍参与,其中包括尼日利亚、哥伦比亚、伊朗和印度。目前约有18,000种设计正在接受测试,结果预计将在2025年初公布。

Adaptyv的首席执行官兼联合创始人朱利安·恩格勒特表示,竞赛中的许多参赛者都有蛋白质工程和设计的背景,然而,也有一些没有生物学专业经验的参赛者提交了有潜力的作品。一位来自伊朗的参赛者甚至使用游戏电脑进行预测,因为他无法获得更强大的计算设备。
恩格勒特指出,这些非专业研究者的高质量作品让他联想到苹果、微软等科技巨头的“车库发明”。他设想,未来自由职业的蛋白质设计师或将通过参与竞赛,争夺公司、学术实验室和其他机构设定的奖金。“他们可能需要两年时间进入实验室才能开始工作,而现在一个周末就能完成,”他说。
竞赛还可以节省研究者的时间。慕尼黑工业大学的机器学习科学家Michael HeinzingerRost是获胜团队成员之一,他表示从竞赛组织者那里获得快速实验结果,极大地减少了研究者申请资助的时间。“这对我来说,最重要的回报就是节省时间,”他说。
虽然并非所有竞赛都提供物质奖励,但有些比赛的奖品相当诱人。Bits to Binders比赛的获胜者将获得3D打印的奖杯,以及由LEAH Laboratories提供的实验商品和合作机会。Adaptyv竞赛则为参赛者提供了一些免费实验和其他奖励,罗塞塔冬季比赛的获胜者则分享了5000美元的奖金。
其中最为引人注目的是最近启动的Evolved 2024竞赛,第一名团队将获得价值2.5万美元的亚马逊云服务积分及其他公司(包括OpenAI)提供的价值数千美元的奖励。赞助商包括纽约的风险投资公司Lux Capital和生物AI初创公司EvolutionaryScale,后者已获得超过1.42亿美元的投资。
然而,如何评选获胜者并非易事。Evolved 2024更像是一场黑客马拉松,团队将围绕药物功效和安全性等大问题展开研究,由专家组主观评判。而对于蛋白质设计目标明确的比赛,评判标准依然复杂。Align to Innovate创始人Erika DeBenedictis指出,设计的活性、稳定性以及制造可行性都要纳入考量,“设计蛋白质的过程中,很多方法都可能失败。”
Rost警告,若竞赛过于狭隘地评判设计,可能会对整个领域产生负面影响。威斯康星大学麦迪逊分校的Anthony Gitter则表示,如果参赛者对自己的方法保持沉默,研究界也无法充分利用蛋白质设计竞赛的成果。
目前,大多数比赛鼓励甚至要求参赛者分享他们的方法。Gitter认为,这些竞赛有助于将不同领域的研究者聚集在一起——从专注蛋白质工程的实验室到刚涉足自然语言处理的机器学习科学家。“如果组织得当,这些竞赛可以最大化对领域的影响,帮助建立社区。”
9月底,Adaptyv竞赛结果公布,Naka的设计尽管在初期表现优异,但在实验室测试中并未成功。他的10个参赛作品没有一个与目标分子成功结合,147个设计中只有5个达标,超过50个设计甚至无法制造。
尽管如此,过去EGFR结合剂设计的成功率更低。“蛋白质工程的常态就是要准备好面对大量失败,”Naka说道。瑞士洛桑联邦理工学院的结构生物学家Martin Pacesa和Lennart Nickel成为获胜者,他们公开了方法并将代码开源(https://www.biorxiv.org/content/10.1101/2024.09.30.615802v1)。
Naka期待未来能尽早开始设计自己的作品。他将这次经历形容为“第二类乐趣”——当时很痛苦,但回想起来却愉快。通过竞赛,他与Gitter等志同道合的科学家建立了联系。“竞赛降低了进入门槛,吸引了许多新人参与蛋白质设计,”他说。“我以后肯定会继续参加类似的活动。”
科学家们表示,要推动蛋白质设计的发展,竞赛需要解决整个领域面临的更广泛挑战。与结构预测不同,蛋白质设计在不同任务中的标准差异较大。用于设计特定酶的方法可能无法直接应用于设计疫苗成分等其他蛋白质




- 转载须知 -


本文著作权归文章作者所有,欢迎个人转发分享,未经作者的允许禁止转载,作者拥有所有法定权利,违者必究。





喜欢就点个 在看 吧 : )



X Omics
生物科学与计算机科学的完美碰撞,激发出探索世界的全新视角,让我们一起探索生命科学的新纪元!合作交流:xomics1@gmail.com
 最新文章