14位专家点评丨Nature震撼发布AlphaFold完成的98.5%人类蛋白结构预测结果

学术   科学   2024-10-09 19:17   河南  


撰文 | 十一月

“AlphaFold确定了覆盖几乎整个人类蛋白质组(98.5%的所有人类蛋白,即Uniprot里所有2700aa以下的蛋白)的蛋白质的结构

就在一周前,即7月16日,Deepmind团队在Nature上发表文章Highly accurate protein structure prediction with AlphaFold,公布了CASP14中AlphaFold的源代码(该版本也称为AlphaFold2,与CASP13中的AlphaFold完全不一样的模型,详见BioArt报道:Nature特别关注丨AlphaFold2—“它来了,它来了,它带着源代码过来了”,预测的蛋白结构达原子水平的准确度。CASP14是2020年5-7月举办,在该场比赛中,AlphaFold就表现异常亮眼,大AI或结构爱好者跃跃欲试,等待源代码公布,直到该篇Nature祭出。在朋友圈对AlphaFold的激情还没有减下去的档口,Deepmind团队又带来了巨大的惊喜,尽管我们知道“它”终将会来,但却没想到仅隔了一周。

2021年7月22日,DeepMind团队再次在Nature发表了文章Highly accurate protein structure prediction for the human proteome描述了AlphaFold对人类蛋白质组(人类基因组编码的所有蛋白质的集合)的准确结构预测。由此得到的数据集涵盖了人类蛋白质组近60%氨基酸的结构位置预测,且预测结果具有可信度。预测信息将通过欧洲生物信息研究所(EMBL-EBI)托管的公用数据库免费向公众开放。


确定蛋白质的结构能为理解生物学过程提供宝贵信息,并有望指导药物研发。考虑到理解人类蛋白质组对健康和医药的重要性,研究人员付出了大量努力来确定这些蛋白质结构。虽然开展了数十年的研究攻关,但通过实验方法确定的结构只覆盖了人类蛋白质组17%的氨基酸——氨基酸是连接起来形成蛋白质的亚单位。利用实验方法解析结构需要跨越诸多十分耗时的障碍,因此,扩大蛋白质组覆盖面仍是一项艰巨挑战。
 
Kathryn Tunyasuvunakool、John Jumper、Demis Hassabis和同事利用前沿机器学习方法AlphaFold确定了覆盖几乎整个人类蛋白质组(98.5%的所有人类蛋白,即Uniprot里所有2700aa以下的蛋白)的蛋白质的结构。作者发现,AlphaFold能对人类蛋白质组58%的氨基酸的结构位置给出可信预测。其中,对35.7%的结构位置的预测达到了很高的置信度,是实验方法覆盖的结构数量的两倍。在蛋白水平上,AlphaFold对43.8%的蛋白的至少四分之三的氨基酸序列给出了可信预测。
 
作者认为,大规模的准确结构预测将成为一种重要工具,让我们能从结构的角度解答新的科学问题,而AlphaFold的预测结果将帮助进一步阐明蛋白质的作用。

原文链接:
https://doi.org/10.1038/s41586-021-03828-1

AlphaFold | 科学家评论

14位来自行业领军科学家的评述:

Paul Nurse,2001年诺贝尔生理学或医学奖得主,弗朗西斯·克里克研究所所长,EMBL科学咨询委员会主席
计算方法正在改变科学研究,为与公众利益息息相关的发现和应用开辟新的可能性。理解蛋白质的功能对于提高我们对生命的认识是至关重要的,并将最终带来医疗保健、食品可持续性、新技术等方面的改善。DeepMind与欧洲分子生物学旗舰组织EMBL共同发布AlphaFold蛋白质结构数据库,这是生物创新的一次巨大飞跃,展示了跨学科合作对科学进步的影响。有了这种资源的自由和公开,科学界将能够利用集体知识加速发现,迎来人工智能生物学的新时代。

Venki Ramakrishnan,2009年诺贝尔化学奖得主,英国皇家学会前主席
这项计算工作代表了蛋白质折叠问题上的惊人进展,这是50年来生物学上的重大挑战。早在许多业内人士预测之前,它就已经应运而生了。看到它将从根本上改变生物学研究的许多方面,这是一件令人兴奋的事情。

Elizabeth Blackburn,2009年诺贝尔生理学或医学奖得主,加州大学旧金山分校荣休教授
随着这些由DeepMind开创的蛋白质结构的革命性方法的普及,这将为科学界了解基因组序列的生物学意义打开新的窗口。

Patrick Cramer, 马克斯·普朗克生物物理化学研究所所长
DeepMind和EMBL提供的绝妙资源将改变我们研究结构生物学的方式。蛋白质结构的预测展示了机器学习的力量,并将服务于全球科研社区,而且这一突破性成就为全球提供了开放数据。这同样也是21世纪科学将如何发展的一个开创性的例子。

来自使用AlphaFold的研究合作伙伴的评述:

Ben Perry,被忽视疾病药物倡议(Drugs for Neglected Diseases Initiative,DNDi)的发现和开放创新领导者
我们需要加快新药的发现,以帮助全世界数百万面临被忽视疾病风险的人。人工智能可以改变药物研发的游戏规则:通过快速准确地预测蛋白质结构,AlphaFold打开了新的研究领域,提高了研发的范围和效率,并促进了我们在疾病流行国家中的研究。令人鼓舞的是,AlphaFold使我们看到强大的尖端人工智能使几乎只集中在贫困人口中的疾病的药物研发成为可能。

Prof.John McGeehan,结构生物学教授,朴茨茅斯大学酶创新中心主任
我们的任务是开发酶使塑料循环利用的解决方案。这项技术正在以一种没人能预料到的方式加速我们的研究。DeepMind提供的开放获取将改变整个科研社区,让每个人都能做这类实验。AlphaFold花一个周末就完成了我们几个月甚至几年时间所做的事情。让我觉得我们每天都比昨天更进步了一年。

Prof. Marcelo Sousa,科罗拉多大学博尔德分校生物化学系

AlphaFold的预测帮助我们加快了对抗生素耐药性的研究,最终解决了我们关注了10多年的实验。这些预测是如此准确和精确,以至于我一开始都以为是我搞错了什么。

来自DeepMind / Alphabet内部的评述:

Sundar Pichai,Google以及Alphabet的CEO
AlphaFold数据库显示了人工智能深刻加速科学进步的潜力。DeepMind的机器学习系统不仅在一夜之间极大地扩展了我们在蛋白质结构和人类蛋白质组学方面积累的知识,而且它对生命基石的深刻洞察为科学发现的未来带来了非凡的希望。

Pushmeet Kohli,PhD,DeepMind科学领域的人工智能主管
我们的团队一直致力于AlphaFold的开发和研究,希望通过预测蛋白质的结构来破译和解锁蛋白质世界。我们正在通过数据库将AlphaFold的预测提供给每个人,以最大限度地利用这些见解取得科学进步。这个数据库和AlphaFold有潜力打开科学探究的新途径,最终将推进我们对生物学和生命本身许多领域的理解。我们相信,这将对健康和疾病相关问题的研究、药物设计过程和环境可持续性产生变革性的影响,我们非常兴奋地看到未来几个月和几年有什么应用开发出来。

John Jumper,PhD,DeepMind中AlphaFold研发带头人
随着数据库的扩充,几乎每一种已编目的蛋白质都可以得到预测模型。AlphaFold数据库可能会改变我们处理生物信息学的方式,因为它将使我们能够以近乎原子的精度研究所有已知生物体的蛋白质。我们乐观地认为,AlphaFold的前景和机器学习的进步将推动蛋白质研究的一个令人兴奋的新阶段的发展,在这个阶段,深度学习工具使定量理解生物与实验方法结合起来。

Kathryn Tunyasuvunakool,PhD,DeepMind研发科学家
AlphaFold模型可以通过实验方法来帮助确定结构。对结构有一个足够准确的初始预测将允许研究人员重新审视和解决旧的X射线数据集和低温电子显微镜地图,而这些在以前是不可能建立模型的。这是计算方法如何补充实验方法的一个很好的例子。

来自EMBL的评述:

Prof. Dame Janet Thornton,EMBL-EBI名誉董事
人工智能的力量是AlphaFold预测的基础,该预测基于过去50年世界各地科学家收集的数据。毫无疑问,使用这些模型将激励实验和理论蛋白质结构研究人员将这一新知识应用到他们自己的研究领域,并开辟新的兴趣领域。这有助于我们对生命系统的认识和理解,也将为人类开启所有的机会。

Sameer Velankar,PhD,EMBL-EBI部门主管
人类基因组革命20年后,AlphaFold是生物学研究的重大突破。蛋白质的功能由其结构决定,AlphaFold蛋白质结构数据库将提供数以百万计的蛋白质结构,加速发现过程。空前的规模将引发一波新的创新浪潮,帮助我们应对从卫生到气候变化等各种挑战。

Dr. Christoph Müller,EMBL结构与计算生物学系主任
这是一个巨大的进步。AlphaFold结构预测将大大加快结构生物学的研究,并将使三维蛋白质结构在生命科学研究中更加引人注目。

转载须知

【原创文章】BioArt原创文章,欢迎个人转发分享,未经允许禁止转载,所刊登的所有作品的著作权均为BioArt所拥有。BioArt保留所有法定权利,违者必究。

BioArt
高屋建瓴,提供专家点评,引导学术争论,展现学术批评;诚心实意,关注科研生态,推广科研经验,倡导师生交流。
 最新文章