别急,让我们一一为你揭开AI生物分子相互作用预测的面纱,深度了解Alphafold3所解决的生物分子相互作用是个什么问题,之后还能做点什么~
生物分子相互作用
结构生物学方法:解析分子(如蛋白质或核酸)的三维结构,揭示其相互作用的具体原子位置和结合模式,从而预测和理解分子间的相互作用。(如X射线晶体学(X-ray),核磁共振(NMR)光谱等) 生物化学和生物物理方法:测量分子间的结合动力学、亲和力和构象变化,揭示其相互作用的性质和机制。如共沉淀(Co-Immunoprecipitation, Co-IP),荧光共振能量转移(FRET),表面等离子体共振(SPR)等。 计算生物学方法:模拟分子间的相互作用和结合模式,预测其可能的结合位点和结构特征。较为知名的方法有计算模拟分子对接(Molecular Docking),分子动力学模拟(Molecular Dynamics Simulation)等。
了解分子间相互作用对我们理解生命活动至关重要,但是测量分子间相互作用需要相当多的花费和时间,而AI或将大大加快该领域的研究进程。
目前AI应用于生物分子相互作用的预测方法包括生物分子相互作用3D结构预测以及生物大分子作用位点预测等。
生物分子相互作用3D结构预测
生物分子相互作用3D结构预测主要用于预测两个或多个生物分子(如蛋白质、核酸、配体等)在结合形成复合物时的三维结构。这种预测对于了解分子间的相互作用机制至关重要。
简而言之,生物分子相互作用3D结构预测给我们提供了分子之间直观的作用关系。
虽然Alphafold2在蛋白质3D结构预测方面有相对较高的精度,但在蛋白质3D结构预测以外的结构预测,例如小分子,RNA,抗原抗体复合物,其他复合物等结构预测方面的能力尚未被发掘。
但在Alphafold3横空出世后,解决了大部分Alphafold2未能解决的分子复合物结构问题。 如下图,可以清晰地看到一些使用Alphafold3成功预测复合物结构的案例。
预测复合物结构的案例。
在Alphafold3发布前,主流的用于蛋白质小分子复合物结构预测的方法是名为docking的方法,但无论是从实用性角度,还是精度,Alphafold3在完成蛋白质小分子复合物结构预测的任务中都表现出了不俗的潜力。如下图所示,无论是否提供小分子的结合口袋,Alphafold3都展现了相对较高的预测成功率。
蛋白质小分子复合物结构预测精度对比图
同样的,在蛋白-核酸复合物,蛋白共价修饰以及蛋白蛋白相复合物结构预测的任务中,Alphafold3也展现了不俗的精度。例如在蛋白小分子复合物预测的任中,相较于RoseTTAFold模型,Alphafold3的预测成功率提升了30%以上。同时在蛋白-核酸复合物结构预测的任务中,Alphafold3预测成功率较于RoseTTAFold2NA模型也有大幅提升。具体对比如下图所示:
Alphafold3在不同任务中的精度对比图。
但是目前Alphafold3在复合物结构预测的过程中同样面临一些问题。例如下图所示,在预测小分子配体结构时会搞错小分子配体的手性。
Alphafold3错误预测与正确预测手性对比图
并且在预测复合物结构时,对于分子动力学结构的预测存在局限,如下图左当配体未结合到蛋白质结构时,结合口袋应该打开。而在预测的结构中则没有明显打开的口袋。
Alphafold3错误动力学示例图
尽管在很多任务中Alphafold3都能有很高的精度水平,但在一些特定的任务中,例如在限制性内切酶的结合靶标预测过程中,出现了碱基互补配对不正确的问题,这个问题可能是由于RNA分子结构生成过程中的幻觉造成的。
Alphafold3在复合物3D结构预测方面取得了显著的效果,但仍然不能代替生物大分子作用位点预测工具的研究。生物大分子作用位点预测用于识别大分子(如蛋白质)上的关键作用位点,如酶的活性位点、药物结合位点、蛋白质-蛋白质相互作用位点等。
3D结构预测提供了分子之间的空间关系和结合模式的详细视图,而作用位点预测专注于具体功能区域(例如蛋白质与小分子靶标作用位点)的识别。
蛋白质-蛋白质相互作用位点预测蛋白质与蛋白质之间相互作用广泛影响生命中的细胞传导和代谢等功能。在深度学习预测方法之前,用于作用位点的方法主要分为两类:
2. 比较建模:这种方法基于与目标蛋白质相似的已知蛋白质结构,但其应用受限于是否存在足够相似的蛋白质。
端到端的深度学习方法进行结合位点预测相较于之前的方法在精度上有了较大提升,例如Masif模型可以捕捉对特定生物分子相互作用重要的指纹,并通过学习大规模数据集中的模式,预测蛋白质的功能位点和相互作用。
另外近期发布的ScanNet模型是一种端到端的、可解释的几何深度学习模型,可以直接从蛋白质的三维结构中学习特征。
Scannet模型示意图
选择哪种方法最终取决于具体的研究需求和应用场景。对于需要高解释性和单一类型相互作用预测的应用,ScanNet可能更合适。而对于需要广泛、多功能预测的应用,MaSIF则显得更为科学和实用。
除了蛋白-蛋白作用位点预测,其他的生物相互作用的作用位点预测模型也在近几年有了一些进展。这些作用位点预测模型包括蛋白-核酸作用位点预测模型(如Graphbind),蛋白-小分子作用位点预测模型(如RLbind)等。
RLbind模型示意图
在生物分子相互作用预测领域,AI的应用正逐步打破传统方法的局限性。AlphaFold3 的出现大大提高了复合物 3D 结构预测的精度,为研究蛋白质、小分子、RNA、抗原抗体复合物等提供了更准确的结构预测。然而,尽管 AlphaFold3 在多个任务中展现了出色的表现,它在某些特定任务中的精度仍然存在不足,例如在预测小分子配体的手性和分子动力学结构方面。
此外,尽管 AlphaFold3 取得了重大突破,预测生物大分子作用位点仍然是一个独立且重要的研究方向。不同的方法如 MaSIF 和 ScanNet各自具有不同的优势和应用场景:MaSIF通过几何深度学习捕捉特定生物分子相互作用的重要指纹,适用于广泛的预测应用;而 ScanNet则通过几何深度学习直接从 3D 结构中学习特征,适用于需要高解释性和单一类型相互作用预测的应用。另外,针对不同的生物大分子之间相互作用,目前的深度学习模型工具精度还有一定地提升空间。
[1] Jumper, J., Evans, R., Pritzel, A. et al. Highly accurate protein structure prediction with AlphaFold. Nature 596, 583–589 (2021). https://doi.org/10.1038/s41586-021-03819-2
[2] Abramson, J., Adler, J., Dunger, J. et al. Accurate structure prediction of biomolecular interactions with AlphaFold 3. Nature 630, 493–500 (2024). https://doi.org/10.1038/s41586-024-07487-w
[3] Tubiana, J., Schneidman-Duhovny, D. & Wolfson, H.J. ScanNet: an interpretable geometric deep learning model for structure-based protein binding site prediction. Nat Methods 19, 730–739 (2022). https://doi.org/10.1038/s41592-022-01490-7
[4] Gainza, P., Sverrisson, F., Monti, F. et al. Deciphering interaction fingerprints from protein molecular surfaces using geometric deep learning. Nat Methods 17, 184–192 (2020). https://doi.org/10.1038/s41592-019-0666-6
关注我!不错过任何AIMShare学术资讯!!
【注意:转载请联系本公众号获得授权。】如果您对我们的内容有任何疑问需要咨询或想要联系作者,可以备注“AIMS”联系课代表。也欢迎大家投稿!
目前已有1000+人关注加入我们