基于AlphaFold-Multimer的多模态蛋白互作智选平台

学术   2024-09-26 08:19   上海  



在蛋白质相互作用研究领域,、酵母双杂交(Yeast Two-Hybrid, Y2H)以及免疫沉淀联合液相色谱-质谱(IP LC/MS)虽然为蛋白质互作研究做出了巨大贡献,但它们在操作复杂性和时间消耗上存在一定的局限性。基于AlphaFold-Multimer的多模态蛋白互作智选平台,作为一种基于人工智能的结构预测程序,以其前所未有的准确性和高效性,为研究者们提供了新的解决方案。




技术原理与应用范围


利用深度学习的方法,将研究对象-蛋白质氨基酸序列和结构数据中学习蛋白质之间的相互作用模式,并根据这些模式来预测未知的蛋白质对的组成和三维结构。



实验方法


将Bait诱饵功能蛋白序列以及待筛选物种文库Prey进行三维建模分析,采用方法为同源建模和AlphaFold建模建立蛋白数据库。把目的蛋白与蛋白数据库进行对接分析,得到对接分值等特征,根据这些特征利用AI-model进行互作预测,判断蛋白对是否互作。


实验流程


1.数字化蛋白文库构建:

提取出研究物种蛋白组的所有序列,然后对每一条蛋白序列进行三维结构的构建,记录建模分值,得到该物种的三维结构数据库,形成整个研究物种的蛋白PDB文件。


2、诱饵蛋白三维结构建模:

对诱饵蛋白序列进行三维结构模型构建,记录建模分值。


3.多模态蛋白互作虚拟筛选算法平台与流程

1).Megadock粗筛

首先使用Megadock进行粗筛,可以快速筛选出潜在的有意义的蛋白互作,Megadock的高效性使得在大规模数据集中进行初步筛选成为可能。

将Megadock分值高的top200进入hdock筛选,这是一个合理的精筛步骤。Hdock能够提供更为精确的对接结果,进一步缩小候选范围。

2).Hdock精筛

在Hdock筛选阶段,通过考虑结合能绝对分值,可以更有效地识别出稳定性好、亲和力强的蛋白互作。这是一个重要的筛选指标,有助于提高最终筛选结果的准确性。

3).AlphaFold-Multimer一对一精细分析:

将Hdock筛选出的top10数据转入AlphaFold-Multimer计算PTM+ipTM值,是对筛选结果的进一步深化和验证。AlphaFold-Multimer在预测蛋白质复合物结构方面的高准确率,有助于确认候选蛋白互作的可靠性和生物学意义。根据Nature 参考文献指导建议:选取AlphaFold-Multimer PTM+iPTM值大于0.75的候选蛋白进行生物学实验验证,其验证成功率是非常高的。




AlphaFold Multimer文献案例实测


1.实验目的:重现Epic2B与Pip1互作的结果测试

🔼 图注:AlphaFold Multimer预测

Epic2B与Pip1互作数据


参考文献:Tan, X., CalderonVillalobos, L. I., Sharon, M., Zheng, C., Robinson, C. V., Estelle, M., & Zheng, N. (2007). Auxin perception and signal transduction by the TIR1/AFB pathway. Nature, 446, 640645. doi:10.1038/nature05731


2.实验流程

本次研究中,我们根据参考文献中提供的信息,从UniProt数据库中检索出Epic2B和Pip1的蛋白序列。随后,利用合肥科晶生物的AF-M(AlphaFold Multimer)大模型平台对这些序列进行了结构预测,旨在重现Epic2B与Pip1之间的相互作用。序列如下:

>EpiC2B:

MSFLRPTLALLAVTALVTTSAQLNGYSKKEVTPEDTELLQKAQSNVSAYNSDVTSRICYLKVDSLETQVVSGENYKFHVSGCSVNSDKELGGCANQNCESSKYDIVIYSQSWTNTLKVTSITPAN

>Pip1 

MAENKEEDVKLGANKFRETQPLGTAAQTDKDYKEPPPAPLFEPGELSSWSFYRAGIAEFMATFLFLYITILTVMGLKRSDSLCSSVGIQGVAWAFGGMIFALVYCTAGISGGHINPAVTFGLFLARKLSLTRAVFYMVMQCLGAICGAGVVKGFMVGPYQRLGGGANVVNPGYTKGDGLGAEIIGTFVLVYTVFSATDAKRNARDSHVPILAPLPIGFAVFLVHLATIPITGTGINPARSLGAAIIYNDEHAWNDHWIFWVGPMIGAALAAIYHQIIIRAMPFHRS





3.实验结果

通过AF-M大模型平台的计算,我们获得了Epic2B与Pip1蛋白复合体的预测模型。该模型给出了模板建模得分(pTM)=0.65,界面模板建模得分(ipTM)=0.23,综合得分(pTM+ipTM)=0.88。尽管这一综合得分与文献中报道的0.92略有差异,但考虑到预测过程中的多种影响因素,我们认为这一差异在可接受的范围内。重要的是,该得分仍大于0.75的阈值,表明Epic2B与Pip1之间存在较强的相互作用能力。

为了进一步验证预测结果的准确性,我们使用PyMol软件打开了AF-M生成的工程文件,并绘制了Epic2B与Pip1结合位点的精细图片。通过对比本地的图片模型与文献中的图片模型,我们发现两者在结构上几乎一致,尽管在角度上存在一些差异,但这并不影响对互作位点的准确描述。


🔼图注:黄色标记代表结合的氨基酸残基



综上所述,本次测试成功地重现了Epic2B与Pip1之间的相互作用,并通过合肥科晶生物的AF-M大模型平台获得了与文献报道相近的预测结果。这一结果不仅验证了AF-M大模型平台的准确性和可靠性,也为后续的生物化学实验提供了有力的理论指导。












合肥科晶生物技术有限公司是一家以AI与生物技术融合为核心的行业领军企业,汇聚生物技术和AI领域的高端人才,经验丰富的资深研发团队,能够为您提供全方位的专业知识、独特见解和技术支撑。


我们倾力打造百库精筛虚拟引擎,已储备数十种物种的蛋白质数字化文库,研究者只需送研究蛋白的CDS序列或者氨基酸序列,即可进行数字化互作蛋白筛选,只需5-10天即可交付!已储备常用物种数据库如下列表:



福利来袭!

科晶生物论文出图

免费蛋白互作分析等您来领!

0551-64669001

扫码添加客服,即可领取!


参考文献:

[1] Huang S , Ma Y , Xu Y ,et al.Shade-induced RTFL/DVL peptides negatively regulate the shade response by directly interacting with BSKs in Arabidopsis[J].Nature Communications, 2023, 14(1).

[2] Homma F, Huang J, Van Der Hoorn R A L. AlphaFold-Multimer predicts cross-kingdom interactions at the plant-pathogen interface [J]. Nature Communications, 2023, 14(1): 6040.

[3] Schuster M, Eisele S, Armas-Egas L, et al. Enhanced late blight resistance by engineering an EpiC2B-insensitive immune protease[Z/OL]. 2023. 29: 541874

[4] Olsvik H L, Johansen T. AlphaFold-multimer predicts ATG8 protein binding motifs crucial for autophagy research [J]. PLoS Biol, 2023, 21(2): e3002002.

[5] Jumper J, Evans R, Pritzel A, et al. Highly accurate protein structure prediction with AlphaFold[J]. Nature, 2021, 596(7873): 583-589.

[6] Yan Y , Tao H , He J ,et al.The HDOCK server for integrated protein–protein docking[J].Nature Protocols, 2020, 15(25):1-24.

[7] Ohue M, Shimoda T, Suzuki S, et al. MEGADOCK 4.0: an ultra-high-performance protein-protein docking software for heterogeneous supercomputers. Bioinformatics. 2014, 30(22):3281-3283.



KjFold
分享最新科研前沿动态;技术介绍及案例分析;科研福利发放
 最新文章