点击蓝字 关注我们
l 题目:基于RFdiffusion预测互作蛋白
l 期刊:bioRxiv
l 发表时间:2024年9月
研 究 背 景
该研究聚焦于植物病原真菌分泌的效应蛋白(effectors),这些蛋白帮助病原真菌克服植物的防御系统,导致植物疾病。效应蛋白与植物抗性基因和病原物来源的Avr基因之间的蛋白质互作(PPI)对于理解这些病原-宿主间的相互作用至关重要。本研究希望通过构建基于结构同源性的计算流程,预测真菌病原体与宿主植物之间的蛋白质互作。
研 究 思 路
该研究使用RFdiffusion这一生成模型,预测病原真菌效应蛋白的互作结合蛋白的结构。生成的结合蛋白结构会通过FoldSeek进行比对,以搜索宿主蛋白中的类似结构。通过对水稻和稻瘟病菌的已验证PPI进行计算工作流程的验证,探索结合物的长度及作用位点对结合蛋白质量的影响。
研 究 结 果
1
该图展示了用于预测水稻与稻瘟病真菌之间的蛋白质-蛋白质互作(PPIs)的计算流程,提供了系统性的步骤和工具整合方案。首先从文献或数据库中提取病原菌效应蛋白的结合热点信息,然后使用RFdiffusion生成与病原菌效应蛋白相互作用的蛋白质结合体。生成的结合蛋白根据效应蛋白之间的相互作用进行过滤,随后通过FoldSeek对宿主蛋白质组进行结构相似性搜索,最终识别潜在的宿主蛋白。
图1: 基于结构同源性的计算流程示意图
2
图二和图三展示了在RFdiffusion预测互作蛋白的过程中,不同长度的结合物(75、100、150个氨基酸)如何影响计算流程在检测水稻和稻瘟病菌效应蛋白(M. oryzae)之间已验证的蛋白质互作(PPI)时的表现。
TM分数越高,表明结合物与目标宿主蛋白的结构相似性越强。图二的左侧部分展示了不同长度结合物的TM分数分布情况,结果表明75个氨基酸的结合物在大多数情况下生成了更多具有较高结构相似性的宿主蛋白。右侧部分展示了随着结合物数量增加,每个长度的结合物捕获到的不同宿主蛋白的数量。结果显示,75个氨基酸的结合物往往捕获了更多的宿主蛋白,而较长的结合物(100和150个氨基酸)虽然也能捕获到宿主蛋白,但捕获的蛋白数量相对较少。这表明较短的结合物可能会产生更多的潜在互作,但其中可能包含较多的假阳性结果。
图三进一步详细展示了在FoldSeek中通过结构相似性搜索时,不同长度结合物的TM分数和宿主蛋白捕获数量的分布情况,并按照每个效应蛋白(如Avr-PikD、Avr-Piz-t等)分别列出。与图二相似,结合物的长度对捕获到的蛋白质数量有显著影响,75个氨基酸的结合物在捕获到的宿主蛋白数量上领先,而100和150个氨基酸的结合物随着长度增加,捕获到的宿主蛋白数量减少,TM分数也略有下降。
在使用RFdiffusion生成结合物时,结合物的长度是影响预测精度和假阳性率的重要因素。
图2 & 图3: FoldSeek结构相似性搜索结果
1
图四展示了对水稻蛋白质进行结构相似性匹配后,基于不同效应蛋白、结合物长度和活性位点类型的基因本体(GO)富集分析结果。GO分析分为三大类:生物过程、细胞成分和分子功能。每个效应蛋白按其PDB ID进行标注,并根据绑定位点类型用不同颜色区分结果:
蓝色代表蛋白质结合位点(protein-binding site),红色代表识别位点(recognition site),绿色表示催化位点(catalytic site),黄色则是辅助因子结合位点(cofactor binding site)。
该图的结果显示,不同效应蛋白及其绑定位点类型之间的GO富集结果存在明显差异。例如:对于效应蛋白Avr-PikD(PDB: 7BNT),较短结合物(75个氨基酸)的富集结果显示与真菌免疫反应相关的GO项明显增加,特别是蛋白质结合位点的富集程度最高。
相比之下,较长的结合物(100或150个氨基酸)在一些特定的识别或催化位点上则表现出与更具体的免疫反应相关的功能。该图表明,不同长度的结合物及其绑定位点类型能够影响宿主蛋白在特定生物学功能上的富集程度。特别是较短结合物往往捕获了更广泛的与免疫反应相关的蛋白,但较长结合物则可能富集到更具特异性的功能蛋白。这一发现提示,在进一步实验验证前,富集分析可作为筛选候选蛋白的重要依据。
图4: 基因本体富集分析
1
图五展示了不同效应蛋白在不同绑定位点类型和结合物长度下,捕获的宿主蛋白数量的分布情况。该图以颜色区分绑定位点类型,并通过不同长度结合物(75、100、150个氨基酸)的柱状图显示捕获到的宿主蛋白数量。图中每个效应蛋白按其PDB ID标注,具体分析包括:Avr-Piz-t(PDB: 2LW6)与APIP6、APIP10等蛋白的互作。在75个氨基酸的结合物中,捕获了更多宿主蛋白,特别是与蛋白质结合位点相关的功能蛋白。Avr1-CO39(PDB: 2MYV)表现出类似的趋势,75个氨基酸的结合物捕获了最多的宿主蛋白,而更长的结合物则捕获到的宿主蛋白相对较少。从结果中可以看出,较短的结合物(75个氨基酸)普遍捕获了更多的宿主蛋白,不同绑定位点类型之间的差异也影响了捕获的蛋白质数量。例如,蛋白结合位点捕获到的蛋白质数量多于催化位点或辅助因子结合位点。因此,结合物的长度和绑定位点类型都直接影响了宿主蛋白的捕获效率。
图5: 效应蛋白捕获的宿主蛋白数量分布
1
图六展示了水稻蛋白Pik5-NP和效应蛋白Avr-PikD的重金属结合域(HMA)与由RFdiffusion生成的结合物之间的结构比对结果。该图使用TM-align工具对Pik5-NP与其对应的水稻蛋白Pik1进行全局结构比对和局部比对。
在全局比对中,Pik1和Pik5-NP表现出中等程度的结构相似性(TM-score为0.6663),但序列相似性较低(序列一致性为0.502)。然而,当只对与生成的结合物重叠的区域进行结构比对时,Pik5-NP的亚结构与Pik1的HMA域显示出很高的结构相似性(TM-score为0.8037),尽管序列相似性较低(序列一致性为0.299)。这一结果表明,虽然全局结构可能差异较大,但局部结构的高度相似性表明这些蛋白质可能在特定区域上具有相似的功能。这种域级别的结构相似性为进一步验证这些候选蛋白是否与效应蛋白发生功能性互作提供了有力的证据。
图6: Pik1和Pik5-NP的HMA域结构比对
1
图七展示了通过RFdiffusion生成的结合物与水稻宿主蛋白的关键功能域之间的比对结果。该图选取了几个具有重要功能域的宿主蛋白,展示了其与效应蛋白的绑定区域(结合物)的结构相似性。
Avr-PikD与宿主蛋白OsHIPP19的重金属结合域(HMA)进行比对,结合物长度为75个氨基酸,TM-score为0.6627,表明二者具有较高的结构相似性。Avr-Piz-t与宿主蛋白APIP10的BRCA1关联域比对,TM-score为0.5793。Avr-Pii与宿主蛋白OsExo70F2的比对中,结合物与Exo70复合体的C端域结构相似,TM-score为0.6242。这些比对结果展示了不同效应蛋白结合物在宿主蛋白的关键功能域中具有较高的结构相似性,表明这些宿主蛋白可能是值得进一步研究的候选互作蛋白。这些比对提供了强有力的证据,支持利用生成的结合物探索植物-病原互作的结构基础。
图7: 结合体与宿主蛋白重要功能域的结构比对
研 究 总 结
RFdiffusion模型在预测植物与真菌病原体的蛋白质互作方面具有强大的潜力。该方法为理解植物免疫反应和开发新型抗病策略提供了新的工具。
!!! New Technology !!!
合肥科晶生物已根据这个计算工作流程建立一站式AI设计筛选互作蛋白平台InterProDesign(IPD,Interaction Protein Design)。
这种方法能够生成与实际相符的多样化结合物结构,不仅降低了实验成本,还为探索动植物生物学中细胞功能和生物过程的互作机制提供了强有力的工具。
扫描下方二维码,添加客服,可获取详细产品资料。
福利来袭!
科晶生物论文出图
免费蛋白互作分析等您来领!
0551-64669001
扫码添加客服,即可领取!
▼