PhiGnet用于蛋白质功能注释
PhiGnet可以在没有结构信息的情况下,仅根据序列预测蛋白质功能。给定一个序列,PhiGnet使用堆叠的GCN学习预嵌入、EVC 和RC,以推断蛋白质功能注释。研究人员计算了含丝氨酸-天冬氨酸重复序列的蛋白D(SdrD)的RC。两个RC被映射到完全β片层折叠上,该折叠与三个Ca2+离子结合。从EVC中鉴定出的大多数残基与三个Ca2+离子,共同作用以稳定SdrD折叠。这表明,即使EVC稀疏地分布在RC中,EVC也包含推断残基功能作用的基本信息。使用PhiGnet来计算MgIA蛋白功能位点的激活分数,PhiGnet计算的活化分数用于衡量每个残基的重要性,分数越高,该残基在生物活性中发挥功能作用的可能性就越大。
PhiGnet注释蛋白质功能位点
鉴于氨基酸的功能贡献在不同功能之间可能存在显著差异,PhiGnet的一个关键特性是它能够定量评估单个氨基酸对特定功能的重要性,使我们能够识别与不同生物活性相关的残基。通过PhiGnet评估了九种蛋白质中残基的重要性,激活分数可以指示必需的配体/离子接触残基,这表明从不同层次的进化知识中学习可以识别残基水平的结合界面。
PhiGnet相对于其他方法的优势
PhiGnet方法展示了在两个测试集中为蛋白质分配功能注释的预测能力,PhiGnet能够实现对蛋白质的EC编号的准确分配。比较GO术语的预测性能,PhiGnet在准确性和稳健性方面均名列第一。PhiGnet在泛化方面具有稳健性,可以测试与训练集中的蛋白质具有不同序列同一性阈值的蛋白质。PhiGnet能够在没有结构信息的情况下,通过氨基酸序列预测蛋白质功能,并量化每个残基对特定功能的重要性,这对于鉴定功能关键位点具有重要意义。
由进化特征驱动的PhiGnet
研究人员通过进行大量实验,发现PhiGnet预测的残基与通过实验测定确定的功能位点的残基一致。进化信息,特别是RC中包含的信息,足以指定蛋白质的功能并定量表征功能位点上的残基。此外,结果表明RC包含的进化知识处于更高阶水平,而EVC中的信息处于较低阶水平。同时,RC中包含的信息在增强PhiGnet在残基水平上识别功能相关位点的能力方面发挥着重要作用。
总结
该研究设计了一种基于统计的学习方法PhiGnet,以促进蛋白质的功能注释和功能位点的识别。该方法固有地表征了进化特征,允许对执行特定功能的残基的重要性进行定量评估。PhiGnet与其他方法相比表现优异,即使在缺乏结构数据的情况下,也能量化特定功能的个别残基的重要性。该研究结果表明将深度学习应用于进化数据可以突出显示残基级别的功能位点,为解释研究和生物医学中蛋白质的现有特性和新功能提供宝贵支持。
更多服务及产品内容欢迎咨询了解。咨询电话:15387173921(微信同号)。
更多推荐