基于171种猴痘病毒蛋白质的完整单点突变图谱,探索潜在疫苗及药物开发途径

学术   2024-10-19 15:41   北京  

猴痘是由猴痘病毒(MPXV)引起的一种人畜共患传染病,常见症状包括发热、淋巴结肿大和全身水疱脓疱等;MPXV为痘病毒科正痘病毒属,具有两个不同的进化枝:进化枝I和进化枝II。2024年8月14日,世界卫生组织宣布猴痘疫情为国际关注的突发公共卫生事件。了解MPXV突变的影响对于评估病毒的进化以及开发新型疫苗或疗法至关重要但目前还未有系统性研究其变异效应的实验方法。因此,对MPXV基因组单点突变景观的计算预测是理解病毒进化、流行病学和治疗干预潜在应答的重要前沿。

MPXV具有一个约197kb大小的双链DNA基因组,编码约180种蛋白质。与RNA病毒相比,MPXV的突变率相对较低,但近年来,特别是2022年后出现的毒株中观察到显著的变异,这种差异强调了持续监测和基因组分析对检测病毒进化和潜在适应性变化的重要性。通过利用计算工具来预测突变影响,科研人员能更好地了解MPXV动态,为疫苗开发和治疗干预提供信息,助于控制未来疫情。


法国索邦大学和土耳其Van Yüzüncü Yıl大学的科研人员合作在预印本平台bioRxiv发表了题为“Comprehensive Mutational Landscape Analysis of Monkeypox Virus Proteome”的文章,对MPXV蛋白质组的单点突变图谱进行了全面的计算分析。研究团队利用ProteinGym(v1.0.0)数据集确定了两种最佳病毒蛋白突变效应预测算法ESCOTT和iGEMME,基于其重建了171种MPXV蛋白的完整单点突变图谱;并通过Colabfold v1.5.5生成了输入多序列比对(MSA)和蛋白质结构,并使用 pLDDT等方法评估了结构质量。特别地,该研究提出了一种名为“平均基因突变敏感性(AGMS)”的新指标,分析了每个基因对突变的敏感性,并将前20个MPXV基因确定为治疗开发的潜在靶标。综上,该研究为评估MPXV新突变的影响和指导治疗策略提供了宝贵的资源。
文章发表在bioRxiv


01
最佳病毒蛋白突变效应预测算法的选择

ProteinGym数据集(v1.0.0)包含来自各种生物体的217个深度突变扫描替代实验,以及来自62种方法的理论预测;其中包括28个病毒实验,涉及多个点突变和单点突变。相关性分析显示,GEMME和TranseptEVE家族模型在病毒蛋白突变效应预测方面表现最佳此外,研究团队还评估了最近开发的ESCOTT和iGEMME方法的性能。结果显示,无论是预测组合突变(单点突变+多点突变)还是仅预测单点突变,ESCOTT方法的表现均是最佳,而iGEMME则是次佳方法与TranceptEVE相比,ESCOTT和iGEMME的计算速度更快,且可以在CPU上运行。

图1. ESCOTT和iGEMME与其他四种方法的性能比较。


02
MPXV蛋白质结构的质量

研究团队使用2024年7月测序的MPXV最新菌株,生成了包含175种蛋白质的fasta文件;OPG003、OPG025、OPG108和OPG147等蛋白质的基因未知片段较长被剔除,最终剩余171种蛋白质。接下来,研究团队使用Colabfold v1.5.5生成了MSA文件和蛋白质结构。ESCOTT和iGEMME都需要MSA文件作为输入;iGEMME仅使用MSA文件的进化信息来确定突变的影响,而 ESCOTT可同时使用进化信息和来自PDB格式文件结构信息

预测结构的质量可能会影响突变景观计算。为此,研究团队通过可用的实验结构(A42R profilin-like蛋白等)对预测结构进行质量评估,发现预测效果良好。pLDDT是检查预测结构质量的另一个指标,研究团队收集了171种蛋白质中所有氨基酸的pLDDT,其中有75.5%的pLDDT值非常高或很高(图2 C)。结构中的螺旋(coil)是蛋白质紊乱的指标,研究团队还分析了所有氨基酸的二级结构,发现coil仅占24.9%。

现有的实验结构、pLDDT值和二级结构分析表明,预测结构的质量良好,可用于预测MPXV基因组编码的所有蛋白质的突变效应。

图2. 利用pLDDT和二级结构分析进行蛋白质结构质量研究。


03
MPXV蛋白质的单点突变图谱

研究团队用ESCOTT和iGEMME方法计算了171种MPXV蛋白的单点突变图谱,分别获得了171个和169种蛋白质的完整突变图谱使用PRESCOTT程序计算了171个基因的所有单点氨基酸突变的原始ESCOTT和iGEMME分数,并对其进行排序,进一步获得ESCOTT和iGEMME排序分数。

如下示例为其中的一个输出,研究团队展示了病毒核心半胱氨酸蛋白酶(其主要作用是降解肽或蛋白质)所有可能氨基酸突变的排序影响。结果显示,该蛋白质的iGEMME分数(排序、原始)与ESCOTT分数(排序、原始)相似。对ESCOTT和iGEMME图形的视觉检查显示,这两种方法的结果在蛋白酶上非常相似,为此,研究团队计算了169种蛋白质ESCOTT评分和iGEMME评分之间的Spearman相关性,发现两种方法具有较高的相似性和一致性

图3. 病毒核心环蛋白蛋白酶(OPG083)的突变图谱及其用ESCOTT获得的预测。

除完整的突变图谱外,研究团队还计算了每个位置的平均最小突变评分(AMMS),将其添加到PDB文件中占位列中。在许多病毒蛋白酶中,存在一个催化二元体(或三元体),其功能类似于化学剪刀。该蛋白酶的催化二元体为H241和C328;从图3B、3C可以清楚地看出,催化二元氨基酸是对突变最敏感的位置。

04
平均基因突变敏感性

研究团队使用ESCOTT结果计算了171种蛋白质的AGMS,并筛选出得分最高的20个基因(图4)。前20种蛋白质中有6种位于病毒膜上,这构成了病毒与宿主蛋白质相互作用的前沿排在前20位的第一个基因为OPG076,可编码成熟病毒膜融合复合物成分,能显著影响病毒感染力及膜融合能力;第二个基因是OPG059,其编码的细胞色素C氧化酶在病毒复制中发挥作用;第三个OPG158基因编码一种与疫苗病毒A32蛋白类似的蛋白质——A32.5L,参与病毒膜的组装。

有趣的是,图4中还出现了一种假想的蛋白质(OPG166),这种蛋白质可能会是一种新的药物靶点。上述结果表明,前20名中的许多蛋白质在病毒中起着重要作用,该研究的分析可能会揭示一些未被考虑的新靶蛋白

图4. 根据ESCOTT计算得出的平均基因突变敏感性最高的前20个基因及其蛋白质产物。

综上所述,研究团队使用最先进的突变效应预测方法ESCOTT和iGEMME方法计算了171个MPXV基因的完整单点突变图谱;ESCOTT/iGEMME突变图谱可用于评估新MPXV蛋白变体的潜在影响。此外,该研究还引入了一种新指标AGMS,具有高AGMS值的蛋白质可作为潜在的药物/疫苗靶标,可显著促进对于药物和疫苗设计研究。这项开创性研究强调了当前全球卫生危机背景下理解MPXV演变的重要性,并提供了一个强大的计算框架。

参考来源:

Ozaktas, Tugba, et al. "Comprehensive Mutational Landscape Analysis of Monkeypox Virus Proteome."bioRxiv (2024): 2024-09.

·END·

热文推荐

王亚东团队发布第一个细胞分辨率多组学遗传调控景观数据资源

MD安德森癌症中心梁晗团队绘制蛋白质表达图谱

哈佛医学院、腾讯AI实验室联合开发病理学基础模型CHIEF

蒋庆华/许召春/王平平团队提出单细胞转录组测序数据挖掘新方法

快点亮"在看”吧

测序中国
聚焦基因科技/精准医学领域的科技前沿与产业动态
 最新文章