Nature | 让病毒无所遁形!研究人员开发“家谱”系统以自动检测传染病的新变种

学术   2025-01-12 19:14   北京  

病原体遗传多样性的动态变化(包括适应度增加的谱系出现)是疾病生态学的一个基本概念,对公共卫生具有重要意义。然而,确定这些谱系和估算相关的适应度仍然具有挑战性行。近期《Nature》上的研究提出了一种可扩展的方法phylowave,它总结了系统发育树中种群组成的变化,使基于共享适应性和进化关系的谱系自动检测成为可能。该方法可用于一系列病毒和细菌(新冠SARS-CoV-2、甲型H3N2流感亚型、百日咳杆菌和结核分枝杆菌)。

计算原理的示意图及其不同病原体的发育树推算

Phylowave 建立在基于遗传距离的指数之上,该指数衡量时间分辨系统发育中每个节点(内部或末端)的流行。即从新的谱系中采样的节点在系统发育上将比当时其他种群更接近,因为它们都将共享相同的近期祖先。
每个节点的索引来自从该节点到当时循环的所有其他节点的距离分布,由具有设定时间尺度的内核加权。这个权重能够动态地跟踪谱系的出现,关注节点之间的短距离(包含有关近期种群动态的信息),而不是长距离(包含有关过去进化的信息)。
时间尺度是根据所研究的特定病原体量身定制的,其选择将取决于分子信号以及传播速率。一旦计算了每个序列的索引值,就可以使用广义加法模型实现一个树分区算法,该算法可以找到最能解释观察到的索引动态的谱系集。

已识别谱系与推算谱系的时间分辨系统发育树和热图比较

将phylowave应用于四种病毒和细菌病原体:SARS-CoV-2、H3N2、百日咳杆菌和结核分枝杆菌进行分析。研究发现,对于所考虑的每种病原体,phylowave 产生了具有明显适应性差异的谱系证据,具有离散指数动力学的遗传相关菌株亚群证明了这一点。依次使用每种病原体,将推算谱系与现有的谱系进行了比较,一致性水平很高,如先前定义的 SARS-CoV-2 变体Alpha、Beta、Gamma、Delta和 Omicron 和其他先前定义的亚变体与推算的谱系密切相关,H3N2分支也是如此。此外,phylowave 确定了三个额外的百日咳芽孢杆菌谱系,具有明显不同的指数动态,这些是之前未被鉴定的。

谱系的适应性估计

phylowave识别离散谱系的限制将取决于潜在的患病率、采样水平和适应度差异。使用 logistic 增长模型估计每个谱系的适应度,这个模型能够捕捉到每种病原体的谱系动态。每个新兴谱系的潜在适应性都是非零的,这与确定的具有真正不同适应性水平的谱系一致。尽管该模型为每个谱系估计了一个恒定的适应性参数,但它们随时间的实际适应性取决于当时正在流通的其他谱系。

对于 SARS-CoV-2,研究发现对应于 Omicron XBB1.5 的谱系 1 具有最佳的最大实时适应性,其次是对应于 Omicron BA.5 和 BA.1 的谱系 5 和 7。而H3N2 谱系在人群中的适应性更加同质,谱系出现后平均持续 3.9 年。

谱系定义基因突变

接下来,研究通过识别谱系定义突变来探索基因组中的特定变化是否与谱系适应性有关。使用不同谱系之间的序列比较来识别不同的特定突变。对于 SARS-CoV-2,研究发现谱系定义氨基酸取代的最高密度位于刺突蛋白的受体结合域。该分析估计了与 600 万个 SARS-CoV-2 基因组的适应度变化相关的核苷酸位置,发现谱系定义突变与先前分析中描述的突变一致。H3N2也获得了的类似结果,其中大多数谱系定义氨基酸取代位于 HA1 结构域。此外,研究也发现了一些以前没有描述过的其他相关突变。在结核分枝杆菌最新分支相关的突变中发现,与抗菌素耐药性相关的基因具有最高比例的谱系定义突变

phylowave关于采样强度和谱系检测时间的稳健性

Phylowave能够跟踪病原体种群构成随时间的变化,并与适应性直接相关。为证明这种对采样偏差随时间变化的稳健性,研究使用 SARS-CoV-2 数据集进行了敏感性分析,方法是反复删除基因组子集,然后每次都重新估计了循环谱系。
结果显示,即使使用严重偏差的数据集,仍然能够检测到几乎所有的谱系。最后,研究探索了phylowave 能够多快地检测到新出现的谱系。每两周截断一次完整的全球 SARS-CoV-2 数据集,并重新运行检测算法。发现该模型能够捕获每个谱系,出现后的中位延迟为 2.2 个月,只需要10 个序列。且该研究中使用的 SARS-CoV-2 数据集来自 NextStrain,使用更大的数据集可以进一步缩短谱系鉴定的时间。

总之,该方法可以在系统发育树中跟踪病原体种群组成的变化,即使在序列的可用性存在严重偏差的情况下也能实现。在广泛的病原体中,研究已证明Phylowave可以恢复每种病原体的主要已知循环谱系,并识别以前未知的、适应性发生重大变化的谱系。Phylowave还可量化每个谱系的相对适应性,并识别与新的、更合适的谱系出现相关的遗传变化。这种方法可能对公共卫生监测产生重要影响。
参考文献:
Learning the fitness dynamics of pathogens from phylogenies, Nature (2024). DOI: 10.1038/s41586-024-08309-9
主编微信
(商务合作,重要事宜)
注:添加微信请备注昵称+单位+研究

生命科学综合交流QQ群:681341860
微信学科群:病毒学群,神经科学群、临床医学、肿瘤学科群、硕博交流群和医药投资交流群(微信群审核要求较高,请各位添加赵编后主动备注单位研究方向)


生命科学前沿
以病毒学为特色,探讨生命科学前沿,普及生命科学知识。生命科学之家!
 最新文章