原文献信息:Glasner, DR, and Daugherty, MD. Unchecked growth: Pushing the limits on RNA virus genome size in the absence of known proofreading. Proceedings of the National Academy of Sciences. 2024; 121, e2414223121.RNA病毒因其高度容易出错的RNA依赖性RNA聚合酶而臭名昭著。因此,在每一轮基因组复制过程中,大量突变会被引入病毒中,导致RNA病毒接近所谓的“错误灾难”阈值,在该阈值下,病毒无法产生足够的感染性后代。从数学角度来看,较小的基因组会累积较少的突变,因此不太可能遇到错误灾难。与这一推论相一致,大多数非分段RNA病毒的基因组大约为10 kb或更小(图1)。
然而,病毒学中每一个趋势都会有例外。已知的最大非分段RNA病毒基因组存在于Nidovirales目中。例如,冠状病毒(包括SARS-CoV-2)的基因组可以达到32 kb,而其他Nidoviruses的基因组超过40 kb。这些病毒通过编码依赖于3'-5'外切酶(exonuclease,ExoN)结构域的聚合酶错误校正机制,维持>30 kb的基因组大小(图1)。这种ExoN活性允许在RNA基因组合成过程中进行校对,有效地降低了每一轮基因组复制的突变率,从而避免了错误灾难。其他病毒,包括Nidovirales目中的动脉炎病毒、植物感染的Closteroviridae病毒,以及最近描述的“类大基因组黄病毒”(LGF)成员,其基因组范围从约15到27 kb,但不编码任何已知的聚合酶错误校正机制。因此,缺乏错误校正机制的非分段RNA病毒基因组的大小上限似乎小于30 kb,超过这一上限的所有已知病毒都属于含有ExoN结构域的Nidoviruses。
然而,Petrone等人现在描述了一种Flaviviridae家族成员的激动人心的发现,违反了这一基因组大小限制:该病毒的基因组约为40 kb,且不包含以前与聚合酶错误校正相关的任何结构域(图1)。作者在澳大利亚悉尼港的海绵及其他无脊椎动物的宏基因组中发现了这一RNA病毒基因组。通过139倍的测序覆盖率组装,该RNA病毒基因组长达39.8 kb,并编码一个>12,500个氨基酸的多聚蛋白。为了确定该病毒与其他RNA病毒之间的关系,作者使用AlphaFold结构预测和结构同源性检测来识别病毒多聚蛋白中与其他病毒蛋白同源的结构域。通过这种方法,他们识别出了Flaviviridae家族病毒特有的衣壳蛋白、包膜蛋白、蛋白酶/解旋酶对及RNA依赖性RNA聚合酶(RdRp)。利用RdRp和蛋白酶/解旋酶结构域,作者证明该病毒在系统发育上归类于Flaviviridae家族,靠近含有猪瘟病毒和其他LGF病毒的进化支根部,此前最大的LGF病毒基因组为27 kb。因此,该新病毒被命名为“Maximus类猪瘟病毒”,它代表了所有Nidovirales以外已知最大病毒之一,并落在Flaviviridae系统发育的基础部分,为这一重要病毒家族的祖先状态提供了新的视角。值得注意的是,使用这些序列和结构同源性分析,作者没有发现任何ExoN样的校对结构域。实际上,基因组的大部分区域与任何其他RNA病毒基因组的结构域都没有明显的同源性(图1)。然而,作者确实发现了几个与细胞(例如,细菌和真核生物)蛋白相似的结构域,他们推测这些结构域可能编码该病毒独有的功能,帮助维持其庞大的RNA基因组和多聚蛋白。例如,一个结构域类似于细胞的Tu延伸因子,该因子有助于真核生物和细菌细胞中mRNA翻译的准确性和快速性,因此对于一个具有>12,000个残基多聚蛋白的病毒可能是有利的。更令人着迷的是,他们发现了一组连续的结构域,他们将其称为“核酸代谢盒”,可能涉及在基因组复制期间避免错误灾难。该盒子包括腺苷酸激酶、核苷酸二磷酸激酶、磷蛋白磷酸酶和光解酶相关结构域,这些结构域与细菌、真核生物,甚至某些DNA病毒中的蛋白质同源,但在其他RNA病毒中未发现这些结构域。由于这些结构域在调节核苷酸磷酸池水平(这对基因组复制的准确性至关重要)以及修复紫外线诱导的核苷酸损伤中扮演了重要角色,病毒对这些细胞结构域的共选提供了一个有趣的假设,即大型RNA病毒如何避免错误灾难。确定这些结构域在病毒复制中的功能将是识别它们是否在基因组复制准确性中起关键作用的重要下一步。不管怎样,这种病毒缺乏任何已知的病毒错误校正蛋白,表明RNA病毒必须存在其他机制来克服错误灾难问题,可能是通过更高保真度的聚合酶、一种与Nidoviruses不同的校对机制,或者尚未被描述的其他机制。超越这一新发现病毒在克服错误灾难的新机制上的影响,本研究还揭示了病毒进化的一般性机制。这些发现清楚地表明,>30 kb的基因组在两个独立的非分段RNA病毒家族中独立进化,表明可能还存在其他类似的例子。有趣的是,尽管有人提出Nidoviruses在基因组扩展之前获得了一种校对机制,但这一新病毒的系统发育位置导致作者推测,Flaviviridae家族的成员可能是从像他们发现的这种大型病毒进化到脊椎动物中常见的小基因组病毒,如登革热病毒、寨卡病毒和丙型肝炎病毒。最后,这些数据表明,RNA病毒从真核生物,甚至从细菌中获取基因可能比目前意识到的更为常见。尽管病毒获取基因的现象已有描述,但它主要发生在大(例如痘病毒和疱疹病毒)或巨型(例如潘多拉病毒和咪咪病毒)DNA病毒基因组中。该研究结果表明,大型RNA病毒也可能通过基因获取来产生进化新颖性。事实上,最近一篇论文描述了大型基因组Nidoviruses的多个独立进化谱系中获取免疫拮抗酶结构域的现象。随着拥有大基因组的RNA病毒数量的增加,我们很可能还会观察到更多的RNA病毒中捕获的细胞基因,它们有助于病毒复制或免疫逃逸。如本文描述的发现一样,这些发现突显了对来自不同宿主,特别是非脊椎动物宿主病毒进行持续采样和表征的重要性。所谓的巨型DNA病毒,其体积及基因组大小远远超过其他已知病毒,最早在藻类和变形虫中被发现,颠覆了许多关于病毒生物学和进化的传统假设。同样,单个病毒的发现,如昆虫、扁虫,乃至海绵中的病毒,已扩大了我们对RNA病毒基因组大小进化的理解。随着RNA病毒发现速度的不断加快,我们将继续修订我们对基因组大小限制以及病毒错误灾难极限的理解。