今日看点
iPhage很荣幸为您传递学术研究报告,iPhage基因编辑将关注最新发表的基因编辑技术或基于CRISPR-Cas编辑系统的优化方案。本期介绍Edward C. Holmes、Florian Krammer和Felicia D. Goodrum在Cell期刊发表的一篇关于病毒学未来五十年发展方向的前瞻性综述。文章在COVID-19大流行的背景下总结了过去五十年病毒学领域的主要进展,并对未来50年病毒学研究的重要领域提出了建议。该成果2024年9月19日发表于国际顶级期刊《cell》。
评论内容
当Cell于1974年1月作为“令人兴奋的生物学”期刊创刊时,第一期便包含了两篇关于小鼠白血病病毒的论文,这反映了当时对病毒作为致癌分子的关注。第二个月出版的论文也包括一篇关于“肿瘤病毒的分子生物学”的书评。在接下来的50年里,Cell为病毒学领域一些最具影响力的研究提供了良好的平台,发表了许多具有里程碑意义的研究,例如揭示逆转录病毒导致肿瘤发生的机制、通过逆转录酶复制乙型肝炎病毒。在2019年冠状病毒大流行期间,细胞和病毒学的交叉研究仍在继续,例如发表的研究揭示了血管紧张素转换酶ACE2和跨膜蛋白酶、严重急性呼吸系统综合症冠状病毒SARS-CoV-2丝氨酸TMPRSS2受体所发挥的作用,鉴定出病毒基因组中的第一个突变,该突变显著提高了病毒的适应性以及广泛的趋同基因组和表型病毒进化以克服人类免疫反应。
作者从细胞学和病毒学50年的发展关系中汲取灵感,概述了其认为在未来50年可能重要的一些研究问题和主题。当然,在技术快速变革和海量数据生成的时代,讨论整个学科的未来非常困难。因此本文必然是对一个学科可能的未来的个人观点,即使存在无数的不确定性,但很明显未来的病毒学将以丰富的数据为特征,那么生物医学面临的挑战之一便是如何处理不断产生的数据。作者期待见证使用人工智能AI实现常规病毒学任务的自动化,也希望得到量子计算机的协助,作者还期待Alphafold导致蛋白质结构预测的革命性变革得以持续发展。由于有许多可能的主题要涵盖,因此作者将重点放在其认为病毒学在未来几十年里可能面临的一些重大机遇和挑战上:
1 对病毒圈进行编目
宏基因组学将病毒学带入了一个新的阶段:大量测序对病毒圈规模和多样性的描述逐渐加深。然而我们对病毒多样性的了解仍然比其它任何群体都少。尽管仍有动物分类群需要识别(还有大量的细菌),但与对病毒圈的微小采样数据相比,这些数字相形见绌。虽然估计值只不过是有根据的猜测,但显然我们对所有病毒的测序少于(可能远低于)0.1%。因此未来病毒学的核心任务将是了解病毒圈的大小、多样性和结构(图1)。不仅要确定有多少病毒以及可能导致疾病,还要了解影响全球病毒多样性的因素:为什么某些病毒群似乎比其他病毒群更物种化?为什么一些宿主似乎比其他宿主携带更多的病毒?。同样重要的是,这些病毒中的许多病毒都具有表型特征,因此基因型和表型方法的新综合应该是未来病毒学的目标。对蛋白质结构的研究,包括通过计算方法预测的蛋白质结构,将成为作者未来病毒圈编目的核心,为发现更加多样化和不同的病毒开辟道路。获得尽可能多病毒蛋白的可靠结构为探索更多的病毒圈提供了依据。更具挑战性的是从结构数据中估计系统发育树,尽管这将彻底改变解决病毒深层进化历史。真正的进步将需要蛋白质结构进化模型,这些模型既包含序列中每种氨基酸取代的概率,也包含这些氨基酸在结构上下文中如何相互作用,从而形成一个极其复杂的进化空间。最大的挑战将是确定地球上每个物种的核心病毒组,这与旨在对真核生物分类群(例如https://vertebrategenomesproject.org)基因组进行测序的项目类似。对病毒圈进行编目将使作者能够解决许多基本问题:RNA和DNA病毒的基因组大小范围是多少?RNA病毒可以有多小?是否存在尚未描述的病毒类型?除了类病毒之外,还有其他病毒样颗粒吗?病毒的规模和复杂性如何才能被视为一个病毒群体?病毒的基因组结构和复制策略的范围是多少,哪些因素决定了这个范围?有了这些数据再加上系统发育分析的改进,有可能重建所有DNA和RNA病毒的进化历史,尽管这挑战了关于当前病毒分类方案是否对病毒圈的巨大多样性具有适应性的问题。
注:无根系统发育树描述了当前 RNA 病毒的大规模分类,外缘标记了五个主要门。还指出了 RNA 病毒的一些单个科和目。由于涉及巨大的遗传距离和固有的对齐不确定性,这种系统发育不应被视为进化历史的准确代表。使用当前仅基于一级序列相似性(例如来自宏基因组学)的计算方法进行病毒检测的假设外部极限用黄色虚线圆圈标记。对蛋白质结构保守模式的分析可能会将可检测的病毒球延伸到外虚线圆圈。除此之外,使用任何基于序列的方法都可能无法检测到病毒。
尽管发现病毒的方法得到了快速发展,但我们对病毒进化和生态学的理解仍然较少。病毒进化中的许多问题只能通过可检验假设的病毒学采样来解决,这些问题包括:病毒的长期宏观进化趋势是什么?RNA病毒进化是否有方向性?由于宿主进化发生了重大转变,例如多细胞性、有性生殖和脊椎动物的进化,那在病毒进化中是否存在等效的进化转变?病毒进化中的重大事件是否反映了它们感染的宿主类型以及感染细菌、植物、无脊椎动物和脊椎动物的病毒之间的差异?哪些因素驱动病毒的基因组进化?
尽管病毒学在过去50年中取得了巨大进步,但在了解病毒如何以及何时起源方面在很大程度上仍然是一无所知。困难在于病毒没有留下化石记录,而且它们的基因组序列往往不同,以至于它们往往无法可靠地对齐,更不用说推断系统发育关系。关于病毒的起源,有两个主要的假设:(1)病毒作为古老复制体的直系后代,例如RNA病毒代表了起源于原始前细胞RNA世界的现存谱系,早期的RNA分子能够自我复制,并在没有细胞结构的早期环境中演化,最终形成了今天我们所知的RNA病毒;(2)病毒作为“逃逸基因”在细胞生命起源之后演化而来的,即这些病毒可能起源于从细胞宿主中逃逸出来的mRNA分子,这些mRNA分子后来获得了保护性的衣壳,并演化出自主复制的能力。确定这些理论中哪一个是正确的,将为理解生命本身的起源提供核心信息。
人类传染病出现的纽带是人与动物的接触,体现在对动物狩猎、食用或毛皮利用、养殖、野生动物贸易、活体动物市场、森林砍伐以及在野生动物栖息地附近生活或工作的种群中。因此,加强对人与动物接触界面的监测可能是预防未来大流行病的最有效方法。COVID-19大流行引发了很多关于需要全球“大流行雷达监测”来帮助防止未来病毒爆发的讨论。尽管这种下一代病毒监测背后的科学技术相对简单,但可能涉及高通量宏基因组测序与靶向血清学筛查的结合在野生动物贸易和活体动物市场等环境中,此外更大的挑战是克服复杂的地缘政治问题。最终应该能够(如有必要)对每个感染患者的病毒基因组进行实时测序,但要实现这一目标,在低收入和中等收入国家推出基因组测序技术至关重要,同时也涉及过程中的政治、法律和监管障碍。反过来,这要求在这些地方建立必要的病毒学、基因组学和计算基础设施并提供相关培训,因此需要大量财政投资。除了更好、更有针对性的监测外,还需要解决科学问题,以了解疾病出现的驱动因素。争论最多的是是否有可能在疾病出现事件发生之前预测它们。尽管越来越多的数据表明某些宿主群体、病毒类型,也许还有地理位置最有可能藏匿新出现的病毒,但这并不构成一门可预测的、可操作的科学。此外,某些病毒比其他病毒更能跨越物种界限的原因,或者为什么某些宿主群体(如蝙蝠)携带和容忍的病毒比其它病毒更多,尽管最近取得了进展但仍需要指导性研究,至少需要了解每组病毒的物种范围及其细胞相互作用的关键,例如受体的使用。通过描述病毒-宿主进化相互作用的范围,我们将更好地理解毒性等特征的进化;当新病毒出现时,通过预测其毒性进化的轨迹(即它是否会增加、减少或保持不变),从而进行合理的公共卫生行动。
多年来,气候科学家一直在警告人为导致全球气温升高问题。全球变暖除了导致许多一般问题外,也会存在导致节肢动物媒介传播病毒的问题。气候变化使包括蚊子、蜱虫及其病毒在内的媒介物种能够扩大活动范围,通常从较温暖的地区扩展到过去较凉爽的地区。近年来在欧洲观察到这种情况:亚洲虎蚊是许多黄病毒和甲病毒的媒介,已经传播到阿尔卑斯山以北;在传播布尼亚病毒克里米亚-刚果出血热病毒的蜱虫中也观察到类似的向北传播,这导致西班牙、意大利和法国爆发了登革热病毒感染。还有人认为,由于可能对病毒季节性、传播和人类行为产生影响,气候变化将增加人类呼吸道感染的负担。通过病毒学、媒介生物学、流行病学和气候研究专家的合作,了解气候变化对病毒(重新)出现的全面影响将成为跨学科研究的重点。
在过去约100年中全球范围内发生了四次流感大流行(图2)。1918年,一种亚型H1N1病毒感染人类,导致了报道的最大规模病毒大流行。1957年,一种新的H2N2亚型越过了物种障碍,导致了另一场大流行。在很短的时间内,H2N2战胜了H1N1,然后H1N1从种群中消失了。1968年,H2N2被H3N2亚型取代。1977年H1N1卷土重来,可能来自疫苗/攻击实验并与H3N2共同传播,直到2009年另一种H1N1毒株从猪引入人类体内并完全替代季节性H1N1病毒。这些亚型替代事件背后的驱动因素尚不清楚,尽管适应人类后不断变化的健身景观和新病毒诱导的交叉反应性抗体可能是一种解释。SARS-CoV-2大流行大大减少了2020年和2021年期间其它呼吸道感染(包括流感)的传播(图2),可能的原因是非药物干预对季节性流感病毒等病毒造成了更大的压力,这种病毒的爆发值仅为1.5,而早期SARS-CoV-2变体的爆发值为2-3。与其它呼吸道病毒一样,流感病毒在2020年和2021年经历了主要的种群瓶颈期,导致乙型/16/88型类似乙型流感病毒谱系消失。同样,SARS-CoV-2的Omicron变体在2021年底出现,可能与H3N2流感减少有关,H3N2流感在第一波Omicron浪潮结束后卷土重来。由于当时广泛的非药物干预受到限制,因此两种病毒很可能相互干扰。由于甲型流感病毒和SARS-CoV-2之间没有预期的适应性免疫交叉反应性,因此替代机制可能支持了这种竞争。这些病毒竞争动态所涉及的机制:它们可能包括先天免疫反应、对易感个体的竞争、行为改变以及密切相关病毒情况下的交叉反应性适应性免疫。这是未来研究的一个重要领域,因为竞争可能足够强大,足以从全球种群中消除某种病毒种类或亚型,因此了解这些现象应该能够制定更好的病毒控制策略,甚至可能完全根除一些呼吸道病毒。如果这些病毒没有像乙型流感病毒那样具有广泛的动物宿主,那它们可能不再构成大流行威胁。
注:(A) 自 1918 年以来流感病毒的传播。甲型流感病毒的 H1N1 亚型于 1918 年至 1957 年存在于人类人群中。1957 年,另一种不同的甲型流感病毒亚型 H2N2 引起了大流行,并在短时间内击败了 H1N1,导致其从人类中消失。1968 年,另一种甲型流感亚型 H3N2 引起了大流行,导致 H2N2 被消除。H1N1 亚型于 1977 年卷土重来并一直传播到 2009 年,当时一种新型猪源性 H1N1 病毒引起了大流行并消除了季节性 H1N1。这些病毒之间的竞争可能是由于血清学交叉反应性增加,导致较老的、可能不太合适的病毒被消除。(B) 来自美国纽约市一个大型医疗保健系统的数据(每天的阳性检测百分比),表明无关病毒之间存在竞争。2021 年深秋,检测到 H3N2 活性增加。然而大约在同一时间,SARS-CoV-2 的早期 Omicron 变体 BA.1 开始在纽约市引起大规模感染浪潮,在此期间甲型流感病毒的活动似乎受到抑制。随着 Omicron BA.1 的衰落,甲型流感病毒活性再次开始上升。
人类对病毒感染的易感性存在很大异质性:一些人接触病毒会被感染,而另一些人则不会。在许多情况下,抵抗力或易感性是暂时的,在某个时间点不易感的个体可能在以后高度易感。对疾病严重程度也进行了类似的观察。世界上大约70%的人口受到单纯疱疹病毒HSV-1的影响,感染者可能在一年内患上3-4次唇疱疹。然而其他人可能永远不会经历唇疱疹。许多因素在易感性中起作用,包括年龄、性别、先天性和适应性免疫系统的健康状况、宿主微生物组和病毒遗传学(图3),尽管这些个体因素或它们的一些种类的贡献通常不清楚。社会经济因素、健康不平等和差异、压力和社区问题也可能同样影响易感性和疾病严重程度。确定暴露于相同病毒剂量时的易感性或耐药性模式显然是未来病毒学的一个主要话题。吸取的经验教训可能会导致更好的对策,包括疫苗以及作用于先天免疫系统的疗法或易于实施的行为改变。在允许确定所有适当参数的环境中进行控制良好的多学科纵向研究非常重要,这也适用于对疫苗的异质性反应和疫苗诱导保护的异质性。
图3 病毒感染模式和疾病产生
虽然许多病毒感染是自限性的(在急性感染后几天内自动清除),但有些病毒会持续数月、数年,甚至伴随宿主一生。宿主健康状况、感染的程度和速度以及对感染的免疫反应是病毒感染疾病结果的主要决定因素(图3)。慢性病通常与持续存在的病毒相关(但不限于病毒),据估计,普通人会遭受8-12次病毒持续感染。持续感染与宿主建立亚稳态但又动态的关系,范围从连续的低水平复制到以发作性再激活为标志的潜伏感染。持续的病毒感染可能导致由于健康状况或压力的变化而出现的慢性疾病,或导致仅折磨一部分感染者的疾病或癌症。了解持久性病毒的复杂关系及其对感染者长期健康的影响,对于控制或治愈这些感染具有重要意义。然而,对不致病或仅在一小部分感染者中或最初感染后几十年内导致慢性病理的病毒与宿主健康之间关系的理解仍处于起步阶段。了解病毒(急性或持续)在慢性病中的病因作用是一项重大挑战。此外,宏基因组学和人工智能(见下文)无疑将在解析人类病毒组方面发挥重要作用,有助于揭示宿主体内病原体之间的关系及其在健康和疾病中的作用。
宏基因组学在临床医学中越来越多地用作诊断,不仅用于SARS-CoV-2等新型病原体的初步鉴定,还用于检测已知的病原体。宏基因组学最终可能成为传染病诊断的一站式流程,尽管在大多数情况下常规诊断技术(如PCR、基于抗原的检测和细胞培养)可以快速且成本高地提供足够的信息,但宏基因组学具有重要优势:除了检测病毒存在与否外,还可以获得病原体的基因组序列(可用于随后的临床和流行病学研究),同时序列读取计数作为病毒丰度的度量。宏基因组学不仅能检测出到我们感兴趣的单一病原体,还能提供个体宿主中所有微生物的数据并揭示它们的相互作用,而获得的宿主基因组数据可能提供有关宿主遗传易感性的信息。
病毒已成为分子和细胞生物学的强大先驱工具(图5)。它们已经进化为靶向宿主细胞生物学中的关键位点并在发现细胞机制方面发挥了重要作用。1952年,分子生物学的早期先驱Alfred Hershey和Martha Chase使用噬菌体T2证明核酸是遗传物质。1972年,病毒学合成了第一个使用lambda噬菌体和猿猴病毒SV40的工程化重组DNA,引领了重组DNA技术的革命。在接下来的十年中,mRNA加帽的基本细胞过程、拼接和聚腺苷酸化都是使用病毒发现的,它们的发现为理解控制基因表达和蛋白质合成奠定了基础。1977年,Levine和Crawford使用腺病毒和SV40发现了p53抑癌基因。1981年利用小鼠乳腺肿瘤病毒MMTV和SV40发现哺乳动物转录因子。此外包括限制性内切酶、RNAi和CRISPR在内的抗病毒防御推动了分子生物学的革命性进步,病毒将继续成为细胞生物学发现的灯塔。鉴于病毒能够将核酸递送至受感染细胞以进行转录表达、诱导免疫反应或诱导细胞死亡,病毒也已成为造福人类健康的工具,如作为基因治疗(例如腺相关病毒、慢病毒和单纯疱疹病毒)、溶瘤疗法(例如腺病毒、单纯疱疹病毒、腺相关病毒、麻疹和牛痘)和疫苗平台(例如麻疹、水泡性口炎、CMV和禽副粘病毒),这将对人类对抗先天性疾病和顽固性癌症产生巨大影响,并将成为个性化医疗的主要驱动力。将病毒载体与CRISPR-Cas9基因编辑技术相结合,将为治疗人类疾病提供无限的可能性。
图5 病毒学内容
我们正在见证AI的一场革命,他同样会影响病毒学,尤其是病毒基因组序列的计算分析,这些序列通常涉及各种重复性任务,而这些任务可以很容易地被机器学习。Alphafold改变了蛋白质结构预测并具有无数的下游应用,并将为病毒学带来巨大的实际好处:包括记录自然界中病毒蛋白的全部结构;帮助更好地剖析蛋白质-蛋白质、病毒-细胞和病毒-宿主相互作用;解决特定结构(如病毒衣壳和聚合酶)之间的进化关系以及治疗通路的理性设计。虽然不会取代实验系统,但人工智能最终可能使使用者能够直接从基因组序列中预测病毒的所有生物学和表型特征;它与宿主细胞、宿主免疫系统和治疗剂的相互作用;以及其致病性和大流行潜力。为了在这个领域取得成功,需要训练AI算法来了解病毒基因组中每一个突变组合的表型后果;每种蛋白质的结构以及它们如何相互作用;病毒如何在多种细胞类型、受体和宿主中发挥作用;以及病毒与免疫系统成分的相互作用,包括它们产生抗原变异的能力、它们对抗病毒药物的可能反应以及它们的流行潜力。虽然这似乎是一个不可能的目标,但早在1974年便对单一病毒种类的1600万个基因组进行测序(就像现在的SARS-CoV-2一样),此外最近在预测免疫逃逸突变方面取得了进展。
作者概述了其认为未来几十年可能对病毒学发展具有重要意义的主题(如下加粗)。当然这门学科的未来也不可避免地会受到意外事件和科学进步的影响,作者几乎肯定未来我们会经历另一场重大大流行病(也许会让COVID-19相形见绌)。
1 病毒圈的多样性、大小和结构如何,它如何影响生态系统健康?
2 原始病毒是什么,它们在细胞生命的进化中起了作用吗?
3 哪些直接和间接因素决定了病毒之间的竞争,它们可以用作病毒控制策略吗?
4 慢性病毒感染如何在机制上导致人类慢性疾病,例如神经认知能力下降、长期COVID、MS和癌症?
5 持续感染如何影响宿主免疫反应,共感染对病毒持久性有何影响,反之亦然?
6 在存在抗病毒药物的地方,如疫苗接种或早期发现和治疗感染可以在多大程度上预防慢性病?
7 如何理解宿主和病毒生物学的界面及其在感染结果方面的复杂性?
8 如何建立公众对病毒学的信任,相信病毒学能够安全地为人类健康开辟新的方向,并确保为未来的大流行病以及其它传染病威胁做准备和应对措施?
https://doi.org/10.1016/j.cell.2024.07.025