来源:进化随想
2024 年 10 月 4 日,最新一期的 Science 杂志以逆转录酶和核酸序列为封面。这篇封面文章早在 2024 年 8 月 8 日,就已经在 Science 杂志官网提前在线了,熟悉 Science 杂志的朋友都知道,Science 杂志一般会随新一期的杂志随同发表最新的文章,一般不会提前在线未排期的文章,而这篇题为 De novo gene synthesis by an antiviral reverse transcriptase 的文章,竟 57 天都未排期,原来就是为了给他一个封面,当然这篇封面也指向 8 月 29 日在线的一篇题为 Phage-triggered reverse transcription assembles a toxic repetitive gene from a noncoding RNA 来自张锋团队的文章。
这种通过 RNA 滚环逆转录形成的新基因,在表现形式上为串联重复,这无疑为基因组注释工作带来了挑战,目前的大多数注释工具都无法正确识别这些隐秘的基因。同时这也是对遗传信息流动(中心法则)的补充,从 RNA 处,也可以从头产生可表达有功能,编码新蛋白的基因。同时,这对于我们开发和改造生物体,认识生物的免疫防御机制,复杂生物的演化,基因治疗等领域也具有启发意义。
聚焦于来自克雷伯氏肺炎菌的防御相关逆转录酶系统,两个研究团队揭示了一种滚环逆转录机制。该机制生成的串联 cDNA 在噬菌体感染时被转化为双链 DNA,进而导致几乎无止境开放阅读框(neo)mRNA 的转录,该 mRNA 编码一种 Neo 多肽。这些研究强调了通过 RNA 模板基因创造扩展基因组编码潜力的重要性。
编辑总结
分子生物学的中心法则指出,遗传信息从 DNA 和 RNA 流向蛋白质,而逆转录则将 RNA 转化为 DNA。在探索细菌如何抵御病毒感染的过程中,两个研究团队发现了从 RNA 产成新基因的替代途径,而这些 RNA 之前并不编码蛋白质(参见 Osterman 和 Sorek 的评论文章)。Tang 等人发现了一种机制,其中一种逆转录酶利用 RNA 模板合成全新基因,从而表达出重复且几乎无止境的开放阅读框(Neo)蛋白,这些蛋白能够阻止细胞生长并限制病毒传播。Neo 的隐秘编码颠覆了传统的遗传信息流动模式,强调了其他生物学背景下可能存在隐藏基因的潜力。Wilkinson 等人发现,某些细菌通过逆转录将 RNA 复制为端到端的 DNA 重复序列。重复的 DNA 重新构建了一个基因,并可转录为编码有毒蛋白的重复 RNA。细菌利用这种基因合成能力生成超毒性蛋白质,以抵御病毒感染。——Di Jiang
结构化摘要
引言
细菌病毒,或称噬菌体,是地球上最丰富的生命形式,它们长期寄生于细菌宿主,导致多种抗病毒防御系统的出现。令人好奇的是,这些抵御入侵者的防御途径所依赖的酶机制,往往源自移动遗传元件。例如,CRISPR-Cas 系统就是通过对转座子编码核酸酶的反复适应进化,用于 RNA 引导的病毒 DNA 切割。最近的研究也表明,逆转录酶(RT)源自反转座子,参与噬菌体的防御。然而,与 CRISPR-Cas 核酸酶降解外源 DNA 不同,这些与防御相关的逆转录酶(DRT)系统通过合成互补 DNA(cDNA)提供保护。迄今为止,cDNA 生成与抗病毒免疫之间的分子通路仍不清楚。
研究动机
在本研究中,我们着手调查 DRT2 免疫系统的噬菌体防御的分子机制。虽然噬菌体防御操纵子通常表现出模块化结构,编码不同的传感器和效应蛋白结构域,DRT2 系统仅包含 RT 基因及其上游的非编码 RNA(ncRNA)。免疫过程需要 ncRNA 和完整的 RT 催化结构域,但它们各自在防御活动中的作用尚不明确。鉴于 DRT2 中缺乏其他可识别的功能结构域,我们推测 RT 会生成具有效应功能的 cDNA,识别此 cDNA 及其功能可能揭示核酸的新生物学作用。
研究结果
我们开发了一种系统的实验方法来识别由特定 RT 合成的 cDNA,并将该方法应用于异源表达在大肠杆菌中的克雷伯氏肺炎菌 DRT2 系统(KpnDRT2),以确定其「逆转录组」。数据表明,KpnDRT2 逆转录的唯一底物是上游的 ncRNA。生物信息学分析发现,ncRNA 两侧具有保守的结构元件,包围一个可变的模板区域,对这些元件的干扰揭示了对 RT 结合和 cDNA 合成至关重要的区域。出乎意料的是,实验还揭示了 RT 从模板区末端精确跳转回起点的模板跳跃现象。通过反复的 cDNA 合成和模板跳跃生成了串联重复的 cDNA(ccDNA),这一过程我们称之为滚环逆转录。尽管表达 KpnDRT2 的细胞持续生成单链 ccDNA,噬菌体的存在会触发 ccDNA 产量的增加以及互补链的合成。双链 ccDNA 在每个重复序列之间形成共识启动子元件,并包含一个未被常规终止密码子限制的开放阅读框(ORF)。ccDNA 编码的近乎无止境的 ORF(Neo)基因在转录和翻译后,细胞进入生长停滞状态,限制病毒的复制和扩散。系统发育分析和同源筛查实验表明,滚环逆转录和 Neo 引发的生长停滞是 DRT2 免疫系统的广泛保守特征。
结论
我们的研究揭示了一种由细菌逆转录酶家族介导的优雅且前所未有的抗病毒免疫机制,其影响范围广泛,涵盖生物学和生物技术。滚环逆转录合成串联重复的 cDNA 产品是一种独特的生化活动,如果加以利用,可能能够在体外或体内实现 RNA 模板的程序化扩增。此外,DRT2 系统中以 RNA 为模板的基因创造途径展示了 RNA 作为遗传信息载体的多功能性,并挑战了传统的基因编码、遗传和存储观念。通过逆转录酶介导的原基因串联化合成成熟的 Neo 基因,为普遍认为基因沿一维 DNA 轴线性编码的范式提供了强有力的对立论点。标准的基因注释方法都未能识别 Neo 基因,这引发了一个令人信服的可能性:仍有其他编码关键细胞功能的隐秘基因有待发现。
编辑总结
分子生物学的中心法则指出,遗传信息从 DNA 和 RNA 流向蛋白质,逆转录过程则将 RNA 转化为 DNA。在探索细菌如何抵御病毒感染的过程中,两个研究团队发现了从 RNA 生成基因的替代途径,而这些 RNA 之前并不编码蛋白质(参见 Osterman 和 Sorek 的评论文章)。Tang 等人发现了一种机制,其中一种逆转录酶利用 RNA 模板合成全新基因,从而表达出重复且几乎无止境的开放阅读框(Neo)蛋白,这些蛋白可以阻止细胞生长并限制病毒传播。Neo 的隐秘编码颠覆了传统的遗传信息流动,强调了在其他生物学背景下可能存在的隐藏基因。Wilkinson 等人发现,某些细菌通过逆转录将 RNA 复制为端到端的 DNA 重复序列。重复的 DNA 重新组成一个基因,并可转录为编码有毒蛋白的重复 RNA。细菌利用这种基因合成能力生成超毒性蛋白质,以抵御病毒感染。——Di Jiang
结构化摘要
引言
RNA 到 DNA 的转化,或逆转录,通常与 RNA 为基础的移动遗传元件(如病毒或反转座子)相关,但也可以被细胞驯化用于细胞功能。在许多真核生物中,逆转录通过端粒酶用于在染色体末端合成重复 DNA,以保护基因组的完整性,而逆转录酶结构域蛋白是真核剪接体的核心。在细菌中,各类逆转录酶可用于抵御噬菌体感染。这其中有一部分,称为 retros,可通过形成具有多种酶活性的 RNA-DNA-蛋白质复合物在噬菌体感染时被激活,但其他与防御相关的逆转录酶如何抑制噬菌体的传播尚不明确。
研究动机
我们之前发现了一类与防御相关的逆转录酶,它们与一种非编码 RNA 结合,并可抵御 T5 噬菌体的感染。在本研究中,我们探讨了这些被称为 2 型防御逆转录酶(DRT2)系统的具体机制。我们推测,这种非编码 RNA 是逆转录酶的底物,而 RNA 指导合成的 DNA 对于 T5 防御非常重要。
研究结果
我们通过 DNA 测序发现,T5 感染会触发一种长重复 DNA 分子的生成,该分子以非编码 RNA 的中心序列为模板。重复的 DNA 包含一个 120 个碱基对的头对头序列,可以长达数千碱基对。相邻的重复序列重新构建了一个启动子序列,导致类似的长重复 RNA 的转录。
我们发现,这种长重复 RNA 包含一个长重复开放阅读框,编码一种重复的蛋白质序列。尽管这种蛋白质不含任何已知的酶活性结构域,但其毒性极强,且毒性随重复次数增加而增强。通过抑制细胞生长,它有效防止了病毒的传播。
为了理解重复 DNA 合成的机制,我们纯化了一个包含逆转录酶和非编码 RNA 的复合物。即使在没有任何噬菌体刺激的情况下,纯化的复合物在体外仍具有高度活跃的逆转录和重复合成功能。在高浓度核苷酸底物存在下,它可以生成长达 6000 个碱基对的 DNA,包含多达 50 个重复序列。纳米孔测序表明,这种重复 DNA 形成了一个延展的发夹结构,实际上使其成为双链 DNA,这是其后续转录和翻译的必要特性。
我们通过冷冻电子显微镜确定了逆转录酶-非编码 RNA 复合物的结构。非编码 RNA 呈现复杂折叠,并围绕逆转录酶蛋白形成假结,这种折叠将重复模板序列呈现给逆转录酶活性位点。纯化的复合物中含有一个自合成的五核苷酸 DNA 引物,该引物共价连接到非编码 RNA 的末端。在核苷酸添加后,引物延伸形成重复 DNA,这伴随着非编码 RNA 结构的变化,形成了一个新生 DNA 的出口通道。
结论
DRT2 逆转录酶系统的机制引入了一种在转录或翻译之前的基因调控新层面:通过编码序列合成进行的调控。对于特别有毒且重复的基因产物来说,这种调控方式可能具有优势。一个完整的编码序列可以隐藏在表面上是非编码的 RNA 中,这对标准的基因组注释方法提出了挑战,其他功能基因也可能以类似方式隐藏。原核生物通过驯化逆转录酶来合成重复 DNA 并从不连续的基因组片段重组基因序列,其活动类似于远亲的真核生物,如端粒酶和剪接体。这突显了原核生物可以使用更加紧凑高效的系统来与真核生物的分子生物学复杂性相匹敌。