2024年10月4日,最新一期的Science杂志以逆转录酶和核酸序列为封面。这篇封面文章早在2024年8月8日,就已经在Science杂志官网提前在线了,熟悉Science杂志的朋友都知道,Science杂志一般会随新一期的杂志随同发表最新的文章,一般不会提前在线未排期的文章,而这篇题为De novo gene synthesis by an antiviral reverse transcriptase的文章,竟57天都未排期,原来就是为了给他一个封面,当然这篇封面也指向8月29日在线的一篇题为Phage-triggered reverse transcription assembles a toxic repetitive gene from a noncoding RNA来自张锋团队的文章。
这种通过 RNA 滚环逆转录形成的新基因,在表现形式上为串联重复,这无疑为基因组注释工作带来了挑战,目前的大多数注释工具都无法正确识别这些隐秘的基因。同时这也是对遗传信息流动(中心法则)的补充,从 RNA 处,也可以从头产生可表达有功能,编码新蛋白的基因。同时,这对于我们开发和改造生物体,认识生物的免疫防御机制,复杂生物的演化,基因治疗等领域也具有启发意义。
👇详细报道见:
Science:改写教科书!细菌能够在基因组外从头生成新基因,以对抗病毒感染
聚焦于来自克雷伯氏肺炎菌的防御相关逆转录酶系统,两个研究团队揭示了一种滚环逆转录机制。该机制生成的串联cDNA在噬菌体感染时被转化为双链DNA,进而导致几乎无止境开放阅读框(neo)mRNA的转录,该mRNA编码一种Neo多肽。这些研究强调了通过RNA模板基因创造扩展基因组编码潜力的重要性。详见第25页,eadq0876和eadq3977。
Illustration: A. Mastin/Science
Stephen Tang et al. ,De novo gene synthesis by an antiviral reverse transcriptase.Science386,eadq0876(2024).DOI:10.1126/science.adq0876
编辑总结
分子生物学的中心法则指出,遗传信息从DNA和RNA流向蛋白质,而逆转录则将RNA转化为DNA。在探索细菌如何抵御病毒感染的过程中,两个研究团队发现了从RNA 产成新基因的替代途径,而这些RNA之前并不编码蛋白质(参见Osterman和Sorek的评论文章)。Tang等人发现了一种机制,其中一种逆转录酶利用RNA模板合成全新基因,从而表达出重复且几乎无止境的开放阅读框(Neo)蛋白,这些蛋白能够阻止细胞生长并限制病毒传播。Neo的隐秘编码颠覆了传统的遗传信息流动模式,强调了其他生物学背景下可能存在隐藏基因的潜力。Wilkinson等人发现,某些细菌通过逆转录将RNA复制为端到端的DNA重复序列。重复的DNA重新构建了一个基因,并可转录为编码有毒蛋白的重复RNA。细菌利用这种基因合成能力生成超毒性蛋白质,以抵御病毒感染。——Di Jiang
结构化摘要
引言
细菌病毒,或称噬菌体,是地球上最丰富的生命形式,它们长期寄生于细菌宿主,导致多种抗病毒防御系统的出现。令人好奇的是,这些抵御入侵者的防御途径所依赖的酶机制,往往源自移动遗传元件。例如,CRISPR-Cas系统就是通过对转座子编码核酸酶的反复适应进化,用于RNA引导的病毒DNA切割。最近的研究也表明,逆转录酶(RT)源自反转座子,参与噬菌体的防御。然而,与CRISPR-Cas核酸酶降解外源DNA不同,这些与防御相关的逆转录酶(DRT)系统通过合成互补DNA(cDNA)提供保护。迄今为止,cDNA生成与抗病毒免疫之间的分子通路仍不清楚。
研究动机
在本研究中,我们着手调查DRT2免疫系统的噬菌体防御的分子机制。虽然噬菌体防御操纵子通常表现出模块化结构,编码不同的传感器和效应蛋白结构域,DRT2系统仅包含RT基因及其上游的非编码RNA(ncRNA)。免疫过程需要ncRNA和完整的RT催化结构域,但它们各自在防御活动中的作用尚不明确。鉴于DRT2中缺乏其他可识别的功能结构域,我们推测RT会生成具有效应功能的cDNA,识别此cDNA及其功能可能揭示核酸的新生物学作用。
研究结果
我们开发了一种系统的实验方法来识别由特定RT合成的cDNA,并将该方法应用于异源表达在大肠杆菌中的克雷伯氏肺炎菌DRT2系统(KpnDRT2),以确定其“逆转录组”。数据表明,KpnDRT2逆转录的唯一底物是上游的ncRNA。生物信息学分析发现,ncRNA两侧具有保守的结构元件,包围一个可变的模板区域,对这些元件的干扰揭示了对RT结合和cDNA合成至关重要的区域。出乎意料的是,实验还揭示了RT从模板区末端精确跳转回起点的模板跳跃现象。通过反复的cDNA合成和模板跳跃生成了串联重复的cDNA(ccDNA),这一过程我们称之为滚环逆转录。尽管表达KpnDRT2的细胞持续生成单链ccDNA,噬菌体的存在会触发ccDNA产量的增加以及互补链的合成。双链ccDNA在每个重复序列之间形成共识启动子元件,并包含一个未被常规终止密码子限制的开放阅读框(ORF)。ccDNA编码的近乎无止境的ORF(Neo)基因在转录和翻译后,细胞进入生长停滞状态,限制病毒的复制和扩散。系统发育分析和同源筛查实验表明,滚环逆转录和Neo引发的生长停滞是DRT2免疫系统的广泛保守特征。
结论
我们的研究揭示了一种由细菌逆转录酶家族介导的优雅且前所未有的抗病毒免疫机制,其影响范围广泛,涵盖生物学和生物技术。滚环逆转录合成串联重复的cDNA产品是一种独特的生化活动,如果加以利用,可能能够在体外或体内实现RNA模板的程序化扩增。此外,DRT2系统中以RNA为模板的基因创造途径展示了RNA作为遗传信息载体的多功能性,并挑战了传统的基因编码、遗传和存储观念。通过逆转录酶介导的原基因串联化合成成熟的Neo基因,为普遍认为基因沿一维DNA轴线性编码的范式提供了强有力的对立论点。标准的基因注释方法都未能识别Neo基因,这引发了一个令人信服的可能性:仍有其他编码关键细胞功能的隐秘基因有待发现。
Max E. Wilkinson et al.Phage-triggered reverse transcription assembles a toxic repetitive gene from a noncoding RNA.Science386, eadq 3977(2024).DOI:10.1126/science.adq3977
编辑总结
分子生物学的中心法则指出,遗传信息从DNA和RNA流向蛋白质,逆转录过程则将RNA转化为DNA。在探索细菌如何抵御病毒感染的过程中,两个研究团队发现了从RNA生成基因的替代途径,而这些RNA之前并不编码蛋白质(参见Osterman和Sorek的评论文章)。Tang等人发现了一种机制,其中一种逆转录酶利用RNA模板合成全新基因,从而表达出重复且几乎无止境的开放阅读框(Neo)蛋白,这些蛋白可以阻止细胞生长并限制病毒传播。Neo的隐秘编码颠覆了传统的遗传信息流动,强调了在其他生物学背景下可能存在的隐藏基因。Wilkinson等人发现,某些细菌通过逆转录将RNA复制为端到端的DNA重复序列。重复的DNA重新组成一个基因,并可转录为编码有毒蛋白的重复RNA。细菌利用这种基因合成能力生成超毒性蛋白质,以抵御病毒感染。——Di Jiang
结构化摘要
引言
RNA到DNA的转化,或逆转录,通常与RNA为基础的移动遗传元件(如病毒或反转座子)相关,但也可以被细胞驯化用于细胞功能。在许多真核生物中,逆转录通过端粒酶用于在染色体末端合成重复DNA,以保护基因组的完整性,而逆转录酶结构域蛋白是真核剪接体的核心。在细菌中,各类逆转录酶可用于抵御噬菌体感染。这其中有一部分,称为retros,可通过形成具有多种酶活性的RNA-DNA-蛋白质复合物在噬菌体感染时被激活,但其他与防御相关的逆转录酶如何抑制噬菌体的传播尚不明确。
研究动机
我们之前发现了一类与防御相关的逆转录酶,它们与一种非编码RNA结合,并可抵御T5噬菌体的感染。在本研究中,我们探讨了这些被称为2型防御逆转录酶(DRT2)系统的具体机制。我们推测,这种非编码RNA是逆转录酶的底物,而RNA指导合成的DNA对于T5防御非常重要
研究结果
我们通过DNA测序发现,T5感染会触发一种长重复DNA分子的生成,该分子以非编码RNA的中心序列为模板。重复的DNA包含一个120个碱基对的头对头序列,可以长达数千碱基对。相邻的重复序列重新构建了一个启动子序列,导致类似的长重复RNA的转录。
我们发现,这种长重复RNA包含一个长重复开放阅读框,编码一种重复的蛋白质序列。尽管这种蛋白质不含任何已知的酶活性结构域,但其毒性极强,且毒性随重复次数增加而增强。通过抑制细胞生长,它有效防止了病毒的传播。
为了理解重复DNA合成的机制,我们纯化了一个包含逆转录酶和非编码RNA的复合物。即使在没有任何噬菌体刺激的情况下,纯化的复合物在体外仍具有高度活跃的逆转录和重复合成功能。在高浓度核苷酸底物存在下,它可以生成长达6000个碱基对的DNA,包含多达50个重复序列。纳米孔测序表明,这种重复DNA形成了一个延展的发夹结构,实际上使其成为双链DNA,这是其后续转录和翻译的必要特性。
我们通过冷冻电子显微镜确定了逆转录酶-非编码RNA复合物的结构。非编码RNA呈现复杂折叠,并围绕逆转录酶蛋白形成假结,这种折叠将重复模板序列呈现给逆转录酶活性位点。纯化的复合物中含有一个自合成的五核苷酸DNA引物,该引物共价连接到非编码RNA的末端。在核苷酸添加后,引物延伸形成重复DNA,这伴随着非编码RNA结构的变化,形成了一个新生DNA的出口通道。
结论
DRT2逆转录酶系统的机制引入了一种在转录或翻译之前的基因调控新层面:通过编码序列合成进行的调控。对于特别有毒且重复的基因产物来说,这种调控方式可能具有优势。一个完整的编码序列可以隐藏在表面上是非编码的RNA中,这对标准的基因组注释方法提出了挑战,其他功能基因也可能以类似方式隐藏。原核生物通过驯化逆转录酶来合成重复DNA并从不连续的基因组片段重组基因序列,其活动类似于远亲的真核生物,如端粒酶和剪接体。这突显了原核生物可以使用更加紧凑高效的系统来与真核生物的分子生物学复杂性相匹敌。