Nature Methods|系统地搜索人类转录组中RNA结构开关

科技   2024-11-18 23:39   北京  
20247月,美国加州大学Hani Goodarzi团队在Nature Methods上发表了题为“A systematic search for RNA structural switches across the human transcriptome”的文章,介绍了SwitchSeeker,提供了一种公正的、实验驱动的方法来探究影响真核生物基因表达的RNA结构开关。

研究背景

在所有生物中,基因表达在RNA水平上受到调控。一些最古老的基于RNA的调控机制是核酶(具有催化活性的RNA分子)和RNA结构开关(采用两种相互排斥的构象的元件,每种构象导致不同的基因调控结果)。然而,真核生物中RNA开关的发现更具挑战性。虽然已经在植物和真菌中发现了许多硫胺素焦磷酸传感核糖开关,但已知的人类RNA开关只有两种: 依赖蛋白质的血管内皮生长因子- A VEGFA RNA开关和基于m6A修饰的开关[1,2]。因此,尽管RNA开关在其他生命领域普遍存在,但它们对高等真核生物基因表达的总体影响仍不清楚。

研究结果

SwitchFinder不依赖于已知的序列基序,而使用RNA序列生成二级结构的集合,并使用玻尔兹曼平衡概率分布生成相应的能量图谱。它优先考虑表现出RNA开关特征的序列,例如在两个局部极小值附近有一个相对较小的屏障(Fig. 1a)。这种方法确保了RNA开关以一种通用的、与家族无关的方式被识别(Fig. 1b)。SwiSpot是最先进的家族未知核糖开关预测方法,将SwitchFinder的性能与其进行了比较,发现除环状di-GMP-II外,所有RNA开关家族的性能平均提高了44%Fig. 1c)。SwitchFinder能够比区分核糖体RNA更有效地区分真正的核糖体开关和对照,并且它在真核和合成核糖体开关上的表现甚至比在细菌核糖体开关上的表现更好(Fig. 1d)。

在所测试的候选RNA开关中,536个(14%)显著下调eGFP的表达,而538个(14%)表现出显著上调(Fig. 2b)。通过引入单个突变或互惠突变对来破坏或加强特异性茎环构象(Fig. 2c)来拓展大规模平行报告基因试验(MPRA)。245RNA开关被锁定在特定的结构构象中时,会对报告基因的表达进行差异调节。以TCF7 RNA开关(位于TCF73’ UTR区域)为例,它的两种构象引发了不同的调控功能(Fig. 2d),在开关序列的不同部分发生有利于构象1的两个突变,降低了eGFP报告基因的表达。相反,两个有利于构象2的突变增加了eGFP的表达。

位于RORC mRNA 3 ' UTR中的186个核苷酸元件是一个已经确定的RNA开关,将涉及碱基配对的三个区域分为“Box 1”61-69个核苷酸),“Box 2”73-81个核苷酸)和“Box 3”116-123个核苷酸)。Box 1既可以与Box 2形成碱基对,也可以与Box 3形成碱基对,从而产生两种互斥的构象,每种构象对基因表达都有不同的影响(Fig. 3a)。设计了突变-恢复实验,使两种构象间的切换具有倾向性(Fig. 3b),并使用体外RNA SHAPE(通过引物延伸分析选择性2′-羟基酰化)来监测合成的RNA结构。突变的Box 3 (117-AC)降低了Box 2区域的反应性(Fig. 3c),说明Box 1将其碱基配对位点从Box 3切换到Box 2,从而稳定构象2

对体内的RORC开关进行了高覆盖率的硫酸二甲酯(DMS)突变谱测序(DMS- MaPseq),使用足以引起对同一RNA分子的多次修饰的DMS浓度,实现了DRACO计算方法[3],该方法在两个生物重复中确定了两个不同的簇,代表了两种构象,相对比例为27%73%Fig. 3d)。

将含有RORC序列的报告基因导入5个具有不同遗传背景的细胞系:LNCaP(前列腺)MCF-7(乳腺)HepG2(肝脏)ZR-75-1(乳腺)293T(肾脏)LS174T(结肠),并分析内源性RORC mRNA。都发现这两种构象的相对比例在这些细胞系中有所不同,而且Box 23的可及性具有很强的负相关性(Fig. 3ef)。

使用单粒子冷冻电镜研究了这两个RORC RNA开关构象的三级结构。构象1突变体(77-GA)的颗粒看起来更延伸,而构象2突变体(117-AC)的颗粒大多紧凑(Fig.4a)。RORC RNA可分为ABC三个结构类,其中(77-GA)突变体中不存在B类结构,(117-AC)突变体中不存在A类结构(Fig.4b)。这一分析表明,A类可以分配给更延伸的构象1,B类可以分配给紧凑的构象2Fig.4b)。在所有三个数据集中都存在的C类代表了一个折叠中间体,缺乏Box 23所产生的三级相互作用。

实施了两种平行策略:对于构象1,一种策略是突变Box 2以防止其与Box 1配对(突变体' 73-CCCTATGA '),另一种策略是在Box 13中引入突变以破坏它们与Box 2的互作(突变体' 61-TATATAA,116-TTATATA ')。虽然这两种策略修改了序列的不同部分,但是对每个构象都诱导了相似的eGFP表达变化:稳定构象1的两种突变体都增加了报告基因的表达(Fig.5a),而采用稳定构象2的类似策略则降低了表达。利用突变-恢复实验,倾向于构象2的突变体与倾向于构象1的突变体相比,始终显示出eGFP表达减少(Fig.5b)。

3′UTR中携带RORC RNA开关序列的eGFP报告基因转入人CD4+ T细胞。然后将这些细胞分化为Th17细胞。与乱序对照相比,加入RORC RNA开关显著降低eGFP表达(Fig.5c)。此外,通过77-GA突变改变开关的构象(朝向构象1)削弱了这种抑制,说明了Th17细胞中RORC RNA开关的活性。

利用α-鹅膏蕈碱抑制RNA聚合酶II,发现构象比例与mRNA稳定性之间存在很强的相关性,表明构象1的比例越高,稳定性越高,构象2的比例越高,稳定性越低(Fig.5d)。分析内源性RORC mRNA,也发现很强的相关性(Fig.5e)。设计了两个反义寡核苷酸(ASOs)来靶向Box 2区域,旨在将平衡转移到构象1。与非靶向对照ASO相比,ASO处理导致RORC mRNA水平显著升高(Fig.5f)。值得注意的是,这种影响在构象2比例较高的细胞系中更为明显。

在表达两种eGFP报告结构之一的Jurkat T细胞中进行了全基因组CRISPRi筛选,分析了报告基因高表达和低表达的细胞中单向导RNAsingle-guide RNAsgRNA)的丰度,发现了包括SMG8UPF1UPF2UPF3B等无义介导的衰变(NMD) 的核心因子(Fig.6a)。比较表达原生RORC开关和77-GA突变体的细胞在高报告基因表达仓和低报告基因表达仓中的sgRNA分布,发现更强调了NMD通路的核心作用(Fig.6b),因为NMD组分的敲低减少了原生开关和突变开关之间的报告基因表达差异。SURF复合体成员的敲低,而不是EJC成分的敲低,显著影响了开关的抑制功能(Fig.6cd)。

使用DMS-MaPseq评估Box 23在内源性RORC mRNA中的可及性,发现抑制NMDBox 2的可及性显著降低(Fig.6f),表明向构象2的转变,可能是由于该构象中mRNA的衰变和积累较慢。与构象2较少的细胞系(LS174T)相比,在构象2较多的细胞系(LNCaPMCF-7)中,UPF1敲低导致RORC mRNA表达显著增加(Fig.6g)。用蛋白酶体抑制剂卡非佐米和硼替佐米处理细胞后,发现表达RORC开关的细胞中eGFP表达显著增加(Fig.6hi)。

DMS-MaPseqcryo - EM数据表明,RORC 3’ mRNA元素存在于一个较浅的能量图谱中,具有两个与两种主要分子构象相关的崎岖最小值(Fig.7a),从而说明SwitchSeeker方法能够识别具有双稳定能量图谱的RNA分子。

综上所述,本文提出了一个模型:UPF1优先识别开关构象2而不是构象1,UPF1招募SURF复合体从而通过蛋白酶体介导的翻译产物降解和mRNA衰变导致基因表达减少,从而阻止了重复的翻译Fig.7b)。此外,影响构象平衡的序列突变不仅改变了RNA的能量格局,还调节了SURF的招募和RNA的稳定性,反映了开关对基因抑制的细微控制。

评述

本文开发了一种计算模型——SwitchSeeker,其整合了生物化学、系统生物学和功能基因组学,为真核生物中的RNA开关发现和表征创建了一个全面的平台。通过覆盖整个发现过程,从从头预测到机制注释,SwitchSeeker克服了现有方法的局限性。研究结果表明,RNA开关在人类转录组中普遍存在,这表明依赖RNA构象的基因调控是一种普遍现象。本文还通过DMS-MaPseqcryo – EMCRISPRi筛选技术,以RORC开关为例验证了预测的可靠性。

此外,本文还发现了一种通过NMD途径发挥作用的新型开关机制,表明RNA开关在多种代谢途径中的巨大潜力。SwitchSeeker的实用之处在于它能够高通量地识别和阐明这些机制,而不考虑它们的特定途径。

SwitchSeeker也有其局限性:首先,它要求RNA开关在体内具有两种互斥的结构构象,但并非所有的RNA开关都符合,如HIV-1 TAR RNA。其次,识别在特定细胞条件下运作的RNA开关需要在这些确切条件下进行结构探测分析,这可能是具有挑战性和资源密集型的。此外,SwitchSeeker不能识别RNA开关的配体,这就需要互补的方法来揭示与这些RNA元件相互作用的特定分子。未来的技术进步可以显著提高该工具的功效。目前,高质量的全转录组RNA结构数据集的缺乏限制了SwitchSeeker的全面应用。这些数据集的开发将使RNA开关识别更加有效和准确。此外,整合额外的功能分析,例如那些针对影响剪接的RNA开关的分析,可以扩大SwitchSeeker的范围和影响。

原文链接:

https://doi.org/10.1038/s41592-024-02335-1


参考文献:

[1] Liu, N. et al. N(6)-methyladenosine-dependent RNA structural switches regulate RNA–protein interactions. Nature 518, 560–564 (2015).

[2] Ray, P. S. et al. A stress-responsive RNA switch regulates VEGFA expression. Nature 457, 915–919 (2009).

[3] Morandi, E. et al. Genome-scale deconvolution of RNA structure ensembles. Nat. Methods 18, 249252 (2021).

SPORTS



评述丨朱茜雅

编辑丨史文成

林木科学评论
聚焦林木科学与技术前沿,分享创新热点评论,服务林业科技提升。
 最新文章