孙江 方显杨 | RNA高级结构解析的研究进展

文摘   2024-09-17 07:07   上海  


RNA是生命不可或缺的功能分子。根据其是否编码蛋白质,RNA可分为编码RNA(coding RNA)和非编码RNA(non-coding RNA,ncRNA)[1]。人类基因组计划研究表明,编码RNA的序列仅占人类基因组的2%,而剩余98%为非编码核酸序列[2]。随着基因组学和生物信息学的发展,特别是高通量组学技术的应用,在人类等高等哺乳动物中,已发现高达数十万种非编码RNA。非编码RNA一度被认为是不具备生物学功能的转录“垃圾”。随着研究的深入,人们发现,非编码RNA在染色体的重塑,基因组防御,DNA的复制,RNA的生成、修饰、剪接,基因的表达调控,蛋白质的代谢等过程中均发挥关键作用[3,4]。非编码RNA的突变或代谢失衡也往往导致多种疾病,包括癌症、心血管疾病和神经退行性疾病等[5]。此外,自然界中存在大量的RNA病毒,如新冠病毒(SARS-CoV-2)。在这些病毒的生命周期中,RNA不仅是遗传物质,还在病毒感染与致病过程中发挥重要作用。由RNA病毒引起的新发和再发传染病也一再严重威胁人类健康和社会经济发展。

RNA的功能发挥与其结构特征密切相关。和蛋白质一样,RNA也可以形成复杂的多层次结构,如一级结构、二级结构、三级结构和四级结构,其中三级结构和四级结构又称为高级结构。目前人们对RNA高级结构的了解还非常有限。在蛋白质结构数据库(protein data bank,PDB)中,存储了主要由X-射线晶体学(X-ray crystallography)、磁共振(nuclear magnetic resonance,NMR)和冷冻电镜(cryo-electron microscopy,Cryo-EM)等实验方法解析的生物大分子高级结构信息。截至2024年7月21日,该库中已有222 624条结构数据,其中90%以上为蛋白质结构数据,纯RNA以及RNA-蛋白质复合物的结构分别仅有1 927和5 877个,不到总数的1%和3%(图1A)。RNA的高级结构数据如此之少,不是RNA不重要,也不是人们不感兴趣,主要原因是RNA的高级结构解析非常困难,极具挑战性。相较于蛋白质,RNA结构的主链更灵活,也缺乏强的长程三级相互作用,RNA结构常表现出构象异质性,此外,RNA在结合配体(如蛋白质、DNA、RNA、离子、小分子配体等)或响应环境(如温度、pH、离子浓度等)变化时,其结构也常发生构象动态变化[6,7]。尽管传统结构解析方法包括X-射线晶体学、核磁共振、冷冻电镜等在蛋白质研究中取得了极大成功,由于RNA的固有柔性,这些方法用于RNA结构解析多有局限。本文将在概述不同研究方法在RNA高级结构研究中的进展以及存在的优势、局限的基础上,讨论RNA高级结构研究的未来方向。


图 1  

传统结构方法对RNA高级结构解析的贡献统

截止到2024年7月21日,PDB中实验方法解析的纯RNA以及RNA-蛋白质复合物的结构统计。A:纯RNA以及RNA-蛋白质复合物的结构总数分别仅占所有结构的0.9%和2.6%;B:在1 927条纯RNA结构数据中,由X射线晶体学、核磁共振和冷冻电镜解析的分别占总数的62.2%、31.7%和6.0%;C:在5 877条RNA-蛋白质复合物结构数据中,由X射线晶体学、核磁共振和冷冻电镜解析的分别占总数的45%、2.5%和52.5%


1 X射线晶体学解析RNA结构

X射线晶体学是最早用于生物大分子结构解析的实验方法。该方法通过筛选优化生物大分子的结晶条件,培养出高质量的具有良好X射线衍射能力的单晶,然后将单晶放置在X射线下,收集衍射数据,再从中分析获得原子的空间位置信息,即晶体结构。它的主要优点包括对所研究的生物大分子没有分子尺寸的限制,并且可以获取近原子分辨率的结构信息[8]。目前,PDB数据库中的纯RNA和RNA-蛋白质复合物的结构分别有61%和45%是通过X射线晶体学解析的(图1B图1C)。应用X射线晶体学解析纯RNA高级结构的主要障碍有[9]:(1)高质量的RNA晶体难以生长;(2)纯RNA晶体衍射的相位问题难以解决。近年来,人们已开发了多种方法来解决这些障碍。
制备高纯度和构象均一的RNA样品对生长出高质量RNA晶体十分关键。体外RNA合成的方法主要有固相化学合成法和酶催化体外转录法。RNA固相化学合成的优点在于合成速度快、序列准确性高和产量大,然而,合成的RNA长度通常局限在100个核苷酸以下。酶催化体外转录法可用于大量合成RNA,其中最常用的酶是T7 RNA聚合酶,但T7 RNA聚合酶通常会在RNA转录本的3′末端额外添加1-3个核苷酸,由此导致的RNA末端不均一性影响晶体生长和衍射能力。通过在模板链DNA的5′末端脱氧核苷酸引入2′甲氧基修饰,可显著降低RNA的3′末端不均一性[10]。此外,也可以在目的RNA 3′末端引入自剪接核酶,如锤头型核酶[11]glmS核酶[12]等,后续通过自剪切产生具有均一3′末端的RNA。
由于RNA的固有柔性,许多RNA序列难以结晶。在不破坏核心结构的前提下,可以工程化地向目的RNA引入辅助结晶模体,促进晶体生长。这些辅助结晶模体包括一些常见的RNA三级结构元件,如四碱基环(Tetraloop)[13]和吻式环(kissing loop)等[14]。在常见的发夹环结构中,GAAA四碱基环常用于促进晶体生长[15]。SAM-Ⅰ核糖开关[16]、THF-Ⅱ核糖开关[17]的晶体结构均通过向原始序列引入GAAA四碱基环而得到解析。GAAA四碱基环与特定的四碱基环受体相互作用模体也可用于辅助结晶,基于该模体,ⅡB型内含子ai5γ的结构域5和6[18]、人肝炎delta病毒(HDV)核酶、细菌核酸酶RNaseP与tRNA的复合物[19]等结构得以解析。吻式环是另一类辅助结晶模体,利用该模体,人类剪接体U1 snRNP的晶体结构被解析[20]。tRNA支架也可以作为辅助结晶模体。通过将目的RNA与tRNA的反密码子臂融合,不仅可促进目的RNA的折叠,也可以辅助结晶。该策略适用于5′和3′末端形成茎环结构(stem)的RNA,如噬菌体前头RNA结构域Ⅱ[21]、T-box核糖开关的抗终止子结构域[22]、黄病毒SLA[23]等,这些RNA均通过与tRNA支架融合使得晶体结构得以解析。除此之外,一些RNA结合蛋白也可用于辅助RNA结晶,被称为RNA结晶伴侣蛋白。这些蛋白质主要分为天然RNA结合蛋白(RBP),如U1A蛋白和L7Ae蛋白家族,它们分别可以高亲和力结合U1A环(5′-CCA AUG CAC UCC GG-3′)以及K-turn结构模体;以及人工筛选蛋白,如可结合特定RNA序列(5′-GAA ACA C-3′)的Fab片段[24]。通过向荧光点亮RNA适配体RhoBAST引入U1A环,利用U1A蛋白辅助结晶,我们研究组解析了RhoBAST与TMR-DN复合物的高分辨率结构[25]
晶体衍射的相位问题通常可基于同源结构利用分子置换法解决。由于目前实验解析的RNA三级结构数目有限,而RNA三级结构预测的准确性不足,纯RNA晶体衍射的相位问题往往难以利用分子置换法解决。RNA结晶伴侣蛋白(U1A、L7Ae和Fabs等)不仅可用于辅助结晶,其结构也可作为分子置换法的搜索模型[24]。类似的,以tRNA作为支架辅助生长的晶体,可利用已知的tRNA结构作为求解相位的搜索模型[22]。除此之外,也可以在RNA样品中引入重原子替代或修饰后结晶,或通过共结晶法、浸泡法等向RNA晶体引入重金属离子,产生重原子衍生的晶体[9]。与天然RNA晶体相比,通过比较单波长反常散射(single-wavelength anomalous dispersion,SAD)、多波长反常散射(multi-wavelength anomalous dispersion,MAD)和单同构反常散射替换(single isomorphous replacement with anomalous scattering,SIRAS)等多种方法测量重原子衍生晶体的散射强度差异,可用于确定重原子位置,从而计算RNA晶体的相位[26]

2 核磁共振波谱解析RNA结构

核磁共振是指核磁矩不为零的原子核在外磁场的作用下,核自旋能级发生塞曼分裂(Zeeman splitting),共振吸收某一特定频率的射频辐射的物理过程。生物大分子中常用于NMR检测的核磁矩不为零的原子核主要有1H、2D、13C、15N、19F、35P等。NMR已被广泛用于生物大分子包括RNA的结构、构象动态和相互作用研究[27]。作为一种溶液方法,NMR不需要结晶,因而在分析柔性分子如RNA时有独特优势。目前,利用NMR解析的纯RNA结构约占总数的30%(图1B),但大多局限于长度在40~60个核苷酸的RNA。随着相对分子质量的增加,RNA的NMR谱图出现严重的信号重叠现象,这限制了NMR用于长链RNA以及RNA-蛋白质复合物的结构解析,目前,NMR解析的RNA-蛋白质复合物结构仅占总数的2.5%(图1C)。为了减轻谱峰重叠的影响,可以将长链RNA拆分成独立折叠的小片段开展研究,例如,将70 nt左右的温度计RNA(RNA thermometers)拆分成上、中、下三段各40 nt左右的小片段分别进行研究,Gabriele等[28]用NMR解析了其三级结构。此外,也可以通过对长链RNA进行核苷酸特异性的同位素标记和区段选择性的同位素标记以减轻谱峰重叠[29]。有研究团队通过对RNA进行全氘代、部分氘代或核苷酸特异性的同位素标记,并结合区段选择性同位素标记,利用NMR解析了多个超过100个核苷酸RNA的三级结构,如101 nt的莫洛尼鼠白血病病毒RNA[30]、131 nt的莫洛尼鼠白血病病毒的双吻式发夹RNA[31],以及155 nt的来自艾滋病毒的包装信号RNA[32]。后者是迄今为止NMR解析的最大相对分子质量RNA结构。
除可解析RNA三级结构外,NMR还可用于直接获取RNA的氢键配对信息,是一种快速准确获取RNA二级结构的方法[33]。相比之下,基于化学探针法的RNA二级结构测定SHAPE技术,由于仅能得到一维的各核苷酸的化学反应活性差别信息,后续仍需借助理论模型预测氢键配对信息,测定的二级结构准确度不高。最近,人们通过NMR对新冠病毒SARS-CoV-2基因组的5′非翻译区(5′-UTR)、3′非翻译区(3′-UTR)以及程序性核糖体移码元件等15个高度保守的RNA元件进行了二级结构表征[34]。Ohyama等[35]将Uchl1 lncRNA的SINE B2元件进行了分拆截短,通过确保各截短的RNA片段与全长lncRNA的结构相比无显著变化,结合SHAPE数据,对SINE B2元件的二级结构进行了测定。NMR也可用于配体筛选,如阿米洛利被鉴定可结合SARS-CoV-2基因组的5′-UTR和相邻茎环(SL)结构域,发挥抑制病毒复制的作用[36]

3 冷冻电子显微镜解析RNA结构

冷冻电子显微镜技术是在低温下使用透射电子显微镜观察样品的显微技术。在冷冻电镜单颗粒技术中,可从多个方向记录粒子的二维投影,然后使用这些投影重建三维结构[37]。与X射线晶体学和核磁共振相比,冷冻电镜所需样品量少,可直接观察样品而不需要结晶,并且可提供比X射线晶体学更接近其天然状态的结构。由于RNA的固有构象异质性、小尺寸RNA的信噪比低而难以用冷冻电镜观察,以及缺乏制备正确折叠且稳定RNA的方法,目前通过冷冻电镜解析的RNA三级结构仅占纯RNA结构的3.9%(图1B),并且这些结构中多数仅具有中等分辨率(4.0~10 Å)。相比之下,冷冻电镜解析的RNA-蛋白质复合物高级结构已占总数的52%(图1C),超过了X-射线晶体学的贡献,而且大多数RNA-蛋白复合物的分辨率在4.0 Å以下,这主要得益于蛋白质结合降低了RNA的柔性及增加了相对分子质量。
科学家正积极发展新方法来解决冷冻电镜研究纯RNA结构面临的困难。Liu等[38]提出了一种纳米结构工程策略——ROCK(RNA oligomerization-enabled cryo-EM via installing kissing loops),即通过向目的RNA的非关键功能茎环引入吻式环(kissing loops),使其通过同源自组装形成具有更大相对分子质量和较低柔性的RNA结构。ROCK策略已被应用于解析四膜虫Ⅰ类内含子(Tetrahymena group Ⅰ intron)和FMN核糖开关两类功能RNA的三维结构,其分辨率接近原子级到亚纳米级。Langeberg等[39]则发展了一种基于支架的方法,利用RNA的模块化性质将目的RNA元件融合到四膜虫I型内含子核酶的P6b茎环结构的环上,对来自寨卡病毒(Zika virus,ZIKV)的xrRNA1、氟离子核糖开关(fluoride riboswitch)、塔马纳蝙蝠病毒(Tamana bat virus,TABV)的xrRNA结构进行了解析,所得电子密度图的分辨率分别为5.04 Å、4.95 Å和4.46 Å。另外,可以向目的RNA引入特异性结合的RNA结合蛋白,这种策略不仅可增加复合物的相对分子质量,也可稳定RNA的结构,而有利于电镜结构解析。Qu等[40]将乳酸乳球菌L1.LtrB的Ⅱ型内含子与其编码蛋白LtrA形成复合物后,冷冻电镜电子密度图的分辨率显著提高到3.8 Å。
与蛋白质相比,RNA结构具有更大的柔性,导致冷冻电镜电子密度图中RNA区域的分辨率通常比蛋白质要低得多,因此,冷冻电镜电子密度图的RNA结构建模要比蛋白质困难得多。人们最近开发了几种新方法包括Brickworx[41]、phenix.map_to_model[42]、Deeptracer[43]和CryoREAD[44]等,可以基于冷冻电镜密度图对RNA结构建模。然而,这些方法主要用于构建初始RNA片段的结构,而非全长结构。Auto-DRRAFTER软件可利用RNA二级结构和冷冻电镜密度图为RNA建立原子模型,解决中等分辨率下RNA从头建模的难题[45]。Kappel等[46]进一步集成了非变性凝胶电泳、RNA二级结构测定技术M2-seq(mutate-and-map read out through next-generation sequencing)、冷冻电镜单颗粒技术和Rosetta auto-DRRAFTER自动RNA建模软件,开发出了Ribosolve方法,解决了利用冷冻电镜解析RNA结构的技术难题。Zhang等[47]通过该方法成功获得3.7 Å分辨率的无底物SAM-Ⅳ核糖开关的冷冻电镜结构,这是首个通过冷冻电镜解析得到的近原子分辨率的RNA三级结构。Ribosolve方法还被用于解析SARS-CoV-2核糖体移码元件FSE的三级结构,分辨率达到了6.9 Å[48]。但是,Rosetta auto-DRRAFTER的三级结构建模严重依赖RNA的二级结构,因而其准确性有待验证。Li等[49]发展了一种基于深度学习的冷冻电镜RNA全长结构建模方法,该方法可以从冷冻电镜图中自动构建全长全原子RNA结构,称为EMRNA。该方法使用三维Swin-Conv-UNet的深度学习网络架构,结合了用于局部学习的传统残差卷积模块和用于非局域学习的移动窗口自注意力模块对RNA原子模型进行搭建。
若将中等分辨率的冷冻电镜密度图与由X-射线晶体学、核磁共振等方法获得的结构数据进行整合,则可以克服冷冻电镜在中低分辨率RNA结构测定方面的局限性。Zhang等[50]通过结合分辨率约为9 Å的冷冻电镜图谱和NMR距离限制,确定了由94 nt组成的HIV-1二聚体起始位点(DIS)二聚体的结构,并证实冷冻电镜密度图的凸起是由鸟嘌呤碱基被翻转引起的。此外,人们对枯草芽孢杆菌glyQS T-box核糖开关与tRNA复合物的冷冻电镜密度图进行分析,其总分辨率为4.9 Å,但T-box的外围区域分辨率较低(约6 Å)。为此,研究人员解析了其中一部分(抗终止子元件)的晶体结构,通过整合晶体结构成功实现了全长T-box-tRNA复合物的结构解析[51]。另外一个例子是双核表达元件(double elements for nuclear expression,dENE),其在结合poly(A)尾部之前和之后的冷冻电镜结构的分辨率分别为8.7 Å5.6 Å。研究人员通过整合dENE+poly(A)的高分辨率晶体结构,成功构建了全长的原子模型并拟合到冷冻电镜密度图中,为dENE和poly(A)之间的相互作用提供了见解[52]。这些例子突出了多方法整合的有效性,可将冷冻电镜低分辨率电子密度图的全局结构信息与其他技术相结合,以增强RNA结构测定的准确性,并为功能机制研究提供有价值的见解。

4 小角X射线散射解析RNA结构

得益于全球更多更亮同步辐射光源的兴建和数据处理方法的进展,小角X射线散射(small angle X-ray scattering,SAXS)日益成为一种重要的生物大分子结构研究方法。小角X射线散射是一种溶液实验手段,可以在近生理条件下测定,且对所研究的对象几乎无相对分子质量限制。SAXS数据不仅可提供生物大分子的相对分子质量、分子尺寸、回转半径(Rg)、成对距离分布函数(PDDF)、低分辨率轮廓结构等诸多结构信息,还可以提供分子的柔性、折叠状态、构象动态,以及时间分辨的结构变化与动力学过程等信息[53,54]。与X射线晶体学和核磁共振相比,SAXS还是一种高通量的实验方法,数据收集和数据分析速度快。
SAXS已被广泛用于不同分子尺寸RNA的结构研究,其不足之处在于分辨率不足。早在2000年,人们就利用SAXS测定了黄栖热菌(Thermus flavus) 5S RNA的低分辨率形状结构[55]。由于对RNA的相对分子质量无限制,SAXS在长链RNA包括lncRNA的结构与功能研究中发挥了重要作用。对于具有多个亚结构域的长链RNA来说,可以将单个亚结构域的形状结构与全长RNA的形状结构进行拟合,获取RNA的三维拓扑结构信息,进一步根据SAXS数据进行原子模型搭建和优化。该策略已被用于获取多种长链RNA的原子结构模型,如VS(Varkud satellite)核酶[56]、艾滋病病毒(HIV-1)的Rev蛋白响应元件(Rev response element,RRE)[57]和T-box核糖开关的核心结构域[58]等。此外,基于RNA的一级序列和二级结构,可以利用RNA三级结构预测软件生成包含多个异构体的构象池,然后将SAXS数据用作过滤器,从构象池中筛选出与SAXS实验数据匹配的结构模型。该方法已被用于分析多种长链RNA的结构,包括黄病毒来源的长链非编码亚基因组RNA[59]、丙型肝炎病毒内部核糖体进入位点RNA[60]、艾滋病毒的5′非翻译区RNA[61]以及人类lnc RNA lincRNA-p21[62]等。
基于SAXS的RNA结构模型的分辨率不足可通过与X射线晶体学、核磁共振以及RNA三级结构预测等方法联用得以弥补。Cornilescu等[63]通过核磁共振获得U4/U6 di-snRNA的二级结构,结合SAXS、广角X射线散射(wide-angle X-ray scattering,WAXS)和残余偶极耦合(residual dipolar coupling,RDC)数据测定其三级结构。Uroda等[64]利用分子筛联用小角X射线散射(size-exclusion chromatography-SAXS,SEC-SAXS)确认了溶液中MEG3 lncRNA的原子力显微镜(atomic force microscope,AFM)模型的几何参数,建立了SAXS和AFM联用解析RNA结构的实验方案。Soni等[65]使用从NMR获得的二级结构信息和SAXS数据来生成Pfu Alu RNA的结构模型,进一步通过单颗粒冷冻电镜分析确认其Y字形状。

5 RNA三级结构预测

最近,基于人工智能技术的深度学习算法给蛋白质高级结构预测带来了革命性的突破[66]。为了预测RNA三级结构,科学家们发展了多种方法和技术[67]。相关方法分为三个步骤:(1)采样,即预测出所有可能的三级结构构象库;(2)打分,通过可靠的打分函数或统计势能从构象库中挑选出最接近天然构象或与实验数据相吻合的结构;(3)优化,对挑选出的结构进行精修。根据采样方式的不同,相关方法主要有三大类:(1)基于物理原理(如SimRNA[68]、NAST[69]等),即最接近天然态的结构模型具有最低的能量状态;(2)基于先验知识(如FARFAR2[70]、3dRNA[71]、RNAComposer[72]等),其依据是,相较于RNA的一级序列,RNA三级结构的进化更为缓慢,因此可以通过片段组装的方式较准确地预测结构;(3)基于深度学习(如trRosettaRNA[73]、DRfold[74]等),但目前具有类似于AlphaFold3效力的RNA三级结构预测的算法还未出现。RNA特别是长链RNA三级结构预测的准确性还不高[67],主要因为:(1)实验方法解析出的RNA高分辨率结构数量远小于蛋白质的结构数量,因此用于学习训练的数据严重缺乏;(2)多重序列比对中包含的共进化信息非常有效地提升了蛋白质结构预测的精度,但对于RNA结构预测帮助甚微;(3) RNA的固有柔性使其可能随环境不同而存在多个稳定的结构态,但当前的理论方法无法做到对这些稳态进行无偏搜索。

6 分子标尺技术研究RNA结构

脉冲双电子共振(pulsed electron-electron double resonance,PELDOR)[75]、单分子荧光共振能量转移(single-molecule Förster resonance energy transfer,smFRET)[76]和X射线散射干涉(X-ray scattering interferometry,XSI)[77]是三种常见的分子标尺技术。通过向生物大分子包括RNA位点特异性地引入成对的自旋探针、荧光探针或金纳米颗粒,应用PELDOR、smFRET或XSI,可分别获得分布在18~60 Å、20~100 Å和20~400 Å范围内的位点特异性距离信息,因而可用于RNA的结构和构象动态研究。
PELDOR本质上是一种电子顺磁共振(electron paramagnetic resonance,EPR)技术[78]。EPR与NMR的原理基本相同,不同之处在于电子自旋共振激发的是原子核外的电子,而核磁共振激发的是原子核的自旋。与核磁共振相比,EPR的优点包括具有更高的灵敏度、对生物分子的大小没有限制,并且所需要的样品量很少。当前PELDOR技术通常可以测量18~60 Å的距离分布。为了突破PELDOR的可测距离范围,结合前述发展的RNA定点自旋标记技术,我们对登革病毒3′SL RNA进行了全氘代和成对定点自旋标记,在稀溶液下测定了超过100 Å的距离分布,理论上可达140 Å[79]。该策略极大拓展了PELDOR技术的可测距离的上限,为应用PELDOR技术研究长链RNA奠定了基础。许多研究表明,EPR测得的距离约束加上NMR的结构约束和计算模拟,可为研究RNA和RNA-蛋白质复合物的结构和构象动力学提供丰富的信息。Duss等[80]将EPR与NMR联用,解析了相对分子质量为70 000的RNA-蛋白质复合物RsmZ-RsmE的溶液结构,发现在溶液中复合物同时存在两种不同的构象。有研究团队利用PELDOR研究了不同状态下四环素核糖开关的构象变化,发现在镁离子浓度较低时,四环素对于稳定RNA的构象十分重要[81]
荧光共振能量转移(FRET)是由于一对荧光基团之间通过长程的非辐射性的偶极-偶极相互作用而产生的,可用于在单分子水平上研究生物大分子的结构、构象动态和相互作用[82]。FRET发生的前提条件是受体荧光团与供体荧光团距离相互靠近(2~10 nm),且供体荧光团的发射光谱与受体荧光团的吸收光谱有重叠。1999年,Ha等[83]首次将smFRET技术应用于研究RNA分子的构象动态,发现Mg2+和核糖体小亚基蛋白可以诱导RNA在开放和关闭两种构象状态之间转变。该研究证实了smFRET技术在揭示RNA构象动态和异质性中的作用。最近,我们研究组利用基于非天然碱基系统的定点荧光标记技术,对黄病毒的xrRNA元件和T-box核糖开关进行了多对荧光探针标记,并应用smFRET开展了构象动态与功能关系研究[84,85]。最近,人们将smFRET衍生的距离约束与计算建模相结合,用于测定RNA的三级结构[86]
X射线散射干涉是一种新兴的分子标尺技术,其本质是基于SAXS实验的[77]。由于金纳米颗粒(AuNP)的平均电子密度远高于蛋白质或核酸,蛋白质或RNA的小角散射信号与金纳米颗粒相比可忽略,通过对金颗粒标记的生物大分子的小角X射线散射数据进行处理,可以提取出分子内金颗粒-金颗粒之间的距离信息,这些距离信息可用于分析生物大分子的结构及构象动态变化[87]。目前,XSI已被用于多种核酸和核酸-蛋白质复合物的结构与构象动态研究。Shi等[88]通过化学合成的方式将金纳米颗粒引入RNA中,利用XSI测得的距离来反映溶液中kink-turn结构模体中的螺旋夹角是否真正形成,进而探究了不同盐浓度等条件对kink-turn结构形成的影响。基于非天然碱基系统,我们最近实现了对登革病毒来源的3′SL(98 nt)元件和DENV-mini RNA(719 nt)元件的位点特异性金纳米颗粒标记,它们分别代表了登革病毒基因组RNA的线性和环化构象,我们应用XSI研究了登革病毒gRNA在线性和环化构象间的动态转变[89]
应用分子标尺技术的前提是对生物大分子进行位点特异性的自旋探针、荧光探针和金纳米颗粒标记。由于大多数RNA分子本身不含稳定的未成对电子、荧光探针或金纳米颗粒,近年来人们发展了多种基于化学的、酶学的以及非天然碱基(unnatural base pair,UBP)系统的RNA位点特异性标记方法[90,91]。对于短链RNA来说,可以通过固相化学合成来实现定点标记,例如,可在合成过程中使用带相关探针的亚磷酰胺核苷前体实现定点标记,或使用经过特定官能团修饰的亚磷酰胺核苷前体,合成后再通过Sonogashira交叉偶联、点击化学等化学反应进行标记[92]。然而,固相化学合成通常仅限于100个核苷酸以下的短链RNA。为了对更长链RNA进行位点特异性标记,人们也发展了化学-酶法结合的策略,如将一段RNA通过固相化学合成进行定点标记,与另一段经固相化学合成或体外转录合成得到的RNA片段在DNA夹板指导下通过连接酶连起来,但该策略过程繁琐、效率低,还需要变性复性的步骤去除DNA夹板,往往不利于长链RNA的重折叠。其他的一些方法,包括基于核酸分子杂交探针的、基于RNA结合蛋白的,要么对RNA的局部结构产生较大干扰,要么引入的探针尺寸过大。最近,我们利用NaM-TPT3非天然碱基系统,开发了一种简便高效且普遍适用的长链RNA位点特异性标记方法。TPT3-NaM系统最早由美国化学家Malyshev和Romesberg[93]发明,TPT3-NaM非天然碱基核苷酸可在天然DNA聚合酶(如Taq DNAP)或RNA聚合酶(如T7 RNAP)作用下实现体外与体内的复制与转录,并具有类似于天然核苷酸的高效率和低出错率,因而可与天然核苷酸A、G、C、T(U)一起组成拓展遗传密码体系。我们自主设计并化学合成了rTPT3TP和rNaMTP的碱基带有氨基修饰(rTPT3A、rNaMA)[85,89,94]、炔基修饰(rTPT3CO、rNaMCO)[85,94]以及rTPT3TP的α-磷硫酰化(rTPT3αS)[95]的化合物。利用固相化学合成非天然碱基替代的DNA引物,以天然质粒DNA为模板,通过重叠延伸PCR反应,可将非天然碱基对位点特异性地引入双链DNA。利用体外转录,可将不同化学修饰的非天然碱基核苷酸引入RNA的特定位点。通过点击化学反应、NHS-amine化学反应和巯基-马来酰亚胺化学反应,可将商业化的经化学修饰的自旋探针、荧光探针和金纳米颗粒引入嗜热脂肪芽孢杆菌RNase P RNA(419 nt)、登革病毒的3′SL(97 nt)和DENV-mini RNA(719 nt)的特定位点,实现位点特异性的自旋标记、荧光探针和金纳米颗粒标记,后续再分别用PELDOR、smFRET和XSI测定了标记位点间的距离分布和构象动态变化[84,85,89,91,94,95]。我们发展的长链RNA位点特异性标记新方法,突破了传统方法对RNA标记位点和相对分子质量的限制,具有高效、快捷、近生理纯化条件等优点,为应用PELDOR、smFRET和XSI等分子标尺技术研究RNA的结构和构象动态奠定了基础。
分子标尺技术的优点是对所研究的RNA的相对分子质量不存在限制。由于获取一个距离分布信息往往至少需要对RNA进行一对标记位点间的标记,因此测定的通量较低。若要基于分子标尺技术获取分子的整体三级结构信息,往往需要多对标记,这限制了分子标尺技术的高效应用。

7 未来展望

由于单一方法在RNA结构解析中的局限,RNA结构解析需要新思路。领域内的一种趋势是,通过多学科交叉,将不同来源、不同类型的实验数据和生物信息学预测数据,通过计算模拟整合起来,以解决复杂棘手的难题,该思路又被称为整合结构生物学[96]。对于RNA来说,通常其一级序列和二级结构信息较容易获得,一方面可通过传统结构研究方法(包括X射线晶体学、NMR或冷冻电镜)获得某些具有紧凑折叠的亚结构域的高分辨率结构;另一方面,也可利用RNA三级结构预测方法(如FARFAR2等),用基于SHAPE或NMR方法获得的二级结构信息作为输入预测其初始三级结构模型(尽管初始结构的准确性往往不太高)。随后,可通过小角X射线/中子散射(SAXS/SANS)获得全长RNA或部分RNA亚结构域的整体形状结构信息,通过对长链RNA进行位点特异性的自旋探针、荧光探针或金纳米颗粒的标记,应用多种分子标尺技术(PELDOR、smFRET、XSI)获得长链RNA分子内或亚结构域间的位点特异性距离分布信息。最后,通过计算模拟将不同类型、不同分辨率的实验和理论数据整合起来,获取与所有实验和理论数据吻合的结构模型。当前,人们已开发了多款针对蛋白质高级结构解析的整合计算模拟平台(如IMP、M3等)[97],由于RNA和蛋白质结构原理的差异,相关整合计算模拟平台并不能直接应用于RNA。为此,开发适合于RNA高级结构解析的整合计算模拟平台至关重要。
研究发现,RNA的功能发挥不仅与其结构密切相关,还受其所处的多种环境,包括离子强度、水活度等的调控。由于现有的大多生物结构解析方法都需先将生物分子从细胞环境中抽提出来开展研究,而体外研究通常使用的稀溶液条件,与细胞内共存有多种大分子拥挤环境不同,体外方法获得的RNA信息无从直接对应于细胞内特性。为此,近年来人们对直接在活细胞内或原位开展RNA的结构研究十分感兴趣。波谱学方法包括NMR、EPR和smFRET,由于其非侵入性和无损伤的特点,是开展生物分子包括RNA的活细胞内/原位结构生物学研究的强有力工具[98]。相较于体外研究,生物分子原位结构研究的时间还很短,相关方法学包括活细胞内生物分子的递送、谱学检测方法和数据解读还不成熟,需要持续发展和不断完善。当前,活细胞内原位结构研究的主要对象是蛋白质,相关方法学也主要针对蛋白质。对核酸,特别是RNA的研究则处在初始阶段[99]。基于RNA的重要性及自身特性,发展RNA的活细胞原位结构研究方法学具有重要的科学意义。

基金资助

科技部国家重点研发计划项目(2021YFC2302400,2021YFA1301500);国家自然科学基金项目(82341081)


--核糖核酸功能与应用专刊--
中国科学院核糖核酸功能与应用重点实验室聚焦“RNA的功能与应用”重大科技问题,着力研究RNA时空调控核心规律、RNA相关重大疾病致病机制、RNA原创技术与高效应用等,志在建立前沿性理念驱动、通用型技术为底盘的研发体系。依托核心骨干团队与《生命的化学》杂志精心组织了本期专刊。专刊聚焦于“新型RNA”“RNA新功能”“RNA新应用”等三个重要方向。
专刊面向生物医学科研人员、科技政策管理人员、本科生及研究生等,期望展现RNA基础研究的科学前沿、RNA生物医学技术应用的瓶颈以及重点实验室面向国家重大战略需求的科研布局。
点击:专刊目次



详细内容请点击“阅读原文”
生命的化学
《生命的化学》创刊于1980年,中国生物化学与分子生物学会主办、向国内外公开发行的生物综合类学术期刊。月刊,中国科技核心期刊,中国期刊网来源期刊,科技期刊世界影响力指数报告(WJCI)(2021)来源期刊,被化学文摘(CA)(美)、日本科学技术振兴机构数据库(JST)(日)等国际数据库收录。

重点刊登生物化学、分子生物学及生命科学相关领域原创性研究论文、综述,反映当前领域国内外最新研究进展,介绍最新研究技术与方法。设有研究论文、综述、教学、科普等栏目。



联系方式
电话:021-54922842/54921091
地址:上海市岳阳路319号31B-407
网址:www.life.ac.cn
投稿网址:http://smhx.cbpt.cnki.net/

欢迎来稿

更多精彩请关注公众号“生命的化学
(ID:ChemLifeOne)

生命的化学
走近生命科学研究前沿,探寻生命的秘密
 最新文章