作为链接中心法则的生物大分子,RNA对于细胞生命活动的维持及其复杂功能的实现具有重要的意义。在真核细胞中,由于膜系统的存在和细胞器的广泛分布,RNA能够借助各种复杂而严谨的转运机制被精确组织定位到特定的亚细胞结构或区域内,从而造成RNA在胞内的不对称性分布。RNA的亚细胞定位(subcellular localization)作为一种重要的转录后调节机制,参与了众多与RNA相关的生物化学和分子生物学过程,如RNA的折叠、编辑修饰、剪接调控、翻译调节、降解以及与相关结合蛋白的相互作用等[1]。1 RNA的异质性分布对细胞功能的影响
长链非编码RNA(long non-coding RNAs,lncRNAs)作为细胞中大量存在的一大类非编码转录产物,可根据其亚细胞定位情况及其发挥功能的方式分为三类[2]:通过顺式(in cis)调控发挥功能的,完全定位于核内的lncRNAs;通过反式(in trans)调控发挥功能的,主要定位于核内的lncRNAs,以及通过反式调控发挥功能但定位于胞质的lncRNAs。不同lncRNAs的功能和亚细胞定位的命运息息相关,如核定位的lncRNAs可参与染色质的三维结构的调节[2],或对维持核结构的完整性起到重要作用[3];而另外许多定位于细胞核或胞质的lncRNAs也可以在转录、转录后乃至翻译水平对基因表达和蛋白质翻译进行调控。mRNA在胞内的极性分布(polarized distribution)对指导胚胎正常发育具有重要作用[4]。海鞘卵中的Macho-1 mRNA在受精后会被迅速限制于合子的植物极胞质中,并随合子的不对称分裂(asymmetric division)精确进入部分细胞中指导其发育为尾部肌肉[5]。此外,果蝇卵母细胞内极性分布于前端的bicoid mRNA和后端的oskar mRNA相互协调,这对于果蝇早期胚胎前后体轴(body axis)的建立和指导细胞分化发育至关重要[6,7]。mRNA的局部定位(localized location)也有助于调节细胞的形态和功能。如β-actin mRNA可借助其3′UTR中长度为54 nt的“邮编序列”在细胞前缘发生局部富集[8],使细胞在接收响应信号后能够迅速发生局部翻译(localized translation),有助于迅速调整细胞内肌动蛋白骨架的组织结构,以满足对复杂环境变化的适应[9]。mRNA的局部定位和局部翻译也是与细胞形态功能相适应的。如神经元的胞体及其远端结构如轴突或树突之间的距离最长可达一米以上,若在胞体进行蛋白合成并通过轴突轴进行转运将非常耗时耗能。有研究已证明,神经元中大量的mRNA会通过转运至轴突或树突末端并进行受调控的局部翻译[10]。这在减少能量消耗的同时也极大地降低了错误靶向的风险,更有利于神经元对外界刺激进行快速的响应。2 RNA亚细胞定位的研究方法概述
传统的生物化学和遗传学方法关注于RNA分子总体的平均表达情况,而忽视了RNA在亚细胞水平上的异质性分布。为了更好地研究不同RNA在亚细胞层面的定位及其动态变化,各种研究RNA亚细胞定位的方法应运而生。使用生化分级分离法(biochemical fractionation)可以通过分离不同的有膜细胞器从而研究封闭膜性结构包裹的亚细胞区室(subcellular compartments)中各种RNA的分布[11,12],然而这种技术无法有效捕获无膜的亚细胞空间结构,因此具有较大的局限性。此外,对细胞的裂解也可能破坏细胞器或蛋白复合体等亚细胞的原始结构并导致弱相互作用结构的丢失,进而导致假阳性或假阴性结果的产生。荧光原位杂交(fluorescence in situ hybridization,FISH)的开发和应用为人们提供了利用荧光显微镜研究靶标RNA亚细胞定位的技术手段。当前,基于该技术的改进衍生版本如单分子FISH(single molecule FISH,smFISH)[13]或π-FISH[14]能够以分辨率更强、信噪比更高、特异性更好的方式研究单个靶标RNA分子的亚细胞空间分布。但这些技术都只能研究既定的靶标RNA分子,无法捕获参与到某种生物学过程的大量未知RNA集群。目前,基于liveFISH技术[15,16]、MS2噬菌体外壳蛋白(MS2 phage coat protein,MS2-MCP)系统[17]或CRISPR/dCas13系统[18]可以实现对靶标RNA的活细胞成像追踪,然而这些技术往往需要额外引入含有特定标签的外源性靶标RNA或对靶标RNA进行靶向修饰操作,对靶标分子天然特性造成的改变可能会导致无法准确还原其真实的分布活动;更重要的是,受限于杂交探针的设计及其繁琐的实验处理步骤,上述各种技术手段都很难对目标RNA实现高通量的检测,无法满足时空转录组学(temporal-spatial transcriptomics)研究的需要。近年来,酶介导的邻近标记技术(enzyme-mediated proximity labeling techniques)在研究RNA的亚细胞定位及其与其他生物大分子互作等方面展现出了巨大的优势和应用潜力(图1)。通过将酶与特定的信号肽序列或亚细胞区室特异性蛋白融合,可以将酶引导靶向至目标区域,并在提供外源标记底物的情况下催化底物转变为能够与蛋白质或RNA发生共价连接的反应中间体。由于具有较短的半衰期,这些反应中间体只能在短距离范围内对空间中邻近的RNA进行连接,超出该范围后其反应活性将迅速衰减。因此,酶介导的邻近标记技术特别适用于活细胞内,尤其是在无膜细胞器(membraneless organelles)等高度动态的亚细胞结构区室中进行复杂生物大分子互作网络的精确研究。图1 几种经典的RNA邻近标记技术原理示意图
A:邻近特异性的核糖体分析技术;B:APEX-RIP或proximity-CLIP技术;C:Poly U聚合酶介导的邻近标记技术;D:APEX-seq邻近标记技术
3 基于蛋白质与RNA互作的邻近标记技术
3.1 邻近特异性的核糖体分析技术
Ingolia等[19]最先开发了核糖体分析技术(ribosome profiling)用以研究蛋白质的翻译调控。由于翻译中的RNA会被核糖体部分掩蔽,在核酸酶的消化作用下这些受核糖体保护的RNA片段将得以保留,并被逆转录为DNA通过深度测序(deep sequencing)进行鉴定。Jan等[20]将核糖体分析和邻近标记技术相结合,开发出了邻近特异性的核糖体分析(proximity-specific ribosome profiling)用以检测感兴趣的亚细胞区域中发生的RNA翻译。他们对酵母细胞和人源HEK-293T细胞进行了工程化改造,使其在核糖体上表达AviTag多肽标签,并在特定的亚细胞区域表达能够特异性生物素化AviTag序列的生物素连接酶BirA。在经过环己酰亚胺(cycloheximide)处理并补充生物素(biotin)后,mRNA-核糖体复合物在BirA的催化下被特异性地加上生物素标记,随后通过进一步的核糖体分析和深度测序对特定亚细胞区域中翻译的mRNA进行鉴定。该工具已成功应用于内质网膜(endoplasmic reticulum membrane,ERM)[20]和线粒体外膜(outer mitochondrial membrane,OMM)[21]定位mRNA的翻译研究。然而,这种依赖于核糖体的方法仅能鉴定mRNA,无法对功能性的lncRNAs进行鉴定。此外,该方法需要在标记之前对细胞进行生物素饥饿处理,这种处理对细胞而言具有很强的毒性。3.2 APEX-RIP及proximity-CLIP技术
RNA免疫沉淀(RNA immunoprecipitation,RIP)是分析蛋白质与RNA相互作用的经典方法,而邻近标记对于给定亚细胞区域内蛋白质的标记非常有效。Kaewsapsak等[22]将上述两种方法进行结合开发出了APEX-RIP技术,可实现对目标亚细胞区域内的RNA进行富集。该技术首先利用过氧化物酶APEX2介导的生物素化对目标亚细胞区域内的蛋白质进行一段时间的标记,在标记终止后使用甲醛对蛋白质与RNA进行交联处理,并通过链霉亲和素磁珠对生物素化标记的蛋白质与RNA的交联物进行富集纯化,最后,通过RNA测序进行下游检测分析。然而,采用化学交联会导致很难获得高完整性的RNA,进而也会影响后续RNA测序的数据质量。相较之下,基于邻近标记联用紫外交联免疫沉淀的proximity-CLIP技术[23]成功地解决了这个问题。该技术同样通过APEX2介导的生物素化标记特定亚细胞区域中的蛋白质。但与APEX-RIP不同的是,proximity-CLIP通过紫外辐射代替甲醛进行蛋白质与RNA的交联,并在APEX2标记前向细胞培养基中加入4-硫尿苷(4-thiouridine,s4U)以促进交联。proximity-CLIP可以在终止反应的同时进行交联,从而最大限度地缩短了蛋白质生物素化和蛋白质与RNA交联两个过程的时间间隔,有助于更加精准地解析动态的蛋白质与RNA互作过程。然而,无论是APEX-RIP还是proximity-CLIP技术都存在缺陷,即APEX2标记的生物素化蛋白可能会在交联前发生扩散,从而降低在非膜的亚细胞区域内对互作RNA标记的特异性。3.3 TurboID-RIP技术
传统的BioID生物素邻近标记技术需要借助生物素连接酶BirA进行18~24 h的标记反应,这导致该技术无法解析细胞内发生的短时间或高度动态的RNA与蛋白质互作过程;此外,较低的反应效率也限制了该技术在某些特定环境如内质网腔中的应用。Branon等[24]基于定向进化方法(directed evolution)开发出能够将标记耗时缩短至10 min且具有更高催化效率的生物素连接酶TurboID,极大地推动了基于生物素的邻近标记技术的发展。Liu等[25]的一项研究将TurboID和RIP-seq技术结合起来成功实现了对拟南芥植物细胞中高度动态无膜细胞器如加工小体(processing bodies,PBs)内蛋白质的生物素化标记及其相关互作RNA的富集和测序检测。值得注意的是,在该研究中TurboID-RIP较APEX-RIP展现出了更好的标记特异性[25]。这可能是由于APEX-RIP使用的生物素-苯酚(biotin-phenol,BP)底物更容易在富含内源性过氧化物酶(endogenous peroxidase)和活性氧(reactive oxygen species,ROS)[26]的植物细胞中发生非邻近特异性的随机标记,进而造成了较高的背景噪音。4 直接靶向RNA的邻近标记技术
前文详细阐述了几种间接进行RNA定位研究的邻近标记技术,该方法通过对目标蛋白的标记、蛋白质与RNA的交联以及蛋白与互作RNA的纯化富集对与蛋白共定位的RNA分子集群进行研究。然而,受限于对蛋白质与RNA相互作用原理的依赖性,上述的邻近标记技术无法实现对特定亚细胞区域中RNA的直接标记,更难以实现对胞内低丰度RNA的检测。近年来,一些直接针对RNA的邻近标记技术被成功开发和应用。接下来,本文将详细介绍这类技术并进行讨论。4.1 Poly U聚合酶介导的邻近标记技术
来源于秀丽隐杆线虫(Caenorhabditis elegans)的多聚尿苷酸聚合酶-2[Poly(U) polymerase-2,PUP-2]可在目标RNA的3′末端进行多聚尿苷酸化修饰。Lapointe等[27]开发了基于PUP-2的邻近标记技术,并通过与酵母来源的RNA结合蛋白Puf3p的融合表达实现了对Puf3p内源底物的多聚尿苷酸标记和鉴定。Medina-Munoz等[28]基于该技术原理进一步开发了基于PUP-2的RNA亚细胞定位标记和识别策略。为了尽可能高效地对靶标RNA进行多聚尿苷酸化修饰,研究人员将多聚腺苷酸结合蛋白的RNA识别基序与PUP-2进行了串联,并进一步通过融合到内质网膜定位蛋白Sec63p的C端或线粒体外膜蛋白Om45p的C端分别实现了对邻近内质网膜(ERM)或线粒体外膜(OMM)的胞质RNA的标记和识别。需要注意的是,由于RNA多聚尿苷酸化修饰的长度能够随时间延伸,因此该技术表征了RNA在目标区域滞留的“历史记录”而非其动态定位的“快照”。这一特性使该技术无法有效鉴定亚细胞区室中RNA定位的快速动态变化,但可以为多区域定位共享的RNA识别及其在不同位置的滞留情况提供有效的研究手段。4.2 APEX-seq邻近标记技术
Fazal等[29]发现,使用生物素-苯酚(BP)作为底物并在辣根过氧化物酶(horseradish peroxidase,HRP)的催化下可以对tRNA进行体外直接标记,研究进一步证实,APEX2也可在细胞内催化BP底物对RNA的直接标记。基于上述结果,研究人员开发了APEX-seq技术,成功地应用于检测定位于核仁、核基质、核膜、核孔、胞质溶胶、内质网膜和线粒体外膜[29]或无膜细胞器如应激颗粒中[30]的RNA。除BP外,Zhou等[31]还测试了若干种性质相似的标记底物,最终发现生物素-苯胺(biotin-aniline,BA)对于RNA也具有较高的标记效率。除了标记底物的优化外,研究人员还发现,通过代谢过程在RNA中掺入4-硫尿苷(4-thiouridine,s4U)或6-硫鸟苷(6-thioguanosine,s6G)两种富电子核苷酸能够增强其与BP或BA标记底物的反应性,提高APEX2催化下的RNA生物素化标记效率[32,33]。由于BP或BA底物具有较差的膜渗透性,导致上述方案虽然在哺乳动物细胞中得到了很好的验证,却在尝试应用于酵母等微生物细胞时出现了困难。为解决上述问题,Li等[34]开发了一种使用炔烃-苯酚(alkyne-phenol,AP)作为标记底物并偶联基于铜(I)催化的炔烃-叠氮化物加成[copper(I)-catalyzed alkyne-azide cycloaddition,CuAAC]的点击反应(click reaction)标记策略。与BP相比,AP对细胞膜具有非常强的渗透性,因此可以高效地通过渗透进入胞内并在APEX2的催化下与掺入RNA的s4U或s6G发生共价连接标记,随后继续投入生物素-叠氮化物进行点击反应使生物素进一步共价连接在被AP标记的RNAs上,最后再通过对生物素化标记的RNA进行富集即可进行后续的测序分析。4.3 光活化的邻近标记技术
邻近标记技术的关键是产生高反应性的底物中间体以与空间邻近的生物大分子发生反应。除了依赖过氧化物酶外,也可以通过光活化的方式产生标记反应所需的高反应性底物中间体。Wang等[35]开发了一种称为CAP-seq的光活化的RNA邻近标记工具。该工具使用融合特定亚细胞定位标签的微型单线态氧发生器蛋白(mini singlet oxygen generator,miniSOG)在蓝光照射时产生ROS,先对RNA的鸟苷进行氧化损伤,随后再投入炔丙基胺(propargyl amine,PA)底物通过亲核进攻与氧化鸟苷交联,并偶联CuAAC点击反应将生物素连接到RNA上,以实现与亚细胞特异性定位miniSOG邻近的RNA的生物素化标记和下游的富集与检测。该技术在标记底物与RNA连接的原理上与APEX-seq存在显著不同,前者依赖蓝光激活miniSOG产生的ROS对RNA进行损伤和标记反应;而后者需要提前通过代谢掺入s4U或s6G,并通过APEX的催化对RNA进行生物素化标记。除此之外,CAP-seq和APEX-seq技术的适用范围并无明显差异,可根据具体的实验情况选用更加合适的技术方案。另一种光活化的RNA邻近标记技术Halo-seq[36]也采用了类似的原理。该方法采用HaloTag蛋白结构域与特定的亚细胞定位标签相融合,以引导HaloTag在目标亚细胞区域中定位,并利用HaloTag的配体二溴荧光素(dibromofluorescein,DBF)与HaloTag的特异性结合将DBF分子限制在与HaloTag相同的亚细胞区域中。随后,DBF分子受绿光照射激发产生单线态氧自由基并氧化邻近RNAs中的鸟苷,之后便依赖与CAP-seq相似的步骤和原理先后投入标记底物和点击反应底物以实现对邻近RNAs的生物素化标记和下游富集检测。实验数据表明,Halo-seq技术相较于上文所述的APEX-seq和CAP-seq技术的标记效率更高[36],因此更有望实现对细胞内低丰度的RNA进行精确而高效的邻近标记和富集检测。4.4 BAP-seq邻近标记技术
Pani等[37]的一项研究开发了一种与众不同的针对RNA的邻近标记策略。与先前针对RNA邻近标记需要依赖自由基或活性氧不同,该方法采用了掩蔽的烯醇酯探针(enol-ester-masked acylating agents)配合特定亚细胞区域靶向定位的枯草芽孢杆菌酯酶BS2,通过酯酶催化释放烯醇并迅速异构为含羰基的高反应活性、短半衰期的酰氯试剂(acyl chloride reagent,AC),进而通过酰化反应标记一定半径内邻近的RNAs;随后再通过烯醇酯探针含有的炔基偶联CuAAC点击反应以实现后续对目标区域RNA分子的生物素化标记及其下游的富集和测序鉴定。该技术提供了一种不依赖光照或活性氧的标记方法,理论上对细胞正常的生命活动具有最小的干扰。此外,该技术的步骤简单、反应迅速且特异性较好,为RNA邻近标记技术的发展提供了全新的思路。5 总结与展望
作为一种转录后调节机制,RNA在细胞内的定位和异质性分布对细胞基因组结构和功能的维持调节、编码蛋白的局部快速翻译、外部信号响应与细胞形态变化的协调乃至细胞的不对称分裂和命运决定等生命活动具有重要的调控作用。当前,基于FISH技术的改进衍生版本如sm-FISH或π-FISH能够通过多轮探针杂交实现单个靶标RNA分子级别的高分辨率原位检测,基于liveFISH、MS2-MCP或CRISPR/dCas13系统的检测技术甚至还可以实现对靶标RNA亚细胞定位的活细胞成像追踪。然而,上述技术往往需要额外引入含有特定标签的外源靶标或对靶标RNA进行靶向修饰操作,且很多技术只能对已知的靶标RNA进行标记示踪,具有较大的局限性。此外,这些技术的原理也决定了其无法实现高通量的RNA检测,无法满足当下对时空转录组研究的需求。近年来,一系列由酶介导的邻近标记技术很好地弥补了上述技术存在的短板。通过邻近标记技术,人们可以将标记所需的酶引导定位到感兴趣的亚细胞区室,并将投入的小分子标记探针转化为具有高反应活性而极短半衰期的活性中间体,实现以酶自身为球心、小半径空间范围内对生物大分子的距离依赖性邻近标记。目前对于以RNA为靶标的邻近标记技术思路大致分为两类,即通过标记RNA互作蛋白并结合RNA免疫沉淀间接实现对RNA的捕获和检测,或通过对RNA进行直接的标记和捕获进行下游检测。此外,这些技术在标记探针底物的设计上也分为两类,其一是将标记反应基团与生物素直接连接,实现一步法标记;其二是将标记反应基团与炔基直接连接,在第一步标记反应发生后再投入生物素-叠氮化物,并偶联CuAAC点击反应实现对靶标大分子的两步法标记。在应用方面,针对RNA的邻近标记技术已经成功在哺乳动物细胞中实现了对质膜、内质网膜、线粒体外膜、线粒体基质、应激颗粒等亚细胞区室转录组的检测。另一方面,目前对于植物细胞中RNA的分布研究还主要采用嫁接、基因表达沉默和特定组织汁液内的RNA测序[38-40]。这些方法具有复杂度高、周期长、空间分辨率差等缺点。因此,邻近标记技术有望作为一种有效的工具手段,以更高的时空分辨率研究RNAs在植物细胞各亚细胞区室结构中的动态组织和相互作用网络,甚至尝试理解胞间连丝在细胞间转运RNA的调控机制。然而,受制于植物细胞与动物细胞在亚细胞结构和胞内生理生化环境的显著差异,目前针对RNA的邻近标记技术在植物体中的开发和应用还存在诸多困难和挑战,我们期待随着邻近标记技术的不断发展和优化,在将来能够开发出具有普适化标记植物各亚细胞区室中RNA的策略,这将为植物细胞、组织或器官的时空转录组研究提供全新的技术手段和视角,更对推进植物生物学的理论发展和提高作物生产力及在极端环境条件下恢复力的研究具有实际的意义。
基金资助
国家自然科学基金项目(92368102,22377126)
--核糖核酸功能与应用专刊--
中国科学院核糖核酸功能与应用重点实验室聚焦“RNA的功能与应用”重大科技问题,着力研究RNA时空调控核心规律、RNA相关重大疾病致病机制、RNA原创技术与高效应用等,志在建立前沿性理念驱动、通用型技术为底盘的研发体系。依托核心骨干团队与《生命的化学》杂志精心组织了本期专刊。专刊聚焦于“新型RNA”“RNA新功能”“RNA新应用”等三个重要方向。专刊面向生物医学科研人员、科技政策管理人员、本科生及研究生等,期望展现RNA基础研究的科学前沿、RNA生物医学技术应用的瓶颈以及重点实验室面向国家重大战略需求的科研布局。
《生命的化学》创刊于1980年,中国生物化学与分子生物学会主办、向国内外公开发行的生物综合类学术期刊。月刊,中国科技核心期刊,中国期刊网来源期刊,科技期刊世界影响力指数报告(WJCI)(2021)来源期刊,被化学文摘(CA)(美)、日本科学技术振兴机构数据库(JST)(日)等国际数据库收录。重点刊登生物化学、分子生物学及生命科学相关领域原创性研究论文、综述,反映当前领域国内外最新研究进展,介绍最新研究技术与方法。设有研究论文、综述、教学、科普等栏目。投稿网址:http://smhx.cbpt.cnki.net/