1 概述
蛋白质是生物活性物质中最重要的大分子组分之一,参与了细胞的所有代谢反应。决定其合成和结构的信息通常由DNA编码,经转录、翻译等步骤得到成熟的蛋白质。蛋白质的生物合成即信使核糖核酸(mRNA)翻译,主要包括氨基酸活化,多肽链合成的起始、延伸、终止以及新生多肽链的折叠和加工。哺乳动物细胞的两套蛋白质合成系统分别位于细胞质和线粒体,均由核糖体、RNA及翻译因子等组成。细胞质蛋白质合成系统负责合成细胞中的绝大部分蛋白质,核基因组编码相应的mRNA、转移核糖核酸(tRNA)以及核糖体核糖核酸(rRNA)。线粒体拥有多拷贝的闭合环状双链DNA基因组,即线粒体DNA(mitochondrial DNA,mtDNA),编码线粒体内膜上氧化磷酸化(oxidative phosphorylation,OXPHOS)复合物跨膜区的13个核心亚基[1]。线粒体翻译所需的RNA,即22种线粒体tRNA(mt-tRNA)和2种线粒体rRNA(mt-rRNA),都由mtDNA编码;而所有必需的蛋白质,如核糖体蛋白质、tRNA修饰酶、氨基酰-tRNA合成酶(aminoacyl-tRNA synthetase,aaRS)、翻译因子等,都由核基因组编码。其中,tRNA接受活化的氨基酸,并将其带到核糖体上按mRNA上密码子的顺序进行多肽链的合成,是蛋白质合成中破译遗传密码的关键分子[2]。tRNA一般由73~93个核苷酸组成,通常具有三叶草型二级结构,包括5个茎区和4个环区:氨基酸接受茎、二氢尿嘧啶茎(dihydrouridine stem,D-stem)和环(D环)、反密码子茎和环、TΨC茎和环、可变环和仅存在于含较长可变区域tRNA中的可变茎[3,4]。D环和TΨC环之间的相互作用使得tRNA在二级结构的基础上进一步折叠成经典的倒L形三级结构[5]。从转录产生前体tRNA(precursor tRNA,pre-tRNA)到最终形成成熟的携带有氨基酸的tRNA需要经历复杂的加工过程。本文以“tRNA”右上角标氨基酸英文缩写表示负责携带该氨基酸的tRNA,如tRNAThr为苏氨酸tRNA。
1.1 细胞质tRNA的代谢
人基因组包含420个左右编码细胞质tRNA(cytoplasmic tRNA,ct-tRNA)的基因,所产生的tRNA组成了21个等受体tRNA(isoacceptor)家族,分别由携带相同氨基酸但含有不同反密码子的tRNA组成,对应了20种常见蛋白质氨基酸以及硒代半胱氨酸[6]。此外,还存在等码体tRNA(isodecoder),它们携带相同氨基酸且具有相同的反密码子,但是反密码子外的其他序列不完全相同。
ct-tRNA基因由RNA聚合酶Ⅲ(RNA polymeraseⅢ,PolⅢ)转录,得到包含有冗余序列的pre-tRNA。其成熟涉及许多步骤,包括核糖核酸酶P(ribonuclease P,RNase P)内切去除5′-前导序列(5′-leader)、RNase Z内切去除3′-旁侧序列(3′-trailer)、tRNA-核苷酸转移酶1(tRNA nucleotidyl transferase 1,TRNT1)添加3′-CCA序列、组氨酸tRNA-鸟苷酸转移酶(tRNAHis guanylyltransferase,THG1)在ct-tRNAHis的5′-端添加G-1残基、部分ct-tRNA第37位和38位之间居间序列(内含子)的切除和再连接等。此外,在ct-tRNA的不同位点还存在不同的化学修饰,它们或有助于稳定tRNA结构,或能确保蛋白质合成的保真度以及实现密码子的简并性[7-9]。人ct-tRNA修饰种类多且具有组织器官特异性,每个tRNA分子平均包含13个修饰,通过位点特异性修饰酶以特定的机制和顺序引入[10-12]。
成熟的tRNA与对应的氨基酸需要在aaRS催化下形成氨基酰-tRNA(aminoacyl-tRNA,aa-tRNA)才能参与蛋白质的生物合成。大多数aaRS催化的反应分为两步:第一步为氨基酸活化,由ATP提供能量生成活化的氨基酰-AMP;第二步,活化的氨基酸转移到相应tRNA的3′-端,生成aa-tRNA[13]。细胞质中存在20种具有氨基酸专一性的aaRS,根据催化结构域结构、特征序列和氨基酰化的位置可分为两类:Ⅰ类酶包含一个基于罗斯曼折叠(Rossmann fold)的催化结构域和构成ATP结合位点的HIGH(His-Ile-Gly-His)和KMSKS(Lys-Met-Ser-Lys-Ser)信号序列,在tRNA末端A76的2′-OH上进行氨基酰化;Ⅱ类酶拥有保守的七链反平行折叠片以及3个特征基序,通常在A76的3′-OH上进行氨基酰化[14,15]。一些氨基酸代谢产物与氨基酸之间或不同氨基酸之间具有相似的结构,导致aaRS可能错误识别非对应的氨基酸造成误氨基酰化[16]。为了保证氨基酰化的准确性,部分aaRS具有额外的编校结构域,用于水解误氨基酰化的tRNA[17]。在进化过程中,aaRS获得了参与mRNA翻译之外的功能,统称为aaRS的非经典功能(non-canonical functions),如参与小分子代谢、细胞凋亡和肿瘤发生、组织发育、血管生成和免疫应答等[18-21]。部分aaRS通过附加结构域与其他aaRS相互作用产生多氨基酰-tRNA合成酶复合物(multiple synthetase complex,MSC)。对于MSC形成的原因尚不清楚,有假说认为MSC有助于aa-tRNA快速进入核糖体以提高翻译效率[22]。
真核生物细胞质中存在两种tRNAMet,分别为起始tRNAMet(tRNAiMet)和延伸tRNAMet(tRNAeMet)。多肽链合成都从生成甲硫氨酰-tRNAiMet(Met-tRNAiMet)开始,其与核糖体结合以起始多肽链合成,而Met-tRNAeMet只能被掺入正在延伸中的多肽链。在起始因子的帮助下,40S小亚基首先与Met-tRNAiMet结合,再与模板mRNA结合并移动至翻译起始位点AUG,最后与60S大亚基结合生成80S起始复合物。在多肽链延伸的过程中,mRNA上的密码子与相应aa-tRNA上的反密码子结合,将氨基酸通过新生肽键有序连接到多肽链末端,该过程包括aa-tRNA与核糖体的结合、肽键的生成和移位,并需要延伸因子的参与。在延伸过程中,当终止密码子出现时没有相应的aa-tRNA可以与之结合,而释放因子识别终止密码子UAA、UAG和UGA,并水解多肽链与tRNA之间的二酯键,新生多肽链和tRNA从核糖体上释放,大、小亚基解体。
1.2 线粒体tRNA的代谢
不同于经典三叶草型二级结构的0型tRNA,mt-tRNA可以分为三种非典型的二级结构:D环和可变环较短而反密码子茎较长的Ⅰ型,缺乏D环和TΨC环相互作用的Ⅱ型,以及缺乏整个D环的Ⅲ型[23]。其中,Ⅰ型仅有mt-tRNASer(UCN),而Ⅲ型仅有mt-tRNASer(AGY),二者分别用于识别UCN(N=U、C、A、G)和AGY(Y=U、C)密码子。
与细胞核tRNA基因的转录不同,mtDNA的重链与轻链分别在线粒体RNA聚合酶(mitochondrial RNA polymerase,mtRNAP)的催化下转录为两条互补的几乎与mtDNA等长的RNA。22个mt-tRNA的5′-和3′-侧翼通常是mt-mRNA、mt-rRNA或其他mt-tRNA,这种现象被称为“tRNA标点(tRNA punctuation)”[1]。线粒体核糖核酸内切酶P(mitochondrial endoribonuclease P,mt-RNase P)和mt-RNase Z分别在mt-tRNA的5′-和3′-端切割,将其从多顺反子RNA中释放出来,并间接提供了mt-mRNA和mt-rRNA。值得一提的是,与大部分RNase P不同,mt-RNase P是一个仅由3种蛋白质组成的复合物而不需要RNA的参与[24]。从多顺反子RNA释放的mt-tRNA同样需要由TRNT1添加3′-CCA序列,但它们没有居间序列因而不需要进一步剪切。此外,mt-tRNA也会被多种不同的修饰酶转录后修饰[25-27],部分修饰在ct-tRNA和mt-tRNA中都存在,部分则是mt-tRNA特有的修饰[5]。
线粒体需要的19种aaRS都由核基因组编码[28,29],其中mt-tRNAGln没有对应的aaRS,而是由线粒体谷氨酰-tRNA合成酶(mt-GluRS)和GatCAB复合物负责[30,31]。此外,线粒体甘氨酰-tRNA合成酶(mt-GlyRS)和赖氨酰-tRNA合成酶(mt-LysRS)与细胞质对应的aaRS由同一基因编码,分别经翻译重起始[32]或mRNA可变剪切产生[33]。其余17个mt-aaRS都由单独的基因编码。部分mt-aaRS也发挥非经典功能,或形成MSC[34]。近几年的研究发现,mt-RNA成熟和降解的过程分别发生在无膜结构线粒体RNA颗粒(mitochondria RNA granule,MRG)和与之紧密联系的降解体(degradosome,D-foci)中[35]。
线粒体翻译的起始类似于细菌,由甲酰甲硫氨酸(fMet-tRNAMet)起始,且不存在两种tRNAMet。线粒体开放阅读框通常以AUG密码子起始,但也可能为替代密码子如AUA和AUU(二者在细胞质中编码异亮氨酸)[23]。哺乳动物中单一类型的线粒体tRNAMet用于识别所有这些密码子,这是通过将摆动碱基修饰为5-甲酰胞嘧啶(5-formylcytosine,f5C34)来实现的。线粒体肽脱甲酰基酶(mitochondrial peptide deformylase,PDF)使新生多肽链的氨基末端脱甲酰基,随后甲硫氨酸氨基肽酶1D(mitochondrial methionine aminopeptidase 1D,MAP1D)去除起始甲硫氨酸,然后新生多肽链会通过蛋白质转座酶OXA1边翻译边插入到线粒体内膜中。当核糖体到达开放阅读框的末端时,核糖体释放因子识别终止密码子并将tRNA和新生链之间的酯键水解以终止翻译。线粒体遗传密码的改变对翻译的终止有很大影响:在线粒体中,UGA编码色氨酸而不是终止密码子;两种线粒体mRNA(编码mt-CO1和mt-ND6)携带的终止密码子分别为AGA和AGG,而细胞质中它们编码精氨酸[23,36]。
1.3 tRNA代谢与疾病
传统观点认为,tRNA是普遍表达的管家分子,但人们现在逐渐意识到编码tRNA的基因表现出组织和细胞类型特异性的表达模式,其表达和功能都受到转录后修饰的动态调节[37]。编码tRNA的基因和参与tRNA转录、加工、修饰和氨基酰化的酶的改变都可能引起tRNA失调,进一步导致疾病。
编码mt-tRNA的基因上鉴定了多种疾病相关的突变。这些突变与tRNA自身稳态和修饰水平的改变以及线粒体蛋白质合成的改变有关。如mtDNA上的A3243G和T3271C突变导致mt-RNALeu(UUR)(R=A、G)上的5-牛磺酸甲基尿苷(5-taurino-methyluridine,τm5U)修饰缺失,UUG密码子的识别受损影响富含该密码子的mt-ND6 mRNA翻译缺陷,进而导致线粒体脑肌病伴高乳酸血症和卒中样发作(mitochondrial myopathy,encephalopathy,lactic acidosis and stroke-like episodes,MELAS)综合征[38,39]。目前对ct-tRNA基因突变在疾病中的作用知之甚少,然而负责ct-tRNA转录的PolⅢ复合物亚基上的突变与多种神经退行性疾病有关,并且通过PolⅢ调节ct-tRNA水平是控制生长、恶性转化和肿瘤发生的重要机制[40]。
tRNA的转录后加工过程在多种疾病中失调。mt-RNase P的三种蛋白质组分(MRPP1、MRPP2、MRPP3)的突变都与多种疾病有关:携带TRMT10C(编码MRPP1)突变的个体在出生时表现出乳酸酸中毒、肌张力减退、进食困难和耳聋,并因呼吸衰竭死亡[41,42];HSD17B10(编码MRPP2)的突变与HSD10疾病有关,该疾病表现为心肌病、认知和运动功能丧失、癫痫和失明[43-45];PRORP(编码MRPP3)的突变会直接导致mt-tRNA加工的缺陷,患者表现出听力损失、原发性卵巢功能不全、发育迟缓和脑白质变化等[46]。ELAC2(编码RNase Z)被确定与前列腺癌易感性相关,同时其突变与心脏病有关[47,48]。CCA加尾酶TRNT1的突变则与一系列罕见的代谢紊乱有关,具有复杂而广泛的临床表现[49]。
由于ct-tRNA有几百种,其修饰谱还没有完全建立。截至目前发现ct-tRNA中存在至少39种转录后修饰。22种mt-tRNA修饰谱已经完全建立,其中存在18种转录后修饰[50]。tRNA修饰的异常可以通过三种主要方式影响翻译:反密码子环处的异常修饰可能限制或扩展解码,影响解码的效率;tRNA核心处的修饰有助于折叠以形成稳定的结构;部分修饰异常会影响氨基酰化的效率和特异性。许多负责修饰的酶在疾病中失调,如参与细胞质N6-苏氨酰氨甲酰腺苷(N6-threonylcarbamoyladenosine,t6A)生物合成的KEOPS(kinase,endopeptidase,and other proteins of small size)复合物中4个亚基的突变与Galloway-Mowat综合征有关[51]。
tRNA错误携带氨基酸会对蛋白质合成产生破坏性后果[28],负责mt-tRNA氨基酰化的aaRS的病理突变主要导致中枢神经系统症状[52,53]。首次被报道的细胞质aaRS的致病突变发生在2型腓骨肌萎缩症(Charcot-Marie-Tooth disease,CMT)患者中。这是一种遗传性周围神经病变,目前认为突变的GlyRS消耗tRNAGly导致核糖体阻滞并通过感受器激酶GCN2引发综合应激反应的慢性激活[54-56]。
2 领域前沿与关键科学问题
从2008年第一次鉴定出mt-RNase P的三个蛋白质组分至今[24],有研究人员提出以下设想:其中的两个蛋白质组分MRPP1和MRPP2作为mt-tRNA成熟的平台,始终与tRNA结合而不只是在5′-切割中发挥功能。近几年,通过对mt-tRNA成熟复合物结构的解析以及分子生物学方法进行实验,该假设逐渐被证实[57,58]。然而,MRPP1和MRPP2在mt-tRNA成熟尤其是3′-切割以及3′-CCA添加时发挥的具体功能以及相应的分子机制仍不完全清楚,目前报道的两个蛋白质上的致病点突变是否与tRNA成熟过程相关也待研究。
2020年,Suzuki等[50]通过片段质谱对所有人mt-tRNA的转录后修饰进行了分析,在22种mt-tRNA的137个位置发现了18种RNA修饰。然而由于ct-tRNA密码子和序列的多样性,其修饰谱尚未完全建立。在已发现的一百多种修饰中,有相当数量的修饰酶未被鉴定;即便是已知的修饰酶,其识别和修饰tRNA的机制、修饰tRNA之外是否具有其他功能等也并不是完全清楚。如上文所述,tRNA修饰缺陷与多种人类疾病相关,然而许多转录后修饰的生理功能、修饰缺陷与疾病的关系、导致重大人类疾病的分子病理机制仍然未知。
aaRS的非经典功能是近些年研究的热点,高等生物在进化过程中出现的众多与氨基酰化无明显相关性的新结构域使得aaRS在氨基酰化这个经典功能之外具有非常广泛的非经典功能,这些功能的异常与包括中枢神经系统疾病、心血管疾病、肿瘤发生等在内的多种人类疾病密切相关。aaRS的非经典功能主要包括:(1)作为氨基酸感受器传递营养、压力信号,参与生理调控,涉及mTOR信号通路[18]、免疫基因表达[21]和细胞凋亡[59]等;(2)通过新添加的结构域参与血管生成[60]、炎症反应[61]和神经发育[54,62]等;(3)参与免疫失调疾病、癌症和神经系统疾病,如抗合成酶综合征(antisynthetase syndrome,ASyS)患者体内出现抗aaRS的自身抗体从而引起自身免疫病[63,64]。此外,与aaRS一同形成MSC的3种支架蛋白质也具有广泛的非经典功能[65]。因此,对aaRS非经典功能的基础和病理研究有助于理解aaRS在发育、免疫反应等生理过程中的分子调控机制并为相关疾病的精准诊断提供新的标志物,为临床治疗提供新的靶点和治疗手段。
3 实验室聚焦研究方向
本实验室运用生物化学、分子生物学、细胞生物学、遗传学等技术方法,在分子、细胞和动物三个层面对以下几个方向进行研究:(1)研究细胞质与线粒体tRNA关键代谢步骤的分子机制,主要聚焦在细胞质和线粒体tRNA氨基酰化和转录后修饰机制的研究,通过体外活力重建及构建特定tRNA代谢缺陷的细胞和动物模型对识别机制、缺陷引起的下游效应和表型等进行深入研究;(2)在重组修饰活力并解析底物识别机制的基础上开发特定RNA分子定点修饰工具,拟实现tRNA与其他类型RNA分子上特定位点的特定修饰,可以应用于改善RNA免疫原性、翻译效率等;(3)阐明临床发生或潜在的蛋白质合成缺陷相关疾病的致病机制,对临床鉴定的tRNA代谢酶(包括aaRS、tRNA修饰酶等)突变及疾病的发生发展进行具体研究;(4)探索线粒体疾病诊断与靶向干预策略,通过基因疗法、底物添加、小分子干预等手段,拟为相关疾病的诊断和干预提供理论基础。
4 未来展望与尚需攻关的科学问题
负责tRNA加工、修饰和氨基酰化的酶是tRNA代谢的关键参与者,同样也是致病点突变的热点。尽管越来越多的研究着眼于翻译系统的生理和病理学,tRNA修饰和氨基酰化的具体分子机制还远未完全了解[53]。亟待解决的问题主要集中在以下几个方面。(1) tRNA代谢过程的具体分子机制是什么? 该问题所面临的难点之一在于表达和纯化线粒体tRNA代谢酶存在困难(主要是由于线粒体蛋白质靶向序列切割位点的不确定性以及部分蛋白质在细菌表达系统中的溶解性差等)以及mt-tRNA结构的不稳定性[23],使得很难在体外成功重建活性。(2) tRNA基因、aaRS和tRNA修饰酶突变的致病机制是什么? 大多数基因突变已在临床上作为病例报告,但缺少进一步的机制研究[66]。病因研究可以在分子生物学、细胞生物学和模型动物的水平上进行。目前已经构建了几种aaRS和tRNA修饰酶突变的小鼠或斑马鱼模型。此外,诱导多能干细胞和类器官等是解决或减少动物疾病模型和病人之间差异的一种方法。(3)如何在致病机制研究的基础上制定有效的疾病治疗策略? 以线粒体疾病为例,目前还没有建立起有效的线粒体疾病治疗策略,但基于细胞中线粒体基因组的异质性已经提出了一些治疗方案。线粒体定位的转录激活样效应因子核酸酶(transcription activator like effector nuclease,TALEN)[67]和单碱基编辑工具(DddA-derived cytosine base editor,DdCBE)[68,69]表现出清除或纠正特定mtDNA突变的潜力,但仍需要在细胞毒性、编辑碱基的类型、编辑效率和脱靶效应等方面进行优化。其他一些治疗手段如线粒体替代疗法等也仍存在技术缺陷和伦理问题[70]。基于对tRNA代谢的病理生理学的更清晰理解,可以开发出有前景的靶向疗法,包括但不限于基于腺相关病毒(adeno associated virus,AAV)的基因疗法、添加tRNA修饰酶底物以提高修饰效率[71]、给予小分子药物以干扰酶降解以及脂质纳米颗粒(lipid nanoparticles,LNP)介导的tRNA疗法等。
基金资助
国家自然科学基金项目(32271300);中国科学院战略先导B项目(XDB0570000);国家重点研发计划项目(2021YFA1300800,2021YFC2700903);上海市科委项目(22ZR1481300,22JC1400503);中国科学院稳定支持青年团队项目(YSBR-075)
--核糖核酸功能与应用专刊--
中国科学院核糖核酸功能与应用重点实验室聚焦“RNA的功能与应用”重大科技问题,着力研究RNA时空调控核心规律、RNA相关重大疾病致病机制、RNA原创技术与高效应用等,志在建立前沿性理念驱动、通用型技术为底盘的研发体系。依托核心骨干团队与《生命的化学》杂志精心组织了本期专刊。专刊聚焦于“新型RNA”“RNA新功能”“RNA新应用”等三个重要方向。专刊面向生物医学科研人员、科技政策管理人员、本科生及研究生等,期望展现RNA基础研究的科学前沿、RNA生物医学技术应用的瓶颈以及重点实验室面向国家重大战略需求的科研布局。
《生命的化学》创刊于1980年,中国生物化学与分子生物学会主办、向国内外公开发行的生物综合类学术期刊。月刊,中国科技核心期刊,中国期刊网来源期刊,科技期刊世界影响力指数报告(WJCI)(2021)来源期刊,被化学文摘(CA)(美)、日本科学技术振兴机构数据库(JST)(日)等国际数据库收录。重点刊登生物化学、分子生物学及生命科学相关领域原创性研究论文、综述,反映当前领域国内外最新研究进展,介绍最新研究技术与方法。设有研究论文、综述、教学、科普等栏目。投稿网址:http://smhx.cbpt.cnki.net/