在世界范围内,肿瘤是一个严重威胁人类健康的公共卫生问题。它位居疾病致死率第二位,仅次于心血管疾病。尽管肿瘤复杂且具有高度异质性,但它也有一些共同特征,包括自给自足的生长信号、抗生长信号的不敏感、抵抗细胞死亡、潜力无限的复制能力、持续的血管生成、组织浸润和转移、避免免疫摧毁、促进肿瘤炎症、基因组不稳定和突变以及细胞能量异常调控等[1]。理解这些特征的根本机制对于挖掘肿瘤致病机理,研发肿瘤预防和治疗手段具有重要意义。
真核生物基因表达过程首先将储存于DNA中的遗传信息转录成众多RNA分子,其中一些信使RNA(messenger RNA,mRNA)可作为蛋白质合成的模板。RNA分子和与之结合的蛋白质形成核糖核蛋白(ribonucleoprotein,RNP)复合物。在二十世纪五十年代,利用电镜观察到灯刷染色体上延伸的转录本快速与蛋白质形成RNP[2]。在七十年代,一些实验室利用生物化学方法分离并鉴定了mRNP的一些组分,如mRNA帽子结合蛋白、多聚腺苷结合蛋白、核不均一核蛋白(heterogeneous nuclear RNP,hnRNP)以及Y-box结合蛋白1(Y-box binding protein 1,YBX1)等[3]。在之后的近四十年中,大量工作关注了参与特定RNA代谢步骤的RNP组分。而近十多年来,利用RNA相互作用组捕获(RNA interactome capture,RIC)技术发现了大量RNA结合蛋白(RNA-binding proteins,RBPs)[4]。
RBPs是一类可以结合单链或双链RNA的蛋白质。它们通常含有RNA结合结构域(RNA binding domain,RBD)和负责蛋白质-蛋白质相互作用、细胞定位或者催化酶反应的辅助结构域。RBPs参与了RNA分子生命周期中的几乎每个重要事件,包括转录、加帽、剪接、加多聚腺苷尾、修饰、转运、定位、稳定性以及翻译等(图1),并决定了大量RNA分子的命运[5]。
图1 RBPs几乎参与RNA代谢过程中的每一个步骤
在正常细胞向肿瘤细胞演变过程中,RBPs受到异常调控可直接导致RNA-蛋白质作用网络改变,并影响抑癌或促癌基因的表达和功能。因此,发现肿瘤发生发展过程中异常调控的RBPs、解析RNA-蛋白质作用网络以及鉴定肿瘤相关的重要RNA靶标对更好地认识肿瘤致病机理和研发新的肿瘤诊断和治疗策略具有重要意义。本文将讨论RBPs的发现、RNA-蛋白质相互作用网络的检测以及RBPs在肿瘤中的具体作用,并展望RBPs在临床应用中的前景。1 利用RIC技术发现大量RBPs
近年来,通过利用生物化学与质谱手段相结合的RIC技术,研究人员在多个物种中系统地检测到了大量RBPs。1.1 RIC技术
现有的RIC技术可分为以下几种。(1)基于poly(A)尾RNA的技术。对细胞或组织进行254 nm波长紫外光交联,使用含有或不含有锁核酸(locked nucleic acid,LNA)修饰的oligo(dT)磁珠[6,7]分离含有poly(A)尾的RNPs,并通过质谱方法进行蛋白质鉴定,从而捕获与带有poly(A)尾RNA相互作用的RBPs。(2)基于核苷类似物的技术。使用人工合成的核苷类似物4-硫代尿苷(4-thiouridine,4sU)标记新生RNA后,采用365 nm波长紫外光诱发4sU与蛋白质发生交联,并通过质谱方法分析与4sU交联后发生质量偏移的RBPs[8]。此外,也可以利用5-乙炔基尿苷(5-ethynyl uridine,EU)标记新生RNA,紫外光交联后使用点击化学辅助捕获RNPs,再进行质谱鉴定[9]。这类技术可以筛选与新生转录本结合的RBPs。(3)基于有机相分离或者固液相分离的技术。细胞或组织经254 nm波长紫外光交联后,使用酸性硫氰酸胍-苯酚-氯仿抽提,并对沉积于有机相与水相之间中间层的RNPs中的蛋白质进行质谱鉴定[10]。基于固液相分离的技术使用核酸亲和柱或磁珠分离RNPs后,并对其中的蛋白质进行质谱鉴定[11,12]。2021年,Gebauer等[13]总结了通过多个RIC技术鉴定得到的候选RBPs,有3 470个之多。其中,只有约25%的蛋白质含有已知RBDs,称为经典RBPs;其余大量RBPs尚不清楚是如何结合RNA的,称为非经典RBPs。1.2 经典RBPs
大多数经典RBPs包含一个或多个相同或不同的RBDs。已知的RBDs有RNA识别基序(RNA recognition motif,RRM)、RGG(Arg-Gly-Gly)、K同源(K-homology,KH)、冷休克(cold shock domain,CSD)、锌指(zinc finger,ZnF)、双链RNA结合结构域(dsRBD)等。通常,RBDs可以特异地结合4~8个核苷酸。RBPs的RNA识别特异性一般依赖于氨基酸的侧链或主链与RNA碱基或戊糖之间形成的氢键或范德华力作用、氨基酸侧链的疏水基团与RNA碱基之间的疏水作用以及芳香族氨基酸或带正电荷的氨基酸与碱基环之间的π键或π-π堆积作用[14]。有一部分经典RBPs携带多个RBDs,可以提高RNA结合的亲和性与特异性。例如:KH结构域经常与quaking(QUA)结构域共同出现,从而在空间上形成更大的RNA结合表面,以更高的亲和力识别其RNA结合基序[15]。此外,有研究报道,约有20%的RBPs携带内在无序区域(intrinsically disordered region,IDR),并通过其结合RNA[16]。与RBDs不同,IDRs没有固定结构,通常具有低疏水性并带有正电荷,通过静电作用与核酸骨架结合。由于IDRs具有灵活且动态的构象,也可以通过弱相互作用结合其他分子伴侣,从而共同结合RNA[17]。1.3 非经典RBPs
利用RIC方法鉴定到的非经典RBPs中,存在很多与糖、核苷酸、脂肪酸代谢相关的酶以及泛素酶或磷酸酶等。如α烯醇酶ENO1可以通过其DNA结合结构域(DNA-binding domain,DBD)结合铁调节蛋白IRP1 mRNA的5′非编码区域(untranslated region,UTR),招募去腺苷化酶CNOT6促进IRP1 mRNA降解,进而调控细胞内铁离子稳态[18]。异柠檬酸脱氢酶IDH1通过其136-285 aa区域结合MED13、KAT6B和JARID2等mRNA 3′UTR中的AU富集基序,促进5′帽子依赖的mRNA翻译起始[19,20]。有趣的是,一些“明星”蛋白质也是非经典RBPs:如细胞程序性死亡-配体PD-L1可以直接结合mRNA,抑制RNA外切体结合从而降解其靶mRNA,进而维持DNA损伤修复正常进行;雌激素受体ERα可以直接结合EIF4G2和MCL1的mRNA,从而促进其翻译[21,22]。这些研究提示,RIC技术为RBPs研究提供了大量的研究资源,深入探究非经典RBPs结合RNA的方式、鉴定它们的靶RNA以及解析调控靶RNA的机制与功能可以丰富我们对RBPs的认识,为很多研究方向提供新的思路。2 RNA-蛋白质相互作用的检测技术及其在机制研究中的重要作用
随着技术的不断革新,RNA-蛋白质相互作用检测技术为准确解析RBPs发挥生物学功能的具体机制提供了有力的技术支持。目前,被广泛应用的检测技术主要分为两类。(1)以RNA为中心的检测技术。利用特定RNA靶标捕捉与之相互作用的蛋白质,联合质谱或蛋白质微阵列(protein microarray)等技术确定与其结合的蛋白质。这类技术大多利用体外转录或合成的寡核苷酸制备带有生物素标记或连接了适配体的RNA,直接钓取细胞提取物中与之相互作用的蛋白质。(2)以蛋白质为中心的检测技术。利用特定的RBPs钓取与其结合的RNA,联合高通量测序技术检测与其相互作用的RNA靶标。应用最为广泛的技术有CLIP(crosslinking immunoprecipitation)[23],应用于紫外或甲醛交联后的细胞或组织,利用特定RBPs的抗体进行免疫沉淀纯化RNP,并回收其中的RNA靶标。CLIP结合高通量测序技术后可实现对全基因组范围内RNA-蛋白质相互作用的检测,此类方法被称为HITS-CLIP[24]及其衍生技术。近年来,TRIBE[25]和STAMP[26]等新技术通过将感兴趣的RBPs与RNA碱基编辑器进行偶联,可以避免免疫沉淀步骤,一定程度上可以实现在少量细胞中检测RNA-蛋白质相互作用。tRIP-seq[27]、LACE-seq[28]和ARTR-seq[29]等技术的研发也为少量细胞中检测RNA-蛋白质相互作用提供了更多可能性。此外,计算生物学和人工智能方法的迅速发展为预测RNA-蛋白质相互作用提供了更多可能。目前的预测方法主要基于RNA和蛋白质序列信息或结构信息[30,31],但对大量非经典RBPs与RNA的相互作用还难以利用现有计算方法进行预测。在实际的研究中,根据具体的科学问题选择合适的RNA-蛋白质相互作用检测技术可以帮助研究人员确定RBPs在特定时空条件下的具体RNA靶标,多种检测技术的联合使用也可以互为佐证,为深入理解RNA-蛋白质相互作用的生物学意义奠定了坚实的基础。3 RBPs的异常调控可以促进或抑制肿瘤的发生发展
肿瘤细胞中RBPs可以是肿瘤激活因子或者肿瘤抑制因子。在不同肿瘤的遗传背景下表达水平或者活性失调,导致肿瘤的发生发展。在肿瘤细胞中,RBPs通过调控靶基因的表达进而影响肿瘤细胞生物学功能,如恶性增殖与转化、迁移与侵袭等。3.1 编码RBPs的基因改变与肿瘤的发生发展
在人类疾病中,有1 000多个RBPs会发生突变,占含有被注释突变的蛋白质的20%以上[5]。发生在RBPs中的突变可以对RBPs本身的性质、表达和作用网络产生很大的影响,改变对其下游RNA靶标的作用。根据突变发生区域的不同,可以分为发生在内含子或外显子上的突变。发生在内含子上的突变可引发内含子滞留,产生提前终止密码子,从而导致无义介导的mRNA降解(non-sense mediated decay,NMD)或产生截短的蛋白质。发生在外显子上的突变,如果在UTRs,可影响mRNA的稳定性或翻译效率;如果在编码区,无义突变会造成截短蛋白的产生,错义突变则会改变氨基酸顺序或翻译后修饰造成蛋白定位、催化活性、蛋白质与蛋白质的相互作用以及蛋白质构象发生变化(图2)。随着外显子或全基因组测序技术在肿瘤生物学中的应用,科研人员意外地发现,编码剪接蛋白SF3B1、U2AF35、SRSF2和ZRSR2基因的体细胞突变高频发生在几种血液系统恶性肿瘤中,包括骨髓增生异常综合征及其他髓系肿瘤和慢性淋巴细胞白血病[32]。其中,发生在SF3B1基因的突变是最常见的,并与骨髓增生异常综合征病理过程密切相关,包括红细胞生成受损、铁代谢稳态失调、炎症过度和R-loop积累等[33]。SF3B1是U2 snRNP的一个组成成分,参与3'剪接位点中分支位点的识别。SF3B1的突变主要发生在其HEAT结构域中,会影响SF3B1与其他剪接蛋白的相互作用,改变对3′剪接位点的识别。这可以导致很多基因发生可变剪接,并产生NMD,包括与血红素生物合成和铁代谢相关的基因ABCB7、PPOX、TMEM14C以及癌症特异性基因NF1、DICER1、PML、PDS5A、MAP3K7和PPP2R5A等[34]。3.2 冷休克家族蛋白质在肿瘤中的作用
冷休克家族成员携带高度保守的冷休克CSD结构域。在哺乳动物中,主要成员有YBX1、YBX2、YBX3、LIN28A、LIN28B和CSDE1,其中YBX1是在肿瘤中被研究得最为广泛的一个RBPs。我们实验室曾通过体外指数富集SELEX(systematic evolution of ligands by exponential enrichment)和iCLIP-seq方法对体外和体内的YB-1-RNA相互作用进行了鉴定,发现YB-1偏向识别带有CA(U/C)C的序列[35,36]。我们还进一步解析了YB-1 CSD-RNA复合物1.7Å分辨率的晶体结构,发现CSD主要通过四个高度保守的芳香族残基H87、F85、F74和W65与RNA形成π-π堆积相互作用[37]。YB-1蛋白在多种肿瘤细胞中高表达,如乳腺癌、肺癌、结肠癌、胃癌等,YB-1表达上调与肿瘤的不良预后密切相关[38]。YB-1转基因小鼠乳腺癌肿瘤形成率为100%,表明YB-1具有很强的致癌能力[39]。在不同的肿瘤中,YB-1通过调控基因表达过程中的多个步骤从而发挥促癌作用。如YB-1可以在转录水平激活乳腺癌细胞中EGFR、HER2等促癌基因的表达[40]。在肉瘤细胞中YB-1通过上调低氧诱导因子HIF1α的翻译促进肉瘤细胞的恶性转移[41]。Chen等[42]发现,在膀胱癌中,YB-1可以作为一个m5C识别蛋白质结合肝素结合生长因子HDGF的mRNA 3′UTR上的m5C位点,增加HDGF mRNA稳定性,促进膀胱癌的增殖和转移。Feng等[43]发现,YB-1在急性髓性白血病细胞中高表达,通过与IGF2BP相互作用使带有m6A修饰的MYC和BCL2 mRNA更加稳定,从而促进细胞增殖。最近,我们实验室发现,YB-1在神经胶质母细胞瘤中的高表达打破了细胞中蛋白质的稳态平衡,YB-1结合CCT/TRiC蛋白质分子伴侣复合物成员CCT4 mRNA的5′UTR促进其翻译,CCT4进而促进mTORC1和mTORC2共同组分mLST8的蛋白质折叠,使其免于被溶酶体降解,从而激活mTORC1和mTORC2信号转导途径。此外,我们还发现,YB-1蛋白可以结合自身mRNA的5′UTR促进翻译,构成了一个自身激活的正反馈通路。我们还根据前期对YB-1-RNA相互作用的鉴定设计了带有YB-1结合基序的RNA寡核苷酸,发现这类竞争性寡核苷酸可以通过靶向YB-1抑制CCT4/mLST8/mTOR轴激活,有效地减少了神经胶质母细胞瘤干细胞的自我更新和增殖,延长了小鼠存活时间,为今后靶向YB-1及其下游mTOR通路的临床应用提供了策略[44]。除了YB-1外,冷休克家族成员LIN28也是一个重要的肿瘤干细胞干性维持因子。LIN28主要通过阻断具有抑癌功能的let-7 miRNA的生成促进肿瘤的进展和转移[45]。综上所述,以冷休克家族成员为例,我们描绘了RBPs结合RNA靶标并在多个基因表达层面调控了关键RNA靶标的表达,在多种肿瘤中发挥促癌的作用。3.3 RNA修饰酶在肿瘤中的作用
近些年,大量RNA修饰被系统地发现和鉴定,尤其是在mRNA上检测到了成千上万个RNA修饰位点,它们可以发生动态、可逆的修饰变化,为基因表达提供了一个新的调控方式。RNA修饰的发生是在一系列相关修饰酶的参与下完成的,如m6A修饰主要是由“writer”甲基转移酶METTL3/METTL14写入和“eraser”去甲基化酶FTO、ALKBH5擦除完成的一个可逆的化学修饰。m6A修饰还可以被一些称为“reader”的RBPs识别,主要包括含有YTH(YT521-B homology)结构域的蛋白:YTHDC1/2和YTHDF1/2/3。mRNA内部的m7G和tRNA上的m7G46修饰是由甲基转移酶复合物METTL1/WDR4催化完成的[46]。QKI蛋白是第一个被发现的结合mRNA内部m7G修饰的RBPs[47]。RNA修饰的writers、erasers和readers蛋白在肿瘤中表达发生变化,具有促癌或抑癌的作用。Paris等[48]发现,YTHDF1通过促进树突状细胞中溶酶体蛋白酶mRNA的翻译进而抑制树突状细胞的抗原呈递能力。在树突状细胞中特异性敲除YTHDF1后,小鼠表现出更强的抗肿瘤免疫应答能力。值得注意的是,一些修饰酶在不同肿瘤类型中的功能是截然不同的,如METTL3在急性髓性白血病中高表达,通过上调MYC促进肿瘤细胞增殖[49];然而,在子宫内膜癌中,METTL3通过抑制AKT信号通路减少细胞增殖[50]。总之,这些研究提示了RNA修饰酶及其相关蛋白有可能成为理想的肿瘤治疗靶点。3.4 RBPs与非编码RNA相互作用在肿瘤中的作用
非编码RNA(non-coding RNAs,ncRNAs)被定义为一类无法翻译为蛋白质的转录本,主要包括微小RNA(microRNAs,miRNAs)、长链非编码RNA(long non-coding RNAs,lncRNAs)、环形RNA(circular RNAs,circRNAs)等。随着它们被大量发现,很多研究显示RBPs结合ncRNAs决定了它们的命运和功能;而反过来,一些被结合的ncRNAs也可以调控RBPs的功能。因此,ncRNAs与RBPs之间形成的高度动态的相互作用网络在肿瘤的发生发展中起到关键作用[51]。MiRNA是一类长度为20~22 nt的短链ncRNA,它可以通过结合靶mRNA上的互补序列来调节RNA的表达。MiRNA的生物合成、稳定性以及靶向过程都受到RBPs的严格调控[52]。我们实验室发现,YB-1能够结合pri-/pre-miR-29b-2的末端环,并通过阻断Microprocessor和Dicer对其底物的招募来抑制miR-29b-2的表达,进而促进胶质母细胞瘤细胞的增殖[36]。此外,有研究表明,HuR可以结合到核仁蛋白NCL mRNA的3′UTR上,通过竞争保护mRNA避免其与负载了miR-494的miRISC相互作用来促进NCL的翻译,进而促进宫颈癌细胞的增殖[53]。LncRNA是一类长度大于200 nt、主要由PolⅡ转录生成的ncRNA。RBPs可以像调控mRNAs一样影响lncRNAs代谢的各个方面;反过来,lncRNAs可以作为RBPs的支架或向导,影响RBPs的稳定性和亚细胞定位等[54]。这些相互作用在肿瘤发生发展中均有体现。如lncRNA THOR能够与mRNP内的IGF2BP1相互作用,从而增加IGF2BP1下游MYC、KRAS等促癌基因mRNA的稳定性和翻译[55]。LncRNA-LET能够与双链RNA结合蛋白NF90相互作用从而破坏NF90的稳定性。NF90能够调控许多mRNA的稳定性、转运和翻译,其中包括HIF1α。LncRNA-LET的下调则会介导缺氧诱导的肝癌细胞迁移[56]。CircRNA是一类单链、共价、闭合的ncRNAs,通常由RNA反向剪接生成。CircRNAs可以直接与RBPs结合,作为RBPs的支架。CircCTNNB1在胃癌组织中表达上调,并且与胃癌患者不良预后相关。它可以结合DDX3并增强其与YY1转录因子的相互作用,导致YY1的激活,增强与β-catenin信号通路激活相关的下游靶基因转录,进而促进胃癌发生[57]。另外,circRNAs可以充当RBPs的分子海绵,在神经胶质母细胞瘤中,circSMARCA5充当了剪接因子SRSF1的分子海绵,过表达circSMARCA5导致SRSF1下游靶标VEGFA的剪接模式发生改变,从而抑制肿瘤血管生成[58]。综上所述,ncRNA研究是近年来的一个非常活跃的领域。许多研究显示,ncRNAs与RBPs之间的分子作用可以相互影响对方的功能。因此,认识肿瘤中它们之间作用网络的改变,可以为肿瘤的临床诊断与治疗提供新的靶点和潜在靶向手段。3.5 RBPs翻译后修饰介导的功能改变
蛋白质的翻译后修饰(post-translational modifi-cation,PTM)是指蛋白质生物合成后发生在氨基酸侧链的、可逆的共价修饰过程。目前已发现了400多种不同类型的PTMs,它们可以动态地调控蛋白质的活性、稳定性、定位和相互作用网络。发生在RBPs上最常见的PTM类型主要有磷酸化、泛素化、类泛素化(SUMOylation,SUMO)、乙酰化和甲基化等。例如,HnRNPA1是一个参与mRNA剪接、稳定性、出核、翻译、端粒维持和miRNA生物合成等过程的重要调控RBPs[59]。我们实验室曾发现,EGF信号通路诱导HnRNP A1的泛素化修饰,导致其结合RNA能力减弱,促进Rac1剪接异构体Rac1b的上调,从而促进细胞迁移[60]。RBPs上的PTMs可以互相影响。Chen等[61]发现,miRNAs作用途径中关键分子TARBP2在第52位赖氨酸残基上发生的SUMO化修饰、MAPK/Erk激酶引起的TARBP2蛋白磷酸化增加了它的SUMO化,而其SUMO化可以抑制K-48连接的多泛素化从而使TARBP2蛋白更加稳定。TARBP2的SUMO化促进细胞增殖与迁移,通过招募Ago2和加载pre-miRNA使miRNA/siRNA有效地发挥基因沉默的功能。综上所述,蛋白质翻译后修饰可以调节RBPs多方面的性质,丰富了RBPs功能的多样性,对基因的表达调控产生了重要影响。4 小结与展望
近些年,很多在本文中所描述的或没有提到的RBPs在肿瘤的各个主要特征过程中发挥了重要功能[60,62-70](图3),我们很容易联想到的一个问题是能否通过靶向RBPs达到治疗肿瘤的目的。过去很长一段时间,RBPs被认为是一类不能成药的蛋白质。然而,随着技术的不断革新,各种靶向RBPs的手段已经或正在被尝试进行肿瘤治疗。例如,与靶向其他基因类似的ASO、siRNA、mRNA、PROTAC等技术,这些方法旨在通过改变RBPs的表达达到抑制肿瘤的目的。此外,研究人员根据RBPs在RNPs中发挥功能的特点设计了研发方案,如通过小分子化合物、适配体或多肽阻挡RBPs与RNA靶标或者其他蛋白质之间的相互作用,以及利用circRNAs作为分子海绵吸附RBPs减少其与靶RNA的相互作用等。从这些药物研发的方案中,我们可以看出,发现肿瘤发生发展中受到异常调控的RBPs,阐明RBPs与RNA之间相互作用的分子基础,解析RBPs与RNA、其他蛋白质或生物大分子的作用网络以及揭示其在肿瘤中的功能机制对今后研发靶向RBPs的有效手段具有重要的临床意义。基金资助
国家自然科学基金项目(32071288,32271349);国家重点研发计划项目(2021YFA1300500,2022YFA1300020)
--核糖核酸功能与应用专刊--
中国科学院核糖核酸功能与应用重点实验室聚焦“RNA的功能与应用”重大科技问题,着力研究RNA时空调控核心规律、RNA相关重大疾病致病机制、RNA原创技术与高效应用等,志在建立前沿性理念驱动、通用型技术为底盘的研发体系。依托核心骨干团队与《生命的化学》杂志精心组织了本期专刊。专刊聚焦于“新型RNA”“RNA新功能”“RNA新应用”等三个重要方向。专刊面向生物医学科研人员、科技政策管理人员、本科生及研究生等,期望展现RNA基础研究的科学前沿、RNA生物医学技术应用的瓶颈以及重点实验室面向国家重大战略需求的科研布局。
详细内容请点击“阅读原文”
《生命的化学》创刊于1980年,中国生物化学与分子生物学会主办、向国内外公开发行的生物综合类学术期刊。月刊,中国科技核心期刊,中国期刊网来源期刊,科技期刊世界影响力指数报告(WJCI)(2021)来源期刊,被化学文摘(CA)(美)、日本科学技术振兴机构数据库(JST)(日)等国际数据库收录。重点刊登生物化学、分子生物学及生命科学相关领域原创性研究论文、综述,反映当前领域国内外最新研究进展,介绍最新研究技术与方法。设有研究论文、综述、教学、科普等栏目。电话:021-54922842/54921091
地址:上海市岳阳路319号31B-407
网址:www.life.ac.cn
投稿网址:http://smhx.cbpt.cnki.net/
欢迎来稿
更多精彩请关注公众号“生命的化学”
(ID:ChemLifeOne)