引言:从中心法则到基因表达的复杂景观
1970年,弗朗西斯·克里克在《自然》杂志上提出了分子生物学的中心法则:信息从DNA(基因)通过信使RNA(mRNA)传递到蛋白质。近50年过去了,中心法则依然成立,但它已不再是表达功能性分子唯一的机制。近年来,研究发现,我们的基因组被广泛转录,大部分DNA并非转录成mRNA,而是转录成大量的非编码RNA(ncRNA)。这些ncRNA不仅数量上超过了经典的编码基因,还在基因表达调控中发挥着重要作用,从而颠覆了传统的“基因”定义。
ncRNA根据其功能可分为持家型ncRNA和调控型ncRNA。前者包括核糖体RNA(rRNA)、转运RNA(tRNA)、小核RNA(snRNA)和小核仁RNA(snoRNA),它们在细胞生存的基本过程中发挥核心作用。后者则分为短链ncRNA和长链ncRNA,执行广泛的功能,其失调与多种病理状态,包括癌症密切相关。
在这片研究的热土中,近期University of Turin的Pier Paolo Pandolfi实验室在Cell Research杂志上发表了一篇综述论文《Coding, or non-coding, that is the question (编码,还是不编码,这是一个问题)》,引发了科学界的广泛关注。本文将带您走进这篇综述,揭示基因编码与非编码之间那模糊而神秘的边界。
编码与非编码的模糊界限
随着高通量测序技术的发展,人们发现基因组中存在大量的非编码转录本,但这并不意味着它们完全没有编码功能。通过多核糖体/核糖体分析和质谱分析,人们发现非典型开放阅读框(ORFs)可以翻译成肽段。因此,编码与非编码之间的二元分类变得越来越模糊。
双功能基因的实例
在基因表达的复杂机制中,有些基因既能产生编码产物(蛋白质),又能产生非编码产物(ncRNA)。这些双功能基因的例子揭示了基因表达的高度复杂性和多样性。例如,某些miRNA的前体不仅能通过经典的miRNA途径调控基因表达,还能翻译成具有功能性的肽段。另一些长链非编码RNA(lncRNA),如Xist和HOTAIR,除了在调控染色质结构和基因表达方面发挥作用外,也能翻译成肽段。
核糖体RNA和转运RNA的双重角色
核糖体RNA(rRNA)和转运RNA(tRNA)是传统的持家型ncRNA,主要参与蛋白质合成。然而,越来越多的证据表明,它们在癌症中也发挥着重要的调控作用。rRNA和tRNA不仅是蛋白质合成的核心组成部分,它们的异常表达还与肿瘤的发生和进展有关。
环状RNA的多功能性
环状RNA(circRNA)是一类由反向剪接产生的高稳定性RNA分子。它们不仅在转录水平上调控基因表达,还能作为miRNA的海绵,调控miRNA的功能。此外,某些circRNA还能翻译成功能性肽段,这进一步模糊了编码与非编码的界限。
双功能基因研究中的方法学挑战
研究双功能基因面临许多方法学上的挑战。传统的基因功能研究主要集中在编码基因上,而非编码RNA的功能研究则相对较少。随着高通量测序技术和质谱分析技术的发展,我们能够更全面地了解基因组的转录和翻译情况。然而,准确地鉴定和验证双功能基因的功能依然需要更先进的技术和更精确的模型。
癌症研究中的新机遇
双功能基因的发现为癌症研究带来了新的机遇。通过理解这些基因在癌症中的作用机制,我们可以开发新的诊断和治疗方法。例如,利用ncRNA的调控功能,我们可以设计新的抗癌药物,或者通过靶向特定的ncRNA来干扰癌细胞的生长。此外,某些ncRNA还可以作为抗癌疫苗的候选分子,为癌症治疗开辟新的途径。
双功能基因组位点表达mRNA和ncRNA
基因组位点被定义为双功能时,既可以视为编码(橙色),又可以视为非编码(蓝色),因为它们通过以下机制同时表达mRNA和ncRNA:a)ncRNA是可变剪接的产物,例如通过内含子的保留或替代剪接位点的选择生成;b)在反向剪接中,上游3′剪接受体与下游5′剪接供体连接,生成非编码环状RNA(circRNA);c)自然反义转录本(NATs)是从相对的DNA链转录的非编码RNA,根据与编码mRNA的重叠程度,NATs分为头对头(5′区域重叠)、尾对尾(3′区域重叠)和完全重叠;d)外显子组成的mRNA被翻译成蛋白质,而内含子则生成非编码RNA,如miRNA。这种ncRNA被称为“基因内的”,而其所在的编码基因被称为“宿主基因”。
双功能mRNA既具有编码功能,也具有非编码功能
图2展示了mRNA分子(中间)中三个可识别的区域:5′UTR(红色)、CDS(浅蓝色)和3′UTR(绿色)。(上方,橙色)mRNA主要是编码蛋白质的RNA分子:它们携带主要的开放阅读框(CDS),并且可能在5′UTR中包含一个短的上游开放阅读框(uORF)。(下方,蓝色)mRNA还具有非经典的非编码功能。5′UTR可以通过与蛋白质相互作用在顺式或反式中发挥非编码功能。CDS可以参与非编码的RNA-蛋白质或RNA-RNA相互作用。3′UTR可以在竞争性内源RNA(ceRNA)的概念下发挥非编码功能:由于存在miRNA识别元件(MREs),3′UTRs可以吸附miRNAs,从而解除与相同miRNAs共享MRE的ceRNA伙伴的沉默。
双功能ncRNA既具有非编码功能,也具有编码功能
图3展示了ncRNA的两大类:持家型ncRNA(上图)和调控型ncRNA(下图)。持家型ncRNA包括rRNA、tRNA、snRNA和snoRNA。调控型ncRNA根据长度进一步分类,短链ncRNA(<200 nt)包括miRNA(浅蓝色),长链ncRNA(≥500 nt)包括lincRNA(浅绿色)、伪基因RNA(PG,浅灰色)、自然反义转录本(NATs,见图1c)和环状RNA(circRNA,浅紫色)。miRNA的主要功能是非编码(蓝色),通过RISC复合物介导的mRNA降解或翻译抑制来进行转录后基因表达调控。lincRNA的非编码功能包括:通过表观遗传修饰进行染色质重塑、转录和剪接调控、吸附miRNA和蛋白质、以及蛋白质的翻译后修饰。PG的非编码功能可以与亲本基因相关或无关,包括吸附miRNA和蛋白质,以及通过endosiRNA进行mRNA降解。环状RNA可以仅由外显子(EcircRNA)、外显子和内含子(EIcircRNA)或仅由内含子(ciRNA)组成。它们通过吸附miRNA和蛋白质以及形成调节信号通路的circRNPs来发挥非编码功能。这些调控型ncRNA也可以翻译成小肽或蛋白质(ncPEPs,橙色),从而表现出非典型的编码功能。
双功能基因的编码和非编码产物的表达和功能具有复杂性
图4展示了这些产物的不同情景和调控机制。编码产物表示为通用的橙色蛋白,非编码产物表示为通用的蓝色ncRNA。基因表达可能在相同环境中共同发生,也可能在不同环境中分别发生。顺式调控机制中,蛋白和ncRNA可以正向或负向调控其源基因或相互调控。反式调控机制中,蛋白和ncRNA可以正向或负向调控下游效应器,这些效应器可以是二者共有的或各自不同的。
在癌症中,来自同一双功能基因的编码和非编码产物可能产生一致或不一致的影响
图5展示了这些组合的例子:编码产物和非编码产物均具有抑癌特性,如PTEN mRNA和其3′UTR吸附的致癌miRNA;编码产物为抑癌基因,而非编码产物为癌基因,如Zbtb7a的前体mRNA生成的Pokémon蛋白和致癌环状RNA circPOK;编码产物为癌基因,而非编码产物为抑癌基因,如AKT3前体mRNA生成的致癌蛋白AKT3和抑癌环状RNA hsa_circ_0017250;编码产物和非编码产物均具有致癌特性,如MCM7前体mRNA生成的致癌蛋白MCM7和致癌的miR-106b~25簇。从治疗角度来看,最佳策略是增强或恢复抑癌活性和/或抑制或阻断致癌活性,这对于产物作用一致的双功能基因更为有效,而对于产物作用不一致的情况,则可能无效甚至有害。
结语:解码基因表达的复杂性
通过对双功能基因编码和非编码产物的研究,我们揭示了基因表达调控的复杂性和多样性。这些双功能基因在癌症中的表现进一步展示了它们的重要性,不同产物的协调或不协调作用对癌症的发生和进展有着深远影响。了解这些机制不仅有助于我们更全面地理解基因组的功能,还为癌症诊断和治疗提供了新的思路和方法。未来的研究需要进一步探索这些基因的多重功能,以开发更有效的治疗策略,从而改善患者的预后。在这个不断发展的领域,科学的前沿在不断被拓展,我们期待更多突破性的发现。