基因组不仅编码了基因,同时也编码了调控元件。这些调控元件可以划分为基于序列和基于结构两大类。G-四链体(G4)是一种在富含鸟嘌呤(G)的核酸中形成的四股链结构,近20—30年来逐渐受到科研界的关注。研究发现G4在转录,复制等细胞活动中起重要作用,并参与许多病理过程。可以说作为一种结构调控元件,G4结构是基因组学的关键组成部分。
G4结构由四段G-tract组成。例如人染色体端粒DNA的4个TTAGGG形成的G4是研究最多的G4结构。据报道人基因组中具有4段相邻 G-tract 的序列有37万之多,而且富集在转录起始位点两侧,说明它们与转录的密切关系。G4的研究历史可追溯至100多年前。历史上研究的G4基本上都是分子内的G4,即4段 G-tract 均来自一个DNA或RNA链(图1,1988年)。学术界对G4结构形式的认知主要来自体外实验。然而,体内环境与体外环境截然不同,了解活细胞中G4的真实生理结构和形成机制具有重要意义,也是一个挑战。
Dell'Oca MC, et al. (2024) Int. J. Mol. Sci. 25:3162.
衰老机制研究与转化应用厅市共建山西省重点实验室培育基地近期完成的工作发现在活酵母基因组上可以形成由 DNA:RNA共同组成的hybrid G4(hG4)(图2)。该研究利用聚合酶遇到G4时的暂停特性,以天然DNA复制中的冈崎片段(Okazaki fragment, OKF)作为探针,并结合其他技术,在全基因组尺度上检测到了hG4结构的形成。
该工作通过分析OKF 3’末端的停滞峰,揭示了基因组G4的若干新特征。首先,基因组中的一个GG tract即可形成hG4(图3左)。其次,即使一段DNA有四段相邻G-tract可以独立形成一个分子内DNA G4(dG4),它仍然更倾向于形成hG4(图3右)。三是酵母基因组中的 G4 位点数从传统的38个增加到了近60万个,增加了1.5万倍。基因组中大量的1段、2段、3段、原来认为不能形成G4的 G-tract,借助于来自RNA的G-tract也都可以形成G4。
这一工作揭示了过去长期被忽略但却又是基因组中的最优势的一种G4结构,在数量、结构形式、形成机制、分布和功能作用等方面带来了对基因组G4的全新认识。一至三段G-tract 也可以形成G4使基因组中的G4位点增加了数个数量级。这个特征解释了G4的逐步进化选择。hG4位点的数量之多,使hG4成为基因组中丰度最高的结构元件。G4中不同DNA:RNA的 G-tract比例,hG4与dG4结构间的竞争,极大丰富了G4的结构多样性和相关功能。特别是 RNA的参与将基于基因组G4结构的调控与转录密切偶联起来,揭示了对G4与转录的新特征。这项工作的完成还建立了一个在天然生理条件下检测G4形成及其结构形式的方法。审稿人认为这项工作是一个hG4方面的 groundbreaking study;为基因组的组织和调控open up new avenues;在G4领域具有far-reaching implications。
链接:
https://www.pnas.org/doi/10.1073/pnas.2401099121
文 | 任晨霞
初审 | 谭铮、王佳
复审 | 牛娜 王聃清
终审 | 崔红