真核启动子在募集转录机制和排除并定位核小体的能力方面具有相似的特性。最近的工作也强调了在CpG岛(CGIs)中,更普遍的是在人类和小鼠启动子中,G-四链体(G4)形成序列可能在细胞和体外的核小体排除中起关键作用。已经开发了各种实验技术来表征细胞中G4的形成。G4染色质免疫共沉淀(G4-ChIP)的最新发展已经能够识别启动子和其他地方的数千种G4形成基因组序列。然而,G4-ChIP高度依赖于BG4纳米抗体对G4识别的选择性,这可能会稳定体外的不稳定结构,从而引入潜在的偏差;而且很难将G4-ChIP应用于所有细胞类型,尤其是非癌原代细胞。因此,需要正交方法来鉴定在染色质环境中形成的G4。
该研究描述了“G4access”,这是一种与高通量测序相结合的不依赖于抗体和交联的方法,可以识别细胞中与开放染色质相关的G4形成序列(G4FS)。利用微球菌核酸酶(MNase)的序列优先性,在酶滴定后分离出富含G4的染色质组分。
首先,推断亚核小体片段可能在G4FS中富集,因为在启动子和基因组的其他位置观察到核小体缺失。第二,MNase同时具有核酸内切酶和核酸外切酶活性,并且据报道在G-伸展之前具有切割偏好性,而G4也对λ-核酸外切酶具有抗性。因此,我们假设G4s应该在低水平MNase消化靶向的基因组序列中富集。原理如图1所示。
经过初始设置和优化后,G4access产生细胞特异性的G4模式,信号富含于启动子和其他基因组位点的可及染色质。之后使用多项大规模体外试验验证了大部分G4access序列形成G4结构的能力(图2)。
富集的G4access基因座不仅与开放染色质存在联系,还与重新定位的核小体和起始/暂停RNA聚合酶II(Pol II)紧密相关。然而,G4access信号仅被转录抑制剂中度削弱,表明它们不依赖于活跃的转录。(图3)。
为了检验G4access识别G4动态变化的能力,使用siRNA敲除G4解旋酶DHX36和WRN,导致强含G4启动子的G4accesss信号特异性增加(图4)。
此外,将G4access应用于相互杂交的小鼠胚胎干细胞(mESCs)。如图5所示,增加的等位基因G4潜力与基因表达相关,说明印记控制区G4的形成和抑制性DNA甲基化是相互排斥的。之后进一步描述了G4形成和DNA甲基化之间明显的拮抗作用,为这一机制提供了一种可能的解释。
最后,将该方法应用于预测的G4(pG4)形成序列密度较低的其他物种的基因组,并始终发现与开放染色质相关,尽管程度低于哺乳动物细胞。