供稿:刘玮,武汉大学
校稿:余思宇,武汉大学
推送:余思宇,武汉大学
今天给大家分享的文献发表在Nucleic Acids Research上,标题为The impact of the embryonic DNA methylation program on CTCF-mediated genome regulation,通讯作者是巴黎西岱大学的Maxim V. C. Greenberg教授。
在哺乳动物胚胎发生过程中,5-胞嘧啶DNA甲基化(5meC)图谱和三维(3D)染色质结构都在“表观遗传重编程”的过程中被深刻重塑。在哺乳动物受精后发育的早期阶段,大部分配子5meC被清除;随后,在着床过程中,新生DNA甲基转移酶3A和3B (DNMT3A和DNMT3B)迅速建立了胚胎DNA甲基化图谱。这一时期被称为原始态-始发态(naïve-to-primed)多能性转变,发生在胚层形成之前。在哺乳动物细胞核中,染色质以层次结构组织,范围从多碱基染色体区域到更局部的顺式调控接触。有几种结构蛋白参与染色质组织,CCCTC结合因子(CTCF)是最具特征的一种。CTCF是一种锌指ZF蛋白,在哺乳动物中高度保守,可与基因组中数万个位点结合。而表观遗传重编程中5meC通量本身如何影响3D基因组仍未得到充分研究。在本研究中,作者使用小鼠胚胎干细胞(ESC)分化方案来模拟胚胎5meC动力学,分析了CTCF结合图谱,以探究胚胎DNA甲基化程序如何在动态系统中影响3D染色质结构。
1 DNA甲基化影响CTCF在少数位点的结合
在无血清培养基中培养的naïve ESCs,特征是低水平的DNA甲基化,会分化为上皮细胞样细胞(EpiLCs),诱导向引物多能性过渡。同时,作者使用了Dnmt1、Dnmt3a、Dnmt3b三敲除(TKO)细胞系。在naïve ESCs中,表现出极低的5meC水平:所有CpGs中<10%被甲基化(图1A,B)。作者在EpiLCs的野生型(WT)和突变体第4天(D4)中进行了CTCF CUT&RUN(一种用于研究染色质中蛋白质与DNA相互作用的高通量技术)。相比于TKO EpiLCs与naïve ESCs的相似性,WT和TKO EpiLCs的CTCF结合格局在整体上更为相似(图1C)。这说明细胞类型在决定CTCF占用率方面比DNA甲基化本身起着更重要的作用。大量的CTCF峰在TKO EpiLCs中特异性富集:66905个总峰中有748个(图1D,E)。通过分析全基因组亚硫酸盐(WGBS)数据,作者发现绝大多数TKO rich位点在WT中获得DNA甲基化(图1F)。此外,作者还检查了TKO特异性位点上CTCF结合基序内CpGs的DNA甲基化状态。CTCF核心结合基序可能包含许多CpG位点,这些位点已被证明在甲基化时影响CTCF-DNA的相互作用,其中JASPAR基序的第5位(CpG5)(图1G)在生化研究中表现出最显著的作用。这表明,局部染色质环境中的DNA甲基化,可能通过与甲基化敏感的DNA结合蛋白的相互作用,在形成CTCF结合图谱中发挥重要作用。随后,作者重点研究了含有CpGs的CTCF结合位点。与整体DNA甲基化模式一致(图1F),CTCF识别位点内的两个CpG二核苷酸(CpG5和CpG15)显示DNA甲基化富集(图1G)。
图1 CTCF在少数位点表现出潜在的5meC敏感性
2 三维基因组结构在DNA甲基化缺陷多能细胞中被整体保存
作者在WT和TKO ESCs和EpiLCs中对CTCF进行了Hi-ChIP(一种用于解析染色质构象的技术),Hi-ChIP数据集按细胞类型而不是基因型分组(图2A)。通过按细胞类型合并数据,ESCs中的总CTCF峰为117294个,而EpiLCs中的CTCF峰为121430个,增加了3.5%。接下来,作者对Hi-ChIP数据中那些将CTCF结合位点连接在一起的接触点进行了差异分析,发现876个ESCs特异性环路和1523个EpiLCs特异性环路(图2B)。这可能意味着细胞类型特异性基因调控程序得到巩固。
作者通过富集组蛋白H3赖氨酸27乙酰化(H3K27ac)标记的区域来评估增强子-启动子接触。与CTCF和转录组数据一致,H3K27ac图谱的细胞类型聚类比基因型更强(图2C),共识别出3802个ESCs特异性H3K27ac触点,以及1864个EpiLCs触点(图2D)。在ESCs和EpiLCs的标记基因中,它们不依赖于DNA甲基化状态,而H3K27ac富集的增强子-启动子接触发生了巨大的变化(图2E)。TKO EpiLCs中染色质结构的整体保存说明DNA甲基化对于产生naïve多能性是必不可少的。
图2 在WT和TKO背景下,染色质结构在EpiLCs分化过程中被重塑
3 TKO EpiLCs特异性CTCF环与离散位点的基因失调相关
作者使用更严格的阈值参数进行分析,在DNA甲基化突变体中发现了43个差异环,而只有两个环在WT型EpiLCs中富集(图3A)。CTCF介导的染色体折叠可以确保增强子与启动子接触,从而实现适当的基因表达,同时将启动子与异常的增强子相互作用隔离(图3B)。作者探究了从头DNA甲基化程序是否可以对CTCF依赖性基因控制产生影响,首先定义了所有的交互:CTCF-CTCF,CTCF-Other,H3K27ac-H3K27ac和H3K27ac-Other。作者发现大多数相互作用分别是CTCF-CTCF和H3K27ac-H3K27ac。从剩下的位点中,筛选出了四个值得进一步分析的候选位点:Csf1、Mob3b、Nrp2和Zdbf2。Csf1编码一种巨噬细胞刺激因子,该因子在小鼠组织中广泛表达,对维持组织特异性巨噬细胞群很重要;Mob3b是高度保守的单极纺锤体结合物基因家族的一部分,虽然蛋白质产物没有已知的酶功能,但它们被认为是支架蛋白,并且与许多人类疾病有关;Nrp2编码一种跨膜蛋白,该蛋白参与细胞骨架、血管生成和癌症进展的一系列信号通路;Zdbf2编码一种含有DBF4型锌指结构域的蛋白质,该基因在淋巴细胞中有印记和父本表达,但在胎盘中更随机地表达。在印迹的Zdbf2位点上发现了TKO EpiLCs中富集的最显著的差异CTCF环,差异环的存在与Zdbf2表达的降低相关(图3C)。
Zdbf2位点上的差异环锚定在位于Zdbf2启动子和上述四个增强子之间的CTCF结合位点上。在WT EpiLCs中,CTCF结合缺失,这与其结合位点5位5meC的增加相关(图3D)。在维持CTCF结合的TKO EpiLCs中,H3K27ac Hi-ChIP数据显示,与WT相比,TKO EpiLCs中Zdbf2启动子与上游增强子之间的相互作用较少(图3D)。这说明,与低甲基化naïve ESCs状态相比,Zdbf2启动子在分化的后期时间点上表达更高,表明与上游增强子的相互作用显著增加。
图3 在缺乏5meC的EpilCs中,CTCF环和启动子-增强子接触的一个子集被破坏
4 表观基因组编辑证实了DNA甲基化-CTCF拮抗作用
为了证明DNA甲基化本身会影响CTCF结合和下游调控缺陷,而不是间接的CTCF介导的作用,作者使用CRISPR/Cas9 SunTag/TET1系统进行了位点特异性DNA去甲基化。作者推测,持续的DNA去甲基化会导致CTCF结合增加,但是根据调控模式的不同,基因要么增加表达(如Csf1、Mob3b和Nrp2),要么抑制(如Zdbf2)(图4A)。结果显示,与对照相比,每个候选位点都有强大的靶向DNA去甲基化(图4B)。接下来,作者评估了CTCF结合增加时,局部基因表达是否会改变。在Csf1、Mob3b和Nrp2中,未观察到与模型一致的表达变化。在表观基因组编辑的Zdbf2位点上富集CTCF导致Zdbf2表达显著降低(图4C,D),与模型相吻合。
图4 胞嘧啶去甲基化导致Zdbf2位点CTCF结合增加
综上所述,本研究利用ESC到EpiLC的分化系统,在发育中的胚胎中使用表观基因组编辑来修饰染色质结构,揭示了DNA甲基化敏感的CTCF结合事件。本研究提供了一个全面的观点:胚胎DNA甲基化程序会影响染色质折叠,从而作为一种控制基因表达的手段。
文章编号:428
原文链接:
https://doi.org/10.1093/nar/gkae724
原文引用:
Ana Monteagudo-Sánchez#, Julien Richard Albert#, Margherita Scarpa, Daan Noordermeer, Maxim V.C. Greenberg*. The impact of the embryonic DNA methylation program on CTCF-mediated genome regulation. Nucleic Acids Res., 2024, 10.1093/nar/gkae724. (#为共同第一作者)