导语
DNA甲基化是控制基因表达和染色质组织的基本表观遗传标记,因此为细胞身份和发育过程提供了一个窗口。目前的数据集通常只包括一小部分甲基化位点,并且通常是基于在培养过程中发生巨大变化的细胞系或包含未指定细胞混合物的组织。作者描述了一个基于深度全基因组亚硫酸盐测序的人类甲基组图谱,对来自205个健康组织样本的39种细胞类型的数千种独特标记进行片段水平分析。相同细胞类型的复制超过99.5%相同,证明细胞身份程序对环境扰动的稳定性。图谱的无监督聚类概括了组织个体发生的关键要素,并确定了自胚胎发育以来保留的甲基化模式。单个细胞类型中唯一未甲基化的基因座通常位于转录增强子中,并包含组织特异性转录调节因子的DNA结合位点。独特的高甲基化位点是罕见的,并且在CpG岛,Polycomb靶点和CTCF结合位点上富集,这表明在形成细胞类型特异性染色质环中具有新的作用。该图谱为基因调控和疾病相关遗传变异的研究提供了重要资源,并为液体活检提供了大量潜在的组织特异性生物标志物。
主要技术
WGBS
研究结果
1. 人类细胞类型的甲基化图谱
为了描述各种细胞类型的全基因组DNA甲基化,对来自137个供体的77个原代细胞类型的样本进行了WGBS。这些基因被仔细分类并定位到人类基因组。通过流式细胞分选、基因表达和DNA甲基化分析确定,平均样本纯度超过90%。所分析的细胞类型代表了大多数主要的人类细胞类型。205个甲基化组之间的相似性,细胞类型之间有明显的变化,作者试图识别特定细胞类型中差异甲基化的基因组区域,以阐明细胞类型特定的生物过程,定义细胞身份,并促进甲基化生物标志物的开发,以识别循环cfDNA片段的细胞起源。
2. 甲基化的个体间变异
甲基化模式在不同的个体中非常稳健。对于大多数细胞类型,0.5%或更少的细胞块在不同的供体中显示出50%或以上的差异,而在不同细胞类型的样本中显示出的差异为4.9%,说明了DNA甲基化主要由细胞谱系和细胞类型特异性程序决定,而不是由遗传或环境因素决定。
3. 甲基化记录了发育历史
虽然DNA甲基化模式反映了细胞的功能特性,但它们也可以用来追踪细胞的发育历史。为了识别早期祖细胞的后代共享的模式,作者计算了至少4个cpg块内的平均甲基化,并选择了在所有样本中显示变异性最高的块。然后使用一种无监督的凝聚算法对所有205个甲基化组进行了聚类,该分析系统地将相同细胞类型的生物样本进行了分组。这支持了细胞分离的可重复性,并表明每种正常细胞类型的三到四次重复足以推断其甲基化模式,用于实际应用,如生物标志物识别。该算法没有对相关的细胞类型进行分组,而且通常根据供体身份对样本进行聚类。这进一步强调了仔细纯化均质细胞类型的重要性,避免了混合细胞群。
4. 细胞类型特异性的甲基化标记物
将205个样本组织成39组特定的细胞类型,包括血细胞类型、乳腺上皮、肺上皮、胰腺内分泌和外分泌细胞、不同来源的血管内皮细胞、心肌细胞和心肌成纤维细胞等。重点关注由5个或更多cpg组成的差异甲基化块,这些cpg在一组细胞类型中未被甲基化,但在所有其他样本中均被甲基化,反之亦然。几乎所有区域(97%)在一种细胞类型中都未被甲基化,而在其他所有其他细胞类型中都被甲基化。然后根据靶细胞类型与所有其他样本的甲基化的绝对差异对这些差异区域进行了分类。
每种细胞类型的前25个差异未甲基化区域包含了一个由1246个标记组成的人类细胞类型特异性甲基化图谱。这些区域在特定的细胞类型中是独特的未甲基化的(平均甲基化13%),在所有其他样本中是甲基化的(平均甲基化91%),并且可以作为敏感的生物标志物,用于定量来自混合物中特定细胞类型的DNA的存在。这些标记物包括953个细胞类型特异性的未甲基化的位点,以及另外293个未甲基化的位点在少数相关的细胞类型中。
5. 人类细胞类型特异性调控图谱
作者分析了通过测序(ATAC-seq)、DNase I超敏位点测序(DNaseI-seq)和组蛋白修饰特异性标记的DNA可及性和染色质状态。单核细胞和巨噬细胞的前250个未甲基化标记物高度可及,在单核细胞中有H3K27ac和H3K4me1,而其他细胞类型的标记物在单核细胞中没有富集,其他细胞类型的标记物也有类似的结果。还发现了chromHMM增强子注释在细胞类型特异性标记上富集。这些发现与之前的研究一致,即组织特异性去甲基化与基因增强子有关。
为了进一步评估细胞类型特异性未甲基化区域的生物学重要性,作者研究了它们与转录因子(TFs)的关联,这些转录因子可能影响DNA甲基化,也可能以细胞类型特异性的方式结合DNA,这取决于甲基化和染色质。作者鉴定了每个细胞类型的前1000个未甲基化标记物,并使用HOMER39进行了基序分析,从而计算已知TF结合基序的富集情况。对于大多数细胞类型,顶部基序包括主调节因子和关键TFs。这种细胞类型特异性的未甲基化区域和TF结合基序之间的关联可以识别新的基因调控回路,并暴露在特定细胞类型中活跃的远端增强子。这突出了许多细胞类型的标志性基因,并提出了每种细胞类型的前25个未甲基化标记的假定靶点。这些发现进一步支持了这样一个原则,即特定细胞类型中未甲基化的位点可能是增强子,正向调节该细胞类型中表达的基因,通常控制邻近基因。然而,在特定的细胞类型中,与特定未甲基化的位点相邻的基因通常广泛表达于这种细胞类型之外。
为了生成每种细胞类型中假定的调节区域的目录,对每种细胞类型的所有样本进行了片段水平分析,独立于其他细胞类型。扫描了整个基因组,并确定了至少85%具有至少4个cpg的DNA片段未甲基化的基因组区域。这在分析的39个细胞类型组中确定了一组未甲基化的基因组区域,其中平均包括36111个区域。然后对这些区域进行了基因组特征注释,结果显示,平均56%的CpG岛重叠,46%位于启动子区域附近,44%的CTCF结合位点重叠,从而突出了未甲基化位点的调控和结构作用。
6. 细胞类型特异性的高甲基化位点
作者研究了那些在一种细胞类型中甲基化但在人体其他地方未甲基化的基因组区域。这些区域富集于CpG岛(38%的甲基化区域,而细胞类型特异性的未甲基化区域为1.7-2.7%),并在其他细胞类型中被H3K27me3和Polycomb标记。这些细胞类型特异性的高甲基化区域通常对基序富集不那么显著,只有大约3%的细胞类型特异性差异甲基化区域被高甲基化。
在汇集了所有细胞类型特异性的高甲基化区域后,发现了染色质调节因子CTCF的目标序列的强富集。这表明CTCF结合位点的DNA甲基化可能作为一个组织特异性的调控开关来调节其结合,并可能影响组织特异性。为了验证这一想法,作者比较了CTCF位点的DNA甲基化模式与特定组织中全基因组CTCF蛋白结合模式。特定细胞类型中甲基化的位点被富集为神经基因转录抑制因子re1沉默TF/神经元限制性沉默因子(REST/ NRSF)的靶点(P≤1×10-24),这在胰岛细胞的甲基化组中最为显著。虽然DNA甲基化尚未被证明会影响REST的结合或活性,但这一发现提出了一种可能性,即胰岛中REST靶点的甲基化可以允许独立于REST抑制的内分泌分化。
7. 片段级的甲基化组反褶积
作者开发了一种用于DNA甲基化测序数据的计算片段级反褶积算法,并使用每种细胞类型定义的前25个标记(共1246个标记)来研究从复合组织样本和cfDNA中获得的甲基组。
对于每一种细胞类型,作者采用留一的方法在白细胞读取中混合一个保留的样本,然后使用反褶积算法来推断混合物中的细胞组成。在浓度从0到10%不同的情况下重复了这个过程。如图6a所示,发现1246个标记(每个细胞类型的前25个)可以在大约0.1%的分辨率下准确检测来自给定来源的DNA,与基于阵列的方法相比,提高了近一个数量级。
利用来自23名健康捐赠者的WGBS数据估计了白细胞和cfDNA的细胞组成;99.5%的白细胞来源的DNA属于粒细胞、单核细胞、巨噬细胞和NK、T和B细胞,与典型的血细胞计数一致。健康受试者的cfDNA主要来源于白细胞:粒细胞(29.7%)、单核/巨噬细胞(20%)和淋巴细胞(3%)。有助于cfDNA的实体组织包括血管内皮细胞(6%)和肝细胞(3.1%),与之前的结果一致。
参考文献:
Loyfer N, Magenheim J, Peretz A, Cann G, Bredno J, Klochendler A, Fox-Fisher I, Shabi-Porat S, Hecht M, Pelet T, Moss J, Drawshy Z, Amini H, Moradi P, Nagaraju S, Bauman D, Shveiky D, Porat S, Dior U, Rivkin G, Or O, Hirshoren N, Carmon E, Pikarsky A, Khalaileh A, Zamir G, Grinbaum R, Abu Gazala M, Mizrahi I, Shussman N, Korach A, Wald O, Izhar U, Erez E, Yutkin V, Samet Y, Rotnemer Golinkin D, Spalding KL, Druid H, Arner P, Shapiro AMJ, Grompe M, Aravanis A, Venn O, Jamshidi A, Shemer R, Dor Y, Glaser B, Kaplan T. A DNA methylation atlas of normal human cell types. Nature. 2023 Jan;613(7943):355-364. doi: 10.1038/s41586-022-05580-6. Epub 2023 Jan 4. PMID: 36599988; PMCID: PMC9811898.
推荐阅读
本文为伯豪生物原创
欢迎转发朋友圈
转载请注明来自伯豪生物
咨询热线:17702139967
邮箱:market@shbio.com
发现“分享”和“赞”了吗,戳我看看吧