表观多组学|DNA甲基化相关基础知识

文摘   2024-05-27 18:35   江苏  

🔗单细胞测序🔗单细胞转录组高级分析🔗R包开发🔗源码拆解🔗测试🔗RNA-seq🔗其它生信分析🔗R语言🔗Python🔗环境配置🔗文献分享🔗一只羊的碎碎念

表观遗传学是研究不涉及DNA序列改变的情况下,通过化学修饰、染色质结构状态等方式,影响基因表达的现象。这些表观遗传变化可以受到环境因素的影响,并在细胞分化、发育和疾病发生中起着重要作用。对基因组功能的相关修饰主要包括对DNARNA、以及组蛋白等的修饰,这些修饰改变了染色质的局部电化学特性和构象,从而调节基因的转录活性。

  • 基因选择性转录表达的调控

    DNA甲基化

    基因印迹

    组蛋白共价修饰

    染色质重塑

  • 基因转录后的调控

    基因组中非编码RNA

    小RNA

    反义RNA

    内含子、核糖开关等

Part1DNA甲基化

生物的遗传信息主要贮存在 DNA 中,而 DNA 由 AGCT 四种碱基、核糖、磷酸基团等组成。DNA甲基化指的是DNA分子上的甲基基团(CH3)与胞嘧啶(DNA的碱基之一)结合的过程,最常见的形式是胞嘧啶 C 的第 5 位碳原子的甲基化,形成 5-甲基胞嘧啶(5mC),而在原核生物中最常⻅的DNA修饰方式则为N6-methyladenine (6mA),即腺嘌呤第6位氮原子甲基化修饰。CpG岛是基因组中一种特殊的DNA序列区域,其特点是富含CpG二核苷酸(胞嘧啶-C-鸟嘌呤-G-核苷酸对)。在哺乳动物的基因组中,CpG岛通常位于基因的启动子区域附近,是一种高密度的CpG二核苷酸聚集区域。

人类大约有 30 亿个碱基对,基因组中大约有 2800 万个 CpG 位点。这些 CpG 位点中,大约 60~80% 被甲基化,而在一些特定的区域,比如启动子,存在 CpG 位点富集的序列(CpG 岛)通常未被甲基化。但是在肿瘤细胞中,整体甲基化水平降低至 20~50%,与正常细胞相比,即可能有 10~60% 的 CpG 位点的甲基化状态发生了改变,也就是大约 280~1680 万个 CpG 位点。

DNA甲基化的发生机制

在正常情况下,CpG岛通常处于未甲基化状态,这有助于维持基因的正常表达。DNA甲基化转移酶(DNMTs)的作用下使CpG二核苷酸5’-端的胞嘧啶转变为5’-甲基胞嘧啶。DNA甲基化通常抑制基因表达去甲基化则诱导了基因的重新活化和表达。

Part2研究DNA甲基化的检测方法

目前常用的DNA甲基化检测方法是将待检序列中甲基化的胞嘧啶转化为其他碱基组成的变化。根据不同的实验目的,研究者已经开发了众多 DNA 甲基化检测方法。这些方法包括重亚硫酸盐转化测序(BS-Seq)、MeDIP-Seq、RRBS-Seq、WGBS、MBD-Seq、SMRT 等。在选择检测方法时,首先要考虑要检测整体的甲基化还是位点特异性的甲基化。

  • 甲基化特异性酶切Methylation-specific endonuclease-PCR:利用甲基化敏感的限制酶或DNA甲基转移酶来检测DNA甲基化。这些酶可以识别甲基化位点并作出特异性切割。

  • 甲基化芯片(Methylation Arrays):这种技术基于DNA芯片(microarray)平台,其中固定了大量的DNA探针,可以用来全面分析DNA甲基化的模式,包括高通量测定DNA甲基化位点的状态。

  • 全基因组亚硫酸盐测序(Whole Genome Bisulfite Sequencing):通过测序技术来检测DNA甲基化位点的状态,包括全基因组甲基化测序和特定基因或区域的甲基化测序。在WGBS中,DNA样品首先经过亚硫酸盐处理,这种处理可以将全基因组甲基化测序技术通过T4-DNA连接酶,在超声波打断基因组DNA片段的两端连接接头序列,连接产物通过重亚硫酸盐处理将未甲基化修饰的胞嘧啶C转变为尿嘧啶U,进而通过接头序列介导的 PCR 技术将尿嘧啶U转变为胸腺嘧啶T。而甲基化的胞嘧啶不受影响。接着,DNA样品被进行测序,测定每个碱基的甲基化状态。通过比较处理前后的测序数据,可以确定DNA中的甲基化位点,并进一步分析甲基化模式和水平。

Part3数据分析

甲基化矩阵数据

注释数据

甲基化矩阵中的DNA甲基化水平用beta值来表示,beta表示的是甲基化等位基因密度与非甲基化等位基因密度的比值,该值为[0,1]之间的连续值,0表示未甲基化,1表示完全甲基化,空值或NA值:没有检测到。

END


#

付费合集

#

推荐阅读

生信分析环境搭建

上游分析|植物gtf文件修改后进行上游分析

标准分析|分群注释全流程(实验原理、seurat标准分析流程、多样本整合、doublet分析、自动注释、批量差异分析、批量富集分析、添加注释样本分组信息、可视化)
标准分析|Read10X源码拆解
标准分析|自动获得QC阈值
标准分析|污染处理工具SoupX

注释|植物细胞marker的数据库
注释|自动注释小工具——SCSA

细胞分化|轨迹分析的基本概念1
细胞分化|轨迹分析的基本概念2
细胞分化|monocle1原理
细胞分化|解决monocle2报错
细胞分化|Cytotrace分析
细胞分化|使用VECTOR进行无监督发育方向推断
细胞分化|单细胞可变剪切分析全流程(基于velocyto.R)
细胞分化|不同scVelo模型
细胞分化|使用GeneTrajectory进行基因轨迹分析

富集分析|基于TBtools&R语言进行富集分析及可视化
富集分析|更新clusterprofiler包
富集分析|基因ID格式转换
富集分析|水稻富集分析
富集分析|植物组织特异性干细胞通路获取

可视化|Featureplot函数进阶
可视化|DotPlot函数进阶
可视化|给你的Dotplot添加聚类及其它统计信息

单细胞联合bulk|一文搞定R包Scissor

公共数据|EgdeTurbo下载CNCB数据
公共数据|不使用Read10x如何读取数据

#

关于我

分享内容:分子标记开发及种质资源鉴定、单细胞多组学数据分析、生信编程、算法原理、文献分享与复现等...

点个赞再走!


你好我是一只羊
个人号,内容主要涉及种质资源、分子标记开发及遗传多样性分析,表观遗传、编程语言在生物信息学中的应用、转录组、基因组、单细胞测序多组学数据分析等;其它更新平台:B站&小红书-一只羊做生信/捡羊毛的咩/生信小羊🐑
 最新文章