DNA甲基化的孟德尔随机化分析:揭示遗传、环境与疾病之间的深层关系

学术   2024-11-22 10:03   上海  

在复杂疾病的研究中,DNA甲基化是一个关键的创新点,因为它是连接遗传学、环境因素和基因表达的关键桥梁。这种甲基化过程在不同物种中相对稳定,是表观遗传学中研究最广泛的标记之一。

具体来说,甲基化通常发生在CpG二核苷酸上,这可能导致基因表达的沉默,尤其是在增强子和启动子区域。相反,基因体内的甲基化往往与基因表达的增加有关。

因此,DNA甲基化的研究对于深入理解肿瘤的发生和癌症的转化机制至关重要,同时揭示了遗传与环境因素如何相互作用影响疾病的发展。

 我们的目标是利用因果推理检验(CIT)和孟德尔随机化(MR)技术,试图阐明 DNA 甲基化、基因表达、遗传变异和疾病活动之间的关系。

在DNA甲基化研究的早期,我们主要依赖单一的SMR分析算法。现在,我们通过以下三步SMR分析方法来探索这一领域:

1.SNPs作为工具变量(eQTLs),氧化应激相关基因表达作为暴露,疾病作为结局。    

2.SNPs作为工具变量(mQTLs),氧化应激相关基因甲基化水平作为暴露,疾病作为结局。

3.SNPs作为工具变量,甲基化水平mQTLs作为暴露因素,基因表达水平eQTLs作为结局因素。

我们的代码调整包括:对甲基化ID对应的SNP提取、去除连锁不平衡、以及不同算法的MR分析。以下是结果图展示:

 

SNP的森林图

           

MR分析结果

通过将甲基化数据融入传统MR分析,不仅增强了对因果效应的评估,还引入了新水平的多效性检验,进一步丰富了SMR和MR两种分析方法的结合应用.

研究为遗传学、环境和基因表达的交叉领域带来了新的分子途径。这对于研究者来说是一个全新的方向,它将促进我们对疾病发生和转化机制的更深入理解。大家看完有没有茅塞顿开,瞬间打开思路呢!没有思路、不知道怎么创新的小伙伴,来找小云,超多个性化的分析思路供你选择哦!

此外,小云也提供生信云服务器,拥有配置好的环境,不需要再额外花时间进行安装,并有专人维护,有需要的友友快来联系我吧。(孟德尔随机化需要的数据很多,各种菌群、表型、eQTL数据,这些数据动辄几十几百个文件,数据量都是几十G几百G,每次下载都非常麻烦。但是不慌,我们已经整理了很多数据(点击查看),您有需要可以直接联系技术老师要这些数据。)

定制生信分析

生信云服务器

(加微信备注99领取试用)


以下是部分代码展示:(完整的代码需要文末付费后获取)

library(data.table)library(foreach)           setwd("C:\\Users\\step1")           all_dfd=fread("GoDMCmQTL.txt")head(all_dfd)all_dfd$cpg           cg="cg02534163"           mycg=all_dfd[all_dfd$cpg==cg,]               fwrite(mycg,file = paste0(cg,".txt"),sep = "\t",quote = F)           #循环提取setwd("C:\\Users\\step1")           all_dfd=fread("GoDMCmQTL.txt")head(all_dfd)all_dfd$cpg           cglist=read.table("cglist.txt",header = F,sep = "\t")           cglist1=as.vector(cglist[,1])           foreach(i=cglist1, .errorhandling = "pass") %do%{           mycg=all_dfd[all_dfd$cpg==i,]           fwrite(mycg,file = paste0(i,".txt"),sep = "\t",quote = F)}

以下开始收费展示

云生信学生物信息学
专注生信10余年,原创文章数千篇; 公号资料免费领,寻求服务找小云; 长期学习加关注,生信干货更不停。
 最新文章