在复杂疾病的研究中,DNA甲基化是一个关键的创新点,因为它是连接遗传学、环境因素和基因表达的关键桥梁。这种甲基化过程在不同物种中相对稳定,是表观遗传学中研究最广泛的标记之一。
具体来说,甲基化通常发生在CpG二核苷酸上,这可能导致基因表达的沉默,尤其是在增强子和启动子区域。相反,基因体内的甲基化往往与基因表达的增加有关。
因此,DNA甲基化的研究对于深入理解肿瘤的发生和癌症的转化机制至关重要,同时揭示了遗传与环境因素如何相互作用影响疾病的发展。
我们的目标是利用因果推理检验(CIT)和孟德尔随机化(MR)技术,试图阐明 DNA 甲基化、基因表达、遗传变异和疾病活动之间的关系。
在DNA甲基化研究的早期,我们主要依赖单一的SMR分析算法。现在,我们通过以下三步SMR分析方法来探索这一领域:
1.SNPs作为工具变量(eQTLs),氧化应激相关基因表达作为暴露,疾病作为结局。
2.SNPs作为工具变量(mQTLs),氧化应激相关基因甲基化水平作为暴露,疾病作为结局。
3.SNPs作为工具变量,甲基化水平mQTLs作为暴露因素,基因表达水平eQTLs作为结局因素。
我们的代码调整包括:对甲基化ID对应的SNP提取、去除连锁不平衡、以及不同算法的MR分析。以下是结果图展示:
SNP的森林图
MR分析结果
通过将甲基化数据融入传统MR分析,不仅增强了对因果效应的评估,还引入了新水平的多效性检验,进一步丰富了SMR和MR两种分析方法的结合应用.
研究为遗传学、环境和基因表达的交叉领域带来了新的分子途径。这对于研究者来说是一个全新的方向,它将促进我们对疾病发生和转化机制的更深入理解。大家看完有没有茅塞顿开,瞬间打开思路呢!没有思路、不知道怎么创新的小伙伴,来找小云,超多个性化的分析思路供你选择哦!
此外,小云也提供生信云服务器,拥有配置好的环境,不需要再额外花时间进行安装,并有专人维护,有需要的友友快来联系我吧。(孟德尔随机化需要的数据很多,各种菌群、表型、eQTL数据,这些数据动辄几十几百个文件,数据量都是几十G几百G,每次下载都非常麻烦。但是不慌,我们已经整理了很多数据(点击查看),您有需要可以直接联系技术老师要这些数据。)
定制生信分析
生信云服务器
(加微信备注99领取试用)
以下是部分代码展示:(完整的代码需要文末付费后获取)
library(data.table)
library(foreach)
setwd("C:\\Users\\step1")
all_dfd=fread("GoDMCmQTL.txt")
head(all_dfd)
all_dfd$cpg
cg="cg02534163"
mycg=all_dfd[all_dfd$cpg==cg,]
fwrite(mycg,file = paste0(cg,".txt"),sep = "\t",quote = F)
#循环提取
setwd("C:\\Users\\step1")
all_dfd=fread("GoDMCmQTL.txt")
head(all_dfd)
all_dfd$cpg
cglist=read.table("cglist.txt",header = F,sep = "\t")
cglist1=as.vector(cglist[,1])
foreach(i=cglist1, .errorhandling = "pass") %do%{
mycg=all_dfd[all_dfd$cpg==i,]
fwrite(mycg,file = paste0(i,".txt"),sep = "\t",quote = F)
}
以下开始收费展示