NC:GWAS+meQTL揭示DNA甲基化在欧洲和东亚人群中大体相同

企业   2024-12-06 17:33   浙江  



英文标题:Genetic control of DNA methylation is largely shared across European and East Asian populations

发表期刊:Nature Communications

影响因子:14.7

发表时间:2024年3月

研究机构:澳大利亚昆士兰大学、西湖大学等

涉及组学:illumina 450k DNA甲基化芯片 等

涉及算法:SMR 等



摘要


DNA甲基化是研究遗传调控在不同祖先群体间共享程度的理想特征,能够有效地提供了数十万个具有较大QTL效应量的模型分子特征。

本文作者在三个欧洲队列(n=3,701)和两个东亚队列(n=2,099)中研究了cis-DNA甲基化QTL(mQTL),以量化不同人群间遗传结构的异同。其中80,394个相关的mQTL(占具有显著mQTL的DNA甲基化的62.2%)在两个祖先群体中均显著,而28,925个mQTL(22.4%)仅在单个祖先群体中被鉴定到。mQTL效应量在不同人群中高度保守,mQTL发现的差异可能是由于相关变异的等位基因频率差异以及因果变异与检测到的SNP之间的连锁不平衡不同所致。

这项研究强调了不同祖先群体间遗传控制的总体相似性,以及祖先多样性在提高检测关联的能力和增强精细定位分辨率方面的价值。



1、cis-mQTL的鉴定

对三个欧洲队列(n=3701)和两个东亚队列(n=2099)开展研究,运用统一的分析方法进行cis-mQTL分析,确定严格的显著性阈值(p<10-10)和复制阈值(p<10-6),将每个DNA甲基化与上下游1Mb内的SNP进行回归,以最显著的SNP(先导SNP)作后续分析。

共在所有队列中鉴定出一定数量满足显著性阈值的DNA甲基化及相关SNP,其中部分在所有队列均显著,五个队列间重叠有限,这与样本量导致的统计功效有关。

样本数量与mQTL数量存在关联,不同队列样本量不同,鉴定出的mQTL数量也有差异,如欧洲队列样本量较大,鉴定出的mQTL数量相对较多。

通过特定方法评估队列间mQTL发现的相关性,考虑效应量估计的标准误差,计算不同队列间先导SNP效应的相关性。结果显示所有队列间相关性较高,同祖先队列间相关性更强,例如欧洲队列间相关性更强,东亚队列间彼此相关性更强。


2、基于祖先的mQTL Meta分析

在祖先群体内对队列结果进行Meta分析,众多DNA甲基化位点在至少一个祖先群体中有显著mQTL,部分在两个祖先群体中均显著,另有部分此前不显著的探针变得显著。

比较不同祖先群体中mQTL的特征,如先导SNP与DNA甲基化位点间的中位距离相近,且在cis-mQTL中,遗传变异与探针为带你距离和显著性关系在不同祖先群体中相似。

与遗传变异相关的DNA甲基化位点在欧洲和东亚人群中与不同数量的SNP相关,反映了附近变异间的连锁不平衡(LD)情况。

为探究祖先群体间mQTL发现的一致性,分别根据P值确定先导SNP,评估其效应量相关性,发现相关性较强。

成对相关性估计值与不同祖先队列间情况相符,具体数据如欧洲(rb_EUR = 0.85,标准误=0.002),东亚(rb_EAS = 0.91,标准误=0.001)。


3、跨祖先群体共享的mQTL

构建在两个祖先群体中均严格显著的mQTL集合,提取相关信息后发现考虑标准误差时,祖先群体间SNP效应高度一致(rb_EUR =  0.92,标准误0.001), rb_EAS ==0.94,标准误=0.001)。

将本研究结果与已发表的研究比较,大量共有DNA甲基化位点在本研究的两个祖先群体中同样显著,体现了一定的一致性。

通过比较区域LD为共享遗传关联提供证据,部分DNA甲基化位点在祖先群体间有相同或强LD的先导SNP,或有重叠LD块(见图3b)。

对于其余在两祖先群体均显著的mQTL,通过条件mQTL分析发现部分存在多个独立SNP,进而确定有假定共享遗传关联的比例。

综合各项分析,多数在两祖先群体均显著的mQTL有共享遗传关联证据,具体数据表明其比例较高。


4、跨祖先群体的精细定位

利用祖先群体间LD结构差异量化跨祖先精细定位分辨率提升,采用SuSiE和SuSiEx方法,利用1000G欧洲和东亚参考人群的LD信息进行精细定位。

对比单祖先和跨祖先精细定位的95%可信集大小,跨祖先精细定位使欧洲和东亚样本的可信集大小显著减少。

以DNA甲基化位点cg09192572为例,展示跨祖先精细定位在分辨率上的改进,单祖先和跨祖先精细定位得到的可信集大小差异明显。

模拟分析样本量增加对可信集大小的影响,以确定跨祖先精细定位分辨率提高的原因,比较不同样本量变化的效果。

结果表明跨mQTL位点精细定位分辨率提升主要源于群体间LD结构差异,增加欧洲样本量的效果不如增加东亚样本。


5、祖先特异性mQTL鉴定

确定祖先特异性mQTL并分类,排除部分干扰情况后明确其数量及在不同祖先群体中的比例,评估各祖先群体中仅由单个队列驱动的mQTL比例(见图S5)。

探究祖先特异性mQTL异质性来源,包括等位基因频率、LD和生物学因果效应差异,发现等位基因频率差异影响显著。

多数祖先特异性mQTL的先导SNP在另一祖先群体中频率极低,部分无法计算LD,可计算的部分中多数LD较弱。

评估另一祖先群体中先导SNP效应,发现部分可能在大样本下跨祖先复制,展示了祖先特异性mQTL的效用。

通过与多性状进行多效性关联分析,发现部分关联与等位基因频率有关,也存在在常见AF下的关联情况。






相关阅读



NC:机器学习构建小鼠DNA甲基化非线性年龄预测分类器

国自然2025热点——植物小RNA高分新宠phasiRNA

NC:翻译组+lncRNA测序揭示lncRNA编码小肽调控上皮细胞增殖

诺奖热点NC:T细胞介导肠炎诱导miR-29a抑制Th1细胞活性



本文系联川生物公众号原创文章,未经授权禁止转载,侵权必究!
扫描下方二维码


点分享


点点赞


点在看


联川生物
一个提供科研入门学习资源、经验的平台。 分享前沿测序技术资讯、实用生信绘图技巧及工具。 发布高质量的科研论文精度、精炼科研思路。 我们的目标是持续提供“干货”,滋润您的科研生涯。
 最新文章