Nat Genet:迄今最大规模的人类DNA甲基化QTL(meQTL)图谱

企业   2024-11-16 09:50   浙江  



英文标题:DNA methylation QTL mapping across diverse human tissues provides molecular links between genetic variation and complex traits

发表期刊:Nature Genetics

影响因子:31.7

发表时间:2022年12月

研究机构:芝加哥大学公共卫生学院

涉及组学:均源自于GTEx数据库,包括illumina 850k DNA甲基化芯片、转录组测序 等

涉及算法:mQTL、eQTL、eQTM等


摘要


人类实体组织中DNA甲基化(DNAm)的研究相对稀缺,而对DNAm进行组织特异性表征探索,对于理解DNAm在基因调控中的作用以及与复杂性状的相关性是非常必要的。

本文来自芝加哥大学公共卫生学院的研究人员利用DNA甲基化芯片,对来自GTEx项目的987个人类样本生成了迄今为止最大的DNAm图谱,这些样本代表9种组织类型和424个个体。

作者对甲基化数据和转录组数据的相关性(eQTMs)、跨组织的cis遗传调控(mQTLs和eQTLs)以及e/mQTLs与复杂性状的联系进行了表征。确定了286,152个CpG位点的mQTLs,其中许多甲基化位点(>5%)表现出组织特异性,并且在83种性状中发现了mQTL与2,254个不同的GWAS位点共定位。对于其中91%的位点,通过整合功能图谱(包括eQTMs)和/或eQTL共定位,确定了候选基因链接,但只有33%的位点涉及在同一组织类型中存在的eQTL和mQTL。

通过这种以DNAm为重点的整合关联分析,有助于理解人类组织中的分子调控机制及其对复杂性状的影响。


1、DNA甲基化及其与局部基因表达的相关性因组织和调控特征而异

运用TSNE降维聚类方法,揭示样本按组织来源的相似性及与转录组聚类的可比性。绘制跨组织的eQTMs,发现其倾向于组织特异性或多组织共享。DNAm-表达负相关在近端eQTM CpGs更常见。分析表明该模式在多组织中存在,证实其普遍性。

因此该研究为理解DNA甲基化与基因表达关系提供新视角。


2、cis-DNAm的遗传调控呈现组织特异性

绘制影响近端(±500 kb)的cis CpG位点DNAm的mQTLs,考虑非遗传因素拟合模型,作者拟合了每个组织的线性模型来解释非遗传性的DNAm变异,包括年龄、环境、抽烟等因素等替代变量。最终确定了显著的cis mQTL CpG位点(mCpGs)并联合模拟了跨组织的mQTL效应,以通过利用组织共享效应来提高QTL作图能力。

检测到大量mQTL CpG位点,组织共享效应明显(Spearman's rho>0.15,P <2.2×10-6)。此外这些组织特异性mQTLs在一些外部队列也得到了验证。

当匹配相应的 GTEx mQTL 组织或具有共享细胞类型的组织时,来自外部队列的mQTL效应大小显着更大(Wilcoxon 秩和检验P <1×10-6),并且相关性更强。

比较mQTL与eQTL模式,发现mQTL更易组织共享,效应大小与共享程度相关。

mQTL在基因调控区域分布有特点,在远端增强子等区域富集。对mQTL在TFBS富集分析,发现其与eQTL富集模式不同。


3、驱动DNA甲基化遗传调控的功能机制与基因表达不同

为了比较检测到的mQTL与eQTL的分子机制,作者整合了CpG岛、基因组功能元件和染色质状态的注释,在组织内和所有组织内进行了富集分析。发现mQTLs多位于转录不活跃(也就是eQTL不活跃)调控区域,与全基因组mQTL研究的结论相符。

与全基因组mQTL研究一致,已发表的多数研究称绝大部分mQTL位于基因组的静默区域(转录不活跃区域)。尽管eQTL和mQTL都在基因调控区中富集,但只有eQTL在CpG岛和基因转录本中富集,特别是在可变剪切和UTR区域。相反,检测到的mQTL不在CpG岛和基因时,基本都在远端增强子和绝缘子中强烈富集。二者在TFBS富集模式差异大,涉及不同转录因子。


4、DNA甲基化和基因表达的遗传共调控相对较少

由于mQTLs和eQTLs在基因组上富集特征不同,预期它们部分由不同因果变体驱动,通过e/mQTL共定位分析发现,可检测到的共定位比例适中。如上图所示,表明相当部分mQTLs与部分基因表达并无明显的组织匹配关联性。


5、DNA甲基化的遗传调控具有分子调控多效性特征

以卵巢中HOXD基因簇区域为例,展示遗传变异对DNAm的影响。大多数(78%)共定位的 eQTL-mQTL影响多个 mCpG,少数部分(28%)影响多个eGene。

多效性与卵巢特异性遗传调控相关,非卵巢特异性基因表达驱动。通过QTL-GWAS共定位,确定相关基因与卵巢癌风险关联。说明遗传变异可改变DNAm,影响基因表达和疾病风险。


6、遗传调控DNAm对复杂性状关联的广泛影响

尽管多数mQTLs对人类性状影响不明显,但已有研究表明少数mQTLs与人类表型相关,为探究其对性状影响并与eQTLs比较,进行了QTL-GWAS共定位分析,采用整合FDR<0.05的QTLs与83个GWAS数据集的方法,并考虑mQTLs Mapping能力和丰度特点进行处理。

共确定12,922个显著QTL-GWAS共定位,发现几乎所有(91%)GWAS数据中mQTL共定位比eQTL更丰富。

eQTL-和mQTL-GWAS共定位overlap程度适中,存在e/mQTL共享、mQTL独有和eQTL独有三种情况,且mQTL特定共定位在各性状组中比例均较大。

研究结果表明整合不同组织来源的多组学数据及考虑二级QTL信号,对识别遗传性状分子联系至关重要。此研究为深入理解mQTLs在复杂性状关联中的作用提供了依据,强调了综合分析多种因素的重要性。


7、DNAm的遗传调控有助于性状相关变异的精细定位和调控机制的表征

在mQTL特异性共定位中,发现卵巢特异性mQTL关联与TERT位点的乳腺癌GWAS信号共定位,虽TERT在正常人的组织表达较低但在肿瘤组织中表达较高,该位点有多种癌症风险相关变异,还发现与体重指数GWAS信号共定位的mQTL关联。

对于部分e/mQTL-GWAS共享位点,mQTL-GWAS关联在某些组织或独立QTL共定位中比eQTL-GWAS关联更优。以高血压相关的MYO9B位点为例,说明mQTL在反映GWAS关联方面可能比eQTL更优。

在与哮喘相关的EFEMP2位点中,GWAS与eQTLs和mQTLs的共定位有助于区分和表征多个独立潜在致病变异。

这些结果表明整合e/mQTL-GWAS共定位信号有助于精细定位性状相关变异并更好地表征复杂性状的分子机制。


8、性状连锁mQTL在性状相关组织中表现出分子调控多效性和富集性

通过分析各组织中mQTL-GWAS共定位比例,发现部分性状在特定组织中存在不成比例的共定位情况,与现有生物学知识相符,如血液相关性状与全血mQTLs、乳腺癌与乳腺mQTLs的关联,但某些不明显的组织关联可能需进一步探究。

许多影响性状的QTL通过分子调控多效性发挥作用,此前对mQTL-性状关联中的调控多效性研究不足。研究发现mQTL-GWAS共定位在调控多个mCpGs的甲基化突变中富集,且在涉及多个mCpGs和eGenes的性状共定位中也存在富集现象。

以HOXD位点为例,展示了mQTL调控多效性与复杂性状的关联。

结果表明具有调控多效性的mQTL更有可能影响复杂性状,且mQTL对复杂性状相关组织和病因研究有潜在价值,但需更大样本量和更广泛组织覆盖的mQTL目录进一步评估。


9、性状连锁mQTL优先位于调控区域并表现出甲基化水平降低

为探究影响mQTL对性状作用的DNAm特征,分析了性状相关mCpGs的DNAm水平及其与开放染色质区域的重叠情况,发现性状相关mCpGs在开放染色质区域富集,且e/mQTL共享位点比mQTL特异性位点富集程度更强,其DNAm水平低于无性状关联的mCpGs。

通常认为影响性状遗传基础的变异通过影响基因调控起作用,性状相关mCpGs在基因调控元件中富集,71%的此类mCpGs属于此范畴。

mQTL特异性共定位的mCpGs与e/mQTL共享共定位的mCpGs在基因调控区域分布不同。

e/mQTL共享共定位的mCpGs在远端增强子减少、在基因体元件区域、启动子和近端增强子富集,而mQTL特异性共定位的mCpGs在近端和远端增强子富集但不在启动子。

结果表明远端调控元件在DNAm对基因型-表型关联的影响中起重要作用,有助于深入理解mQTL与性状的关系。


10、性状连锁mQTL与功能注释的整合能够识别具有因果关系的候选基因

作者检测到大量的GWAS数据中与至少一个与mQTL共定位,但没有与eQTL共定位。

检测到许多与至少一个mQTL共定位但无eQTL的GWAS位点,为确定其候选因果基因,将mQTL特异性性状相关mCpGs与功能图谱整合,发现该组mCpGs在基因链接中富集,确定了包括已知和新发现的基因-性状关系,可确定1,129个GWAS位点的候选因果基因链接。

为进一步确定性状-基因链接,联合建模GWAS、mQTL和eQTL信号,利用61个来自不同组织和细胞类型的多情境eQTL图谱(包括诱导多能干细胞和刺激的免疫细胞)。

对于之前仅考虑GTEx匹配组织eQTLs时确定为mQTL特异性的位点,56%(824/1,461)可确定e/mQTL-GWAS共定位簇。

缺乏同一组织类型e/mQTL共定位的簇在较少eQTL情境中存在,可能反映特定时空的调控事件,如CLPTM1L和TERT的eQTLs与乳腺癌亚型GWAS信号共定位。

结果表明mQTL-性状图谱与功能基因组和多情境eQTLs图谱整合有助于确定性状相关候选基因,体现了这种整合分析的价值。

相关阅读


Nat Aging:机器学习构建新型DNA甲基化时钟来预测衰老


用户文章Plant J:降解组等多组学揭示水稻miRNA在愈伤组织形成中的作用


诺奖热点NC:骨髓miRNA增强脂肪细胞胰岛素信号并预防肥胖期间高血糖


诺奖热点NC:T细胞介导肠炎诱导miR-29a抑制Th1细胞活性

           


本文系联川生物公众号原创文章,未经授权禁止转载,侵权必究!


扫描下方二维码




点分享


点点赞


点在看



联川生物
一个提供科研入门学习资源、经验的平台。 分享前沿测序技术资讯、实用生信绘图技巧及工具。 发布高质量的科研论文精度、精炼科研思路。 我们的目标是持续提供“干货”,滋润您的科研生涯。
 最新文章