英文标题:QTL mapping of human retina DNA methylation identifies 87 gene-epigenome interactions in age-related macular degeneration发表期刊:Nature Communications
影响因子:14.7
发表时间:2024年3月
研究机构:NIH国家眼科研究所
涉及组学:illumina 935k DNA甲基化芯片(MethylationEPIC BeadChip)、转录组测序、Hi-C、ATAC-seq等
涉及算法:SMR、meQTL/mQTL、eQTL、eQTM等
摘要————
DNA甲基化提供了一个关键的表观遗传标记,将遗传变异与环境影响联系起来。本文作者对160例人类视网膜样本开展了DNA甲基化芯片、配套的转录组测序以及超过8M的遗传变异位点分析,揭示了Cis遗传调控位点(37,453个甲基化数量性状位点和12,505个表达数量性状位点)以及13,747个影响基因表达的DNA甲基化位点,其中超过三分之一是视网膜特异性的。
甲基化水平和基因表达数量性状位点并非完全的随机分布,这些数量形状位点主要富集在突触、线粒体和分解代谢相关的生物学过程。基于汇总数据的孟德尔随机化和共定位分析确定了87个靶基因,其中甲基化水平和基因表达水平的变化可能介导基因型对年龄相关性黄斑变性的影响。
整合通路分析揭示了免疫反应和代谢的表观遗传调控,包括谷胱甘肽通路和糖酵解。因此本研究定义了遗传变异驱动甲基化变化的关键作用,确定了基因表达的表观遗传控制的优先级,并提出了视网膜中基因型-环境相互作用调控黄斑变性病理的框架。
1、确定本研究的分析流程搭建概述
本研究设计了综合分析流程,整合人类视网膜多组学数据集,包括DNA甲基化、基因表达、基因型(如SNP等)、AMD-GWAS和Hi-C数据。
对160例死亡后产生的视网膜样本进行DNA甲基化芯片分析,经质控和协变量调整后,与基因型和转录组测序数据整合用于后续分析。
采用QTLtools进行cis-mQTL和cis-eQTL分析,同时应用SMR和多种共定位方法,如eCAVIAR、coloc和moloc,以探究遗传变异、DNA甲基化和基因表达之间复杂关系。
通过整合Hi-C数据中的染色质环、CREs和SEs等信息,为确定高置信度候选基因提供物理联系依据。
因此整个流程旨在全面揭示视网膜在正常和疾病状态下的分子调控机制,特别是与年龄相关性黄斑变性(AMD)相关的机制。
2、视网 mQTLs和eQTLs的特征
利用QTLtools对通过质控的749,158个CpG位点顺式(±1Mb)区域内的变异进行cis-mQTL分析,确定了大量显著的变体-CpG顺式-mQTLs及相关基因。通过条件分析检测到37,453个独立mQTL信号,多数CpG位点仅有一个独立信号,同时对视网膜中表达基因进行cis-eQTL分析,发现众多显著的突变-基因顺式-eQTLs及独立eQTLs。
对比发现,eGenes中较大比例有多个独立遗传效应,与CpG位点不同,且mQTL突变多聚集在CpGs岛附近,eQTL突变多聚集在相应基因的TSS附近,分布距离有差异。
多数CpG位点分布在TSS、5’UTR、gene body和intergenic区域,且显著mQTLs的CpGs在外显子边界和3’ UTR区域相对较少。
3、与eQTL相比,视网膜mQTL中的基因组特征和生物过程更加丰富
利用TORUS检测mQTL突变在功能基因组元件中的富集情况并与eQTL突变对比,发现视网膜mQTLs在编码区和转录调控元件中显著富集,如移码突变、开放染色质区域等,而eQTLs在影响剪接的突变中富集程度更高。
尽管移码突变中mQTLs高度富集,但此类相关遗传突变数量较少,同义突变、增强子和开放染色质区域的富集mQTLs数量较多。
GO富集分析发现,视网膜中可能受mQTLs调控的基因(mGenes)在细胞粘附、肌动蛋白丝组织等富集,如PARK7和MTOR等基因。与之相反视网膜eQTLs的靶基因(eGenes)在细胞外基质和内质网腔等细胞成分中富集。
综上表明,视网膜中遗传对CpG甲基化和基因表达的影响机制及相关生物过程存在明显差异。
4、视网膜mQTL的组织特异性
为评估视网膜DNA甲基化和mQTLs的组织特异性,将视网膜中的甲基化CpGs和独立mQTLs与脂肪、血液、子宫内膜、额叶皮层和骨骼肌中的数据对比,发现视网膜甲基化CpGs在额叶皮层中占比最高,mQTLs与骨骼肌和额叶皮层重叠比例最高。
确定了视网膜特有的13,458个mQTLs和5895个CpGs,其分布模式与所有视网膜甲基化CpGs相似,且在gene body周围分布为主,但是在外显子边界和3’ UTR区域较少。
视网膜特异性mQTLs与所有视网膜mQTLs在功能基因组元件中的富集情况相似,但在剪接供体(Spicing donor)突变中富集更强,可能对可变剪接异构体表达有更多遗传影响。
GO富集分析显示,视网膜特异性mGenes在突触发生和光感受器细胞维持等独特生物过程中富集。
5、人类视网膜中eQTM的识别
评估视网膜中CpG位点DNA甲基化与基因表达的关联,确定了13,747个显著cis-eQTMs(顺式基因表达数量性状甲基化位点),包含特定比例的独特CpGs和基因,且多数为蛋白编码基因,部分与mQTL和eQTL相关。
多数具有显著eQTMs的CpGs靠近靶基因TSS在特定区域富集,与显著mQTLs的CpGs分布相似,其靶基因在线粒体和翻译等相关GO中富集。
分析CpG甲基化对基因表达的影响,发现多数呈负相关,部分呈正相关。如特定CpGs与GSTT2B、ABCA1、NLRP2和ZNF232等基因表达的相关性。
结合ATAC-seq数据,发现多数eQTMs的靶基因与CpG甲基化正负相关,且部分与开放的染色质区域重叠。
观察到不同染色体上eQTMs分布不同,较小染色体(chr16/chr17/chr19)上相对较多。少数CpGs调控多个基因,主要在chr16和chr19号染色体上,且相关基因在分解代谢过程中富集。
chr16号染色体上相关基因在端粒维持调节中富集,chr19号染色体上相关基因在特定转录和RNA剪接调节及细胞蛋白分解代谢过程中富集。
这些结果揭示了视网膜中eQTMs的特征,包括数量、分布、与基因表达的相关性及相关生物学过程。
6、DNA甲基化遗传调控与基因表达之间的因果或多效关系
运用SMR(基于汇总数据的孟德尔随机化)分析探究视网膜中mQTLs与eQTLs在DNA甲基化和基因表达调控中的因果或多效性关系,进行E2M_SMR和M2E_SMR分析,并通过HEIDI测试区分模型。
E2M_SMR分析鉴定出众多关联,部分通过连锁测试,对应特定数量的eQTLs、mQTLs和基因。M2E_SMR分析也发现大量关联,其中部分通过测试,且效应大小正负相关比例不同,同时部分关联基因也是显著eQTMs。
两种SMR分析检测到部分共同关联,表明少数mQTLs和eQTLs间可能存在反馈调节机制,且DNAm对基因表达的遗传效应更主要,对比分析发现众多共同基因。
共同基因在谷胱甘肽代谢等通路及免疫和代谢相关过程中富集,以GSTM1为例阐述了其在两种SMR分析中的关联及与eQTM分析结果的一致性。
应用贝叶斯共定位方法coloc43对显著eQTL和/或mQTL(EM)突变进行分析,确定大量突变和基因的显著共定位(PPA≥0.8),其靶基因在嘌呤和嘧啶代谢通路中富集。比较coloc与E2M_SMR的EM结果,发现部分共同关联及对应基因,进一步验证了部分基因在遗传调控中的重要性。
这些结果有助于深入理解视网膜中DNA甲基化与基因表达的调控机制及相关分子关系。
7、SMR以及视网膜mQTL和eQTL的共定位优先考虑AMD基因座的致病基因
为探究DNA甲基化与AMD风险的关系,应用SMR分析视网膜mQTLs与AMD GWAS数据,并开发对应。
作者确定多个位点上mQTLs与AMD的显著关联,部分通过连锁测试,可能为多效性关联。同样利用SMR分析视网膜eQTLs与AMDGWAS,发现多个位点的关联,部分通过测试,且部分位点与之前eQTL研究结果一致,同时确定了新的关联位点和基因。
视网膜mQTLs和eQTLs在部分位点出现相同或新的AMD相关靶基因,如PILRB/PILRA位点的相关突变及基因表达关联,以及C2-CFB-SKIV2L和CFI位点的例子。
采用eCAVIAR方法检测视网膜mQTLs和eQTLs与AMD GWAS位点是否共享因果突变,发现部分位点存在显著共定位,确定了不同类型位点及相关因果基因数量。
具体位点中,部分仅mQTLs或eQTLs与AMD信号共定位,涉及多种基因,且在特定AMD位点上mQTL和eQTL同时与AMD信号共定位,相关基因可能通过影响表达水平发挥作用。
部分共定位基因在对应AMD位点尚未被确定为靶基因,以KMT2E/SRPK2位点为例阐述了mQTL与AMD的共定位及SMR分析对其因果效应的验证。
这些结果有助于确定AMD的潜在因果基因和突变,为深入理解AMD发病机制提供依据。
8、视网膜mQTL、eQTL和GWAS的共定位分析确定其他AMD基因
采用coloc43方法进行共定位分析,比较AMD GWAS与mQTL(GM)、AMDGWAS与eQTL(GE)以及mQTL与eQTL(EM),确定了多个AMD位点上GM和GE的显著共定位结果及相关基因和突变。
GM和GE共定位基因在免疫相关过程中富集,且分别检测到新的AMD关联,确定了相应的突变和基因。
采用moloc44多性状共定位方法分析AMDGWAS、视网膜eQTL和mQTL(GEM)信号,发现部分CpG位点和基因存在强共定位证据,其变异与DNA甲基化、基因表达和AMD相关。
部分显著共定位突变位于已知AMD位点,同时moloc分析提出新的AMD关联位点及相关突变和基因,如CNN2和C2-CFB-SKIV2L位点的例子。
比较不同分析中的CpGs和基因,发现GM与GME、GEM与EM、GE与EM之间存在部分重叠,且与SMR分析结果进一步对比,确定了共同的CpGs和基因。
共同的CpGs再Mapping到潜在靶基因(mGenes),主要在丙酮酸代谢和嗅觉信号通路中富集,总结了所有共定位和SMR分析结果。
这些结果有助于发现新的AMD相关基因和突变,为深入研究AMD发病机制提供更多线索
9、视网膜Hi-C数据整合分析提升目标基因筛选优先级
整合视网膜Hi-C数据中的染色质Loops、顺势作用因子(CREs)和增强子(SEs),再与mQTLs、eQTLs、eQTMs及其靶基因以及相关分析中的突变进行关联分析,以确定高置信度变体,发现多数mQTLs、eQTLs和eQTMs位于A compartment(代表转录活跃的染色质区域)。
分析Hi-C数据中的Loops与mQTLs和eQTLs突变及其靶基因的重叠情况,区分启动子和远端元件类型,确定了不同类型的mQTLs和eQTLs数量及与已知AMD位点的关联。对eQTMs进行类似分析,确定其与Hi-C环的重叠情况及不同类型的数量。
评估mQTLs、eQTLs和eQTMs与视网膜CREs和SEs的重叠,发现大量相关重叠,确定了不同类型的数量。
进一步整合Hi-C数据与靶基因及相关分析中的突变关联,在SMR分析中确定了特定AMD位点的靶基因。
eCAVIAR分析也确定了相关位点的靶基因,同时在E2M_SMR和M2E_SMR分析中确定了与其他基因相关的高置信度因果链接及关联。colocEM共定位分析确定了大量相关靶基因,且发现LPIN1基因的相关靶基因。
10、受DNA甲基化影响并与AMD相关的基因和通路
通过整合SMR、eCAVIAR、coloc和moloc在mQTL与AMD GWAS分析中确定的靶基因,锁定了87个受DNA甲基化影响的非冗余基因,其中部分位于已知AMD GWAS位点,部分为潜在新关联位点的靶基因。
这些基因通过GO以及Reactome富集分析后,发现大部分涉及多种生物学过程,如mTOR信号通路、RHOF GTPase循环、肌动蛋白细胞骨架重组和糖基化调节等。
相关阅读
干货!!肠道菌群+机器学习发现肿瘤相关生物标志物研究思路|机器学习专题
Gut:机器学习+DNA甲基化区别胰腺癌和慢性胰腺炎队列研究
本文系联川生物公众号原创文章,未经授权禁止转载,侵权必究! 扫描下方二维码 点分享
点点赞
点在看