文献分享 | Nat. Commun.:整合多组学数据以识别与癌症风险相关的组织特异性DNA甲基化生物标志物

文摘   2024-10-29 20:41   湖北  

供稿:刘玮,武汉大学

校稿:胡秋霜,武汉大学

推送:胡秋霜,武汉大学



今天给大家分享的文献发表在Nature Communications上,标题为Integrating muti-omics data to identify tissue-specific DNA methylation biomarkers for cancer risk,美国弗吉尼亚大学公共卫生基因组学中心的Yaohua Yang教授和范德堡大学医学中心的Qiuyin Cai,Jirong Long教授是本文的共同通讯作者。



DNA甲基化在调节基因表达、维持基因组稳定性和建立细胞身份方面起着重要作用。异常的DNA甲基化模式,如整体低甲基化和基因特异性高甲基化,是癌症的标志。除环境因素外,DNA甲基化还受到遗传因素的影响。因此,解析组织特异性遗传预测DNA甲基化具有揭示复杂性状遗传易感性的潜力,包括癌症易感性。在本研究中,作者利用基因组织表达(GTEx)联盟的正常组织DNA甲基化数据和无癌供体的配对遗传数据,以确定与癌症风险相关的组织特异性DNA甲基化生物标志物,并破译其潜在机制。


作者从基因表达Omnibus(GEO)中获得了424名无癌GTEx受试者的987个组织样本的754054个CpGs,具体分析框架如图1所示。最终研究保留了来自367名受试者的856份样本,包括49个乳腺样本、189个结肠样本、47个肾脏样本、190个肺样本、140个卵巢样本、105个前列腺样本、47个睾丸样本、47个全血样本和42个肌肉组织样本。


  

图1 研究总体工作流程和样本来源


对于特定组织内的每个CpG位点,作者开发了两种预测模型,结果表明,跨组织预测模型的性能显著优于单组织预测模型。此外,作者使用相同数据构建了基于最佳甲基化数量性状位点(mQTL)的预测模型,该模型在预测精度(R值)方面不如跨组织预测模型(图2)


  

图2 两种模型的预测精度比较


作者将跨组织预测模型应用于相应癌症的全基因组关联研究(GWAS)数据,以鉴定具有遗传预测DNA甲基化水平与癌症风险显著相关的CpGs。作者共发现4248个不同的CpGs与至少一种癌症的风险显著相关,产生4461个CpG-cancer对,在4248个CpG中有4052个(95.4%)显示出与特定癌症类型特有的关联。通过共定位分析,发现在这4461对CpG-cancer对中,4210对CpG分布在先前GWAS鉴定的801个癌症易感位点中的453个(56.5%)位点上,而其余251对CpG分布在与GWAS鉴定的任何癌症风险变异至少有百万碱基距离的73个位点上(图3)。本研究在56.5%的已知GWAS基因座中发现了大量DNA甲基化可能介导癌症风险遗传效应的CpGs,揭示了55个假定的新基因座,并在52个已知GWAS基因座中检测到独立于GWAS识别的风险变异的关联信号。在本研究中发现的453个已知含有癌症相关CpGs位点中的143个(31.6%)中,在基于基因和剪接的全转录组关联研究(TWAS)中未发现任何显著的关联,这说明与TWAS相比,本研究方法在检测GWAS识别位点内关联信号方面更具有有效性


图3 基因预测的CpGs DNA甲基化与癌症风险的曼哈顿图


为了寻找与癌症相关的CpGs的潜在靶基因,作者使用相应组织的GTEx数据进行了表达数量性状甲基化(eQTM)分析。作者利用先前研究建立的基因表达模型和本研究中使用的癌症GWAS数据,对eQTM分析中发现的与癌症及CpGs显著相关的360个基因进行了分析,结果发现61个基因中有55个(90.2%)与乳腺癌相关,49个基因中有46个(93.9%)与结直肠癌相关,4个基因中有4个(100.0%)与肾细胞癌相关,68个基因中有64个(94.1%)与肺癌相关,38个基因中有31个(81.6%)与卵巢癌相关,127个基因中有105个(82.7%)与前列腺癌相关,13个基因中有13个(100.0%)与睾丸生殖细胞癌相关。通过整合CpG与癌症之间、CpG与基因之间以及基因与癌症之间的关联,作者发现了854个CpG-基因-癌症三联体。在每个三联体中,CpG-癌症、CpG-基因和基因-癌症的关系呈现一致的方向。这854个三联体涉及309个独特的CpGs,这些CpGs同205个不同的顺式基因和7个癌症相关,这表明这些CpGs的DNA甲基化通过调节这些基因的表达来影响癌症风险(表1,图4)


 表1 选定的CPG-基因-癌症三联体分析结果



图4 CpG-基因-癌症三联体的分析结果


综上所述,作者利用来自GTEx联盟的正常组织DNA甲基化数据和无癌供体的配对遗传数据,开发了一组性能优越的统计模型用于预测7种类型组织基因组中CpGs DNA甲基化,并将这些模型应用于癌症GWAS数据,识别了4248个与癌症风险显著相关的CpG位点,综合多组学分析揭示了854个CpG-基因-癌症三联体,揭示了DNA甲基化在癌症风险中的潜在调控作用。

文章编号:447

原文链接:

https://www.nature.com/articles/s41467-024-50404-y

原文引用:

Yaohua Yang*, Yaxin Chen, Shuai Xu, Xingyi Guo, Guochong Jia, Jie Ping, Xiang Shu, Tianying Zhao, Fangcheng Yuan, Gang Wang, Yufang Xie, Hang Ci, Hongmo Liu, Yawen Qi, Yongjun Liu, Dan Liu, Weimin Li, Fei Ye, Xiao-Ou Shu, Wei Zheng, Li Li, Qiuyin Cai*, Jirong Long*. Integrating muti-omics data to identify tissue-specific DNA methylation biomarkers for cancer risk. Nat. Commun., 2024, 15, 6071.



环境表观遗传学与暴露组学
核酸修饰研究相关文献分享
 最新文章