供稿:刘玮,武汉大学
校稿:赵晨茜,武汉大学
推送:赵晨茜,武汉大学
今天给大家分享的文献发表在Nature Communication上,标题为Tumor detection by analysis of both symmetric- and hemi-methylation of plasma cell-free DNA,通讯作者是美国哥伦比亚大学欧文医学中心的张志国教授。
癌症是全世界主要的公共卫生威胁之一。早期发现肿瘤有可能改善癌症患者的预后,例如,肝细胞癌(HCC)在早期和局部阶段诊断时的5年生存率为34%,但在晚期和远处疾病诊断时则降至3%。因此,开发早期癌症检测方法至关重要。哺乳动物细胞中绝大多数DNA甲基化以对称的方式发生在CpG二核苷酸上。在DNA复制过程中,半甲基化的CpG二核苷酸(hemi-methylation,HM),由亲本链上的甲基化CpG和互补新生链上的非甲基化CpG组成,迅速转化为对称的和完全甲基化的CpG,以维持DNA甲基化模式。使用DNA甲基化模式训练的模型可用于肿瘤检测。已有研究发现人类胚胎干细胞中大约10%的CpG二核苷酸是半甲基化,且这些半甲基化区域(HMRs)可在多次细胞分裂中保持。但是其中存在于约10% CpG中的半甲基化模式尚未得到充分研究。
MeDIP-seq已用于分析DNA甲基化(5mC),作者将其与pA-Tn5转座酶相结合,开发了ssg-MeDIP-Seq(图1a),能够以特定链的方式分析DNA甲基化模式,从而检测对称DNA甲基化(SM)和半甲基化(HM)。利用该方法,作者首先分析了16个组织样本的DNA甲基化,其中8个来自肝脏肿瘤,8个来自其相应的邻近非肿瘤组织(Adj-NT)。通过对DNA甲基化块进行分析,作者鉴定出11930个高甲基化DMRs和12974个低甲基化DMRs(图1b)。这些DMRs与来自TCGA肝癌数据集被鉴定出的DMRs显著重叠(图1d)。这些结果表明ssg-MeDIP-seq程序可用于分析基因组DNA甲基组。
图1 ssg-MeDIP-Seq以链特异性方式分析基因组DNA的甲基化组
作者利用ssg-MeDIP-Seq对肝脏肿瘤样本及其匹配的Adj-NT中的半甲基化区域(HMRs)进行了分析,分别鉴定出192106和228575个HMRs(图2)。这些HMRs在SINEs、CpG岛、启动子和外显子的基因组区域富集最多,在卫星和内含子的基因组区域富集较少(图2c)。与其对应的Adj-NT相比较,作者在肝脏肿瘤DNA样本中鉴定出6864个DHMRs,其中包含2330个HM增加的区域和4534个HM减少的区域(图2d)。大多数肝脏肿瘤DHMRs(6562个中有4474个)不与DMRs重叠(图2e)。肝肿瘤样本中HM升高的DHMRs富集于SINEs、CpG岛、启动子和外显子的基因组区域,而HM降低的DHMRs富集于SINEs和CpG岛的基因组区域,但不富集于启动子(图2f)。作者分析了8个肝脏肿瘤样本中24904个DMRs和6864个DHMRs的双链甲基化密度,结果显示DHMRs是由一条DNA甲基化的变化引起的,而DMRs是由两条DNA甲基化的变化引起的。这些结果表明肝脏肿瘤DHMRs和DMRs可能是独立的生物标志物。
图2 使用ssg-MeDIP-Seq分析肝癌样本的DNA半甲基化
血浆细胞游离DNA(cell-free DNA,cfDNA)是肿瘤检测的潜在生物标志物。作者建立了可以分析血浆cfDNA甲基化组的方法——sscf-MeDIP-Seq(图3a)。该方法可以分析dsDNA(双链)、ssDNA(单链)和受损DNA在内的所有DNA分子的甲基组,重要的是,可以同时分析SM和HM。利用该方法,作者对10例肝脏肿瘤患者和10例年龄和性别分布相似的健康对照组的cfDNA生成的20个sscf-MeDIP-Seq数据集进行了深入分析,以了解sscf-MeDIP-Seq的性能以及cfDNA DMR和DHMRs的特性。与对照相比,作者在10个肝癌cfDNA样本中鉴定出2229个超甲基化和5002个低甲基化的cfDNA DMRs(图3b,c),这些 DMRs分别与ssg-MeDIP-Seq分析的肝肿瘤DNA高甲基化和低甲基化DMRs有显著的重叠(图3d中的“A”和“D”组)。这表明,sscf-MeDIP-Seq方法鉴定的肝肿瘤患者血浆cfDNA DMRs很可能反映了肝癌细胞中DNA甲基化的变化。
为了鉴定cfDNA DHMRs,作者还分析了8个未经过甲基化DNA免疫沉淀的DNA样本和10个肝肿瘤样本的cfDNA DHMRs,结果显示cfDNA DHMRs可能也反映了肿瘤DNA DHMRs,且来自肝癌样本的绝大多数血浆cfDNA DHMRs与相同样本的cfDNA DMRs不重叠(图3g),这表明cfDNA DHMRs也可以作为肿瘤检测的独立生物标志物。
图3 使用sscf-MeDIP-Seq程序分析血浆cfDNA甲基组
为确定sscf-MeDIP-Seq方法是否可以用于肿瘤预测,作者分析了三组血浆样本的cfDNA甲基组:肝脏(73例)或脑(97例)癌症患者和对照组(101例),共生成了271个sscf-MeDIP-Seq数据集。从中随机选择215个数据集(包括58个肝癌样本和77个脑癌样本)和80个对照组作为训练队列,训练GLMnet、随机森林或深度神经网络(DNN)的机器学习模型(图4a)。三种机器学习模型都准确地预测了验证队列中的样本(56个样本,包括20个脑癌样本,15个肝癌样本和21个对照样本),其中GLMnet模型表现出最好的性能(图4b-e),突出了机器学习预测和sscf-MeDIP-Seq数据集的稳定性。接着,作者结合DMR和DHMR模型来训练校准模型,结果显示基于DMR+DHMR的模型比单独使用DMR或DHMR的模型的预测精度略高(图4b-d)。使用基于DMR+ dhmr的模型识别脑癌、肝癌和对照样本的平均概率分别为0.72、0.75和0.76(图4e)。这些研究表明,sscf-MeDIP-Seq方法提供了一种独特的方法来分析cfDNA DMRs和DHMRs,可以在将来应用于肿瘤检测。
图4 使用DMRs和DHMRs以及机器学习模型进行多肿瘤检测
综上所述,作者开发了两种甲基化DNA免疫沉淀和链特异性测序(MeDIP-Seq)方法,分别用于基因组DNA(ssg-MeDIP-Seq)和血浆cfDNA(sscf-MeDIP-Seq)的甲基组分析。由此鉴定的DMRs和DHMRs不仅能够作为肿瘤生物标志物,且通过结合机器学习模型可以提高多种癌症检测的准确性。
文章编号:414
原文链接:
https://www.nature.com/articles/s41467-024-50471-1
原文引用:
Xu Hua#, Hui Zhou#, Hui-Chen Wu, Julia Furnari, Corina P. Kotidis, Raul Rabadan, Jeanine M. Genkinger, Jeffrey N. Bruce, Peter Canoll, Regina M. Santella, Zhiguo Zhang*. Tumor detection by analysis of both symmetric- and hemi-methylation of plasma cell-free DNA. Nat. Commun., 2024, 15(1): 6113.