IF-58.7/Nature Medicine | 基于DNA甲基化特征的肺腺癌脑转移预测模型:从组学数据到临床应用

文摘   2024-10-10 19:08   美国  

医学科研新动向

Prediction of brain metastasis development with DNA methylation signatures

Nature Medicine

<脑转移>

脑转移(BM)是恶性肿瘤患者常见的并发症之一,尤其是肺腺癌(LUAD)患者中,其发病率高达30%以上,且与极差的预后相关。目前,BM的早期检测主要依赖影像学和临床症状,但这往往为时已晚,治疗效果有限。尽管近年来多组学研究揭示了肿瘤的异质性,尤其是The Cancer Genome Atlas (TCGA)提供了LUAD的分子特征,但由于缺乏与BM相关的随访数据,预测BM发生的生物标志物仍然十分匮乏。DNA甲基化特征在癌症诊断和预后中的潜在价值已逐渐被证实,研究表明,DNA甲基化可以用于预测肿瘤的发生和进展。因此,本研究利用大规模LUAD队列的DNA甲基化数据,构建并验证预测脑转移发生的模型,旨在为肺腺癌患者的个体化治疗提供可靠的早期预测工具。。

研究设计

  • 研究设计:从346名肺腺癌患者中收集了402个肿瘤及血浆样本,分为发生脑转移和未发生脑转移两组,基于DNA甲基化特征进行建模。

  • DNA甲基化数据分析:使用Infinium MethylationEPIC BeadChip技术检测患者的DNA甲基化状态,分析差异甲基化CpG位点与脑转移发生的关联。

  • 机器学习建模:使用梯度提升回归模型构建5年内脑转移风险的预测模型,并对独立的验证数据集进行模型评估。

  • 生物标志物验证:通过液体活检技术分析血浆中的甲基化DNA,验证液体标志物对早期脑转移的预测能力。

  • 蛋白质组数据整合:整合蛋白质组数据,探讨脑转移相关的差异甲基化基因与蛋白质表达的关系。

核心结果

1. 基于DNA甲基化的5年脑转移预测模型的构建与验证

图1a展示了本研究所采用的机器学习方法构建5年脑转移(BM)预测模型的流程。在LUAD发现集中(n=106)筛选出5,553个显著差异甲基化的CpG位点,并使用这些特征构建了梯度提升回归模型。在独立验证集(n=60)中,该模型有效区分了高、中、低风险组。图1b的Kaplan-Meier分析显示,模型的高风险组患者在5年内脑转移发生率显著高于低风险组(P=0.0031)。图1c中的单变量Cox比例风险模型进一步验证了甲基化风险评分对脑转移发生的预测效能(HR=5.65, 95% CI=1.85–17.2,P=0.0023)。

2. 甲基化模型与临床分期模型在脑转移预测中的对比

图2a展示了在多变量Cox模型中,甲基化风险评分在控制了临床因素(如TNM分期)后,仍显著预测脑转移的发生(HR=8.92, 95% CI=1.97–40.5,P=0.0046)。图2b显示了基于甲基化模型和临床分期模型的ROC曲线。甲基化模型的AUC为0.81,而临床分期模型的AUC为0.65,表明甲基化模型在脑转移预测中的准确性更高,差异AUC为0.16。

3. 整合甲基化风险评分与临床因素的5年脑转移预测nomogram模型

图3a展示了结合甲基化风险评分和临床因素(如TNM分期)的nomogram模型。该模型通过总评分计算患者5年内脑转移发生的概率。图3b的Kaplan-Meier分析显示,高风险组患者的脑转移发生率显著高于低风险组(P<0.0001)。图3c显示,nomogram评分在Cox比例风险模型中显著预测了脑转移的发生(HR=17.2, 95% CI=4.13–71.3,P<0.0001)。图3d展示了nomogram模型的时间依赖性AUC为0.82(95% CI=0.77–0.86),证明了模型的预测准确性。

4. 差异甲基化位点和蛋白质表达的关联

图4a展示了差异甲基化的CpG位点与蛋白质组变化的关联。甲基化和蛋白质组数据表明,发生脑转移的LUAD中,免疫相关通路的基因呈现低甲基化,而细胞相互作用相关通路的基因则高甲基化(P<0.05)。图4b通过基因集富集分析(GSEA)显示,脑转移患者中免疫途径显著上调,表明免疫反应在脑转移发生中可能起关键作用。

5. 基于血浆甲基化的液体活检检测脑转移

图5a展示了血浆甲基化特征用于液体活检检测脑转移的流程。通过对血浆DNA甲基化特征进行分析,图5b显示,该分类器在区分脑转移和其他脑病变(如胶质瘤、CNS淋巴瘤等)中的AUC为0.80(95% CI=0.68–0.93)。图5d进一步显示,血浆中的甲基化信号与肿瘤组织甲基化信号之间有显著的相关性,Spearman相关系数为0.62(P<2.2×10⁻¹⁶),表明该方法在非侵入性检测中具有高精度。

6. TCGA验证队列中甲基化模型的外部验证

图6a展示了甲基化预测模型在TCGA LUAD队列中的外部验证,Cox比例风险模型显示,甲基化风险评分可以显著预测远处转移的发生(HR=2.8, 95% CI=1.1–7.4,P=0.0391)。图6b展示了nomogram模型在TCGA队列中预测远处转移的时间依赖性AUC,AUC为0.78(95% CI=0.76–0.79)。此外,图6c展示了液体活检分类器在额外验证队列中的准确性,分类器能够以74.2%(95% CI=63.0–85.3%)的准确率检测脑转移。


本文研究了肺腺癌(LUAD)患者发生脑转移的预测,利用DNA甲基化特征构建了一个高精度的预测模型,并整合了临床因素,最终开发出一个全面的个体化脑转移风险预测工具。该研究为未来癌症个体化治疗提供了重要的理论和数据支持,同时也展示了甲基化特征在癌症预后和转移预测中的潜力。

  1. 创新点本研究首次通过大规模LUAD患者的DNA甲基化数据构建脑转移预测模型,并在独立验证集中表现出较高的预测准确性,显示了甲基化数据在转移预测中的潜力。

  2. 关键结果

  • 甲基化风险评分能够显著区分高、中、低风险患者,并独立于临床因素进行脑转移预测(HR=8.92,P=0.0046)。

  • 在验证集中,基于甲基化特征的预测模型的AUC为0.81,明显优于临床分期模型的AUC(0.65)。

  • 血浆甲基化标志物在非侵入性液体活检中展示了高精度的脑转移预测能力(AUC=0.80)。

  • 模型借鉴该研究的思路可以为其他肿瘤转移风险的预测研究提供借鉴:

    • 多组学数据整合:在本文中,DNA甲基化数据与蛋白质组数据相结合,揭示了脑转移的分子机制。这种多组学数据整合的方式可以应用于其他肿瘤或疾病的分子机制研究,帮助识别关键的生物标志物。

    • 机器学习模型构建:本文通过梯度提升回归模型对甲基化数据进行建模,并结合临床数据进行校正。类似的方法可以应用于其他疾病的预测研究,尤其是需要结合组学数据与临床信息的场景。

    • 液体活检技术的应用:利用血浆中的甲基化标志物进行非侵入性检测,是本文的一大亮点。

    -END-

    文字丨本人编写,如有补充,下方留言即可
    (点击左下角阅读原文”即可获取全文

    医学科研新动向
    每日分享-相关领域包括:MIMIC、NHANES、SEER、GEO、TCGA、CHARLS等公共数据库最新研究成果解读。深入剖析机器学习、生信分析与临床流行病学研究方法。
     最新文章