IF-58.7/Nature Medicine | 基于DNA甲基化特征的肺腺癌脑转移预测模型：从组学数据到临床应用

文摘 2024-10-10 19:08 美国

✦

医学科研新动向

✦

Prediction of brain metastasis development with DNA methylation signatures

Nature Medicine

<脑转移>

研

究

背

景

脑转移（BM）是恶性肿瘤患者常见的并发症之一，尤其是肺腺癌（LUAD）患者中，其发病率高达30%以上，且与极差的预后相关。目前，BM的早期检测主要依赖影像学和临床症状，但这往往为时已晚，治疗效果有限。尽管近年来多组学研究揭示了肿瘤的异质性，尤其是The Cancer Genome Atlas (TCGA)提供了LUAD的分子特征，但由于缺乏与BM相关的随访数据，预测BM发生的生物标志物仍然十分匮乏。DNA甲基化特征在癌症诊断和预后中的潜在价值已逐渐被证实，研究表明，DNA甲基化可以用于预测肿瘤的发生和进展。因此，本研究利用大规模LUAD队列的DNA甲基化数据，构建并验证预测脑转移发生的模型，旨在为肺腺癌患者的个体化治疗提供可靠的早期预测工具。。

研究设计

研究设计：从346名肺腺癌患者中收集了402个肿瘤及血浆样本，分为发生脑转移和未发生脑转移两组，基于DNA甲基化特征进行建模。
DNA甲基化数据分析：使用Infinium MethylationEPIC BeadChip技术检测患者的DNA甲基化状态，分析差异甲基化CpG位点与脑转移发生的关联。
机器学习建模：使用梯度提升回归模型构建5年内脑转移风险的预测模型，并对独立的验证数据集进行模型评估。
生物标志物验证：通过液体活检技术分析血浆中的甲基化DNA，验证液体标志物对早期脑转移的预测能力。
蛋白质组数据整合：整合蛋白质组数据，探讨脑转移相关的差异甲基化基因与蛋白质表达的关系。

核心结果

1. 基于DNA甲基化的5年脑转移预测模型的构建与验证

图1a展示了本研究所采用的机器学习方法构建5年脑转移（BM）预测模型的流程。在LUAD发现集中（n=106）筛选出5,553个显著差异甲基化的CpG位点，并使用这些特征构建了梯度提升回归模型。在独立验证集（n=60）中，该模型有效区分了高、中、低风险组。图1b的Kaplan-Meier分析显示，模型的高风险组患者在5年内脑转移发生率显著高于低风险组（P=0.0031）。图1c中的单变量Cox比例风险模型进一步验证了甲基化风险评分对脑转移发生的预测效能（HR=5.65, 95% CI=1.85–17.2，P=0.0023）。

2. 甲基化模型与临床分期模型在脑转移预测中的对比

图2a展示了在多变量Cox模型中，甲基化风险评分在控制了临床因素（如TNM分期）后，仍显著预测脑转移的发生（HR=8.92, 95% CI=1.97–40.5，P=0.0046）。图2b显示了基于甲基化模型和临床分期模型的ROC曲线。甲基化模型的AUC为0.81，而临床分期模型的AUC为0.65，表明甲基化模型在脑转移预测中的准确性更高，差异AUC为0.16。

3. 整合甲基化风险评分与临床因素的5年脑转移预测nomogram模型

图3a展示了结合甲基化风险评分和临床因素（如TNM分期）的nomogram模型。该模型通过总评分计算患者5年内脑转移发生的概率。图3b的Kaplan-Meier分析显示，高风险组患者的脑转移发生率显著高于低风险组（P<0.0001）。图3c显示，nomogram评分在Cox比例风险模型中显著预测了脑转移的发生（HR=17.2, 95% CI=4.13–71.3，P<0.0001）。图3d展示了nomogram模型的时间依赖性AUC为0.82（95% CI=0.77–0.86），证明了模型的预测准确性。

4. 差异甲基化位点和蛋白质表达的关联

图4a展示了差异甲基化的CpG位点与蛋白质组变化的关联。甲基化和蛋白质组数据表明，发生脑转移的LUAD中，免疫相关通路的基因呈现低甲基化，而细胞相互作用相关通路的基因则高甲基化（P<0.05）。图4b通过基因集富集分析（GSEA）显示，脑转移患者中免疫途径显著上调，表明免疫反应在脑转移发生中可能起关键作用。

5. 基于血浆甲基化的液体活检检测脑转移

图5a展示了血浆甲基化特征用于液体活检检测脑转移的流程。通过对血浆DNA甲基化特征进行分析，图5b显示，该分类器在区分脑转移和其他脑病变（如胶质瘤、CNS淋巴瘤等）中的AUC为0.80（95% CI=0.68–0.93）。图5d进一步显示，血浆中的甲基化信号与肿瘤组织甲基化信号之间有显著的相关性，Spearman相关系数为0.62（P<2.2×10⁻¹⁶），表明该方法在非侵入性检测中具有高精度。

6. TCGA验证队列中甲基化模型的外部验证

图6a展示了甲基化预测模型在TCGA LUAD队列中的外部验证，Cox比例风险模型显示，甲基化风险评分可以显著预测远处转移的发生（HR=2.8, 95% CI=1.1–7.4，P=0.0391）。图6b展示了nomogram模型在TCGA队列中预测远处转移的时间依赖性AUC，AUC为0.78（95% CI=0.76–0.79）。此外，图6c展示了液体活检分类器在额外验证队列中的准确性，分类器能够以74.2%（95% CI=63.0–85.3%）的准确率检测脑转移。

小

结

本文研究了肺腺癌（LUAD）患者发生脑转移的预测，利用DNA甲基化特征构建了一个高精度的预测模型，并整合了临床因素，最终开发出一个全面的个体化脑转移风险预测工具。该研究为未来癌症个体化治疗提供了重要的理论和数据支持，同时也展示了甲基化特征在癌症预后和转移预测中的潜力。

创新点：本研究首次通过大规模LUAD患者的DNA甲基化数据构建脑转移预测模型，并在独立验证集中表现出较高的预测准确性，显示了甲基化数据在转移预测中的潜力。
关键结果：

甲基化风险评分能够显著区分高、中、低风险患者，并独立于临床因素进行脑转移预测（HR=8.92，P=0.0046）。
在验证集中，基于甲基化特征的预测模型的AUC为0.81，明显优于临床分期模型的AUC（0.65）。
血浆甲基化标志物在非侵入性液体活检中展示了高精度的脑转移预测能力（AUC=0.80）。

模型借鉴：该研究的思路可以为其他肿瘤转移风险的预测研究提供借鉴：

多组学数据整合：在本文中，DNA甲基化数据与蛋白质组数据相结合，揭示了脑转移的分子机制。这种多组学数据整合的方式可以应用于其他肿瘤或疾病的分子机制研究，帮助识别关键的生物标志物。
机器学习模型构建：本文通过梯度提升回归模型对甲基化数据进行建模，并结合临床数据进行校正。类似的方法可以应用于其他疾病的预测研究，尤其是需要结合组学数据与临床信息的场景。
液体活检技术的应用：利用血浆中的甲基化标志物进行非侵入性检测，是本文的一大亮点。

-END-

文字丨本人编写，如有补充，下方留言即可
（点击左下角“阅读原文”即可获取全文）

http://mp.weixin.qq.com/s?__biz=MzkzOTcyMzUyNQ==&mid=2247486143&idx=1&sn=f9571e8ea8a8aa491936686429079dce

医学科研新动向

每日分享-相关领域包括：MIMIC、NHANES、SEER、GEO、TCGA、CHARLS等公共数据库最新研究成果解读。深入剖析机器学习、生信分析与临床流行病学研究方法。

最新文章

IF-23.5 | 单细胞多组学整合揭示乳腺癌亚型分子调控机制

IF-21.2 | 脑功能连接、蛋白组与影像组数据整合揭示上额回与下颞回间分子网络在脑区功能连接中的调控机制

Nature Genetics | 炎症新靶点-CRISPR筛选揭示TNF mRNA的m6A修饰在巨噬细胞炎症调控中的关键作用

Nature Genetics | 肿瘤新靶点-基因组负担分析揭示肿瘤易感基因及稀有变异新靶点

IF-14.7/Q1 基于多组学整合分析的鸡腹部脂肪沉积及其肥胖与代谢相关遗传调控机制研究

IF-58.7/Q1 儿童与青少年肥胖相关脂质谱特征及其在心血管代谢风险中的潜在干预作用

Q1/14.4 | 深度生成模型预测新化学扰动对转录响应的影响以加速药物发现

Nature Medicine | 基于肥胖亚型划分的心血管代谢疾病精准风险预测：一种BMI-生物标记不一致性分析

2024新版TCGA转录组+临床数据R语言下载和整理

R语言完整代码下载2024新版TCGA数据库 miRNA数据

Nature正刊 | 单细胞多组学染色质重塑研究：BRD4在Cx3cr1+巨噬细胞与纤维母细胞非细胞自主通讯中对心力衰竭的调控

IF-14.7/Q1 血浆蛋白质组学与多基因风险评分结合提高结直肠癌个性化筛查和风险预测

IF-14.7/Q1 整合多组学与深度学习解析食管鳞状细胞癌的分子亚型及其预后关联

IF-14.7/Q1 多组学整合揭示脓毒性休克亚群差异：开发基于蛋白组学的个体化液体管理策略预测模型

IF-27.7/Q1 炎症性肠病中抗肿瘤坏死因子治疗的单细胞纵向图谱：细胞异质性、炎症机制及治疗反应的关键预测

IF-40.8/Q1 基于组学的研究揭示C. parakroppenstedtii分泌新型糖脂促进肉芽肿性小叶乳腺炎的发展

IF-31.7/Q1 赤松（Pinus densiflora）基因组组装及重测序揭示基因组进化与等位基因失衡机制

IF-14.7/Q1 多组学整合揭示脓毒性休克亚群差异：开发基于蛋白组学的个体化液体管理策略预测模型

IF-14.7/Q1 整合多组学与深度学习解析食管鳞状细胞癌的分子亚型及其预后关联

IF-8.5/Q1 MIMIC-IV-应激性高血糖比值与重症心房颤动患者全因死亡率关联的回顾性研

IF-21.2/Q1 基于单细胞RNA测序的人类小胶质细胞异质性分析-跨疾病亚型识别及其功能调控潜力

IF-14.7/Q1 血浆蛋白质组学与多基因风险评分结合提高结直肠癌个性化筛查和风险预测

IF-14.7/Q1 中国2010-2018年高空腹血糖相关心血管疾病负担的区域和年龄差异分析

IF-9.6/Q1 纯生信分析 | 酒精使用障碍对人类大脑基因表达的影响及潜在治疗靶点发现

顶刊级别的科研绘图技巧：配色如何提高科研影响力

IF-6.2/Q1 溴化阻燃剂暴露与慢性肾病及肾功能指标的关联研究：基于NHANES数据库的分析

IF-58.7/Nature Medicine | 基于DNA甲基化特征的肺腺癌脑转移预测模型：从组学数据到临床应用

IF-5.0 非肿瘤生信-凝血相关基因在急性心肌梗死中的诊断模型构建

IF-14.7/Q1 单细胞RNA测序揭示肝脏驻留Th1样细胞在原发性胆汁性胆管炎中的促炎作用及JAK/STAT抑制剂的治疗潜力

IF-21.4/Q1 全球控烟政策的比较：基于网状Meta分析的系统评价

IF-18.9/Q1 | 综合基因组与表型数据的血浆蛋白质组变异解析及其生物学调控因素

MIMIC-IV v3.0 数据库安装详解与步骤

IF-31.7/Q1 | 基因组研究揭示代谢综合征的共同遗传特征及其对多种健康的影响

IF-23.6/Q1 | 基于UK Biobank的蛋白质组分析揭示健康饮食模式可降低慢性疾病风险并延长寿命

R语言下载+处理GEO数据库基因表达数据

IF-12.4/Q1 | 基于自然语言处理（NLP）的ClinicalBigBird模型在麻醉ASA-PS评分分类中的优越性

IF-10.1/Q1 中老年人长期PM1暴露与认知的关系：来自CHARLS和UKB的证据

IF-9.4 | 孟德尔随机化识别心血管相关蛋白-基于UKB和中国Kadoorie生物样本库的证据

IF-5.8 | 基于MIMIC数据库的TabNet机器学习模型预测ICU心脏骤停

Q1/ IF-10.7 武汉大学中南医院队列+MIMIC IV：高血清镁水平增加脓毒症患者死亡风险

MIMIC IV+eICU+协和医院回顾性队列 | 基于预测模型的血压反应指数（BPRI）对脓毒性休克患者住院死亡率的预测分析

Q1/IF-7.7 纯生信分析DUSP6蛋白在脓毒症诱导的急性肺损伤中的作用

纯生信分析47天发Q1区7.7分 | 加权基因共表达网络分析+分子对接研究POU2AF1在肝细胞癌中的作用

生信-预后模型发6.1分 | M2巨噬细胞相关基因预后模型预测胃癌患者

IF-40.8/Q1 | 微生物在健康与疾病中的作用机制及临床转化

IF-23.5/Q1 | 中国高危前列腺癌患者的多组学整合分析揭示代谢脆弱性与潜在诊断标志物

孤独与多种疾病有关？孟德尔随机化+UK biobank五图一表拿下21.4分nature子刊！

Q1/ IF-8.2 生信+环境暴露-多氯联苯（PCBs）相关基因在前列腺癌中的预后模型构建

Q1/IF-12.2 生信+NHANES 48天发表 | 挥发性有机化合物暴露对青少年生长发育的影响

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉