2024年11月24日,南昌大学第一附属医院乐爱平教授团队在Biology Direct(IF=5.7)发表了题为“Machine learning-driven estimation of mutational burden highlights DNAH5 as a prognostic marker in colorectal cancer”的研究论文,该文章利用RNA-seq+WES-seq+机器学习,揭示DNAH5是结直肠癌的预后标志物(爱基百客为本研究提供了RNA-seq和WES-seq技术支持)。
1. 构建和评估机器学习驱动的TMB估计模型
该研究团队从南昌大学第一附属医院(FAHNU)收集了148名原发性结直肠癌(CRC)患者的肿瘤样本、相邻正常组织样本和外周血单核细胞(PBMCs),这些样本(FAHNU队列)用于通过联合分析RNA-Seq和全外显子组测序(WES-seq)数据来预测癌症新抗原(Fig. 1a)。整个模型创建和后续验证的流程图在Fig. 1b中展示。
Fig. 2 基于机器学习的TMB估计模型构建与评估
2. 20个基因TMB预测模型在CRC患者中的应用
研究者专注于使用Lasso模型构建一个基于20个基因的TMB预测模型,这个模型在预测TMB时显示出最佳结果(Fig. 3a)。这20个基因包括DNAH3, MUC5B, DNAH5等,它们被选为最优的Lasso基础TMB预测模型(Fig. 3b)。与著名的泛癌TMB预测panel(如MSK-IMPACT和F1CDx)相比,这个20个基因模型表现出明显的差异,只有少数基因与CRC突变负荷明确相关。这强调了泛癌panel在捕捉与结直肠癌特别相关的TMB相关基因方面的不足。在这个20个基因模型中,只有CREBBP和FAT1出现在其他泛癌panel中。
Fig.3 20个基因TMB估计模型构建与验证
3. 20个基因TMB模型与CRC患者预后的关联
研究者在三个数据集中评估了TMB与预后之间的关联,这些数据集总共包含超过1000名患者。研究发现,根据20个基因面板模型定义的高TMB患者展现出更好的总生存(OS)率(Fig. 4a)。此外,高TMB与良好的无进展生存(PFS)结果之间也存在显著关联(Fig. 4b)。研究者确定了PFS的理想截断点为274.06,这是由20个基因TMB模型确定的。在这个截断点下,患者的生存结果表现出最显著的差异。这个截断点将患者分为高TMB组(218名患者)和低TMB组(865名患者)(Fig. 4c)。与之前的研究一致,在TMB前20%的患者中存在显著的预后差异。
Fig.4 20个基因TMB和DNAH5突变预后作用
4. DNAH5突变对TMBhigh CRC患者预后的影响
通过多变量Cox回归分析,研究者发现DNAH5基因的突变是TMBhigh患者更有利的无进展生存(PFS)结果的独立预测因子。具体来说,一个或多个DNAH5突变的存在对应于0.40的风险比(HR),95%置信区间(CI)从0.19到0.87(Fig. 4f)。虽然有DNAH5突变的TMBhigh患者的总生存(OS)没有显著差异(Fig. 4g),但在考虑PFS时,被标记为TMBhighDNAH5mut的患者展现出最佳的生存率(Fig. 4h)。有趣的是,DNAH5突变的预后影响似乎仅限于TMBhigh患者。在TMB较低的患者亚组中,DNAH5突变对OS或PFS均无显著影响(Fig. 4d,Fig. 4e)。
Fig.5 TMB高且DNAH5突变的患者临床和基因表达特征
5. 20个基因TMB与肿瘤新抗原负荷(TNB)的关联
肿瘤突变可以产生多种抗原,但只有部分能刺激免疫反应。TNB衡量在特定基因组区域内产生的免疫原性抗原的数量。过去的研究表明,较高的TNB与接受免疫疗法的患者有更好的预后相关。在FAHNU和TCGA队列中,使用配对的RNA-seq和WES-seq数据分析了肿瘤新抗原。发现WES TMB和TNB之间存在强正相关。此外,基于20个基因面板模型估计的TMB与TNB也显示出明显的正相关(Fig. 6a)。IC50值小于50nM的新抗原被分类为高亲和力新抗原。WES TMB和基于20个基因面板的TMB都与高亲和力新抗原负荷(HTNB)显示出强相关性(Fig. 6b),表明20个基因面板模型是预测CRC患者新抗原水平的可靠工具。TMBhigh患者也有较高的TNB和HTNB(Fig. 6c)。值得注意的是,TMB、TNB和HTNB在TMBhighDNAH5mut患者中也显著增加(Fig. 6d-e)。分析显示,TMBhighDNAH5mut患者的CD8+肿瘤浸润性淋巴细胞(TILs)密度增加,表明有更活跃的免疫反应,这可能对预后和治疗策略有影响(Fig. 6f-g)。
Fig.6 20个基因TMB与肿瘤新抗原负荷相关
本文提出了一种基于20个基因的机器学习模型,用于在CRC患者中高效估算TMB。该模型不仅准确预测TMB,还与患者预后显著相关。特别是,DNAH5基因在TMBhigh患者中的突变与更好的预后相关,表明其在个性化治疗中的潜在应用价值。该研究为CRC的精准治疗提供了新的思路和工具。
项目咨询
运营至今合作的科研客户超2000家,涵盖国内知名科研院所、高校以及相关生物企业,科研成果曾多次在Science、Cancer Cell、Nature Communications、J HEMATOL ONCOL、Plant Cell 等国际高水平学术期刊发表,受到了客户广泛好评,是国内成长最迅速的高通量测序科研服务企业之一。
精选合集,欢迎收藏哟!