文章标题:Integrated multiomics analysis and machine learning refine molecular subtypes and prognosis for muscle-invasive urothelial cancer
中文标题:综合多组学分析和机器学习可改进肌层浸润性尿路上皮癌的分子亚型和预后
发表期刊:Mol Ther Nucleic Acids
发表时间:20230605
影响因子:6.5/Q1
研究背景
膀胱癌是最常见的尿路上皮癌,其中肌层浸润性膀胱癌(MIBC)往往进展迅速并发生转移,死亡率高。虽然免疫疗法在肌层浸润性尿路上皮癌(MUC)的治疗中已经取得重大进展,但仍有相当一部分患者未能从中获益,这可能是由于MUC患者具有明显的异质性,而分子亚型可能有助于解决这一问题,因此亟待利用大规模多组学数据和先进的机器学习算法来确定生物标志物以为MUC患者进行有效的疗效预测。
研究方法
使用计算管道使用 10 种聚类算法合成来自 MUC 患者的多组学数据,然后将其与 10 种机器学习算法相结合,以识别高分辨率的分子亚组并开发稳健的共识机器学习驱动特征 (CMLS)。
研究结果
1.MUC 的多组学共识预后相关分子亚型
选出mRNA, lncRNA, miRNA, 基因组突变以及甲基化组中变异程度最大的1500个基因,随后使用单因素cox回归筛选出预后相关基因作为候选基因(突变信息根据突变频率筛选)。接下来使用10种多组学聚类方法将MUC患者分为3个亚型,然后进一步使用基于10种机器学习算法的99种算法组合选出最能准确预测免疫治疗队列患者生存的CoxBoost+Stepwise Cox组合,使用该组合构建CMLS,从而全面评估其与预后,免疫治疗反应,肿瘤免疫微环境以及药物治疗反应之间的关系。
2.MUC 整合共有分子亚型的分配
MUC 的大多数分子亚型是根据分子表达水平进行分类的,可能与特定的生物学功能有关。因此,我们还尝试探索这些 CSs 的不同分子特征。单样本基因集富集分析 (ssGSEA) 算法测量了样本中不同分子特征的富集。
3.CMLS 的发展
我们进行了单变量 Cox 回归分析,从共有基因 IMvigor 210 队列 (IMvigor)-MUC 、癌症基因组图谱 (TCGA)-MUC 和 META-MUC 中筛选出 32 例表达与 OS 显著相关的 SPRGs。随后,SPRG 被包含在集成框架中以执行 CMLS。
4.MUC 预后特征的比较
随着下一代测序技术的出现,近年来广泛报道了许多基于基因表达的预后特征。为了能够全面比较 CMLS 和其他特征,我们对过去 5 年内发表的相关文献进行了系统检索,并最终将 22 个不同的特征纳入我们的研究。
5.与 CMLS 相关的免疫特性
采用免疫肿瘤学生物学研究 (IOBR) R 包,我们对 MUC 的肿瘤微环境 (TME) 进行了全面分析,并观察到低 CMLS 患者的免疫细胞浸润水平(包括 T 细胞、B 细胞和巨噬细胞)显著高于高 CMLS 患者,表明免疫激活状态 。这些发现表明,以低 CMLS 水平为特征的 MUC 更有可能被归类为 “热肿瘤”。
6.CMLS 对免疫治疗反应具有出色的预测能力
与之前的许多研究不同,我们通过比较两组在 6 个月和 12 个月时的限制性平均生存期 (RMS) 来解释免疫治疗的延迟临床效果,同时评估治疗 3 个月后患者之间的长期生存差异 (p < 0.05)。较低的组显示出更好的预后结果,这表明免疫治疗的益处更大。
7.潜在治疗药物的筛选
高 CMLS 人群和低 CMLS 人群之间的预后存在显著差异,GSEA 还显示高 CMLS 患者血管生成、EMT、缺氧和其他途径显著激活。鉴于高 CMLS 患者对免疫治疗的反应不佳,我们使用癌症治疗反应门户 (CTRP) 和混合物中同时分析相对抑制 (PRISM) 来筛选高 CMLS 患者的潜在治疗药物。
文章小结
本研究通过多组学共识聚类确定了 MUC 的三种分子亚型,揭示了它们之间预后的显著差异,并可能完善 MUC 的分子分型。利用机器学习算法框架,我们定义了 CMLS,它在多个队列中表现出卓越的性能,可以稳健地预测患者的预后,同时证明与免疫治疗反应密切相关。鉴于在高 CMLS 组中观察到的预后不良和免疫治疗反应低,我们进一步探讨了达沙替尼和罗米地辛对该人群的潜在治疗益处。通过整合多组学数据和前沿计算算法,本研究为 MUC 患者的早期诊断和精准治疗提供了基础(对这种思路感兴趣的老师,欢迎联系小编!)