6.5/Q1,中国医学科学院北京协和医学院子宫内膜癌基于代谢途径的亚型:多组学分析和机器学习算法的综合研究

文摘   2024-10-07 17:40   海南  

今天小刀为大家分享的文章来自中国医学科学院北京协和医学院文章主题是子宫内膜癌作者通过多组学分析和机器学习算法开发出子宫内膜癌用于精准治疗的有用分子靶点,并构建了一个基于 13 中心基因的分类器来预测患者亚型发的杂志Molecular Therapy-Nucleic Acids(中科院2区,JCR1区,IF=6.5)。思路简单!老师们也可以通过这个思路找到疾病的相关性与其潜在参与的基因与通路~

文章标题:Metabolism pathway-based subtyping in endometrial cancer: An integrated study by multi-omics analysis and machine learning algorithms

中文标题:子宫内膜癌基于代谢途径的亚型:多组学分析和机器学习算法的综合研究

发表期刊:Molecular Therapy-Nucleic Acids

发表时间:202402

影响因子:6.5/Q1

研究背景

子宫内膜癌(EC)是女性生殖系统中第二常见的恶性肿瘤,因其基因组异质性而受到越来越多的关注,但对其代谢特征的了解仍然很少。

研究方法

通过全面的多组学分析(来自癌症基因组图谱 [TCGA] 的 RNA-seq 数据集、癌细胞系百科全书 [CCLE] 和 GEO 数据集;临床蛋白质组学肿瘤分析联盟 [CPTAC] 蛋白质组学;以及CCLE 代谢组学)开发用于精准治疗的有用分子靶点。采用无监督共识聚类将 EC 患者分为三个基于代谢途径的亚组 (MPS)。这些 MPS 亚组具有不同的临床预后、转录组和基因组改变、免疫微环境景观、以及化疗敏感性的独特模式。此外,MPS2亚组对免疫治疗有更好的反应。最后,使用三种机器学习算法(LASSO、随机森林和逐步多元 Cox 回归)来开发基于代谢分子的预后元基因特征。

研究结果

1. 转录组学和蛋白质组学图谱揭示了 EC 的代谢重编程

为了研究 EC 中是否发生代谢重编程,我们首先对正常(子宫内膜旁和正常子宫内膜)与肿瘤组织进行主成分分析(PCA),发现不同的代谢转录谱,而不同组织学类型和级别的 EC 具有相对相似的表达TCGA 和GSE17025队列中的模式(图1A、1B、S1A和 S1B)。与 EC 组织相邻且无异型性的子宫内膜增生患者也与GSE106191队列中的配对肿瘤组织具有相似的代谢相关基因表达模式(图 S1 C)。因此,进一步对 EC 和正常/癌前组织之间的差异表达基因 (DEG) 进行基因集富集分析 (GSEA) 分析,以揭示显着变化的代谢途径。失调的途径似乎涵盖了大多数代谢过程,其中大多数在 EC 肿瘤样本中被上调。在所有 3 个数据集的前 10 个上调途径中,在糖酵解/糖异生和叶酸生物合成途径中观察到一致的激活(图1C)。随后,在蛋白质水平上,临床蛋白质组肿瘤分析联盟 (CPTAC) EC 蛋白质组研究分析了 131 个样本的 10,180 个蛋白质水平及其相应的生物样本信息。然而,仅研究了 1,161 种代谢途径相关蛋白。此外,PCA 分析证实,基于蛋白质水平的代谢途径,EC 与正常组织相比表现出独特的代谢景观(图1D)。EC 和正常组织之间的 CPTAC 转换数据 (log2 (num + 10)) 的差异分析显示 120 DEG 具有统计显着性(p < 0.05,对数倍数变化 [FC] > 0.05)(图 S1 G)。与上述转录组数据(GSE17025和 TCGA EC 队列)类似,与 CPTAC 队列中的正常组织相比,EC 中的氧化磷酸化和聚糖生物合成途径被发现显着激活(图1E、S1 H 和 S1I)。这些发现表明 EC 样本中存在代谢重编程。

2. 基于代谢途径的 EC 亚型

为了揭示EC的代谢异质性,对84条代谢途径的基因集变异分析(GSVA)衍生的富集分数进行了共识聚类和NbClust测试分析,并确定了3个作为TCGA队列中的最佳聚类数。 PCA 还确认 3 是聚类的最佳数字。随后,共有 548 名患者被分为 3 个不同的基于代谢途径的亚组 (MPS):MPS1 (35.9%)、MPS2 (33.4%) 和 MPS3 (30.7%)(图2A-B)。 MPS1 表现出“热”代谢特征,涵盖几乎所有代谢类别。 MPS2 在特定的脂质代谢和氨基酸代谢途径中表现出上调,包括初级胆汁酸生物合成、类固醇激素生物合成和亚油酸代谢等。相比之下,与其他两个簇相比,MPS3 表现出相对“冷”的代谢表型(图2C)。我们进一步研究了三种代谢相关亚型的临床病理特征。Kaplan-Meier (KM) 生存分析显示,与另外两个亚型(图2D)。单变量 Cox 回归分析证实,MPS3 的 OS和 DFS较差,关于 MPS2 集群。然而,MPS1 和 MPS2 之间的 OS 和 DFS 没有观察到显着差异。与其他两个簇相比,MPS3 簇表现出浆液性组织学类型、2-3 级和 III-IV 期 EC 患者的比例较高 (p < 0.001) (图2E)。与 MPS1/2 簇中的患者相比,MPS3 簇中的患者往往年龄较大。TCGA 分子亚组34与 MPS 簇的比较表明,MPS3 簇主要由 CN-H 型组成,而 MPS2 簇则表现出较高比例的 CN-L 型 (p < 0.001)(图2F)。亚组分析显示,EC 的最大子集(称为非特异性分子谱 [NSMP],也称为 CN-L)在 MPS 簇中表现出异质代谢谱。重要的是,在 MPS1 亚组中,NSMP 患者表现出 OS 较差的趋势(图2G 和S2 D)。同样,在具有中等预后的 MSI 或未分配组的患者中,属于 MPS3 亚组的患者表现出较短的复发持续时间,尽管差异未达到统计学显着性。总之,这些发现强调了 TCGA 分子亚型和代谢特征之间复杂的相互作用,揭示了 NSMP EC 中预后的细微差别。

3.  MPS 亚型之间的转录组分析比较

异质的代谢表型促使我们基于转录谱探索不同 MPS 亚群的潜在分子特征。我们首先通过比较分析确定了每个 MPS 簇显着改变的代谢途径相关基因。接下来,我们确定这些关键代谢酶的表达水平是否与不同 MPS 簇中代谢途径的富集分数相关。GSEA分析进一步揭示了MPS簇之间的代谢异质性,每个亚组中富集的代谢途径与基于GSVA评分的差异分析确定的代谢途径高度一致(图3A-3C)。通过深入研究 EC 复杂的分子景观,仔细剖析了三种不同 MPS 亚型的标志性信号通路的激活模式。参与细胞周期的途径,包括 MYC、E2F、G2M 和有丝分裂,在 MPS1 和 MPS3 亚组中明显激活,而在 MPS2 簇中则失活。图3D 和S4 A)。先前报道肿瘤代谢重编程与EMT密切相关。有趣的是,EMT 评分和 EMT 相关基因表达,如SOX9、TWIST1、FOXF1、ZEB1、ZEB2 和 GATA6在 MPS1 中相对低于其他两个簇 (图3E-F)。相关性分析后,氨基酸代谢途径(如甘氨酸、丝氨酸和苏氨酸代谢;半胱氨酸和蛋氨酸代谢;赖氨酸降解)、碳水化合物代谢途径(包括TCA循环、磷酸戊糖途径、乙醛酸和二羧酸代谢)、生物合成相关识别途径(糖基磷脂酰肌醇生物合成、脂肪酸延伸和类固醇合成)、辅助因子和核苷酸代谢。值得注意的是,这些途径是细胞复制和增殖不可或缺的一部分,已被确定。此外,发现糖胺聚糖合成途径与肿瘤 EMT 相关(图3G)。因此,我们合并了显着影响 MPS 亚型内肿瘤行为的亚型特异性代谢特征,总结了独特的代谢疗法(表 S5)。MPS1 建议涉及葡萄糖代谢和氨基酸代谢抑制剂的靶向策略。MPS3 建议针对核苷酸代谢,特别是中断 DNA 合成。同时,正如之前的文献所指出的,MPS2 表明外源 α-亚油酸治疗的潜在益处。靶向肿瘤细胞代谢为分子干预提供了一条有希望的途径。

4. EC MPS 簇中的特色基因组改变

基因组改变可能导致癌症代谢重编程。我们探索了每个亚组的前 10 个突变基因,发现 3 个 MPS 亚组之间完全不同的突变谱。然后我们比较了 3 个 MPS 簇中 10 条经典致癌途径的突变频率。PI3K、NRF2、TGF-β、MYC、Hippo 和 Notch 通路中显示出更高的突变频率,而 MPS3 簇的特征在于TP53 通路中最高的突变。值得注意的是,PI3K 通路中的成员在 MPS1/2 簇中发生高度突变 (p < 0.05)(图4A)。这一观察结果使 MPS1 成为利用针对这些特定途径定制的小分子抑制剂的靶向治疗的潜在候选者。KMT 亚家族基因催化核心组蛋白的各种赖氨酸甲基化事件,从而在多种类型的癌症中诱导表观基因组和代谢重编程。如KMT2D 调节多个糖酵解基因,从而赋予糖酵解抑制剂治疗上的脆弱性。因此,通过分析基因突变谱,我们对肿瘤代谢异质性有了深刻的了解。这些知识构成了开发针对特定 MPS 亚型的靶向疗法的基础。在体细胞拷贝数变异(CNV)差异方面,我们还在三个 MPS 簇中观察到 MPS3 具有相对较高的 CNV 负担和染色体不稳定水平(图4C 和S5 D)。每个簇的扩增或缺失区域显示在图4D-4F。KEGG分析显示,扩增的基因在MPS1簇中的氮代谢和糖胺聚糖合成途径中富集;MPS2 簇中调节干细胞多能性和癌症通路的信号通路,以及 MPS3 簇中的核糖体、TGF-β 信号传导、EGFR 酪氨酸激酶抑制剂耐药性和胆固醇代谢(图4G-4I)。

5. MPS 亚组之间独特的免疫微环境渗透和对免疫治疗的异质反应

各种代谢变化和表观遗传修饰也被报道通过驱动免疫逃逸或阻碍免疫监视在肿瘤进展中发挥重要作用。在我们的研究中,我们观察到 EC 的 TME 内存在丰富的 CD4 T 细胞、M0 巨噬细胞、M2 巨噬细胞和Treg。与其他簇相比,MPS2 表现出显着升高的 CD4 记忆静息 T 细胞和 Tregs 丰度。相反,滤泡辅助 T 细胞、M1 和 M2 巨噬细胞、活化肥大细胞和中性粒细胞的水平相对较低 (图5A)。正如预期的那样,淋巴细胞的浸润表现出从 MPS2 到 MPS3 和 MPS1 簇的逐渐下降,在 MPS1 中观察到巨噬细胞总数和 M2/M1 比率最高(p < 0.05)。我们还通过单样本 GSEA (ssGSEA) 算法观察到 MPS3 亚组中的免疫浸润水平较低,并且 MPS2 亚组中发挥抗肿瘤或促肿瘤作用的总免疫细胞均增加(图5B)。我们可以得出结论,EC的代谢异质性与TME变化的发生密切相关。我们探讨了不同的 MPS 亚组对免疫治疗是否表现出不同的敏感性,因为每个亚组内的免疫细胞浸润存在显着差异。MPS2 簇的估计免疫评分和功能障碍评分高于 MPS3 簇(图 5C)。然而,MPS1 簇中的肿瘤免疫功能障碍和排除 (TIDE) 评分和排除评分低于其他簇 (p < 0.05)(图5D 和 5E)。TMB水平在 MPS1 簇中也是最高的,这表明对免疫治疗有更好的反应(图5F)。MPS2 簇则表现出较高水平的细胞毒性 T 淋巴细胞相关蛋白 4 (CTLA4) 和程序性细胞死亡 1 (PDCD1)(图5G)。毫无疑问,根据 TIDE 算法,MPS2 亚组的预测缓解率最高(图5H)。总之,对比这两个簇,尽管 MPS2 簇表现出丰富的免疫细胞浸润,但它同时呈现出免疫功能障碍的迹象。然而,以 TMB 升高和 TIDE 评分降低为特征的 MPS1 簇表明免疫逃逸的可能性降低,同时新肿瘤抗原的产生增加。与MPS3亚组相比,其他两个亚组可能受益于免疫治疗。

6. 基于代谢途径的亚型反映了细胞水平上独特的化疗敏感性和代谢特征

除了常规化疗外,我们的目标是探索基于 MPS 亚型的新型高效分子靶向药物,以提高精准治疗效果。总体而言,根据 PRISM 和癌症治疗反应门户 (CTRP) 数据库,确定了整个 TCGA 队列中AUC值最低的前 10 种药物。然后,我们通过比较分析(logFC >0.2,p < 0.05) (图6A 和 6B),RPN2 和BUB1上调赋予癌细胞对多西他赛的耐药性。与既往研究一致,MPS3亚组患者上述两个基因的表达水平和AUC值较高,提示对多西紫杉醇的敏感性较低(图6C)。为了验证 MPS 分类的化疗敏感性预测能力,我们使用配对方法根据转录组图谱对 EC 细胞系进行分层(图6D)。代谢物差异分析显示,MPS3 细胞中还原型谷胱甘肽、胞苷一磷酸和三酰甘油水平较高,而鸟氨酸、鹅氨酸和 3-甲基己二酸水平较低(图6E)。接下来,正如预期的那样,EC 细胞 MPS3 亚组比 MPS1 亚组表现出更大的攻击性,其标志是 EMT 和刺猬通路的上调(图6F)。此外,我们发现基于 PRISM 的两个细胞 MPS 亚组之间对 MPS 独特药物的反应相似(图6G)。这种综合方法结合了细胞转录组和代谢组学,不仅增强了代谢途径亚型分型的可靠性,而且还为 EC 的定制治疗策略提供了宝贵的见解。

7. 使用机器学习算法开发代谢相关的预后风险模型

使用先进的机器学习技术来开发预测模型来定量评估代谢基因表达的预后相关性(图7A)。首先,通过单变量 Cox 回归分析发现 392 个代谢基因与 OS 相关。LASSO-LR(最小绝对收缩和选择算子正则化逻辑回归)当将 lambda 值设置为 lambda 时,Cox 回归识别出 22 个关键基因。分钟(图7B)。LASSO-LR 模型结合了这些选定的基因,在 1-5 年内表现出较高的 AUC 值,并有效区分患者的 OS。最优的随机森林模型是通过网格搜索实现的,设置ntree = 200和nsplit = 5,导致错误率低于0.20(图7C)。内部10倍交叉验证进一步证实了随机森林模型的准确性,训练队列中的平均C指数值为0.72,测试队列中的平均C指数值为0.60。其次,将来自 LassLR 和随机森林模型的 21 个常见代谢基因进行逐步回归分析。然后通过考虑 13 个选定基因的所有可能组合来构建基因签名多元 Cox 回归分析并根据各自的 AUC 值分为 5 个簇(图7D)。根据中位基因评分,EC 患者被分为两组。ROC曲线和 KM 生存曲线也证实了宏基因评分的预后预测价值(图7F-G)。此外,MPS 亚组之间风险评分的差异强调了元基因特征在捕获肿瘤代谢的复杂变化方面的功效。高风险组在 MPS 亚组中所占比例相对较高,从而强调了其作为有效对 EC 病例进行分层的工具的效用(图7H-I)。

文章小结

该研究构建了一个基于 13 中心基因的分类器来预测患者的 MPS 亚型,提供了一种更容易获得和实用的方法。这种基于代谢的分类系统可以增强预后预测并指导 EC 免疫治疗和代谢靶向治疗的临床策略。

生信Neuro
生信Neuro,持续更新神内外,胶质瘤,动脉瘤,癫痫,帕金森,老年痴呆等疾病的临床生信前沿文献和思路,提供专业的生信分析服务:思路设计,生信分析,文献复现,科室科研培训,数据库搭建,全力助力神内外科研之路!
 最新文章