文章标题:Identification and validation of a prognostic risk-scoring model for AML based on m7G-associated gene clustering
中文标题:基于 m 的 AML 预后风险评分模型的识别和验证7G 相关基因聚类
发表期刊:Front Oncol
发表时间:20240111
影响因子:3.5/Q2
研究背景
急性髓系白血病(Acute myeloid leukemia, AML)患者的5年生存率仍然很差,缓解后复发。迫切需要更好的预后评估工具。新的证据表明,7-甲基鸟苷(7-methylguanosine, m7G)甲基化修饰在AML中起重要作用,然而,m7G相关基因在AML预后中的确切作用仍不清楚。
研究方法
该研究从 TCGA 、 GEO 和 TARGET 数据库获取了 AML 表达谱和临床信息。使用来自 TCGA 队列的患者数据作为训练集。基于 29 个 m7G 相关基因进行共识聚类。通过 KM 曲线进行生存分析。使用 WGCNA 筛选亚组特征基因集。通过 ssGSEA 进行肿瘤免疫浸润相关性分析。
研究结果
1.基于 m 的共识聚类7G 相关基因
基于 29 m 的表达式相似性7G 相关基因,通过应用共有聚类对 TCGA 数据进行聚类。150 个 AML 样本可以很好地分为 3 个簇,即集群 1 (n = 51)、集群 2 (n = 60) 和集群 3 (n = 39)。m 的表达式7簇 2 的 G 相关基因显著高于其他两组。此外,Kaplan-Meier 生存分析的进一步应用表明,与第 3 组相比,第 1 组和第 2 组在总生存期 (OS) 方面的预后更差。
2. 基于免疫浸润差异构建的预后评估模型
基于各簇之间免疫浸润和预后的显著差异,我们将第 3 簇定义为缺乏免疫浸润(IL 型),第 1 簇/第 2 簇定义为富含免疫浸润的亚型 (IR 型)。对两种类型的 AML 患者的 mRNA 表达谱进行了详细分析,以揭示 IL 和 IR 亚型之间预后不同的潜在机制。经过基因表达分析,鉴定出 265 个 IL 和 IR 亚型之间的差异表达基因,FDR < 0.05 和 |log FC|> 2 个,其中 131 个在 IR 类型中上调,134 个在 IR 类型下调。
3. 特征基因集的鉴定
为进一步探讨上述 3 个簇之间的差异,建立预后评估较好的预后评估模型,采用 WGCNA 算法挖掘每个簇的共表达编码基因集,均为每个簇的特征基因。首先使用分层聚类;此外,使用 Pearson 相关系数计算每个基因之间的距离,并使用 R 包 WGCNA 构建加权共表达网络。
4. 预后模型的识别和验证
基于对 3 个模块化基因簇的富集分析,获得了 1754 个共表达模块之间的差异基因。对 TCGA 训练集样本中这些基因的表达和存活数据进行单因素 Cox 回归模型分析。获得 194 个与预后显著相关的差异基因 (P < 0.005)。为了进一步筛选用于模型构建的基因,随机选择 80% 的 TCGA 训练集样本进行套索回归分析,采用 10 倍交叉验证,从而进行 1000 次套索分析,最后保留 6 个频率> 500 的 mRNAs 作为靶基因。
5. 风险评分以及临床和病理特征的独立预后分析
为进一步探讨预后风险评分模型的临床价值,对 TCGA 队列进行了单变量和多变量 Cox 回归分析。在单变量 Cox 分析中,年龄和风险评分与 AML 患者的预后显著相关。此外,多因素 Cox 回归结果表明,年龄和风险评分是 AML 患者预后的独立危险因素。接下来,我们对这些因素进行了 ROC 分析,AUC 值的结果表明,风险评分在预测 OS 方面的准确性高于年龄风险因素。
6. 为 AML 患者创建预测柱线图
校准图曲线碎片图还显示,柱线图比理想模型具有更好的预测函数。根据柱线图模型评分、中位数和绘制的 KM 曲线将样本进一步分为高低风险组,由此可见高低风险组的 OS 存在显著差异 (log-rank p < 0.0001,HR = 5.99),其中 68 个样本被归类为高风险,69 个样本被归类为低风险。
文章小结
在本研究中,开发了一种新的预后评分模型,以 CBR1 、 CCDC102A 、 LGALS1 、 SLC29A2 、 RD3L 和 TWIST1 为特征基因,根据 AML 患者的 m7G 相关聚集特征基因集预测 AML 患者的预后。并且,该模型与肿瘤免疫之间存在显着相关性。这些发现表明,该评分模型和关键风险基因可用作 AML 患者的潜在预后生物标志物。(对这种思路感兴趣的老师,欢迎联系小编!)