零实验照样高分,公共数据库+机器学习+预后模型助力发文

文摘   2024-11-28 20:03   中国  

点击蓝字 关注我们

今日解读的文章是发表在《iScience》杂志上的一篇文章《A cancer-associated fibroblast subtypes-basedsignature enables the evaluation of immunotherapyresponse and prognosis in bladder cancer》。本研究基于 scRNA-seq 数据和机器学习方法,构建了一个新的成纤维细胞亚型相关的风险评分 CRRS,用于预测膀胱癌患者的预后和免疫治疗反应。CRRS 不仅在多个独立队列中得到验证,还与 BLCA 的多种生物学特征显著相关,包括 EMT、免疫微环境和基因组变异。这项研究为 BLCA 的预后预测和个体化治疗提供了新的思路和潜在的生物标志物。

01背景介绍

膀胱癌 (BLCA) 是一种异质性很强的泌尿系统恶性肿瘤,其特征是进展迅速、复发率高。尽管化疗和靶向治疗取得了进展,转移性 BLCA 的预后仍然很差。因此,开发新的有效工具来预测预后和治疗反应对 BLCA 患者至关重要。肿瘤微环境 (TME) 在肿瘤进展中发挥着关键作用,其中癌症相关成纤维细胞 (CAF) 是 TME 的重要组成部分。CAF 可以分泌多种细胞因子和细胞外基质 (ECM) 蛋白,促进免疫逃逸、治疗抵抗和肿瘤发展。先前的研究报道了高水平的 CAF 与肿瘤患者的不良预后之间存在显著关联。然而,CAF 在 BLCA 肿瘤微环境中的作用尚不清楚,需要进一步研究 BLCA 中 CAF 相关基因特征。单细胞 RNA 测序 (scRNA-seq) 是一种强大的技术,可用于揭示肿瘤异质性和 TME 状态。最近几年,scRNA-seq 已被用于将 CAF 细分为不同的亚型,并研究 CAF 在癌症中的分布。本研究利用 scRNA-seq 数据,对 BLCA 患者的 CAF 亚型进行了综合分析。随后,我们构建了一个与 CAF 相关的预后特征,用于预测 BLCA 患者的总生存期 (OS)。我们的 CAF 相关风险评分 (CRRS) 的准确性使用多个数据集进行了评估。我们进一步评估了 CRRS 与临床病理特征、上皮间质转化 (EMT)、免疫表型和 BLCA 治疗反应性之间的相关性。总而言之,我们的研究表明 CRRS 有可能预测 BLCA 患者的预后和免疫治疗反应。

02数据来源

单细胞 RNA 测序 (scRNA-seq) 数据: 用于识别 CAF 亚型及其标记物。本研究使用了两个 scRNA-seq 数据集:GSE135337 作为训练集,GSE130001 作为验证集。这两个数据集均来自膀胱癌患者的肿瘤组织和癌旁组织。

RNA 测序 (bulk RNA-seq) 数据: 来自 TCGA-BLCA 队列,共 405 例患者,用于构建和验证预后模型。去除随访时间少于 30 天的删失患者后,剩余 393 例患者被随机分为训练集 (n = 280) 和内部验证集 (n = 113)。

GEO 验证队列: 来自 GEO 数据库的 9 个公开数据集 (GSE13507, GSE31684, GSE32548, GSE32894, GSE169455, GSE91061, GSE120736, IMvigor210CoreBiologies 和 UROMOL2016),共 1986 例患者,用于外部验证 CRRS 的预后价值。

湘雅队列: 来自湘雅医院的 56 例 BLCA 患者的组织样本,用于进一步验证 CRRS 的预后价值和免疫学特征。

03分析方法

研究团队首先搜集了膀胱癌(BLCA)患者及其对照组的单细胞RNA测序(scRNA-seq)数据。他们运用单变量Cox回归和LASSO技术筛选出与癌相关成纤维细胞(CAF)相关的预后基因,并最终确定了8个CAF相关的标志物,用于构建膀胱癌患者的最佳预后标志,并据此计算出CAF相关风险评分(CRRS)。接着,他们构建了一个预测模型(NOMOGRAM),并利用外部数据集进行了验证。此外,研究还探讨了CRRS与临床病理特征及免疫细胞浸润的相关性,并在CRRS高低组中进行了差异表达基因分析和功能富集分析。最后,通过引入外部数据集进一步证实了CAF相关风险评分在预测膀胱癌患者预后方面的有效性。

04研究结果

     01BLCA单细胞组学分析和CAF亚型鉴定

作者收集了BLCA患者及其对照的scRNA-seq数据集。根据特定的细胞标记因子,上述细胞簇被划分为五种主要的细胞类型并计算了其得分和主要差异表达基因(图1A-C)。EMT评分和上皮评分结果表明,EMT评分从上皮和epiEMT到纤维EMT和成纤维细胞逐渐升高(图1D-E)。2362个成纤维细胞被分为三个不同的亚群ECM-CAF、fibroEMT和myofi-broblast(图1F)。细胞轨迹分析表明epiEMT细胞数量减少,而ECM-CAF细胞数量增加(图1G)。GSEA富集表明与细胞外基质相关的通路在所有三种CAF亚型中都富集(图1H);各CAF亚型差异表达前15位的基因热图如图1I所示。

图1BLCA单细胞组学分析和CAF亚型鉴定

02 BLCA中CAFs相关风险评分的构建

采用单因素Cox回归分析和LASSO算法筛选与CAF相关的预后基因,最后确认了18个候选标记(图2A)。随后作者基于18个候选标记构建了102714个签名,进行多变量Cox回归并绘制随时间变化的ROC曲线,并引入外部队列对每个特征进行检验。最后,综合选择8个CAF相关标志物作为BLCA患者的最佳预后标志(图2B)。根据8种标志物的表达水平及多变量Cox回归系数计算CAF相关风险评分(CRRS)。结果表明,高CRRS患者的预后明显差于低CRRS患者(图2C)。与其他临床病理参数相比,ROC曲线显示CRRS具有更强的预测能力(图2D-H)。

图2BLCA中CAFs相关风险评分的构建

03NOMOGRAM模型构建

作者根据TCGA队列中CRRS、年龄和病理分期的多变量Cox回归结果构建了NOMOGRAM模型(图3A)。结果表明NOMOGRAM模型通过校准曲线对BLCA患者的OS有较高的准确度(图3B)。TCGA-BLCA队列(图3C)和6个外部验证队列(图3D)的单因素和多因素Cox回归表明,CRRS可以作为BLCA患者的独立预后因素。此外,决策曲线分析(DCA)表明,NOMOGRAM显著优于单个独立的预测参数(图3E)。总之,NOMOGRAM对BLCA患者具有潜在的预后预测价值。 

图3NOMOGRAM模型构建

     04BLCA分子特征描述

随后作者评估了CRRS与临床病理特征的相关性(图4)。在TCGA队列中,年龄大于60和TNM晚期的BLCA患者的风险评分更高。CRRS调控基因在高CRRS组和低CRRS组中存在差异表达。在高CRRS组中,p-EMT、DNA复制和TGF-b信号通路显著富集;而在低CRRS组中,分化通路FGFR3共表达基因富集。靶向上述通路可能使高CRRS组的患者受益。作者进一步探讨了CRRS与BLCA中7个经典亚型的相关性。结果表明低CRRS的BLCA患者更可能为腔型,高CRRS组为基底型。与BLCA相关的23个转录因子的调控活性存在显著差异。与肿瘤促进相关的转录因子在高CRRS组中高于低CRRS组。

图5EMT与CRRS相关性分析

     05免疫景观和免疫治疗反应分析

TME影响肿瘤的进展和免疫治疗的效果。因此作者首先研究了CRRS与免疫细胞浸润的相关性。结果显示,在高CRRS组中,几种抗癌肿瘤浸润免疫细胞(TIICs)表达显著下调(图6AC)。此外,作者发现在TCGA队列中,CRRS与TIDE评分、T细胞排斥和功能障碍评分呈正相关(图6D)。ROC曲线显示CRRS对ICB完全反应具有较强的预测能力(图6E-F)。黑色素瘤免疫治疗队列GSE91061的结果也显示高CRRS组免疫治疗的缓解率明显低于低CRRS组(图6G)。

图6免疫景观和免疫治疗反应分析

06高低CRRS组DEG鉴定分析

在该研究中,研究团队通过3种不同的方法相交得到642个共同的DEG(图7A),在火山图中筛选了最显著的DEG(图7B)。基于KEGG和GO数据库的富集结果表明,上调的DEG在ECM受体相互作用、局灶黏附、含胶原的细胞外基质和间充质上皮细胞信号传导等生物学途径中富集(图7C-D)。GSEA分析与KEGG和GO富集结果一致(图7E-F)。高CRRS组RB1和APOB的突变率显著升高(图7G)。此外,在高CRRS组中检测到GNA13、TTYH1、KRAS、CDKN2A和NFE2L2等癌驱动基因,而在低CRRS组中未检测到这些基因(图7H-I)。 

图7高低CRRS组DEG鉴定分析

     07外部队列验证分析

引入外部队列进一步验证了CAFs相关风险评分在预测预后中的作用。CRRS评分高的患者总生存期短于CRRS评分低的患者(图8A-B)。单因素和多因素cox回归分析也发现CRRS是独立的预后因素(图8C)。CRRS预测1年、3年和4年OS的ROC曲线AUC分别为0.846、0.71和0.788(图8D)。该团队选择EMP1、P4HB和EGFL6进行进一步的实验验证。免疫荧光结果显示,EMP1、P4HB和EGFL6是特异性CAF亚型的显著标记物(图8E)。与低CRRS组相比,高CRRS组CD8、PD-L1和CTLA4的表达较低,这表明CRRS与非炎症表型显著相关(图8F)。   


图8外部队列验证分析

05结论

    在这项研究中,研究团队通过多组学数据分析,基于癌相关成纤维细胞(CAFs)亚型构建了CAF相关风险评分(CRRS),为膀胱癌(BLCA)患者的预后评估和免疫治疗提供了新的视角。文章的亮点在于其系统的生物信息学分析,以及对模型的严格验证。然而,研究也存在一些局限性,包括肿瘤内的遗传异质性、样本偏倚问题,以及CAF亚型和与CAF相关的风险特征是基于公共数据集的回顾性数据获得的。这些因素可能影响结果的普适性和准确性,提示未来研究需要在更大的前瞻性队列中进一步验证这些发现。

结语

临床研究的根本使命是发现并解决生命科学领域亟待解决的临床问题,同时,为即将发生的临床难题提供备选解决方案。

打开极智分析—智能医学统计分析平台 https://www.xsmartanalysis.com/ 进行实操吧!


往期精彩回顾

【1】LANCET(IF=90+):机器学习+SHAP+风险分层=非ST段抬高急性冠状动脉综合征患者GRACE评分的性别特异性评估

【2】《Molecular Therapy-Nucleic Acids》(IF=8.8): 组学分析+机器学习 =子宫内膜癌分型系统

【3】《CARDIOVASC DIABETOL》(IF=8.5),糖尿病前期和肝脂肪变性对年轻人心脏代谢结局的综合影响

【4】《CARDIOVASC DIABETOL》(IF=8.5),估计葡萄糖处理率和心血管疾病发病率的变化

【5】LANCET子刊(IF = 9.6):深度学习使用磁共振血管造影数据构建烟雾病自动诊断模型

扫二维码

关注我们

公众号|极智分析

知乎|极致分析

B站|极智分析


极智分析
为临床、科研人员提供一站式临床研究在线分析建模平台;提供医学统计咨询服务;提供临床数据分析服务;提供医疗大数据建模服务;分享研究进展、临床研究设计方案、询证医学案例。
 最新文章