单细胞测序技术曾被评为年度最值得关注的领域,单细胞水平研究能够避免传统组织水平检测的误差和局限性,对于疾病机制研究具有重要价值!机器学习近几年的风头正盛、热度持续!今天,胡哥分享一篇利用单细胞分析和机器学习构建预后模型的二区SCI,一起看看吧~1. 单细胞分析。该研究通过对单细胞测序数据进行处理和分析注释了8个细胞簇,根据先前研究具体分析了4种癌症相关成纤维细胞(CAF)亚型,再通过一系列富集分析将后续研究聚焦于基质CAF(mCAF)。从单细胞水平进行研究,对于疾病机制研究具有重大意义!2. 基于机器学习构建预后模型。该研究通过10种机器学习算法拟合了101种组合,并选择了最佳预后模型mCAF风险预后特征(mRPS)。机器学习是SCI发文的热门主题,紧密联系热点方法,是该文的一大亮点!3. 临床应用。通过使用4个免疫治疗队列的数据对mRPS进行建模,再结合免疫应答反应分析,从临床角度对mRPS的应用价值进行探讨。(PS:换个癌种,一篇5分+SCI不就妥了!想要更高分,那得加点料!感兴趣的朋友,来找胡哥~) 回复“原文”即可获取文献
题目:利用单细胞分析和机器学习构建基于基质癌相关成纤维细胞特征基因的风险预后特征,用以指导乳腺癌患者免疫治疗杂志:International Journal of Molecular Sciences乳腺癌(BRCA)是女性最常见的恶性肿瘤,在BRCA的肿瘤微环境(TME)中, CAF在肿瘤的生长、增殖、侵袭、转移和血管生成中起着至关重要的作用。本研究基于CAF特征基因利用机器学习构建风险预后特征,用以指导BRCA患者的免疫治疗。 | | | |
| | | |
| | | |
| | | |
| | | |
| | | |
| | | |
| | | |
| | | |
| | | 包括IMvigor数据集、Gide、Riaz、Hugo数据集 |
首先,通过单细胞分析确定了BRCA的四种CAF亚型。其次,基于mCAF特征基因的共识聚类将样本分为高纤维化组和低纤维化组,并比较两组预后差异。接着,通过加权基因共表达网络分析(WGCNA)和单变量COX分析揭示17个具有预后价值的特征基因,使用10种机器学习算法开发了mRPS。最后,分析了mRPS的临床应用价值。通过单细胞分析及标记基因识别了8个细胞簇(图1A-B),并检查了4种CAF亚型(血管CAF(vCAF)、mCAF、循环CAF(cCAF)、发育CAF(dCAF))中的细胞数量(图1C-D)。通过基因本体论(GO)分析和京都基因和基因组百科全书(KEGG)富集分析,发现mCAF、vCAF均参与TGF-β途径和细胞外基质(ECM)重塑(图1 E-F)。通过基因集富集分析(GSEA),发现mCAF参与ECM组织、分解和蛋白聚糖合成,vCAF参与胶原原纤维、多聚体结构和整联蛋白细胞表面接触的组装(图1G-H)。以上结果提示,mCAFs在BRCA恶性肿瘤进展中的重要作用,塑造有利于BRCA发生和发展的微环境,影响BRCA患者的不良预后。2. 批量RNA-Seq分析揭示mCAFs积累决定患者的不良预后通过单变量COX回归分析和生存分析,鉴定了24个与BRCA患者预后不良相关的特征基因,通过共识聚类分析,基于一致性累积分布函数图(CDF图)认定k=2为最佳聚类,将样本分为高纤维化组和低纤维化组,通过Kaplan-Meier曲线生存分析显示,高纤维化组的预后较差(图2A-D)。通过差异表达基因(DEG)分析鉴定了218个DEG,通过GO和KEGG富集分析发现DEGs在TNF信号传导途径和涉及氨基和核苷酸糖的代谢过程中显著富集(图2E-G)。 图2 批量RNA分析揭示mCAF积累决定患者的不良预后通过MCP计数器算法发现高纤维化组的成纤维细胞数量、基质评分显著高于低纤维化组(图3A-B),通过WGCNA发现MEgreen模块(包括593个与肿瘤发生和进展密切相关的基因)表现出与成纤维细胞和基质评分的最高相关性(图3C-D)。通过比对WGCNA鉴定的基因与DEGs确定了124个重叠基因,通过单变量COX回归分析选择其中17个特征基因,后选择其中TCGA和其他验证数据集共有的11个基因,通过10种机器学习算法拟合了101种组合,根据C指数确定最小绝对收缩和选择算子(LASSO)和plsRcox组合构建的最佳预后模型mCAF风险预后特征(mRPS)(包含11个基因)(图4A-B)。通过受试者工作特征(ROC)曲线下面积(AUC)发现高mRPS组的预后较差,基于mRPS评分的组合特征较常规TNM分期方法表现出稳健的预后能力(图4C-K)。通过比对发现低纤维化组的mRPS评分显著低于高纤维化组(图5A)。通过免疫浸润分析发现,低mRPS组初始B细胞、记忆B细胞等丰度显著上调,高mRPS组中M0型巨噬细胞、M2型巨噬细胞等丰度上调(图5B)。以上结果表明,低mRPS组中抗肿瘤免疫细胞的存在可能有助于改善结局,高mRPS组中富集的免疫细胞的功能在BRCA微环境中发生改变导致促癌后果。基于mRPS的TCGA-BRCA临床数据集分析显示了6种免疫亚型,其中免疫C2、C6亚型与TGF-β和IFN-γ信号传导密切相关,基于6种机器学习算法构建AI分类器,通过ROC曲线揭示了GBM算法具有最高的预测准确度(图5C-E)。以上结果表明,mRPS可作为准确预测BRCA免疫亚型的可靠指标、指导临床精准治疗。使用4个免疫治疗队列的数据对mRPS进行建模,发现高mRPS评分组患者存活结果明显较差,通过对患者的免疫应答反应分析,发现达到完全应答或部分应答的患者表现出的mRPS评分显著低于疾病进展或疾病稳定的患者(图5 F-M)。以上结果表明,mRPS具有区分患者免疫治疗反应的潜力。 该研究鉴定了BRCA中各种异质性CAF细胞群,基于mCAF相关标记基因开发了mRPS,该模型可以稳定地预测BRCA预后,反映肿瘤的局部免疫状态,辅助肿瘤免疫治疗的临床决策。该文逻辑清晰,0实验,轻松拿下二区SCI! 胡哥持续为大家带来最新生信思路,更多创新性分析思路请点击往期推荐!想复现思路、定制分析的朋友,欢迎扫码咨询!