IF=6.1,机器学习+多组学:分析用于具有免疫治疗反应的癌症的生存预测

文摘   2025-01-25 18:32   四川  

生信一区,解读生物信息分析最前沿文献和思路,提供专业的生信分析服务,今天分享的文章亮点是机器学习+多组学:分析用于具有免疫治疗反应的癌症的生存预测,感兴趣的老师可以点点关注

文章标题:Integrated explainable machine learning and multi- omics analysis for survival prediction in cancer with immunotherapy response

中文标题:整合可解释机器学习和多组学分析用于具有免疫治疗反应的癌症的生存预测

发表期刊:Apoptosis 

发表时间:2024年12月

影响因子:6.1


研究背景

为了证明机器学习模型在预测黑色素瘤癌症死亡率方面的有效性,我们开发了一个可解释性模型,以更好地理解癌症的生存预测。

研究思路

使用十种不同的机器学习模型来预测不同数据集的死亡率。然后,我们利用这些机器学习方法所识别的重要特征构建了一个名为NKECLR的新模型来预测癌症患者的死亡率。为了明确澄清模型的决策过程并揭示新发现,采用了一种结合机器学习和SHapley加性表达(SHAP)以及LIME的可解释技术,并从这些机器学习(ML)中识别了四个基因EPGN、PHF11、RBM34和ZFP36。对训练和验证数据集进行的实验分析表明,与现有方法相比,所提出的模型具有良好的性能,AUC值分别为81.8%和79.3%。

结果分析

1. 单细胞分析识别NK细胞标记基因
使用单细胞数据进行分析,聚类为12个细胞群体,对细胞进行注释后,发现NK细胞和其917个标记基因。随后利用CellChat进行细胞间通讯分析。    

2. 机器学习特征基因筛选和模型构建
基于917个NK细胞标记基因,利用10种机器学习算法筛选特征基因,并通过准确度、召回率、精确度、F1、kappa 和 MCC 得分这些指标来评估不同算法的效率。结果发现LightGBM、CatBoost、ET 和 RF 模型表现出优异的性能,用于后续分析。
3. 免疫相关性分析

首先在单细胞水平上分析了4个特征基因的表达和分布。然后在单细胞水平上分析了免疫细胞与黑色素瘤细胞之间的相互作用

文章小结

研究引入了一种创新的预测性NKECLR模型,该模型利用自然杀手(NK)细胞标记基因,用于黑色素瘤患者队列。NKECLR 模型可以有效预测黑色素瘤癌症队列的存活率和治疗结果,揭示高危人群中明显的免疫细胞浸润。(对文章数据库和分析方法感兴趣或需要生信分析服务的老师,欢迎关注小鱼一起交流)

多组学与孟德尔随机
多组学与孟德尔随机,专注与分享多组学与孟德尔随机化的最新生信文献和思路。提供专业的生信分析服务:思路设计,生信分析,文献复现,科室科研培训,数据库搭建,助力您的科研之路!
 最新文章