一招鲜,吃遍天!10种机器学习算法+101种组合出手即二区,这个屡试不爽的套路你掌握了吗!

文摘   2024-07-09 19:00   山东  

好久不见,生信的经典思路~

其实2024都过半了,大家心里可能也在嘀咕,这种思路还能不能发呢?船长当然会挺起胸膛说:方法绝对没问题,发高发低看细节,下面的截图是船长搜索的2024年用类似方法发表的文章:

不想做特别多的努力,发一篇3区还是有的!如果创新度足够,1区也可冲击~今天船长带大家回顾下这种结合了101种机器学习组合的生信经典思路,可复现性强,数据可公开获取,可以根据研究情况添加湿实验验证,总之性价比还是满满的~非常适合课题比较明确,但是苦于数据挖掘比较艰辛,或者课题没有思路,需要个性化数据挖掘进行辅助的医生小伙伴,get同款思路直接扫码,船长后台等你~

定制生信分析

云服务器租赁

加好友备注“99”领取试用

题目:基于机器学习的肿瘤浸润免疫细胞相关模型的识别对改善膀胱癌患者预后和免疫治疗反应具有重要意义

杂志:Front Immunol

影响因子:IF=5.7

发表时间:2023年3月

后台回复321获取原文献,文献编号20240710

研究背景

免疫细胞是肿瘤微环境 (TME) 的重要组成部分,调节癌细胞的发展。然而,免疫细胞浸润相关 mRNA 对膀胱癌 (BCa) 的临床意义仍不清楚。

研究思路

采用10倍交叉验证框架,包含10种机器学习算法的101种组合,开发出一致的免疫细胞浸润相关特征(IRS),全面评估IRS在预后和免疫治疗方面的预测性能。

数据来源

数据集/队列

数据库

数据类型

详细信息

TCGA-BLCA

TCGA

RNA-seq数据

n = 399,正常样本被丢弃

GSE32894            

GEO

RNA-seq数据

n = 224

GSE13507

GEO

RNA-seq数据

n = 165

GSE32548

GEO

RNA-seq数据

n = 128

GSE31684

GEO

RNA-seq数据

n = 93

GSE48075

GEO

RNA-seq数据

n = 73

GSE48277

GEO

RNA-seq数据

n = 71

GSE70691

GEO

RNA-seq数据

n = 49

GSE69795

GEO

RNA-seq数据

n = 38

13个ICI RNA-seq 队列

收集

RNA-seq数据

1010 名患者


主要结果

共识聚类将BCa TME分为具有不同免疫学特征的两个亚簇

研究者应用ssGSEA技术在TCGA-BLCA数据集中分析了28种免疫细胞的浸润情况。

通过无监督共识聚类方法,研究者将膀胱癌的肿瘤微环境(TME)分为两个具有不同免疫学特征的亚簇。利用CDF曲线和PAC得分确定了最佳的聚类数量为两个。与簇1相比,簇2的TME显示出更高程度的免疫细胞浸润,与炎症性TME相关。        

研究者采用五种不同的方法进一步验证了聚类结果的稳定性和免疫表型的差异性,确认了簇2具有更高的免疫活性。

图1 TCGA-BLCA数据集中免疫细胞浸润相关基因的识别

免疫细胞浸润相关基因的鉴定

应用WGCNA方法构建了基因表达的相关网络,以识别与免疫细胞浸润相关的基因。在R平方值为0.85的条件下,确定了最佳的软阈值为5,将5000个基因聚类为12个模块。通过“模块-性状”相关热图,研究者分析了各模块与免疫簇、生存时间和状态、肿瘤阶段等临床特征之间的相关性。黄色模块与免疫簇的相关性最高,表明其与免疫细胞浸润有最强的联系。通过设置基因显著性和模块成员资格的阈值,鉴定出了256个关键的mRNA,这些mRNA在免疫相关生物学过程中起到重要作用。

IRS构建和评估

在模型开发之前,执行了单变量Cox分析,并从256个中心mRNA中鉴定出26个与预后相关的基因。随后,这26个mRNA被用于基于机器学习的集成程序,以识别具有最高准确性和稳定性的最优IRS。基于StepCox(向后方向)和随机生存森林(RSF)的结合,开发了一个在几个数据集中表现最佳的最终IRS(图2A)。IRS包含十四个mRNA(图2B)。基于IRS得分的中位数,将BCa患者分为高IRS和低IRS两组。所有数据集中高IRS的BCa患者生存时间减少(图2C)。每个队列的C指数在图2D中呈现。随后采用时间依赖的ROC分析来测量IRS在生存方面的区分能力(图2E)。总体结果表明,IRS在多个数据集中具有稳定的性能。

图2 TCGA-BLCA 和多个 GEO 数据集中的 IRS 开发和评估

为了进一步评估IRS相对于其他临床病理特征的优越性,全面比较了IRS与每个特征之间的C指数,并发现IRS的表现优于其他特征(图3)。考虑到肿瘤阶段在预后预测实践中的广泛应用,将IRS和阶段结合起来,发现综合模型的C指数比单独的IRS或阶段更高(图3)。 

图2 IRS与临床病理特征和 94 个已发表特征的预后预测性能比较

预后签名的比较

收集了94个与各种生物学特征相关的预后mRNA签名(例如,坏死、焦亡、氧化应激和自噬)。为了比较IRS与这些已发表签名的性能,计算了每个模型的C指数。值得注意的是,在包括TCGA、GSE32548、GSE32894、GSE13507、GSE31684、GSE48075和GSE48277等多个数据集中,IRS显示出最高的性能。在GSE69795和GSE70691中,IRS仍然显示出比大多数已发表的签名更高的性能。

 IRS在PUMCH_Uro队列中指示生存期减少

使用RNA测序队列来验证在硅片上构建的模型。一致地,高IRS在总体生存期(OS,图4A)和无复发生存期(RFS,图4C)方面表明了减少的生存时间。通过多变量Cox分析,IRS被视为OS和RFS的独立预后因素(图4B、D)。时间依赖的ROC分析显示,1年、3年和5年OS的AUC分别为0.82、0.74和0.9(图4E)。C指数也证明了IRS优于其他特征(图4F)。这些指标显示了IRS在作者内部队列中的良好和稳定表现。 

4 评估 PUMCH_Uro 队列中 IRS 的预后预测性能

IRS塑造了BCa的炎症性和免疫抑制性肿瘤微环境(TME)

高IRS组的BCa TME表现出更高水平的免疫细胞浸润,以及免疫调节因子表达谱的类似趋势。

通过GSEA分析,研究者发现在高IRS组中,与免疫相关的多个生物过程和信号通路上调。

高IRS与T细胞耗竭相关签名呈现正相关,且高IRS组过表达了多种抑制性受体,表明可能存在免疫抑制性的TME。这些发现表明IRS与BCa的炎症性和免疫抑制性TME有关,可能对免疫治疗的响应有重要影响。

图5 IRS 塑造了 BCa 的炎症和免疫抑制TME

IRS预测PUMCH_Uro中的免疫治疗反应

探索了高IRS和低IRS组之间免疫治疗预测通路和癌症免疫周期的富集得分,发现高IRS组中多数通路过度激活。使用TIDE计算框架评估了内部队列的免疫治疗反应,结果显示高IRS组有更多的反应者。通过GenePattern的SubMap分析,确认了高IRS与抗CTLA-4和抗PD-1免疫治疗反应的相关性。相关分析和IHC验证表明,高IRS组中CD8A和PD-L1的表达水平显著更高,这可能意味着更好的免疫治疗响应。除了免疫治疗,高IRS还被预测对常用的化疗药物(除了吉西他滨)更敏感,这为BCa患者的治疗提供了新的视角。

图6 IRS 预测了 PUMCH_Uro 中的免疫治疗反应

IRS预测多个ICI治疗队列中的免疫治疗反应

将13个不同的ICI RNA测序队列标准化,创建了一个GEO元队列,以评估IRS对ICI反应的预测能力。在这个元队列中,高IRS与患者较长的生存时间相关,且在有反应者中IRS得分显著高于无反应者。ROC分析表明IRS具有满意的预测准确性。在包括尿路上皮癌、肾细胞癌、皮肤黑色素瘤、非小细胞肺癌和胃癌的其他独立队列中,IRS同样展现出了一致的预测性能。在尿路上皮癌队列中,高IRS与更好的总体生存和无进展生存预后相关,AUC值显示了IRS的预测效能。对于其他癌症类型,IRS的AUC值也显示出其在不同癌症中的预测潜力。

图7 IRS 预测了 ICI 队列中的免疫治疗反应

文章小结

这是一篇非常简单、一年前发表的纯生信文章。当然这些研究方法我们现在也经常用,但是同样的纯生信思路是发不了5分啦。在这基础上可以加实验。那么不加实验就想靠纯分析发高分咋办?不仅需要选题兼顾创新性和普遍性,数据量也要够大。如果能结合热门的孟德尔随机化方法就更ok啦!对自己的课题没思路,或者思路不太清晰,可行性不好估算?那就可以来找船长啦,这里有免费的方案评估,付费的方案设计和个性化生信分析!自测后的数据再分析也可以找我!

 

船长寄语


船长可以为您提供以下服务哦:评估思路(免费)、生信分析、方案设计、服务器租赁、特色数据库搭建等!欢迎大家扫码咨询,有问必答!

生信分析

思路设计

服务器租赁

扫码咨询船长

往期推荐



1、这也太city了吧!北京大学詹思延教授团队整合蛋白质组+转录组+孟德尔随机化,纯生信拿下1区10分+!这个框架大有搞头!
2、【NC】经费足直接冲:复旦大学郁金泰等团队:全外显子组关联分析(UKB可申请数据)+孟德尔随机化一举拿下14.7分!
3、可复现性极强的nature子刊思路!泛凋亡+机器学习果然是生信统治区~
4、先天科研圣体!西南医科大学这篇数据挖掘+机器学习+单细胞,超经典数据挖掘套路SCI拿到手软!

       

 

   

生信海
怕错过生信热点?来生信海,船长日更不落伍!船长擅长思路设计、个性化生信分析、高分文献复现、特色数据库搭建等,欢迎来撩~
 最新文章