暑假弯道超车靠它了!这篇miRNA预后模型狠活别错过,联手多组学+机器学习脱颖而出get7+,白嫖上二区你说香不香!

文摘   2024-08-22 18:00   上海  

一天连轴转,看完门诊忙手术, 你还有时间忙课题吗?不用怕!阿星团队“生信人发文必备的好东西”,劲爆来袭!花小钱办大事!用一半预算实现生信文章精准复现!


嗨嗨大家好啊,这里是阿星!有些宝子跟阿星吐槽,为什么自己的预后模型发不出高分,那自然是因为审稿人觉得你的内容不出彩,没有跟随热点或做出一点创新的东西。

今天阿星给大家带来一个生信顶级思路——基于miRNA的预后模型。越来越多的研究发现,miRNAs直接或间接调控靶基因的表达,对肿瘤进展具有至关重要的影响,所以挖掘miRNAs作为预测标志物是一个很新颖的方向,而在本研究中,研究者还整合scRNA-seq和bulkRNA-seq,以建立与CAFs相关的miRNAs的预后特征,因此能在众多预后模型中脱颖而出鹤立鸡群,获得审稿人的青睐,发在7+期刊理所当然!现在阿星就带大家把这篇干货学起来!

1、多组学数据整合分析:结合单细胞RNA测序和批量RNA测序数据,提供了对前列腺癌肿瘤微环境和CAFs的全面认识。多组学整合方法是对传统单一数据源分析的重要补充,可以揭示细胞群体间的复杂相互作用。

2、综合使用多种机器学习算法:研仅应用了单一的预测模型,而是结合了Lasso、RF和SVM等多种算法,提高了对CAFs相关miRNAs预后预测的准确性。这种多算法融合策略提高了模型的鲁棒性和预测效能。

3、开发新的预后模型:基于CAFs相关miRNAs、Gleason评分和病理分期构建预后模型,为PC患者的风险评估和个性治疗提供新工具。新模型比现有的工具拥有更精确的风险分层。PS:阿星查阅最近纯生信文章,发现非编码RNA出现次数越来越多了,这或是一大趋势。若想要寻找更多的idea,欢迎来戳下方二维码和阿星交流,这里有一大波干货等着你~    

题目:鉴定癌症相关成纤维细胞中的miRNA特征以预测复发性前列腺癌

杂志:Computers in Biology and Medicine

影响因子:IF=7.0

发表时间:2024年08月13日    

后台回复“888”获取原文献,编号240822

研究背景

前列腺癌(Prostate Cancer是男性生殖系统的恶性肿瘤之一,其治疗过程极为棘手,特别是进入去势抵抗性阶段时。这一阶段的挑战主要是因为缺乏明确的治疗目标,以及肿瘤的多样性使得预后评估变得复杂。

研究思路

首先确定了临床中的需求,再通过运用scRNA-seq剖析TME中的细胞群体多样性,尤其关注肿瘤相关成纤维细胞(CAFs的潜在作用。接下来运用机器学习算法在数据集中筛选出与CAFs密切相关的miRNA,将其视作可能的预后生物标志物,并通过实验进行验证,最后构建了基于miRNA的预后模型。以下为流程图:

数据来源

数据集

数据库

数据类型

详细信息

GSE141445,GSE176031,GSE185344,GSE193337

GEO

Sc RNA-seq

包含34位PRAD患者

TCGA-PRAD

TCGA

Bulk RNA-seq

包括495位PRAD患者的临床数据和基因/miRNA表达数据,其中460名患者有完整的BCR生存信息。

主要结果  

1.PCa的单细胞分析概括

作者通过分析4个单细胞队列,发现89个CAFs相关的mRNA。经过质控、降维和聚类后,识别出七到八种不同的细胞类型,(图2A-D)。上皮细胞是主要组成部分,但在不同个体中的比例不同(图2E–H)。    

图2 PC患者单细胞分析概况

GO分析发现这些基因在细胞外基质组织、细胞外结构组织中富集显著(图3C)。KEGG分析进一步发现它们参与蛋白质消化与吸收等通路(图3D)。基于PRAD患者CAFs相关基因和miRNA的表达谱,则鉴定出了63个与CAFs相关的miRNA(图3E和F)。    

图3 识别CAF相关基因、富集分析和共表达网络

2.PRAD中预后相关CAF miRNA的挖掘

研究者首先利用单变量Cox回归发现16个与PRAD预后有关的CAFs相关miRNAs,应用了等五种机器学习算法(图4A-G),通过C指数AUC指标最终确定Lasso惩罚模型为最优模型(图4H和I),并根据RS的中值将PRAD患者分为高风险低风险组    

图4 应用5种机器学习方法识别预后相关的miRNA

3.基于CA相关miRNA和临床病理信息的预后预测模型的构建

随后构建了一个CAFs相关miRNAs和临床病理信息的预后预测模型,运用了10种机器学习方法(图5A)。RF模型最优,ACC=0.934,AUC=0.76(图5A),识别出了4个因素并验证(图5B,C)。最终,建立了一个包含这四个变量的Nomogram模型来评估BCR的预后(图5D)。TCGA-PRAD被随机分为三个队列进行验证,结果表明其具有良好的AUC值和校准曲线,具有预测预后的能力(图5E–L)。    

图5 基于miRNA 的RS和临床特征构建列线图与评价

4.不同RS组的临床病理特征、TME和药物敏感性分析

之后分析了RS与PRAD患者的临床病理特征、TME和药物敏感性之间的关系。结果显示,较高的RS与“较大的年龄”以及“更差临床病理特征”相关(图6A)。高RS组患者比低RS组的BCRPFI显著更差(图6C–E,图6F–H)。此外,在TCGA和GSE26247中也观察到高风险组的预后比低风险组差(图6B)。    

图6 不同风险得分分组临床病理特征及生存分析

GSEA显示,在高RS组中,细胞增殖信号相关的组分表达较高,低RS组中激活了几个促炎通路(图7A,B)。使用CIBERSORT进一步检查了不同RS组的免疫细胞浸润情况,发现高RS组的水平较高,表明其TME更为复杂(图7C)。此外,使用CTRPPRISM数据库预测了潜在的抗癌药物,在筛选的8种药物中,发现高RS组对NVP-TAE684表现出的敏感性最高(图7D)。    

图7 GSEA分析、免疫细胞浸润和化疗反应在低风险组和高风险组之间的差异

5.hsa-miR-106b-5p 的下调抑制 CAF 的生长

TCGA的分析确定了9个CAFs相关miRNAs,其中5个miRNAs上调表达,而4个下调表达(图8A)。相关性分析强调了miRNAs在肿瘤微环境中的调控作用(图8B)。

其中hsa-miR-106b-5p通过单变量Cox生存分析被识别为与PRAD预后高度相关的miRNA(图9A和9B)。qRT-PCR也证实了这些miRNAs的差异表达(图9C)。实验证实hsa-miR-106b-5p表达下调可以抑制CAFs的迁移、增殖,并在体内减少肿瘤发展(图9D–K)。    

图8 CAF相关miRNA的差异表达及表达相关性分析    

图9 用于 PRAD 和体外细胞实验及体内动物模型的最佳预后 miRNA 的鉴定

文章小结

本研究的创新之处在于综合运用scRNA-seqbulk RNA-seq技术,结合5种机器学习算法,顺利开发了一个以CAFs相关miRNAs为依据的预测模型。此外还发现了特定的miRNAs如hsa-miR-106b-5p在调控CAFs功能及前列腺癌预后中的关键作用增加了研究深度),并探索了NVP-TAE684等药物可能的治疗效果这增加了研究广度)。看到这里,宝子们是否觉得这个思路有可做之处?我们可以通过使用其他独立的癌症类型样本集进行验证性实验,也可以通过整合多种类型的数据,如基因表达数据、蛋白质互作网络和临床数据,获得更全面的分子特征。研究者研究了prostate cancer,那其他疾病会不会也适用于“基于miRNA的预测模型”?欢迎扫码联系阿星寻找更多新思路!  



阿星有话说




生信星持续为大家带来最新生信思路,更多创新性分析思路请点击下方链接。想复现这种思路或者定制更多创新性思路欢迎直接call阿星,生信星团队竭诚为您的科研助力!



往期精选

22 August 2024



生信星
生信星提供专业生信分析服务,助您把握科研最新动态;思路设计、生信分析,就来找阿星~
 最新文章