一天连轴转,看完门诊忙手术, 你还有时间忙课题吗?不用怕!阿星团队“生信人发文必备的好东西”,劲爆来袭!花小钱办大事!用一半预算实现生信文章精准复现!
今天阿星给大家带来一个生信顶级思路——基于miRNA的预后模型。越来越多的研究发现,miRNAs直接或间接调控靶基因的表达,对肿瘤进展具有至关重要的影响,所以挖掘miRNAs作为预测标志物是一个很新颖的方向,而在本研究中,研究者还整合scRNA-seq和bulkRNA-seq,以建立与CAFs相关的miRNAs的预后特征,因此能在众多预后模型中脱颖而出鹤立鸡群,获得审稿人的青睐,发在7+期刊理所当然!现在阿星就带大家把这篇干货学起来!
1、多组学数据整合分析:结合单细胞RNA测序和批量RNA测序数据,提供了对前列腺癌肿瘤微环境和CAFs的全面认识。多组学整合方法是对传统单一数据源分析的重要补充,可以揭示细胞群体间的复杂相互作用。
2、综合使用多种机器学习算法:研仅应用了单一的预测模型,而是结合了Lasso、RF和SVM等多种算法,提高了对CAFs相关miRNAs预后预测的准确性。这种多算法融合策略提高了模型的鲁棒性和预测效能。
3、开发新的预后模型:基于CAFs相关miRNAs、Gleason评分和病理分期构建预后模型,为PC患者的风险评估和个性治疗提供新工具。新模型比现有的工具拥有更精确的风险分层。PS:阿星查阅最近纯生信文章,发现非编码RNA出现次数越来越多了,这或是一大趋势。若想要寻找更多的idea,欢迎来戳下方二维码和阿星交流,这里有一大波干货等着你~
题目:鉴定癌症相关成纤维细胞中的miRNA特征以预测复发性前列腺癌
杂志:Computers in Biology and Medicine
影响因子:IF=7.0
发表时间:2024年08月13日
后台回复“888”获取原文献,编号240822
研究背景
前列腺癌(Prostate Cancer)是男性生殖系统的恶性肿瘤之一,其治疗过程极为棘手,特别是进入去势抵抗性阶段时。这一阶段的挑战主要是因为缺乏明确的治疗目标,以及肿瘤的多样性使得预后评估变得复杂。
研究思路
首先确定了临床中的需求,再通过运用scRNA-seq剖析TME中的细胞群体多样性,尤其关注肿瘤相关成纤维细胞(CAFs)的潜在作用。接下来运用机器学习算法在数据集中筛选出与CAFs密切相关的miRNA,将其视作可能的预后生物标志物,并通过实验进行验证,最后构建了基于miRNA的预后模型。以下为流程图:
数据来源
数据集 | 数据库 | 数据类型 | 详细信息 |
GSE141445,GSE176031,GSE185344,GSE193337 | GEO | Sc RNA-seq | 包含34位PRAD患者 |
TCGA-PRAD | TCGA | Bulk RNA-seq | 包括495位PRAD患者的临床数据和基因/miRNA表达数据,其中460名患者有完整的BCR生存信息。 |
主要结果
1.PCa的单细胞分析概括
作者通过分析4个单细胞队列,发现89个CAFs相关的mRNA。经过质控、降维和聚类后,识别出七到八种不同的细胞类型,(图2A-D)。上皮细胞是主要组成部分,但在不同个体中的比例不同(图2E–H)。
图2 PC患者单细胞分析概况
GO分析发现这些基因在细胞外基质组织、细胞外结构组织中富集显著(图3C)。KEGG分析进一步发现它们参与蛋白质消化与吸收等通路(图3D)。基于PRAD患者CAFs相关基因和miRNA的表达谱,则鉴定出了63个与CAFs相关的miRNA(图3E和F)。
图3 识别CAF相关基因、富集分析和共表达网络
2.PRAD中预后相关CAF miRNA的挖掘
研究者首先利用单变量Cox回归发现16个与PRAD预后有关的CAFs相关miRNAs,应用了等五种机器学习算法(图4A-G),通过C指数和AUC指标最终确定Lasso惩罚模型为最优模型(图4H和I),并根据RS的中值将PRAD患者分为高风险和低风险组。
图4 应用5种机器学习方法识别预后相关的miRNA
3.基于CA相关miRNA和临床病理信息的预后预测模型的构建
随后构建了一个CAFs相关miRNAs和临床病理信息的预后预测模型,运用了10种机器学习方法(图5A)。RF模型最优,ACC=0.934,AUC=0.76(图5A),识别出了4个因素并验证(图5B,C)。最终,建立了一个包含这四个变量的Nomogram模型来评估BCR的预后(图5D)。TCGA-PRAD被随机分为三个队列进行验证,结果表明其具有良好的AUC值和校准曲线,具有预测预后的能力(图5E–L)。
图5 基于miRNA 的RS和临床特征构建列线图与评价
4.不同RS组的临床病理特征、TME和药物敏感性分析
之后分析了RS与PRAD患者的临床病理特征、TME和药物敏感性之间的关系。结果显示,较高的RS与“较大的年龄”以及“更差临床病理特征”相关(图6A)。高RS组患者比低RS组的BCR和PFI显著更差(图6C–E,图6F–H)。此外,在TCGA和GSE26247中也观察到高风险组的预后比低风险组差(图6B)。
图6 不同风险得分分组临床病理特征及生存分析
GSEA显示,在高RS组中,细胞增殖信号相关的组分表达较高,低RS组中激活了几个促炎通路(图7A,B)。使用CIBERSORT进一步检查了不同RS组的免疫细胞浸润情况,发现高RS组的水平较高,表明其TME更为复杂(图7C)。此外,使用CTRP和PRISM数据库预测了潜在的抗癌药物,在筛选的8种药物中,发现高RS组对NVP-TAE684表现出的敏感性最高(图7D)。
图7 GSEA分析、免疫细胞浸润和化疗反应在低风险组和高风险组之间的差异
5.hsa-miR-106b-5p 的下调抑制 CAF 的生长
TCGA的分析确定了9个CAFs相关miRNAs,其中5个miRNAs上调表达,而4个下调表达(图8A)。相关性分析强调了miRNAs在肿瘤微环境中的调控作用(图8B)。
其中hsa-miR-106b-5p通过单变量Cox生存分析被识别为与PRAD预后高度相关的miRNA(图9A和9B)。qRT-PCR也证实了这些miRNAs的差异表达(图9C)。实验证实hsa-miR-106b-5p表达下调可以抑制CAFs的迁移、增殖,并在体内减少肿瘤发展(图9D–K)。
图8 CAF相关miRNA的差异表达及表达相关性分析
图9 用于 PRAD 和体外细胞实验及体内动物模型的最佳预后 miRNA 的鉴定
文章小结
本研究的创新之处在于综合运用scRNA-seq和bulk RNA-seq技术,结合5种机器学习算法,顺利开发了一个以CAFs相关miRNAs为依据的预测模型。此外还发现了特定的miRNAs如hsa-miR-106b-5p在调控CAFs功能及前列腺癌预后中的关键作用(增加了研究深度),并探索了NVP-TAE684等药物可能的治疗效果(这增加了研究广度)。看到这里,宝子们是否觉得这个思路有可做之处?我们可以通过使用其他独立的癌症类型样本集进行验证性实验,也可以通过整合多种类型的数据,如基因表达数据、蛋白质互作网络和临床数据,获得更全面的分子特征。研究者研究了prostate cancer,那其他疾病会不会也适用于“基于miRNA的预测模型”?欢迎扫码联系阿星寻找更多新思路!
阿星有话说
生信星持续为大家带来最新生信思路,更多创新性分析思路请点击下方链接。想复现这种思路或者定制更多创新性思路欢迎直接call阿星,生信星团队竭诚为您的科研助力!
往期精选
22 August 2024