机器学习又闷声干大事!联合单细胞分析+分子对接,不用测序,纯生信拿下2区6分+,南通大学团队这思路和期刊选的妙!

文摘   2024-11-25 10:00   上海  

哈喽大家好!大海哥准时上线啦~现在谈起0实验、0样本、快速成文和发表的好方法,一定绕不开最近的大热门机器学习(ML),今天,大海哥带着一篇新鲜出炉的ML相关文章来啦,该思路不仅适用于想要发表小论文争取毕业的研究生,对于工作繁忙的临床医生同样作用不小!让我们先来看看文章亮点吧~
 1. 该研究建立了一个 ML 框架,全面分析了胰腺癌(PAAD)队列中的 DPIRG 特征,从而为 PAAD 患者建立了稳健可靠的预后模型。还预测了PAAD 预后的生物标志基因,为 PAAD发生的肿瘤-免疫相互作用的复杂网络提供新的见解。这为胰腺癌临床治疗提供了一种新的思路,并可能促进个性化免疫治疗策略的发展!
2. 该研究利用单细胞RNA转录组数据,鉴定了几个与 DPIRG 表达水平呈正相关的 miRNA,为理解肿瘤微环境中的细胞间相互作用提供了新视角。
3. 该研究通过ML 算法确定可能影响疾病预后或 DPIRG 表达的主要潜在药物,为治疗 PAAD 的适当医疗干预提供参考。
PS:这种纯生信的分析思路很容易复现,简单好上手又节省时间,堪称性价比王者!感兴趣的朋友欢迎找大海哥沟通哦~


定制生信分析

云服务器租赁

加微信备注99领取使用


题目:基于机器学习的免疫冷和热胰腺癌生物标志物和药物鉴定
杂志:Journal of Translational Medicine
影响因子:IF=6.1
发表时间:2024年8月

研究背景
胰腺癌(PAAD)是一种起源于胰腺导管上皮及腺泡细胞的恶性肿瘤,通常表现出“冷”或免疫抑制性肿瘤环境,其与对免疫检查点阻断疗法的抗性相关。然而,其潜在机制尚不完全清楚。本研究旨在提高对肿瘤微环境中发生的分子机制的理解,并确定生物标志物、治疗靶点和改善PAAD治疗的潜在药物。    
研究思路
首先,研究者根据免疫学热或冷的PAAD亚型对患者进行分类,对其进行Cox回归和加权分析,构建一种称为“热肿瘤、预后和免疫相关基因下调”(DPIRGs)的基因特征,用于通过机器学习(ML)开发PAAD的预后模型。随后,作者全面分析了DPIRGs在PAAD中的作用,通过ML鉴定区分了PAAD免疫亚型和预测预后的生物标志基因。并使用公共单细胞转录组和蛋白质组资源验证生物标志物的表达。最后,通过分子对接研究鉴定了使冷肿瘤变热的候选药物和相应的靶蛋白。
研究结果
1.热/冷肿瘤和DEGs的鉴定
研究者基于CIBERSORT算法估计了22种细胞的免疫浸润浸润,将PAAD患者分为2-9个聚类(图1A)。Cox分析揭示了两个聚类之间存活率的显著差异(图1B)。基于基质评分、免疫评分和估计评分,研究者将其分为“热免疫”肿瘤和“冷免疫”肿瘤(图1C)。研究者使用“limmavoom”算法在热肿瘤中鉴定了相对于冷肿瘤的差异基因(图1D),使用clusterProfiler对上调和下调基因进行GO和KEGG分析。(图1E,图1F)。KEGG分析进一步表明,与免疫配体-受体相互作用相关的途径富集在热肿瘤中上调的DEGs中(图1G),而一些代谢相关途径富集在DEGs中,在热肿瘤中下调(图1H)。此外,研究者还通过GSVA确定了在热肿瘤中富集的多个标志性途径(图1I)。    
图1.热/冷肿瘤和DEGs的鉴定
2.免疫相关基因特征的鉴定
研究者使用WGCNA鉴定了由不同颜色指示的10个模块,计算其与免疫簇或免疫细胞之间的相关性(图2A)。在粉色模块中,基因显著性(GS)和模块隶属度(MM)之间的相关系数为0.46(图2B),绿色和黑色模块的相关系数分别为0.81和0.23(图2C和D)。DEGs和WGCNA结果的交叉揭示了118个基因在上调的DEGs和HRGs之间重叠,375个基因在下调的DEGs和CRGs之间重叠(图2E,F)。模块与免疫细胞之间的相关性如图2G所示。    
图2.加权相关网络分析。
3.机器学习驱动的预后模型的构建
为了开发一个机器学习模型,研究者使用LOOCV框架,对预后免疫相关基因进行了整合,使用TCGA-PAAD、ICGC-CA和ICGC-AU数据集评估所有模型的预测能力(图3A-C)。根据风险评分的中位数将PAAD患者分为高风险组和低风险组。结果表明,低风险组存活概率更高(图3D)。一致地,TCGA+ICGC队列中ROC曲线下面积随年龄的增长而降低(图3E)。风险评分和临床状态也表明高危组的存活率较低(图3F)。    
图3.预后信号的构建和验证。
4.DPIRG信号在PAAD中的预后价值
在基于ML构建了PAAD患者的预后模型后,作者还研究了不同的预后模型是否可以分别应用于热肿瘤和冷肿瘤患者。作者将RF和ridge的组合,指定为热肿瘤患者的最佳模型(图4A),冷肿瘤患者的最佳模型是plsRcox和XGBoost的组合(图4B)。Cox分析显示,热模型在将患者分为高、低危组方面优于冷模型;根据热模型和TCGA+ICGC及GSE数据库的数据表明,风险组之间的生存率差异更显著(图4C-G)。    
图4.热/冷胰腺癌(PAAD)肿瘤患者预后特征的构建和验证
5.DPIRGs的遗传改变和DNA甲基化分析
为了探索调节DPIRG表达的机制,研究者使用cBioPortal阐明PAAD患者DPIRGs的遗传改变(图5A),并评估了基因拷贝数变异(CNV)与表达水平之间的关系(图5B)。此外,对具有DPIRGs的CNV的患者进行生存分析(图5C)。接下来,作者还探究了DNA甲基化对这些DPIRGs表达的影响,结果表明ITGB4、AHNAK2和XDH的DNA甲基化水平与其表达负相关(图5D,E)。    
图5.在热肿瘤、预后和免疫相关基因(DPIRG)突变中下调。
6.预测DPIRGs对于PAAD预后和ML聚类至关重要。
为了了解DPIRGs影响PAAD患者肿瘤免疫景观和预后的潜在生物学功能和机制,研究者首先用五种ML算法评估了DPIRGs在混合、热和冷肿瘤中的意义。与患者存活率最显著相关的前5个基因、热肿瘤中的前5个基因、冷肿瘤中的前5个基因(6图A-C)。
   
图6“在热肿瘤中下调”、“预后”和“免疫相关基因”(DPIRG)预测预后的能力。
7.药物分子与DPIRGs的结合
研究者从ZINC15数据库选择了4个具有相应完整蛋白结构的基因,探索基因与药物的结合模式(图7A-D)。根据2D和3D分子相互作用可视化,semagacestat与GLIPR1L1的Asp84和Gln225氨基酸的相互作用比SB-43154更强。TRPV1和PLEC蛋白与药物之间之间存在大量氢键,其结合也相对稳定(图7C-F)。SB-43154和semagacestat与CEP295NL蛋白结合较弱(图7G, H)。
图7.药物分子与热肿瘤、预后和免疫相关基因下调编码蛋白的结合
8.PAAD样品中细胞类型特异性DPIRG表达的验证    
研究者下载了8个PAAD scRNA-seq数据集,鉴定了TME中的15种细胞类型,并检测了几种DPIRGs的细胞类型特异性表达,发现这些基因在恶性细胞中表达更强烈(图8A)。在HPA网站上,可获得DPIRGs对应蛋白的免疫组化结果,根据免疫组化分析,这些蛋白在代表性PAAD样品中的分布和染色强度,从低表达到高表达,如图8B所示。
图8.单细胞RNA测序(scRNA-seq)和免疫组织化学分析。
文章小结
这篇文章采用免疫细胞反卷积、共有聚类和免疫分析确定了一种新的 DPIRG 基因特征,预测 PAAD 患者预后效应。此外,分子对接可以确定 PAAD 中的候选药物和相应的蛋白靶点,有可能在未来应用于PAAD的治疗。对机器学习感兴趣的朋友,可以联系大海哥进行思路设计、定制分析~我们有专业的团队,丰富的经验,更有各种创新思路等着您~


医学海公众号持续为大家带来最新科研思路,想复现这种思路或者定制更多创新性思路欢迎直接call大海哥,竭诚为您的科研助理!


最新热点思路

文献思路复现

创新思路设计

服务器租赁

往期推荐

我缺的是Nat Commun吗?我缺的是撬动它的王炸思路!暨南大学团队:微生物组+代谢组学+转录组,这热点把握度,绝了!

超绝思路新鲜出炉!直接平地起高楼?准备好迎接国立成功大学林世杰团队“铁死亡+线粒体”把“毛坯”秒变“精装”的科研震撼吧!

震惊!只研究1种交互作用就拿到21分+?快进来学最严谨的交互作用分析方法

医学海
实用医学学术平台:专注分享生物医学方向最新热点研究,高分思路分享
 最新文章