超级思路,卷王必备!当“DNA甲基化”结合“多组学”,遇上“机器学习”联手冲击最终拿下1区9+分

文摘   2024-08-20 18:00   上海  


“生信人发文必备的好东西,劲爆来袭!介绍一下阿星团队的服务器:服务器租赁续费不涨价还倒送你时间?是的,快来!


哈喽,各位小伙伴们,炎热暑期即将到来,届时大家也不要忘记学习噢!近日,一篇文章引起了阿星的注意,它巧妙的结合了单细胞测序技术和机器学习,新老方法一起上,拿下了9分+哦!下面让我们一起来学习这篇涉及到多种数据源和分析工具的文章吧!

今天阿星给大家带来的这篇文章发表在Cancer Letters杂志上,影响因子高达9分。该文章结合了多种数据源,且设计合理具有创新性,综合利用了多种数据以及机器学习的方法,值得我们借鉴和学习。那么这篇文章的亮点主要都有哪些呢?阿星这就给大伙揭秘!

1.多种数据源结合:利用TCGA数据库中甲基化样本,UCSC Xena数据库中癌症类型数据,以及GEO数据库,通过综合分析使结果更加可靠

2.多种方法融合:采用多组学分析结合机器学习的方法,分析甲基化数据,识别与干扰素相关的甲基化位点,构建了预测模型。

3.干湿实验结合:生信分析最后结合上相关细胞实验,验证基因的生物学功能,形成闭环使结果更具可信度

PS:跨学科应用越来越广泛,先人一步掌握机器学习在生信分析中的应用,可以帮助小伙伴们在未来的研究中抢占先机!如果在研究思路、研究方法有疑问,那你可以随时来找阿星!

    

题目:通过多组学和单细胞转录组分析揭示PSMB9在黑色素瘤中的肿瘤抑制作用

杂志:Cancer Letters

影响因子:IF=9.1

发表时间:2024年1月

公众号回复“888”,即可领取原文献,文献编号为240820

研究背景

皮肤黑色素瘤是皮肤癌中的一种,近年来免疫疗法的突破使黑色素瘤的治疗方式发生了彻底变化,但肿瘤异质性仍然是一个难点。DNA甲基化引起的表观遗传修饰促进肿瘤发生,因此有可能揭示黑色素瘤的预后。本研究通过分析DNA甲基化和基因表达数据,构建鲁棒模型,综合分析结果表明,PSMB9是一个重要的预测标志物,具有潜在预测黑色素瘤免疫治疗反应的能力。

研究思路    

本研究通过对基因组数据和临床信息的综合分析,探索了预测黑色素瘤患者免疫治疗反应的潜在标志物。首先分析了360827个甲基化探针和相应的25577个黑色素瘤患者的基因表达概况,区分了一种新的免疫亚型。利用机器学习方法分析甲基化数据,识别与干扰素相关的甲基化位点。然后,结合基因表达数据和临床信息建立预测模型,用于评估患者对免疫治疗的反应。在建模过程中,特别关注了关键基因PSMB9,研究其潜在的抗肿瘤作用,并进一步讨论PSMB9的临床意义。

图1 研究设计思路

研究结果

1.基于IFN相关基因的甲基化亚型鉴定及分析

本研究通过利用TCGA-SKCM数据库,分析了其中的472个DNA甲基化样本,基于干扰素相关基因将黑色素瘤分为三个不同的亚型(图2A&B),通过比较不同聚类间的DNA甲基化水平和差异甲基化位点(DMPs),以及对基因表达的影响cluster2(C2)中几乎所有干扰素-γ相关基因表达上调(图2C)C2的异常DNA甲基化状态表明了内在的癌症表型(图2D)。DMP在染色体中的分布显示在圆形曼哈顿图中(图2E)。通过Wilcoxon检验确定了高甲基化的C2在黑色素瘤中具有特定的DNA甲基化模式(图2F)。同时还发现54.75%的差异甲基化探针呈现低甲基化,而45.25%呈现高甲基化(图2G)    

图2 IFN基因相关甲基化亚型的构建

2.利用机器学习构建干扰素(IFN)甲基化特征

随后,研究使用了三种建模方法来获得鲁棒模型。首先采用单变量Cox回归过滤了DMP,并选择了所有p < 0.05的DMP进行下一步分析(图3A)随后采用随机森林算法进行模拟训练,并根据变量重要性对探针进行选择和排序(图3B)。使用Lasso-Cox算法进行变量检索,选择了22个变量(图3C&D)。选取10个探针图3E,使用Lasso-Cox回归计算各探针的系数。低于截断点的组定义为IFN阳性(IFN+。与IFN-组相比,IFN+组预后明显较好图3F)。使用该模型对每个样本测量IFN甲基化评分IMS。IMS、年龄、Breslow深度、Clark IV和Clark V是黑色素瘤患者的风险因素图3G)IFN+群体免疫细胞比例较高图3H,且免疫反应途径如PD1、CTLA4、CTL和干扰素反应富集图3I    

图3 IFN+和IFN-群体在黑色素瘤患者中的分析

3.IMS在黑色素瘤治疗及泛癌分析中的预后价值

泛癌分析是理解IMS内在价值的一种新方法。研究将模型应用于TCGA-PANCANCER甲基化数据集。通过泛癌分析发现,在大部分癌症类型中IFN+组预后较好,只有极少部分癌症类型中IFN+组生存状况更差(图4A&B)甲基化DNA干性指数(mDNAsi)是一种机器学习模型,用于评估细胞自我更新和分化能力该研究计算了每种癌症类型的甲基化DNA干性指数,并比较了高危组和低危组之间的差异(图4C)随后对不同癌症类型之间进行了比较,为理解IMS的内在价值提供了新视角。    

图4(A) 森林图展示了IMS在TCGA数据库中29种其他癌症类型中的预后价值。(B) 12种不同类型癌症的K-M生存曲线图。(C) 箱线图展示了33种癌症类型中甲基化DNA干性指数(mDNAsi)

4.PSMB9通过IFN-γ塑造黑色素瘤微环境

PSMB9基因黑色素瘤患者预后和免疫检查点阻断(ICB)治疗中的一个关键因素。PSMB9可通过IFN-γ影响黑色素瘤的微环境。为了进一步探究PSMB9 在黑色素瘤中的作用,作者通过单细胞RNA测序分析了7186个细胞,并将它们分为9个类别,分别是CD8+T细胞、CD4T细胞、B细胞、巨噬细胞、恶性肿瘤、恶性肿瘤2型、树突状细胞、癌症相关成纤维细胞自然杀伤细胞(图5A&C)发现PSMB9主要在T细胞和树突细胞中表达(图5B&C)。在恶性肿瘤细胞中,PSMB9只某些仅在治疗前存在亚型表达(图5D&E&G)。通过每种细胞类型PSMB9表达水平鉴定,PSMB9的高表达免疫基因的激活相关联,如IFN-γ反应和NF-kB途径的TNFa激活,以及MYC靶标的抑制(图5F)。    

图5 单细胞RNA测序揭示了黑色素瘤微环境及PSMB9的作用

5.PSMB9参与IFN-γ信号传导并由转录因子驱动

PSMB9通过影响IFN-γ信号通路在黑色素瘤微环境中发挥作用,这种作用受到转录因子的调控。作者使用NicheNet工具恶性细胞与免疫细胞的相互作用进行分析,发现在PSMB9高表达组中,IFNG是最活跃的配体,主要由CD8+T细胞和树突状细胞分泌,揭示了PSMB9能够增加树突状细胞和T细胞中IFN-γ的表达(图6A&B)。通过pySCENIC转录因子分析,发现ETV5特异性靶向控制IFNGR2转录的恶性细胞;STAT1、EOMES和PRDM1是PSMB9的主要调控因子,主要存在于CD8T细胞(图6D。此外,PSMB9的表达影响恶性细胞中的IFN-g受体IFNGR1和IFNGR2,这两种受体在单细胞水平的恶性细胞中均呈正相关(图7A&B)在Bulk RNA seq色谱中,PSMB9与免疫标记基因如PD-L1和IFNG密切相关(图7C&D),这些均说明了PSMB9在免疫治疗反应中的重要性。    

图6 细胞间相互作用和转录因子分析

图7 PSMB9与IFNGR1(A)和IFNGR2(B)的分布之间的相关性。IFNG(C)、PDL1(D)与PSMB9之间的相关散点图。(E)热图显示了异质细胞类型中独特的转录因子(TFs)

6.异常的PSMB9调节黑色素瘤细胞的增殖、克隆形成和细胞侵袭

在两种黑色素瘤细胞系SK-MEL-28和A375中过表达PSMB9,通过Western blotting检测结果显示,重组慢病毒两种黑色素瘤细胞系过表达图8A),并通过RT-PCR证实了这一结论(图8B&C)。使用 CCK8细胞增殖实验证明过表达PSMB9 后,显著限制了细胞的增殖能力图8D&E),并采用细胞克隆实验验证了这一结果图8G肿瘤细胞浸润影响恶性肿瘤转移。因此该研究通过创伤愈合实验评估细胞迁移能力,过表达PSMB9降低细胞迁移速度图8F这些结果表明PSMB9在黑色素瘤中具有抑制恶性程度和转移的作用。    

图8 PSMB9的过表达降低了肿瘤细胞的增殖和迁移能力

文章小结

该文章综合利用了肿瘤基因组学、转录组学和表观遗传学的数据,包括肿瘤组织样本、单细胞RNA测序数据和公共数据库中的数据。通过结合分析这些多种数据源,使结果更加可靠,且建立了一个可靠的预测模型,能够帮助评估患者对免疫治疗的反应,最后又结合湿实验冲上了1区9分+,是一篇非常值得借鉴的生信文章!如果你也想发一篇整合公共数据+湿实验的SCI就来找阿星吧,思路设计、生信分析选题创新等难题阿星都能为你提供帮助,想要发高分就快快扫二维码与阿星探讨合作



阿星有话说




生信星持续为大家带来最新生信思路,更多创新性分析思路请点击下方链接。想复现这种思路或者定制更多创新性思路欢迎直接call阿星,生信星团队竭诚为您的科研助力!



往期精选

20 August 2024



  

生信星
生信星提供专业生信分析服务,助您把握科研最新动态;思路设计、生信分析,就来找阿星~
 最新文章