题目:胃腺癌中乳酸酰化相关基因集和线粒体功能的综合分析:对预后和治疗策略的影响杂志:Frontiers in Immunology影响因子:IF=5.7发表时间:2024年10月研究背景胃腺癌(STAD)具有高度的异质性和侵袭性,导致全球预后不佳。本研究通过整合大规模基因组数据集,包括TCGA和多个GEO数据集,探讨了乳酸化相关基因集和线粒体功能在STAD中的预后意义数据来源转录组数据:GSE15459、GSE15460、GSE57303、GSE62254、GSE84437、GSE55696(用于差异基因分析)、GSE79973(用于差异基因分析)、GSE91061(肺腺癌数据集)、GSE78220(肺腺癌数据集)、IMvigor210(尿路上皮癌数据集)单细胞RNA测序数据集:GSE184198空间转录组数据集:GSE251950乳酸化基因集:从MSigDB数据库中获取,包含332个乳酸化相关基因。研究方法通过综合分析胃癌的基因表达数据,特别是关注乳酸化修饰相关的基因集和线粒体功能,来探索其在胃癌中的预后意义。利用单细胞RNA测序和空间转录组学技术深入剖析了肿瘤微环境,识别出与免疫细胞浸润、上皮细胞和基质细胞相关的乳酸化基因表达模式。基于差异基因构建了预后模型,并通过多数据集验证其预测能力。此外,研究还涉及了免疫治疗反应、药物敏感性分析以及不同风险组间的免疫细胞浸润和肿瘤突变负荷的比较。通过这些分析,研究旨在为胃癌的分子分类、预后评估和个性化治疗提供新的见解和靶点。主要结果1.目标基因集的特征化热图展示了332个乳酸化相关基因与170个线粒体相关基因集之间的相关性(图2A)。共识别出304个与肿瘤微环境调节、免疫反应调节、细胞增殖和凋亡、代谢重编程以及潜在预后标记物相关的乳酸化相关基因。随后,利用TCGA、GSE55696和GSE79973的数据分析了这些基因在肿瘤和相邻正常组织之间的表达差异(图2B),在至少一个数据集中识别出280个差异表达基因。接下来,生成了这些差异基因在TCGA、GSE55696和GSE79973中的表达相关性热图(图2C)。最后,这些基因在TCGA中进行了单变量Cox分析,并应用了五个额外的GEO验证数据集,构建了森林图(图2D)。最终选定了12个预后基因,这些基因在至少三个数据集中显示出预后意义。图2目标基因集的表征2.功能特征化与分子亚型应用非负矩阵分解(NMF)算法,对12个预后基因进行了聚类分析。聚类结果表明,将其分为三组是最合适的。三组的聚类一致性热图和生存分析结果显示,C1组和C3组之间存在显著的生存差异,其中C1组与较差的预后相关(图3A)。进一步分析比较了三组之间的临床指标组成,如年龄、性别、分期和病理分级,发现这些差异在统计上并不显著(图3B)。还对TCGA的免疫亚型与NMF分组进行了比较(图3C)。由于C1组和C3组之间存在显著的生存差异,因此进行了差异基因分析(图3D)。分别对上调和下调基因进行了基因富集分析,重点关注与C1和C3相关的功能(图3E)。计算了这些基因的富集通路的ssGSEA评分,并进行了相关性热图分析(图3F)。图3功能表征和分子分型3.能特征化-单细胞和空间转录组学应用AUCell软件包和12个预后基因来计算每个细胞的乳酸化评分。被分类为基质细胞的细胞,包括肿瘤微环境中的成纤维细胞和其他支持组织类型,其乳酸化评分高于上皮细胞。AUCell软件包中的AUCell_exploreThresholds函数被用来确定阈值并将细胞分为两组。进行了差异基因和富集分析,以探索这些组之间的功能差异(图4A)。空间转录组结果显示了免疫细胞、上皮细胞和基质细胞的分布差异。空间样本中也计算了乳酸化评分,揭示了高乳酸化区域,主要在基质区域,与单细胞结果一致(图4B)。结果表明,上皮细胞与乳酸化评分之间存在负相关,而免疫细胞和基质细胞则显示出正相关。随后,对高乳酸化组进行了功能富集分析(图4C)。图4单细胞分析乳酸化相关基因表达及其与肿瘤微环境中免疫细胞、上皮细胞和基质细胞群体的关联4.基于差异基因的预后模型开发应用12个预后基因,101种算法被用来构建模型;训练集是TCGA,测试集是五个GEO数据集。最佳模型,由五个测试集的平均C指数确定,被识别为RSF+SuperPC(图5A)。应用六个数据集计算了1年、3年和5年的AUC值(图5B)。条形图显示了不同数据集中最佳模型的C指数(图5C)。六个数据集的生存分析结果表明,高风险组的预后较差(图5D)。图5基于差异基因构建预后模型5.预后模型的比较呈现了六个数据集的风险和PCA图(图6A,B)。随后,将风险评分与其他临床指标进行了比较,发现风险评分的C指数优于大多数临床指标(图6C)。然后我们收集了最近1-2年发表的15个预后模型,并比较了它们的C指数。虽然我们的预后模型在TCGA队列中的表现并不是最好的,但在剩余的五个测试数据集中,它通常优于大多数其他模型(图6D)。图6预后模型的比较6.列线图模型的开发显示了风险评分和临床指标的单变量和多变量分析结果(图7A)以及相应的森林图。展示了一个包含风险评分和临床指标的列线图(图7B)。决策曲线分析(DCA)揭示了列线图和风险评分的结果比其他临床指标表现出更高的性能(图7C)。呈现了1年、3年和5年的校准曲线(图7D)。应用列线图评分的生存分析发现,较高的评分与较差的预后相关(图7E)。图7列线图模型的开发7.肿瘤免疫浸润和TMB分析显示了三个NMF分类组的风险值,表现出显著差异(图8A)。进行了风险评分与分子标志数据库(MSigDB)中的“50个特征基因集”之间的相关性分析,这些基因集代表不同的生物学状态和过程,通常用于评估癌症研究中的通路活性(图8A)。应用突变数据计算了肿瘤突变负荷(TMB),揭示了风险组之间的显著差异(图8A)。展示了两组之间的基质、免疫和ESTIMATE评分的差异。应用CIBERSORT算法描绘了不同组之间免疫细胞浸润的变化。应用MCP-counter和TIMER等其他算法进一步估算了免疫浸润水平,并将它们与风险评分相关联,应用热图展示(图8B)。图8癌症患者不同风险组的免疫浸润和肿瘤突变负荷(TMB)分析8.免疫治疗分析和药物敏感性分析进行了免疫评分与常用免疫检查点基因之间的相关性分析,显示出大多是负相关。应用TCGA数据集,利用TIDE算法预测了免疫反应情景。结果显示,两个风险组的反应组成有显著变化,无反应组的风险评分更高。结合免疫表型评分(IPS)的结果显示,低风险组的IPS评分更高(图9A)。包括GSE91061(肺腺癌)、GSE78220(肺腺癌)、IMvigor210(尿路上皮癌,UC)和Braun(肾细胞癌,RCC)数据集的生存分析结果,以及两个免疫反应组的风险评分(图9B)。药物敏感性分析显示,Bortezomib_1191和Dactinomycin_1911在低风险组中敏感,而Dasatinib_1079和BMS-754807_2171在高风险组中敏感(图9C)。对肺腺癌和尿路上皮癌的GEO数据集的分析揭示了与乳酸化相关基因表达相关的免疫细胞浸润和反应性的趋势,表明这些变化可能在STAD之外有更广泛的影响。这些发现支持了乳酸化可能在不同癌症类型中调节肿瘤免疫微环境的普遍作用的假设。图9免疫治疗和药物敏感性分析9.单细胞高风险和低风险细胞间的细胞通讯差异在单细胞RNA测序数据集GSE184198中,应用风险模型为每个细胞计算了风险评分,并应用中位数值对细胞进行分组。然后进行了Cellchat细胞通讯研究,比较了两组之间的差异(图10)。显示了上皮细胞、髓系细胞和T细胞及NK细胞组之间的通讯差异。图10单细胞水平上高风险和低风险预后细胞之间的细胞通讯差异10.PTMA在组织和细胞中的表达基于我们的差分基因表达分析,PTMA基因被鉴定为在胃癌组织中显著高表达,与相邻非癌组织相比。在12个已鉴定的预后基因中,大多数是最初的304个乳酸化相关和线粒体相关基因的一部分。然而,PTMA虽然不包含在最初的332个乳酸化相关基因或170个线粒体相关基因的集合中,但基于其与线粒体功能障碍的显著相关性以及通过单变量Cox分析确定的其在癌症进展中的作用,被确定为12个预后标记物之一。随后从临床样本中提取的RNA证实了肿瘤组织中PTMA的高表达,如图1A所示。此外,在四种胃癌细胞系(AGS、NCI-N87、BGC-823和MKN45)和正常胃黏膜细胞系GES-1中也确定了PTMA的表达。这些发现与人体组织中观察到的趋势一致,表明胃癌细胞中PTMA表达更高(图1B)。这些结果表明,PTMA基因在胃癌中高度表达。