哈喽哈喽~宝子们!盼星星盼月亮,甄博终于盼到你们啦!甄博争取做你们的多啦A梦!看看甄博今天找到什么好东西!首先甄博给大家带来一本JCRQ1区,中科院医学2区Top期刊“Journal of Translational Medicine”这个期刊接收纯生信文章,很友好噢!上面的纯生信发文思路极其新颖,是个优秀的学习平台!年发文量900多,目前国人发文量排名第一。此外,审稿速度较快,平均2.33月,被同学们称为“毕业神刊”!下面甄博今天分享一篇此期刊上的纯生信文章,咱们一起来学习一下这篇文章的新颖之处!
这篇是由同济大学医学院团队发表的研究论文,研究旨在通过综合多组学方法阐明线粒体相关基因在肺腺癌中的意义,为其制定个性化的治疗策略。该文章利用转录组学和单细胞RNA测序,以及来自公开数据库的临床信息,首次将降维和聚类技术应用于LUAD单细胞数据集,在通过利用机器学习算法的集合,开发AIDPS模型,并在多个独立数据集验证了其预后准确性最后利用全基因组关联研究(GWAS)数据进行MR分析。作为一个纯生信文章可以看出作者是诚意满满!单细胞RNA测序开道,诺奖新宠机器学习上分,生信老大哥孟德尔助力,这种联合思路你想不想要!有想法没思路,想实践没条件怎么办!来找甄博,这里有成熟的发文思路和生信服务器,欢迎来询~
题目:综合多组学整合揭示肺腺癌预后和个体化治疗的线粒体基因特征
杂志:Journal of Translational Medicine(IF=6.1)
日期:2024年10月
研究背景
肺癌(LC)是全球最致命的疾病之一,2020年约有180万例与肺癌相关的死亡,约占所有癌症死亡率的18%。吸烟和接触环境污染物是肺癌的主要病因。肺腺癌(LUAD)属于NSCLC类别。线粒体是调节真核细胞分化和存活的重要动态细胞器,拥有自己独特的基因组,称为线粒体DNA(mtDNA)。因此,研究线粒体相关基因在LUAD中的作用和潜在机制可以为新的治疗靶点和预后标志物提供重要见解,最终改善患者的治疗结果。
研究思路
首先将LUAD单细胞数据集进行降维和聚类,随后使用TCGA-LUAD数据确定了线粒体相关的预后基因,在利用机器学习算法开发了一种AIDPS模型,并在多个独立数据集上验证其预后准确性。分析两风险组间的生存预后、免疫治疗反应、TMB、免疫微环境特征差异。在利用GWAS数据进行MR分析,为相关基因在LUAD发病机制中的作用提供见解。
图1:研究流程图
主要结果
1. LUAD单细胞表达图谱
研究者先对单细胞数据集聚类、注释,依标记基因表达分出8个细胞亚型,发现正常与肿瘤样本细胞类型组成差异显著(图2);再分离上皮细胞独立降维、聚类,得到24个细胞簇并分为3个亚组,随后开展细胞轨迹、转录因子与CNV分析(图3);最后对T细胞、CAF细胞也做独立降维、聚类,针对亚分类做转录因子富集分析(图4)。
图2:LUAD单细胞表达图谱
图3:上皮细胞的亚分类分析、细胞轨迹分析和CNV分析
图4:T细胞和CAF细胞的的亚分类分析
2. 线粒体相关预后基因的鉴定和聚类分析
对2030个线粒体相关基因开展单变量Cox回归分析,从中精准锁定220个具备显著预后价值的基因。以这220个基因的表达数据为依托,在TCGA-LUAD数据集上实施一致性聚类分析,成功划分出2个亚型。经Kaplan-Meier生存分析发现,相较于C1群集的患者,C2群集患者的总体生存率显著偏低,与此同时,两个聚类在临床特征分布上也呈现出明显差异(图5)。
图5:线粒体相关预后基因的鉴定和聚类分析
3. 预后模型的构建和性能评估
在TCGA-LUAD数据集里,用LOOCV框架拟合101个预测模型,横跨11个验证集算各模型C指数。最佳模型Enet平均C指数达0.655,性能优异。(图6)。借ROC曲线评估AIDPS模型,其AUC值凸显强大预测力;与性别、年龄等传统临床特征比预测能力,AIDPS准确性更优(图7)。
图6:预后模型构建
图7:AIDPS模型评价
4. 化疗/免疫治疗反应分析和突变、TME分析
对比高低风险组发现:高风险组化疗药物IC50值低于低风险组,TIDE评分显著更高;生存分析显示高风险无应答组预后明显差于其他组。用免疫治疗数据集验证AIDPS模型,高风险组预后较差(图8)。肿瘤SNVs分析,7种突变类型中错义、多重命中常见,高风险组突变得分高。(图9)。
图8:化疗/免疫治疗反应分析
图9:突变、TME分析
5. MR分析
通过SMR软件使用eQTLGen和LC-GWAS数据进行基因共定位分析,确定了两个预后相关的基因,CDKN3和MYO1E。利用MR分析探索预后模型基因和SNP基因座之间的相关性,以及间质性肺疾病(ebi-a-GCST90018643)和LC之间的相关性。(图10)。
图10:MR分析
小结
研究通过整合多种方法,包括转录组学和scRNA-seq的获取和处理,以及随后的细胞分类和亚分类分析,对LUAD进行了深入分析。此外,还进行了免疫浸润分析、免疫治疗和化疗反应预测、GSEA和SNV分析。这些生物信息学方法的综合应用产生了一个强大的、多方面的数据集,为LUAD的分子景观和免疫动力学提供了有价值的见解。从此文的工作量可以看出纯生信发文是很有难度是,但并非不可行,可以走2条路:拼选题和拼思路!选题方向搞不定拿不准?联合思路不会设计?找甄博!专业的思路设计和生信分析为您提供个性化服务!
生信云服务器
个性化生信分析定制
课题设计、标书评估
加好友备注“66”领取试用
1.直接开挂了!“合成致死+铁死亡+CRISPR”国自然多热点组合,火速上车带你分分钟拿下Cell 子刊!
注:本文为原创编译,非声张版权,侵删!