​这本7+Top“神刊”闭眼投!广东二院团队:创新思路出其不意,迭代机器学习助力纯生信预后模型49天接收,5天见刊!

学术   2024-11-19 10:02   上海  

预后模型是纯生信分析中最常见的思路,常规思路好复现但是没点新意却很难发表,尤其是想发篇高分文章更难。
如何创新呢?
今天小云就给大家带来一篇不靠热点纯生信发了7分+的文章!怎么做到的呢?
常看小云文章的宝子应该知道,目前大多数预后模型分析都是基于某一热点或者特定生物功能的基因集进行分析,主要关注组间差异,而忽略了个体特征。而这篇文章则利用来自TCGA数据库的胶质母细胞瘤患者的临床信息和转录组测序数据,通过迭代机器学习进行基因逐个分析,考虑了患者间和患者内(个体)的差异,构建了一个生存相关变量预测指数(OPISV)。这种迭代分析建立预后模型的方式与常规机器学习建模过程也是不同的,整体思路和切入点都非常有新意。文章发表在了1区Top期刊International Journal of Biological Macromolecules上(小云以前分享过哦~感兴趣的宝子可以回头看看IF 7.7!这才是当下正的毕业神刊:药食同源+肠道菌群+多组学,这篇文章我愿称它是中药生信思路的天花板!)。别看是7分+,文章复现起来并不难,因为用到的都是咱们常见的分析包,动手能力强的小伙伴可以试试哦~想实践没条件的可以找小云!创新思路、个性化分析方案,应有尽有,欢迎来询~

定制生信分析

生信云服务器

(加微信备注99领取试用)

题目:生物信息学分析基于胶质母细胞瘤全基因组表达数据构建了生存相关变量(OPISV)的最佳预后指数
发表时间:2024.11
关注公众号,后台发送“123”可以直接获取原文PDF,文献编号:241119
研究背景
利用TCGA数据库中胶质母细胞瘤(GBM)患者的临床信息和转录组测序数据,进行符合患者个体特征的逐基因分析,并通过迭代机器学习技术建立生存相关变量(OPISV)的最佳预后指数,预测GBM患者的预后。
研究思路
研究结果
胶质母细胞瘤的生存分析及预后评价
通过逐步回归构建模型的初始最优风险因素包括NSUN5、DNAJC30、CTSD、PTPRN、CTSD、SOX21和Age。多变量Cox模型显示,年龄、PTPRN和DNAJC30是独立的危险因素。最终构建了OPISV(生存相关变量的最佳预后指标),OPISV_low组患者预后较好,总生存率相对较高。通过Kaplan-Meier生存曲线对OPISV_high组和OPISV_low组进行生存分析,其中OPISV_low亚组的预后优于OPISV_high组,相对于个体变量的生存曲线明显改善。    
分别对三个风险变量和OPISV进行ROC分析,结果显示OPISV对死亡事件的预测能力优于单个基因。ROC分析,折线图均表明,模型的预测能力很好。外部数据集GEO GSE83300和GSE7696的验证结果也证实了这些发现。    
预后指标差异基因组
火山图显示了OPISV_high和OPISV_low患者之间的差异基因表达,PPI网络图显示了差异基因之间的连接。    
GO和KEGG富集分析显示,差异基因主要富集于突触信号传递过程、免疫细胞受体和免疫球蛋白通路,以及GABA能突触、突触囊泡周期和Wnt信号通路。
GSEA分析发现,在OPISV_high组中,与T细胞受体复合物和免疫球蛋白复合物相关的免疫因子通路上调,核糖体通路下调。此外,一些与肿瘤预后不良相关的经典信号通路,如PI3K-Akt、Wnt信号通路和cAMP信号通路在OPISV_high组中上调。CIBERSORT和ssGSEA算法的免疫结果在免疫细胞浸润方面没有明显差异。OPISV组间GABA能突触通路内25个基因表达差异显著。    
GABA能突触聚类分析
对GBM患者GABA能突触通路相关基因表达水平进行聚类分析,将其分为高表达组和低表达组。采用维恩图来说明FPKM值超过1的基因的数量,并将其命名为基因集3。GO富集分析的结果表明,这些基因主要聚集在与突触信号、免疫球蛋白复合物和抗原结合相关的途径中,而KEGG项富集则强调gaba能突触和突触囊泡循环等信号通路。此外,对基因集3和之前的基因集2进行了交叉分析。PPI网络被用来证明gaba能突触通路基因与胶质瘤之间的直接相互关系。同样,PPI网络说明了与gaba能突触通路高度相关的基因模块与富集的胶质瘤通路基因之间的直接相互关系。    
   
深入分析GABA能突触通路基因与POISV和胶质瘤通路基因的关系
参与胶质瘤信号通路的三个基因CAMK1G、CAMK2A和PRKCB在GABA能突触和OPISV组中表现出显著差异。    
加权基因共表达网络分析(WGCNA)用于枢纽基因鉴定
对来自GBM患者的表达矩阵进行了WGCNA,确定了与gaba能突触通路相关性最高的基因模块,随后标记为基因集4 (tan模块,125个基因)。GO富集分析表明,这些基因在神经调节通路中存在聚类,而KEGG术语富集强调了与胶质瘤通路的直接关联。    
突变分析
关于GBM患者中突变基因的分析结果以全景视图的形式描述了不同的亚组:OPISV组, OPISV_low组,死亡组和存活组,显示了前10个突变基因。提供了一张热图来描述每个亚组的分组信息以及临床数据的分布,有助于更清晰地呈现相关数据。    
文章小结
研究通过整合诊断为GBM的患者的全基因组表达数据和个体临床参数,建立了一个最佳的多变量预后模型,称为OPISV。该模型为GABA能突触通路在GBM进展中的参与提供了新的见解。    
这篇文章整体分析流程并不复杂,用到的方法也是常见方法,创新性选题和思路决定了文章的分数,如果你在选题方面拿不准可以来找小云。Ps:电脑不给力的宝子可以考虑试用小云这里的高速服务器哦~

定制生信分析


生信云服务器

热点推荐

孟德尔随机化

临床公共数据分析

单细胞测序

肿瘤免疫与微环境

机器学习

单基因分析

生信云服务器

代码合集(点击查看)

培训班系列(点击查看)

云生信学生物信息学
专注生信10余年,原创文章数千篇; 公号资料免费领,寻求服务找小云; 长期学习加关注,生信干货更不停。
 最新文章