机器学习卷出天际!12种算法113种组合,携手双疾病,纯生信拿下1区Top!你说City不City~

文摘   2024-11-07 19:01   上海  


话说馆长是不是好几天没发机器学习的文章了,大家是不是都等着急了?不是馆长不想发,是没找到适合小伙伴们的创新思路。这不今天发现了一篇新意满满的文章就马上给大家安排上!

双疾病研究大家都见过吧?结合了12种机器学习算法131种组合的双疾病研究你们见过吗?今天馆长带来的这篇文章就是这么做的。文章基于GEO的转录组数据,分析了重度抑郁障碍和间质性膀胱炎之间的共病机制,纯生信就能拿下4+Top期刊。如果你此刻选题拿不准、思路搞不定,随时可以联系馆长哦,馆长可以让你的文章少走弯路,更快见刊哦!

定制生信分析

云服务器租赁

加好友备注“99”领取试用


题目:基于间质性膀胱炎相关基因开发和验证重度抑郁障碍诊断模型的集成机器学习框架

杂志:Journal of affective disorders

影响因子:4.9

发表时间:2024.8


研究背景

重度抑郁障碍(MDD)与间质性膀胱炎(IC)是两种高度衰弱的疾病,常相互影响共存,显著加重患者的痛苦。然而,这些疾病的分子基础仍然知之甚少。    

研究思路

系统分析来自GEO的抑郁症和IC患者转录组数据,以建立和验证模型。首先确定各自疾病组和对照组之间的差异表达基因(DEGs)。然后对共有DEGs进行功能富集分析。此外,通过ssGSEA定量分析免疫浸润。通过探索12种机器学习算法的113种组合,在训练集进行10折交叉验证,然后在测试集进行外部验证,构建抑郁症诊断模型。最后,通过"Enrichr"平台鉴定治疗抑郁症的潜在药物。

研究结果

IC和MDD差异表达基因(DEGs)筛选    

考虑到抑郁症和IC之间的相互关系,对IC和MDD (GSE98793)队列进行了limma分析,以发现与IC相关的MDD的致病基因。在IC队列中,确定了1,531个DEGs。MDD队列产生了100个DEG。交集分析获得了21个共享基因。

IC相关抑郁症致病基因的功能富集

通过GeneMANIA数据库建立候选基因的PPI网络,并通过GO、KEGG和DO进行功能分析以识别潜在的作用机制。GO富集分析发现氧化应激反应调节、对真菌的反应、细胞杀伤、不饱和脂肪酸生物合成过程、宿主对病毒的负调控过程等生物过程表达上调。KEGG通路分析进一步揭示了流体剪切力和动脉粥样硬化、化学致癌作用-活性氧、叶酸生物合成和精氨酸生物合成的显著富集。DO富集分析显示,IC-MDD与机会性真菌病、肾衰竭、胰腺炎和肠道疾病显著相关。    

IC和MDD的免疫细胞浸润分析

对IC和MDD之间重叠的DEGs进行功能和通路分析发现,这些DEGs与炎症和免疫过程显著相关。采用ssGSEA分析IC和MDD患者免疫细胞亚群的构成。    

通过机器学习筛选具有诊断价值的关键基因并建立IC相关抑郁症的诊断模型

作者结合了12种机器学习算法(113种算法组合),以确定基于21个共享基因的最稳健诊断模型。

通过整合Stepglm[both]和XGBoost算法,建立了性能最好的最终模型。Stepglm[both]算法筛选出11个关键基因(ABCD2、ATP8B4、TNNT1、AKR1C3、SLC26A8、S100A12、PTX3、FAM3B、ITGA2B、OLFM4、BCL7A),XGBoost算法筛选出最可靠的模型。诊断模型的校准曲线证明了稳健的校准性能。与整个队列相比,模型在60岁以下患者亚组或男性亚组中显示出更高的诊断性能。    

抑郁症诊断模型的比较

作者将该模型的性能与其他模型的综合比较,该模型在训练队列和测试队列中的AUC均表现出优于Peng的基于自噬相关基因的模型和Gao的基于时钟基因的模型。    

候选药物的鉴定

利用基于Enrichr的DSigDB药物数据库分析模型基因,以识别潜在的靶向药物。    

文章小结

研究结果为早期MDD,特别是IC患者的MDD诊断建立了一个新的分子框架。这篇文章的分析思路非常简单,方法还是常用的方法,创新点就在于了双疾病,并结合了12种机器学习,纯生信发4+,真是不要太香哦。小伙伴们赶紧码住这个思路,想复现的联系馆长哦~  

馆长有话说

馆长会持续为大家带来最新生信思路,也可以提供特色数据库构建、免费思路评估、付费生信分析和方案设计以及实验项目实施等服务,对数据库构建和生信分析感兴趣的朋友可以咨询馆长哦!

生信分析

方案设计

服务器租赁

孟德尔随机化

网络药理学

单细胞测序

临床公共数据库分析

往期推荐

1.9分“神刊”再现!又快又“水”,沾边就收!不要钱,速度来捡漏!

2.JAMA子刊顶级模板!北大团队新作:NHANES数据库,选题就要“接地气”!是时候卷一卷同门啦!!

3.赢麻了!独到的思路加上简单的分析就能发12.5分!华西医院团队这篇NHANES可复现性极强!快来学! 

生信图书馆
深入解读最新生信文献,分享研究思路和方法,提供专业生信分析服务,帮助您把握生物信息学的最新动态
 最新文章