3.9/Q2,第四军医大学西京医院肝胆外科挖掘GEO数据库采用WGCNA+PPI+功能富集分析+机器学习诊断慢性肾病与脂肪性肝病

文摘   2024-07-23 18:10   陕西  

文章标题:Identification of biomarkers for the diagnosis of chronic kidney disease (CKD) with non-alcoholic fatty liver disease (NAFLD) by bioinformatics analysis and machine learning

中文标题:通过生物信息学分析和机器学习鉴定诊断慢性肾脏病(CKD)与非酒精性脂肪性肝病(NAFLD)的生物标志物

发表期刊:Front Endocrinol

发表时间:2023年2月

影响因子:3.9/Q2

研究背景

慢性肾脏病(CKD)和非酒精性脂肪性肝病(NAFLD)与免疫和炎症途径密切相关。本研究旨在探讨CKD患者NAFLD的诊断标志物。

究思路

GEO数据库中筛选CKD和NAFLD微阵列数据集,并分析CKD日期集GSE10495差异表达基因(DEGs)。采用加权基因共表达网络分析(WGCNA)方法构建基因共表达网络,鉴定GSE89632日期集中NAFLD的功能模块。然后通过CKD的DEG和NAFLD的模块化基因相交获得NAFLD相关的共享基因。然后对NAFLD相关共享基因进行功能富集分析。NAFLD相关的枢纽基因来自cytoscape软件和机器学习的交叉点。采用ROC曲线检测NAFLD相关枢纽基因在CKD数据集和NAFLD日期集中GSE89632诊断价值。

结果分析

1. WGCNA鉴定了NAFLD样品中的关键模块基因

GSE89632是研究 NAFLD 的代表性数据集,我们用它来获得与 NAFLD 最相关的模块化基因 。WGCNA用于鉴定与NAFLD最相关的模块化基因。

2. CKD与NAFLD之间NAFLD相关共享基因的鉴定

接下来,在GSE104954数据集,其中 227 个基因上调,159 个基因下调。图3A通过火山图显示 DEG。数据集中最重要的 50 个 DEG 的热图绘制在图3B.然后,将 386 个 DEG 和 412 个模块基因相交,随后获得 45 个与 NAFLD 相关的共享基因,如 Venn 图所示图3C。

3. 45个NAFLD相关共享基因的富集分析

为了探究NAFLD相关共享基因在CKD发展过程中的生物学功能和通路,对45个共享基因进行了GO和KEGG富集分析。共获得563个显著相关的生物过程和23个KEGG信号通路。

4. 通过cytoscape软件和机器学习鉴定NAFLD相关枢纽基因及其差异表达得到验证

为了揭示每种蛋白质的相互作用,根据STRING数据库构建了共享基因的PPI网络。

5. 随机森林算法

通过两个CKD数据集验证了4个NAFLD相关枢纽基因的下调。

6. ROC曲线用于评估CKD和NAFLD的诊断效果

在CKD和NAFLD数据集中,通过ROC曲线验证了4个NAFLD相关枢纽基因的诊断效果。(A-D)4个NAFLD相关枢纽基因的ROC曲线GSE104954,GSE32951,GSE66494和GSE89632。

7. 免疫浸润分析及相关性分析

富集分析结果显示,NAFLD相关共享基因可能参与CKD进展的免疫相关机制。因此,4个诊断标志基因与CKD免疫细胞浸润的相关性值得进一步探索。

文章小结

4个NAFLD相关基因(DUSP1、NR4A1、FOSB、ZFP36)被鉴定为CKD合并NAFLD患者的诊断标志物。我们的研究可能为患有NAFLD的CKD患者提供诊断标志物和治疗靶点。共病+WGCNA+机器学习+免疫浸润,经典共病生信思路,不蹭热点也能轻松发文章,需要思路复现、设计、定制分析、临床科研服务的小伙伴快扫描下方二维码联系小科吧~

生信文献汇
汇集临床生物信息文献,提供专业的生信分析服务:思路设计,生信分析,代码复现,欢迎老师们定制分析服务
 最新文章