文章标题:Identification of biomarkers for the diagnosis of chronic kidney disease (CKD) with non-alcoholic fatty liver disease (NAFLD) by bioinformatics analysis and machine learning
中文标题:通过生物信息学分析和机器学习鉴定诊断慢性肾脏病(CKD)与非酒精性脂肪性肝病(NAFLD)的生物标志物
发表期刊:Front Endocrinol
发表时间:2023年2月
影响因子:3.9/Q2
慢性肾脏病(CKD)和非酒精性脂肪性肝病(NAFLD)与免疫和炎症途径密切相关。本研究旨在探讨CKD患者NAFLD的诊断标志物。
研究思路
从GEO数据库中筛选CKD和NAFLD微阵列数据集,并分析CKD日期集GSE10495差异表达基因(DEGs)。采用加权基因共表达网络分析(WGCNA)方法构建基因共表达网络,鉴定GSE89632日期集中NAFLD的功能模块。然后通过CKD的DEG和NAFLD的模块化基因相交获得NAFLD相关的共享基因。然后对NAFLD相关共享基因进行功能富集分析。NAFLD相关的枢纽基因来自cytoscape软件和机器学习的交叉点。采用ROC曲线检测NAFLD相关枢纽基因在CKD数据集和NAFLD日期集中GSE89632诊断价值。
结果分析
1. WGCNA鉴定了NAFLD样品中的关键模块基因
GSE89632是研究 NAFLD 的代表性数据集,我们用它来获得与 NAFLD 最相关的模块化基因 。WGCNA用于鉴定与NAFLD最相关的模块化基因。
2. CKD与NAFLD之间NAFLD相关共享基因的鉴定
接下来,在GSE104954数据集,其中 227 个基因上调,159 个基因下调。图3A通过火山图显示 DEG。数据集中最重要的 50 个 DEG 的热图绘制在图3B.然后,将 386 个 DEG 和 412 个模块基因相交,随后获得 45 个与 NAFLD 相关的共享基因,如 Venn 图所示图3C。
3. 45个NAFLD相关共享基因的富集分析
为了探究NAFLD相关共享基因在CKD发展过程中的生物学功能和通路,对45个共享基因进行了GO和KEGG富集分析。共获得563个显著相关的生物过程和23个KEGG信号通路。
4. 通过cytoscape软件和机器学习鉴定NAFLD相关枢纽基因及其差异表达得到验证
为了揭示每种蛋白质的相互作用,根据STRING数据库构建了共享基因的PPI网络。
5. 随机森林算法
通过两个CKD数据集验证了4个NAFLD相关枢纽基因的下调。
6. ROC曲线用于评估CKD和NAFLD的诊断效果
在CKD和NAFLD数据集中,通过ROC曲线验证了4个NAFLD相关枢纽基因的诊断效果。(A-D)4个NAFLD相关枢纽基因的ROC曲线GSE104954,GSE32951,GSE66494和GSE89632。
7. 免疫浸润分析及相关性分析
富集分析结果显示,NAFLD相关共享基因可能参与CKD进展的免疫相关机制。因此,4个诊断标志基因与CKD免疫细胞浸润的相关性值得进一步探索。
文章小结
4个NAFLD相关基因(DUSP1、NR4A1、FOSB、ZFP36)被鉴定为CKD合并NAFLD患者的诊断标志物。我们的研究可能为患有NAFLD的CKD患者提供诊断标志物和治疗靶点。共病+WGCNA+机器学习+免疫浸润,经典共病生信思路,不蹭热点也能轻松发文章,需要思路复现、设计、定制分析、临床科研服务的小伙伴快扫描下方二维码联系小科吧~