就这么水灵灵地发了一篇6分+!GEO数据库+WGCNA+机器学习+诊断模型+共识聚类,这性价比直击心巴!

文摘   2024-11-10 10:02   上海  

Hello呀,各位亲爱的读者老爷们,生信湾我又双叒叕带着文章回来啦~(刚刚发表,新鲜热乎的干货分享来咯~)

今天为大家分享一篇2024年10月发表在《Journal of Translational Medicine》上的超有料研究论文,名为“Identification of metabolism related biomarkers in obesity based on adipose bioinformatics and machine learning”。此论文由重庆医科大学团队携手完成,凭借公共数据挖掘、生物信息学分析以及实验验证等手段,探索肥胖代谢相关生物标志物。话不多说,让我们一同深入研读这篇佳作~

1. 利用WGCNA机器学习算法结合的方法,从基因表达数据中识别出与肥胖代谢相关的STOX1和NWD2基因,为肥胖的诊断和治疗提供了新靶点。

2. 通过共识聚类分析揭示肥胖患者的代谢亚型,这一思路创新在于识别肥胖患者的异质性,也为开发针对性治疗方案提供了新思路。

PS:没有思路、不知道怎么创新的宝子们,记得来找生信湾哦,超多个性化思路等你来拿!    

l题目:基于脂肪生物信息学和机器学习的肥胖代谢相关生物标志物鉴定

l杂志:Journal of Translational Medicine

l影响因子:IF=6.1

l发表时间:202410

(注:公众号后台回复“123”获取文献全文!文献编号:20241110

近几十年来,肥胖成为全球性公共健康问题,其患病率在不同地区差异大。肥胖与多种疾病相关,但肥胖与常见心脏代谢并发症的潜在机制尚不完全清楚。本研究旨在探究代谢相关基因在肥胖相关代谢疾病中的作用,评估其在细胞模型中的表达。

本研究生信分析数据全部来源于GEO公共数据库,再搭配小鼠样本对生信结果进行简单PCR验证,工作量不大,性价比超高!    

研究从GEO数据库获取基因表达数据集,通过DESeq2识别差异表达基因(DEGs),利用多种方法分析代谢相关基因及通路,运用机器学习确定特征基因,在小鼠模型中用qRT - PCR验证,最后评估基因诊断性能及探究其与代谢过程关系。

1. 肥胖相关差异表达基因(DEGs)的鉴定

从GSE110729数据集筛选出40个显著DEGs(20个上调,20个下调),经层次聚类分析,两组间表达差异明显,且火山图显示芯片中差异基因多为下调基因。通过主成分分析评估数据集方差,表明数据具有一定特征性(图1)。

图1:A展示了所有DEGs的层次聚类热图,B呈现了差异基因的火山图,C为PCA分析图。

2. DEGs的GO和KEGG富集分析

GO分析显示DEGs在“细胞葡萄糖醛酸化”等生物过程、“纺锤体”等细胞组分、“葡萄糖醛酸转移酶活性”等分子功能上富集。KEGG分析表明DEGs在“卟啉代谢”等通路显著富集,提示这些通路可能在肥胖中起重要作用(图1)。    

图1:D为GO富集分析结果,E是KEGG富集分析结果。

3. GSVA揭示差异基因潜在功能

GSVA分析得到各样本通路分数,经差异分析确定“丙酸代谢”等为主要差异代谢通路。火山图显示肥胖个体中“丙酸代谢”相关基因下调,“卟啉和叶绿素代谢”及“半乳糖代谢”相关基因上调。

4. **基于WGCNA的基因共表达网络分析**

对GSE110729数据集进行WGCNA,选择软阈值功率为24,合并相似模块后得到10个模块。其中橙红色4模块与丙酸代谢相关性最强,其基因在“羧酸分解”等生物过程、“高尔基体顺面膜囊”等细胞组分、“维生素结合”等分子功能上富集(图2)。

   

图2:A展示了尺度独立性和平均连通性,B为模块特征基因层次聚类树状图,C呈现基因树状图及合并前后模块,D是合并模块与代谢通路相关性分析

5. 机器学习模型构建与评估

将WGCNA得到的橙红色4模块与DEGs取交集得到14个代谢相关DEGs,通过随机森林XGBoost模型确定两个关键基因STOX1和NWD2。在训练集和验证集中,模型及基因均有一定诊断性能,且肥胖个体中NWD2和STOX1表达降低(图3)。    

图3:A、D为模型ROC曲线,B、E是基因ROC曲线,C、F展示肥胖特征基因表达差异。

6. 肥胖中的不同代谢亚型

利用“ConsensusClusterplus”对28例肥胖和苗条个体数据聚类,确定k = 2时稳定性最佳,两个亚型间代谢相关化合物水平有显著差异,经PCA等验证,且亚型与代谢通路强相关,STOX1和NWD2与代谢通路密切相关(图4)。

   

图4:A、B为聚类结果,C展示代谢相关化合物水平差异,D是PCA分析图,E - G为GO、KEGG分析和GSEA结果,H、I是棒棒糖图。

7. STOX1和NWD2在小鼠中的表达

通过qRT - PCR分析野生型、ob/ob、DB/DB和高脂饮食(HFD)小鼠白色脂肪组织中STOX1和NWD2基因表达,发现肥胖小鼠中两者mRNA水平低于瘦小鼠,表明其可能作为肥胖代谢相关生物标志物(图5)。

图5:展示了STOX1和NWD2在不同小鼠中的表达情况。

怎么样?思路学到没?其实这些生信方法并不陌生,几乎把能用的生信分析方法用了个遍,最后加上外部队列+小鼠样本的qPCR实验验证形成闭环,成功拿下6.1分Top刊!这种干湿结合的思路完整又好复现,发文速度也是杠杠滴,虽然只是一篇二区文章,但是评奖学金+毕业也是足够了。想做机器学习、数据挖掘的可以联系生信湾,无论是生信分析还是基础实验,各种创新性思路设计,生信湾都可以帮你解忧哦~    

定制生信分析

云服务器租赁

扫码加群

合集 · 推荐

机器学习

孟德尔随机化

网络药理学

临床公共数据库分析

 注:本文为原创编译,非声张版权,侵删!

         

 

   

生信湾
持续分享最新生信热点思路,提供专业生信分析服务:思路设计、生信分析、文献复现、数据库搭建等。助力您的科研之路!欢迎朋友们沟通交流与合作~
 最新文章