小伙们看过来,在小云这里无论什么选题、思路的难题全都可以迎刃而解!今天给大家带来一篇广东医科大学团队近期发表的文章:Explore key genes of Crohn’s disease based on glycerophospholipid metabolism: A comprehensive analysis Utilizing Mendelian Randomization, Multi-Omics integration, Machine Learning, and SHAP methodology。首先,咱们从题目就能看出,这篇文章结合了孟德尔随机化+多组学+机器学习+SHAP(用于解释机器学习模型的预测结果),分析思路上就是一种创新;此外,该研究从磷脂代谢的角度出发,脂代谢本身就是频频现身国自然的热点方向,热点思路+热点选题,强强联合,发文事半功倍。观望中的宝子不要再犹豫了,好思路不等人!项目评估、方案设计、定制分析,有需要的快来滴滴小云!此外,如果遇到数据运行不流畅的情况,可以试试云生信团队的高速服务器,已经有小伙伴免费试用啦~定制生信分析
生信云服务器
(加微信备注99领取试用)
题目:基于甘油磷脂代谢探索克罗恩病的关键基因:利用孟德尔随机化,多组学整合,机器学习和SHAP方法的综合分析关注公众号,后台发送“123”可以直接获取原文PDF,文献编号:241113
克罗恩病(CD)是一种慢性、复杂的炎症性疾病,在世界范围内的发病率和患病率不断上升。然而,CD的病因仍不完全清楚。该研究通过孟德尔随机化(MR)、多组学整合、机器学习(ML)和SHAP鉴定了CD相关代谢物、炎症因子和关键基因。表1-3列出了1400种代谢物、91种炎症因子和CD的MR分析结果。MR分析显示五种特定磷脂可降低CD风险;升高的CXCL9水平与CD风险增加之间存在关联;这些磷脂和CXCL9之间呈负相关。两步中介MR分析表明CXCL9是将这些磷脂与CD连接起来的中介。 CXCL9在单核细胞中的表达最高。根据甘油磷脂代谢中位数得分,将单核细胞分为高甘油磷脂代谢组和低甘油磷脂代谢组两组。MR分析表明磷脂可能降低CD的风险,而CXCL9似乎增加了风险。与正常组相比,CD组的高代谢组比例更高,并且CXCL9在稿代谢组中的表达升高,与MR结果一致。 高低代谢组鉴定出4712个差异表达基因,GSEA富集分析显示,这些差异基因与粒细胞趋化、对趋化因子的响应、粒细胞迁移和对细菌来源的分子的响应等途径正相关,与有氧呼吸、肽生物合成过程、氧化磷酸化和质子动力驱动的ATP合成等途径负相关。细胞通讯研究显示,高低代谢组与各种免疫细胞之间存在不同的相互作用模式,高代谢组通过CXCL2、CXCL3和CXCL8等趋化因子与中性粒细胞表现出更强的相互作用。 进一步通过FDR和log2FC筛选差异基因,共鉴定出33个基因。进一步的LASSO回归分析鉴定出19个枢纽基因。免疫浸润分析表明,大多数枢纽基因与单核细胞和中性粒细胞的调节呈正相关。选择Catboost、XGboost和NGboost构建枢纽基因的ML模型。验证集中,Catboost的曲线下面积(AUC)为0.91,NGboost为0.88,XGboost为0.85。 SHAP方法被用来解释三个ML模型。在分析中,G0S2是对Catboost影响最大的基因,S100A8对NGboost影响最大,PLAUR对XGboost影响最大。在另一个数据集GSE16879中,G0S2、S100A8和PLAUR在CD患者中的表达高于健康人,且这些基因的AUC均大于0.7。这三个基因可能是CD的潜在关键驱动因素。 利用临床样本进行qRT-PCR分析了上述三个CD关键基因的表达情况,CD患者PBMC中S100A8 (p = 0.0003)、G0S2 (p < 0.0001)和PLAUR (p = 0.0141)的表达水平显著高于健康者PBMC。总之,文章结合了孟德尔随机化、单细胞分析、代谢组学、机器学习等,筛选了CD的潜在致病基因。文章思路经典却不老套,绝对是复刻发文的不二之选!对该研究方法或者思路感兴趣的朋友,欢迎来找小云定制专属于你的分析方案~