肠道菌群+机器学习:双剑合璧,助力国自然基金申报突破重围!|备战国自然2025

企业   2024-11-02 10:01   浙江  


引言:

肠道微生物组与多种疾病之间的联系已成为医学研究的热点,尤其在消化疾病和肿瘤研究等领域。随着高通量测序技术的进展,公共数据库如NCBI BioProject和ENA提供了丰富的微生物组数据资源,极大地促进了相关研究,而且利用这些数据库的数据,研究者不仅能研究本地队列的微生物组数据,还能跨地域分析其他队列的微生物组数据,加速科学发现并提高结果的普适性。此外,微生物多组学数据结合能够为机器学习算法的应用提供了丰富的素材,有助于识别与疾病相关的生物标志物,这对于推动精准医疗的发展至关重要。相关专题文章小编前面已经发表过两篇了,对类似内容感兴趣的读者可以通过下面链接进行阅读:

一文告诉你肠道菌群+机器学习发现生物标志物研究思路

干货!!肠道菌群+机器学习发现肿瘤相关生物标志物研究思路|机器学习专题


微生物组结合机器学习的研究方案:

通过整合微生物多组学组数据,结合机器学习技术,能够识别出与健康问题密切相关的微生物标志物。在验证基微生物组模型时,可以通过分割数据集进行交叉验证,采用AUROC、AUPRC等指标评估模型性能,并进行内部和外部验证以测试模型的稳健性和泛化能力。此外,通过特征重要性分析确定关键微生物标志物,并将其与临床数据对比,以确保模型在实际医疗环境中的准确性和实用性。

整合微生物多组学数据结合机器学习的研究方案研究思路如下图所示:

生物学重复:≥150个(考虑个体差异性存在,可适当增加每组生物学重复数目)



典型案例一:使用传统风险因素和肠道微生物组增强的梯度提升法对肝病发生的早期预测

英文标题:Early prediction of incident liver disease using conventional risk factors and gut-microbiomeaugmented gradient boosting

发表期刊:Cell Metabolism(IF=27.7)

发表时间:2022.03

样本类型:人类粪便样本

研究方法:宏基因组测序

实验设计:如下图所示

 

研究内容:本研究通过结合传统风险因素和肠道微生物组数据,运用增强型梯度提升机算法,对新发肝病进行早期预测。研究基于芬兰FINRISK 2002队列的7000余名参与者,通过长达15年的跟踪随访,利用机器学习模型深入分析了肠道微生物组单独及与传统风险因素结合对肝病发病的预测价值。研究结果显示,肠道微生物组的预测准确性与传统风险因素相媲美,而两者的联合使用能显著提升预测的精确度。此外,在独立验证队列中,作者纳入了加州大学圣地亚哥分校的非酒精性脂肪肝病(NAFLD)患者和对照组,进一步证实了肠道微生物组数据在肝病早期风险评估中的有效性。这支持了肠道微生物组作为临床预测工具的潜力,为肝病的预防和治疗提供了新的视角。


典型案例二:在人工智能支持的多队列粪便宏基因组上,微生物基因比物种和单核苷酸变异(SNV)更优越作为克罗恩病的诊断标记。

英文标题:Microbial genes outperform species and SNVs as diagnostic markers for Crohn’s disease on multicohort fecal metagenomes empowered by artificial intelligence

发表期刊:Gut Microbes(IF=12.2)

发表时间:2023.01

样本类型:人类粪便样本

研究方法:宏基因组测序

实验设计:如下图所示

 

研究内容:本研究利用人工智能算法分析了多队列粪便宏基因组数据,旨在探索克罗恩病(CD)的微生物标志物。研究共纳入了870名CD患者和548名健康对照者的粪便样本,通过多维度分析(包括物种、基因和单核苷酸变异SNV水平)构建了诊断模型。结果表明,与物种和SNV模型相比,基于微生物基因的模型展现出更高的诊断准确性,平均AUC(曲线下面积)为0.95。特别是,磷酸转移酶系统(PTS)中的celB和manY基因在CD诊断中具有重要价值,其在独立队列中通过qRT-PCR分析得到了验证。研究揭示了CD患者肠道微生物群落的多维度变化,并确定了微生物基因作为跨不同地理和文化队列的稳健诊断生物标志物,为CD的非侵入性诊断提供了新的可能性。


典型案例三:结合微生物建模和机器学习的综合性分析揭示了溃疡性结肠炎的潜在缓解因素

英文标题:Integrative analysis with microbial modelling and machine learning uncoverspotential alleviators for ulcerative colitis

发表期刊:Gut Microbes(IF=12.2)

发表时间:2024.04

样本类型:粪便样本

研究方法:宏基因组测序、非靶代谢组分析

实验设计:如下图所示

研究内容:本研究通过结合微生物建模和机器学习技术,探索了溃疡性结肠炎(UC)的潜在缓解方法。UC 是一种复杂的炎症性肠病,与肠道微生物组的失衡有关。研究者利用人类微生物组整合计划(iHMP)的宏基因组数据,构建了个性化的微生物群落模型,分析了UC患者与健康对照组之间的微生物多样性和代谢物差异。

研究发现,UC患者的肠道微生物多样性降低,且粪便代谢物谱发生显著变化。通过机器学习模型,研究者识别出特定的微生物菌株和代谢物,如Parabacteroides merdae和N-乙酰-D-甘露胺(ManNAc),可能对UC有缓解作用。实验验证显示,这些潜在的缓解剂在DSS诱导的UC小鼠模型中能够显著改善结肠炎症状。

这项研究的意义在于,它不仅揭示了UC患者肠道微生物群落和代谢物的变化,而且通过机器学习技术识别出可能的生物标志物,为UC的早期检测和治疗提供了新的视角。此外,通过动物实验验证了所选菌株和代谢物的抗炎特性,为UC的治疗提供了新的策略。这些发现为未来开发针对性的UC治疗干预措施奠定了基础。





参考文献



[1].Liu Y, Méric G, Havulinna AS, et al. Early prediction of incident liver disease using conventional risk factors and gut-microbiome-augmented gradient boosting. Cell Metab. 2022 May 3;34(5):719-730.e4.

[2]. Gao S, Gao X, Zhu R, et al. Microbial genes outperform species and SNVs as diagnostic markers for Crohn's disease on multicohort fecal metagenomes empowered by artificial intelligence. Gut Microbes. 2023 Jan-Dec;15(1):2221428.

[3].  Zhu J, Yin J, Chen J, et al. Integrative analysis with microbial modelling and machine learning uncovers potential alleviators for ulcerative colitis. Gut Microbes. 2024 Jan-Dec;16(1):2336877.


相关阅读

2025国自然热点:当空间转录组拥有百亿“像素”
2025国自然热点:FFPE空转+单细胞如何助力科研课题转化
植物篇-获得诺奖的miRNA如何赢战国自然2025?这几个新方向考虑下!
对肿瘤微生物组感兴趣,不知道要怎么检测,看这里!|备战国自然2025

本文系联川生物公众号原创文章,未经授权禁止转载,侵权必究!
扫描下方二维码


点分享


点点赞


点在看


联川生物
一个提供科研入门学习资源、经验的平台。 分享前沿测序技术资讯、实用生信绘图技巧及工具。 发布高质量的科研论文精度、精炼科研思路。 我们的目标是持续提供“干货”,滋润您的科研生涯。
 最新文章