转载||南昌大学徐振江团队介绍DeepPhylo:基于系统发育的微生物嵌入增强了人类微生物组数据分析的预测准确性

文摘   2024-10-19 16:05   中国  
2024年10月15日,南昌大学徐振江通讯在Advanced Science 在线发表题为“DeepPhylo: Phylogeny-Aware Microbial Embeddings Enhanced Predictive Accuracy in Human Microbiome Data Analysis”的研究论文。本研究引入了一种名为DeepPhylo的新方法,它使用系统发育感知的扩增子嵌入来有效整合丰度和系统发育信息。DeepPhylo提高了微生物组数据分析的无监督区分能力和有监督预测准确性。与现有方法相比,DeepPhylo在五个真实世界的微生物组应用案例中表现出优越性,包括皮肤微生物群落的聚类、宿主实际年龄和性别的预测、15项研究中炎症性肠病(IBD)的诊断以及多标签疾病分类。


研究背景

微生物数据的复杂性:微生物数据具有高维性、稀疏性和组成性等特点,这些特点给微生物组学研究带来了显著的挑战。

微生物与人类生理状态的关系:研究表明,微生物群的变化与宿主的生理状态有关,如多发性硬化症、2型糖尿病和炎症性肠病等疾病。

技术进步:16S rRNA基因靶向测序技术的发展使得细菌和古菌的低成本有效鉴定成为可能,该技术通过序列化核糖体RNA基因的可变区域(V1-V9)来实现。


研究方

本文介绍了一种名为DeepPhylo的新方法,该方法通过整合微生物丰度数据和系统发育信息来提高微生物组数据分析的预测准确性。DeepPhylo利用系统发育感知扩增子嵌入有效地结合了丰度和系统发育信息,从而提高了无监督学习的区分能力和监督学习模型的预测准确性。

Fig. 1: DeepPhylo的整体框架

研究结论

DeepPhylo在多个实际应用场景中表现出色,尤其是在以下方面:
皮肤微生物组聚类DeepPhylo能够更准确地对皮肤微生物组样本进行聚类,与其他方法相比,其区分能力更强。

年龄和性别预测:在预测宿主年龄和性别方面,DeepPhylo的性能优于其他方法,如随机森林(RF)、岭回归(Lasso)和神经网络(NN)。

IBD诊断:在15项研究的IBD诊断任务中,DeepPhylo展现了较高的诊断准确性,优于传统机器学习方法。

多标签疾病分类:在处理更复杂的多标签疾病分类任务时,DeepPhylo同样表现出色,尽管其性能略逊于MDeep和PopPhy-CNN。


讨论

DeepPhylo作为一种新型的机器学习方法,在微生物组数据分析领域展现出了巨大潜力。通过整合系统发育信息,DeepPhylo不仅提高了无监督学习任务的样本区分能力,还在有监督学习任务中提升了预测准确性。此外,DeepPhylo在处理合成数据时也表现出了稳定的性能,这表明它在不同类型的微生物数据上都有良好的泛化能力。


要点总结:

1.南昌大学徐振江团队发表研究,通过整合微生物丰度数据和系统发育信息,开发出一种深度学习新方法DeepPhylo,显著提高微生物组数据分析的预测准确性;

2.DeepPhylo在皮肤微生物群聚类、年龄和性别预测、炎症性肠病诊断以及多标签疾病分类等五个真实世界案例中表现出优越性能;

3.DeepPhylo采用主成分分析技术提取每个操作分类单元的嵌入表示,结合对应的丰度数据,增强了无监督学习的判别能力和监督学习模型的预测准确性;

4.相比现有方法,DeepPhylo在多个任务中展现出更高的预测性能,尤其是在处理具有复杂进化关系的数据时,证明了其在微生物组数据分析中的强大潜力;

5.通过模拟研究和实际数据集验证,DeepPhylo在不同信号密度和系统发育信息量条件下均表现出稳健的性能,突出了其在微生物数据分析领域的有效性。


原文链接

https://onlinelibrary.wiley.com/doi/10.1002/advs.202404277


V言微语
从微生物与健康视角,以小见大,推荐并探讨微生物科技前沿与行业动态。
 最新文章