研究背景
微生物与人类生理状态的关系:研究表明,微生物群的变化与宿主的生理状态有关,如多发性硬化症、2型糖尿病和炎症性肠病等疾病。
技术进步:16S rRNA基因靶向测序技术的发展使得细菌和古菌的低成本有效鉴定成为可能,该技术通过序列化核糖体RNA基因的可变区域(V1-V9)来实现。
研究方法
本文介绍了一种名为DeepPhylo的新方法,该方法通过整合微生物丰度数据和系统发育信息来提高微生物组数据分析的预测准确性。DeepPhylo利用系统发育感知扩增子嵌入有效地结合了丰度和系统发育信息,从而提高了无监督学习的区分能力和监督学习模型的预测准确性。
Fig. 1: DeepPhylo的整体框架
研究结论
年龄和性别预测:在预测宿主年龄和性别方面,DeepPhylo的性能优于其他方法,如随机森林(RF)、岭回归(Lasso)和神经网络(NN)。
IBD诊断:在15项研究的IBD诊断任务中,DeepPhylo展现了较高的诊断准确性,优于传统机器学习方法。
多标签疾病分类:在处理更复杂的多标签疾病分类任务时,DeepPhylo同样表现出色,尽管其性能略逊于MDeep和PopPhy-CNN。
讨论
要点总结:
1.南昌大学徐振江团队发表研究,通过整合微生物丰度数据和系统发育信息,开发出一种深度学习新方法DeepPhylo,显著提高微生物组数据分析的预测准确性;
2.DeepPhylo在皮肤微生物群聚类、年龄和性别预测、炎症性肠病诊断以及多标签疾病分类等五个真实世界案例中表现出优越性能;
3.DeepPhylo采用主成分分析技术提取每个操作分类单元的嵌入表示,结合对应的丰度数据,增强了无监督学习的判别能力和监督学习模型的预测准确性;
4.相比现有方法,DeepPhylo在多个任务中展现出更高的预测性能,尤其是在处理具有复杂进化关系的数据时,证明了其在微生物组数据分析中的强大潜力;
5.通过模拟研究和实际数据集验证,DeepPhylo在不同信号密度和系统发育信息量条件下均表现出稳健的性能,突出了其在微生物数据分析领域的有效性。
https://onlinelibrary.wiley.com/doi/10.1002/advs.202404277