关于某些疾病与肠道微生物组之间关系的研究往往集中在微生物组成上,即样品中不同种类微生物的相对比例。EMBL海德堡大学的一项新研究展示了一种机器学习工具,可以从测序数据中预测微生物负荷——肠道微生物样本中的微生物密度,而无需进行昂贵的额外实验。该研究认为,在疾病关联研究中,微生物负荷是一个重要的考虑因素,以避免错误的关联或结论。
无论生病还是健康,生活在我们肠道中的数十亿微生物都是我们一生的伴侣。在过去的几十年里,科学家们已经展示了这种“微生物组”的性质如何为人类疾病及其治疗提供有价值的线索。
海德堡EMBL的博克小组最近在《细胞》杂志上发表的一项新研究报告称,许多条件,如生活方式和疾病,都会影响肠道中微生物的总数,这使得这一经常被忽视的指标在肠道微生物组研究中需要进一步评估。
从构成到数量
在研究微生物组时,研究人员更倾向于关注微生物组成——不同种类微生物(通常是细菌和古菌,但也包括原生生物、病毒和其他微生物)的相对比例。例如,这告诉我们,与某些疾病患者肠道中的其他细菌相比,一种细菌的水平是上升还是下降。
为了说明这一点,想象一下你的肠道里只有1000个细菌。在健康个体中,这可能包括10种“红色”细菌和20种“蓝色”细菌,所以我们可以说红色细菌占微生物组的2%,而蓝色细菌占5%。然而,在患有某种特定疾病的个体中,我们可能会注意到红色细菌占微生物群的4%——相对增加,而蓝色细菌仍占5%。然后我们可以假设红色细菌与这种疾病有关。
另一方面,微生物负荷指的是我们肠道内微生物的密度。实验上,它被确定为每克粪便中微生物细胞的数量。与微生物组成不同,它是一个绝对数量。在上面的例子中,假设由于疾病,细菌总数下降到500。从绝对数量来看,有可能红色细菌的数量保持不变,而蓝色细菌的数量减少了。
科学家在进行微生物组研究时通常只考虑微生物组成,因为目前测量微生物负荷的实验方法既耗时又成本高。
利用机器学习使微生物组研究更加稳健
“我们想开发一种新的方法,不需要额外的实验方法来量化微生物负荷,”该研究的第一作者、博克集团的博士后Suguru Nishijima说。“我们可以访问大型数据集,包括微生物组成和实验测量的微生物负荷数据。我们想看看我们是否可以用这些来训练机器学习模型,以估计单独给定微生物组成的微生物负荷。”
用于这项工作的数据集来自GALAXY/MicrobLiver和Metacardis联盟——博克集团以前曾参与过的大型欧盟资助项目。这些数据来自3700多人,提供了一种理想的方法来测试机器学习模型是否可以被训练来估计样本中微生物的总数。
事实上,Nishijima和他的同事创建的模型可以可靠地预测微生物负荷,他们使用模型以前没有遇到过的新数据集验证了这一点。知道该模型有效后,研究人员将其应用于超过27,000人的庞大样本中,这些样本来自45个国家的159项先前的研究。
他们发现许多因素可以影响微生物负荷。例如,腹泻会减少肠道微生物的数量,而便秘会增加肠道微生物的数量。平均而言,女性的微生物负荷高于男性(可能与观察到女性比男性更频繁地便秘有关),而年轻人的平均微生物负荷低于老年人。许多疾病,以及用于治疗疾病的药物,显著地改变了微生物负荷。
“重要的是,许多以前被认为与疾病相关的微生物物种更有力地解释了微生物负荷的变化。这些发现表明,微生物负荷的变化,而不是疾病本身,可能是患者体内微生物组变化的驱动因素。”“然而,某些疾病-微生物关联仍然存在,这表明这些关联确实很强。这进一步证实了在微生物组关联研究中包括微生物负荷以避免假阳性或假阴性的重要性。”
多亏了这些科学家开发的新的机器学习模型——第一个从成分数据中预测微生物负荷的模型——科学家们现在可以在未来的肠道微生物组研究中包括这一重要因素。该模型是免费和公开提供给世界各地的研究人员测试和重用。
这可能还具有远远超出肠道微生物组的影响。
“我们的海洋、土壤、河流都充满了微生物,了解这些微生物群可以产生有价值的见解,帮助保护我们的地球健康,”海德堡EMBL小组组长兼主任、该研究的资深作者Peer Bork说。“这项研究向我们表明,微生物负荷是这类研究中必须考虑的重要指标。因此,我们将努力将肠道微生物组的知识转化为其他栖息地。”
参考文献
Fecal microbial load is a major determinant of gut microbiome variation and a confounder for disease associations