【Cell】粪便微生物载量是肠道微生物组变异的主要决定因素

文摘   2024-11-20 08:02   中国澳门  
2024年11月13日,欧洲分子生物学实验室团队在Cell发表研究性文章“Fecal microbial load is a major determinant of gut microbiome variation and a confounder for disease associations”(Q1, IF=45.5),文章提出粪便微生物载量而不是丰度是微生物组研究中的主要混杂因素,突出了它对理解健康和疾病中微生物组变异的重要性。


背景介绍


宏基因组测序促进了对环境样本中复杂微生物群落的高通量分析。应用于人类肠道微生物组时,宏基因组学揭示了其结构、功能及变异,以及与宿主生理(包括疾病、免疫功能和癌症治疗反应)的关联。然而,从宏基因组分析中获得的微生物特征本质上是组成性的,每种微生物物种的丰度以相对比例(总读取数的部分)表示。在这种组成数据中,一种微生物物种的变化会导致其他物种的相对变化,造成负相关偏差,可能导致关联研究中的假阳性和假阴性。此外,测序数据并未提供微生物载量的信息(即每克的原核细胞总数或微生物密度),而微生物载量与肠道中的粪便运输时间、粪便一致性、水分含量和pH密切相关,是影响微生物组多样性、代谢和个体间变异的重要生态因素。为了解决这些问题并考虑总体绝对丰度,各种实验方法被应用于微生物组研究,例如基于流式细胞术的细胞计数、定量PCR或提供内标(如加入DNA)来量化环境样本中的微生物载量这些额外的数据有助于避免与组成数据相关的陷阱,并将个体间的微生物组变异与微生物载量的变化联系起来。然而,生成这种定量特征需要额外的实验,这些实验既费力又昂贵,对于大规模微生物组研究来说不切实际。因此,绝大多数公共或正在进行的宏基因组研究在分析中并未考虑相关的微生物载量

在此提出了一种机器学习模型,能够在不需要额外湿实验的情况下稳健地预测微生物载量利用来自两个独立研究人群(GALAXY/MicrobLiver和MetaCardis)的宏基因组和微生物载量数据的大规模配对数据集,首先训练模型,直接从相对微生物组特征预测人类粪便样本的微生物载量。然后,通过将模型应用于大规模公共宏基因组数据集(n = 34,539)来展示其实用性,揭示了各种宿主生理与预测微生物载量之间的显著关联。此外,还显示微生物载量是微生物组变异的主要决定因素,常常混淆微生物物种的疾病关联,这对生物标志物的开发具有重要意义。


文章亮点


1. 机器学习模型根据相对微生物组概况预测粪便微生物载量

2. 预测的载量与大规模数据集中的宿主和环境因素相关

3. 疾病相关的微生物特征与预测的微生物载量有关

4. 预测的载量调整降低了疾病相关物种的统计意义

图文赏析


图 1. 微生物载量与两个研究人群中肠道微生物组的分类学特征密切相关

图2. 机器学习模型稳健地预测粪便样本的微生物载量

图 3. 预测的微生物载量与各种宿主因素有关

图 4. 预测的微生物载量与各种疾病有关

图 5. 微生物载量混淆了疾病与微生物的关联


总结与意义


个体栖息地中的微生物群在相对组成和绝对丰度上存在差异。虽然测序方法可以确定分类群和基因的相对丰度,但它们并不提供绝对丰度的信息。在此开发了一种机器学习方法,仅根据相对丰度数据预测粪便微生物载量(每克微生物细胞数)。将预测模型应用于一个大规模的宏基因组数据集(n = 34,539),证明了微生物载量是肠道微生物群变异的主要决定因素,并与多个宿主因素相关,包括年龄、饮食和药物。进一步发现,对于某些疾病,微生物载量的变化比疾病本身更能解释患者肠道微生物群的变化。调整这一影响显著降低了大多数与疾病相关的物种的统计显著性。文章分析揭示了粪便微生物载量是微生物组研究中的主要混杂因素,强调了其在理解健康与疾病中的微生物组变异的重要性。

通讯作者

Peer Bork,EMBL Heidelberg 董事。EMBL Heidelberg生物信息学战略负责人、分子医学合作部门组长和 ERC 高级研究员。领导了多个国际知名的基因组和宏基因组项目,包括人类基因组计划、小鼠基因组计划、酵母蛋白质组计划、MetaHit、人类微生物计划和 Tara Ocean 计划等。发表了600多篇期刊论文,其中70多篇发表在Cell、Nature和Science等顶级期刊上。

Michael Kuhn,欧洲分子生物学实验室研究员。研究课题:中心体的进化分析,远距离物种之间组织特异性基因表达模式的保守性,以及大规模筛选数据的分析。自 2016 年以来,一直是Peer Bork实验室的研究员,部分管理实验室,并研究肠道微生物群和药物对人类的影响。

药医肠道菌
生物医药与肠道菌群的前沿研究学术分享
 最新文章