Cell|揭示了微生物载量对理解健康和疾病中微生物组变异的重要性

政务   2024-12-20 08:15   湖北  

开发了仅基于粪便样本相对物种和基因丰度预测微生物载量的机器学习模型,证明了其在大规模微生物组数据集中的有效性,揭示了微生物载量是微生物组变异的主要决定因素,且在疾病关联研究中常为混杂因素,强调了考虑微生物载量对理解健康和疾病中微生物组变异的重要性。

1 微生物载量与肠道微生物组的关系

1.1 微生物载量与分类和功能谱强相关

基于 GALAXY/MicrobLiver(n=1894)和 MetaCardisn=1812两个研究群体的粪便样本,发现微生物载量与微生物组的分类和功能谱显著相关。在两个群体中,厚壁菌门(瘤胃球菌属)肠型的微生物载量最高,其次是普氏菌属和拟杆菌属肠型。微生物组的多样性指数与微生物载量呈正相关,如香农多样性在两个群体中均显示出较强的正相关。

多种因素与微生物载量相关,如年龄、性别、饮食、药物治疗和疾病状态等。在全球数据集中,高收入国家的样本微生物载量显著高于低收入国家;在日本 4D 和爱沙尼亚微生物组队列中,药物类别与微生物载量的关联最强,其次是人体测量因素、疾病状态、饮食和其他因素。

1.2微生物载量可从肠道微生物组谱中稳健预测
基于微生物载量与肠道微生物组相对丰度的强关联,训练了极端梯度提升(XGBoost)回归模型,可从物种水平的分类谱和功能谱(京都基因与基因组百科全书(KEGG)直系同源水平)预测微生物载量。在 GALAXY/MicrobLiver 和 MetaCardis 群体中,模型预测的微生物载量与实测值的皮尔逊相关系数分别为 0.67±0.0068 和 0.68±0.0069;在外部验证中,将两个模型应用于对方数据集,相关系数均为 0.56。
该模型对不同测序技术和不同表型样本具有稳健性,对 16S rRNA 基因测序数据的预测也有较高准确性(内部验证相关系数为 0.79,外部验证为 0.60),且在健康和疾病样本中均能有效预测微生物载量。

2 微生物载量与宿主因素和疾病的关联

2.1 预测微生物载量与多种宿主因素相关

收集了来自 159 项研究的公共肠道宏基因组n=27832及日本 4D 队列n=4198和爱沙尼亚微生物组队列n=2509的数据,发现预测微生物载量与多种宿主因素相关。在全球数据集中,高收入国家样本的预测微生物载量较高;在日本 4D 和爱沙尼亚微生物组队列中,药物类别与预测微生物载量关联最强。

自我报告的布里斯托大便量表与预测微生物载量呈负相关,排便频率也与微生物载量呈负相关;年龄与微生物载量在日本 4D 和全球数据集中呈正相关,女性的微生物载量平均比男性高 3.5%;特定饮食习惯(如杂食者微生物载量最高,素食者和纯素食者较低)和成分(如高淀粉饮食干预增加微生物载量,低热量饮食干预无显著影响)对微生物载量有重要影响;抗生素治疗与预测微生物载量呈负相关,且不同类型抗生素对微生物载量影响不同,微生物载量在抗生素治疗后至少需要几周才能恢复。
2.2 众多疾病与微生物载量改变有关
通过大规模病例对照分析,发现多数疾病(14/26)与预测微生物载量显著相关,其中 9 种呈负相关(如克罗恩病、溃疡性结肠炎、肝硬化、艰难梭菌感染和 HIV 感染等),患者平均预测微生物载量比对照组低 17.3%;5 种呈正相关(如慢传输型便秘、多发性硬化症、结直肠癌和高血压等),患者平均预测微生物载量比对照组高 7.7%。
对疾病相关微生物特征分析发现,负相关疾病的微生物组多样性较低,正相关疾病部分显示微生物组多样性增加;鉴定出 86 种可区分正负相关疾病的物种,如 Alistipes spp.、Bacteroides spp. 和 Eubacterium spp. 等在正相关疾病中富集,在负相关疾病中减少,而未分类的 Burkholderiales 物种在负相关疾病中富集,在正相关疾病中减少。

3 微生物载量对疾病 - 微生物关联的影响

3.1 微生物载量混淆疾病 - 微生物关联

将预测微生物载量作为协变量纳入回归模型,发现调整后疾病相关物种的效应大小和统计显著性在多种疾病中显著降低,尤其是克罗恩病、溃疡性结肠炎、肝硬化、腹泻型肠易激综合征(IBS-D)、乳腺癌、艰难梭菌感染和慢传输型便秘等疾病。调整后,平均效应大小降低 21.9% - 49.9%(平均 35.5%),部分疾病中先前显著的疾病 - 物种关联不再显著。
微生物载量调整后失去显著性的物种多为在疾病患者中减少且与微生物载量正相关的物种,而在疾病患者中富集的物种大多不受影响;调整后,香农多样性在多种疾病中的统计显著性降低,部分疾病中与香农多样性的关联不再显著。
3.2 基于预测载量的调整具有可靠性
分析 GALAXY/MicrobLiver 研究中的肝硬化样本n=64和 MetaCardis 研究中的 2 型糖尿病样本n=539比较基于实测和预测微生物载量调整的结果,发现两种调整方法对物种 FDR 值变化高度一致(肝硬化相关系数为 0.90,2 型糖尿病为 0.95),且对香农多样性统计显著性的影响相似。

4 研究的意义与局限

意义:开发的机器学习模型可从相对丰度数据预测微生物载量,有助于理解微生物组变异与宿主因素及疾病的关系,揭示微生物载量是微生物组变异的主要决定因素和疾病关联研究中的混杂因素,强调分析中考虑微生物载量的重要性。

局限:模型预测准确性中等,微生物载量与特定肠道物种间的因果关系不明确,模型适用性有限(基于儿童和成人粪便样本开发,对婴儿、动物粪便或活检样本适用性未知),且分析主要关注原核生物群落,未考虑病毒和真核微生物。

(翻译水平有限,敬请批评指正)

投稿、转载、合作、申请入群可在后台留言(备注:姓名+微信号)或发邮件至sthjkx1@163.com

【点击下方超链接阅读16个栏目推文】 
1.【直播】9.【院士】
2.【视频10.【综述】
3.【健康&毒理11.【写作】
4.【12.【Nature】
5.【13.【Science
6.【14.【WR
7.【固废15.【EST
8.【生态】16.【JHM

生态环境科学
最新学术成果与讯息
 最新文章