背景介绍
此外,传统分析方法常常聚焦于单一特征的差异分析,忽视了微生物之间复杂的相互作用。这种做法忽略了肠道微生物组作为复杂适应系统(CAS)的现实特征,其中的组成部分或代理以动态和非线性方式相互作用。这些相互作用导致系统层面的涌现特性,这些特性无法仅从单个代理的行为中预测。在这一微生物 CAS 中,微生物形成称为“公会”的结构模块,支撑着支持宿主健康的肠道生态系统的涌现特性。同一公会的成员可能来自不同的分类背景,但共同繁荣或衰退,表现出共丰度行为。我们通过 HQMAGs 的共丰度分析来描绘基于微生物相互作用的公会级组织,揭示了这一复杂生态系统中“谁与谁合作”。通过这种视角,每个公会与人类临床参数相关联,提供了对它们对健康和疾病影响的深入见解,并体现了“整体大于部分之和”的 CAS 原则。
文章亮点
2. 揭示了肠道细菌在不同干预和疾病状态下的稳定关系
3. 发现了跨人群和健康状态的两个竞争公会的核心结构
4. 提供了稳定相互作用的微生物公会作为健康调节的新目标
图文赏析
图 1. 研究方案和所使用的数据集。(A 和 B) 在 (A) QD 试验和 (B) 病例对照数据集收集 I (CCDC-I) 中识别出两个具有稳定关系的竞争公会 (TCGs)。(C) 通过基因组级别的去重(99% ANI)整合 (A) 和 (B) 中发现的 TCG,并进行特征选择以找出 TCG 的核心成员,称为 CC-TCG。CC-TCG 进一步用于在病例对照数据集收集 II (CCDC-II) 中对病例与对照进行分类。随后,基于 CC-TCG 构建了一个通用模型,以区分 CCDC-I 和 CCDC-II 中的所有样本的病例与对照。此外,CC-TCG 还用于基于治疗数据集收集 (TDC) 中的预治疗肠道元基因组预测治疗反应。
图 2. 高纤维饮食引起的肠道微生物群的可逆变化与 2 型糖尿病患者的代谢表型相应变化相关。(A) QD 试验的研究设计。在适应期后,基线(M0)、高纤维干预(W)或标准护理与常规饮食(U)后的 3 个月(M3)以及干预停止后的 1 年(M15)进行了医学检查和样本收集。(B) 纤维摄入量的变化。(C 和 D) (C) 基于 Bray-Curtis 距离的主坐标分析显示的肠道微生物组的全球变化,涉及 1,845 个 HQMAGs,(D) 各组之间的平均 Bray-Curtis 距离。采用 PERMANOVA 测试(9,999 次置换)比较各组。∗p < 0.05 和 ∗∗∗p < 0.001。方框的颜色强度表示平均 Bray-Curtis 距离的大小。(E–H) (E) HbA1c 的变化,(F) 达到适当血糖控制的参与者比例,(G) 空腹血糖,以及 (H) 餐后耐糖试验 (MTT) 中曲线下面积 (AUC) 的变化。对于 (E)、(G) 和 (H),数据以基线的百分比变化表示(± 标准误)。使用 Friedman 测试,随后进行 Nemenyi 事后检验以比较同组内的差异;紧凑字母反映显著性(p < 0.05)。W 组 n = 67,U 组 n = 28。使用 Mann-Whitney 测试(双侧)比较 W 和 U 在同一时间点的差异,∗p < 0.05,∗∗p < 0.01,和 ∗∗∗p < 0.001。W 组在 M0 时 n = 74(对于 H,n = 72),M3 时 n = 74,M15 时 n = 67;U 组在 M0 时 n = 36,M3 时 n = 36,M15 时 n = 28。
图 4. TCGs(QD-TCG)中的基因组预测 QD 试验中 2 型糖尿病患者的代谢健康结果,并在 CCDC-I 中区分病例与对照。(A) W 组中 C1A、C1B 及其比率在试验期间的均值范围缩放稳健中心对数比(rclr)转化丰度的变化。使用 Friedman 测试,随后进行 Nemenyi 测试以分析时间点之间的差异。紧凑字母反映显著性(p < 0.05)。数据以均值 ± 标准误表示。(B) 使用 TCGs 中的基因组预测生物临床参数。基于 M0 和 M3 时 C1A 和 C1B 的均值范围缩放的 rclr 丰度以及临床参数训练线性混合效应模型,以个体作为随机效应。使用 M15 时 C1A 和 C1B 的均值范围缩放 rclr 丰度根据训练模型预测临床参数。柱状图显示预测的临床参数与 M15 时测量值之间的 Pearson 相关系数。参数名称前的星号表示显著的 Pearson 相关性。p 值使用 Benjamini & Hochberg 方法进行了调整。∗ 调整后的 p < 0.05,∗∗ 调整后的 p < 0.01 和 ∗∗∗ 调整后的 p < 0.001。(C) 从 11 个不同数据集收集的七种疾病的数据作为病例对照数据集收集 I。左侧面板中每个病例对照数据集的样本大小分别以红色和绿色数字显示。对于集合中的每个数据集,元基因组读数被招募到 141 个 QD-TCG 基因组中,以估算每个样本中基因组的丰度。(D) 基于这 141 个基因组的丰度矩阵,训练了一个带有留一交叉验证的随机森林分类模型,以在每个数据集中对病例和对照个体进行分类。这里显示了接收者操作特征曲线下面积(AUROC)。
图 5. 从特定于某种疾病的数据集中识别的形成 TCG 的基因组,在 CCDC-I 中对不同疾病的独立数据集进行病例与对照的分类表现出显著的有效性。(A) 在 CCDC-I 中识别 TCGs。左侧面板中每个病例对照研究的样本大小分别以红色和绿色数字显示。CCDC-I 包含 11 个已发布的七种疾病的元基因组病例对照数据集。三个结直肠癌(CRC)数据集被合并以分析 CRC。三个炎症性肠病(IBD)数据集被合并以分析 IBD。遵循 TCGs 模式的相关性百分比(即每个公会内的正边,两个公会之间的负边)以黄色显示。矛盾相关性的比例,即每个公会内的负相关和公会之间的正相关,在 100% 堆叠条形图中以黑色显示。(B–H) 在 CCDC-I 中发现的 TCGs。(I) 在一个数据集中发现的 TCG 被用作预测因子,以在同一数据集和其他十个数据集中分类病例与对照。在每个数据集上,针对每组 TCGs 应用带有留一交叉验证的随机森林分类模型。ROC 曲线下面积(AUC)值在热图中显示。
总结与意义
利用公会基础方法,本研究集中于稳定的相互作用以识别与健康相关的微生物实体。受到系统生物学原则的启发,即稳定的相互作用标志着核心系统组件,我们假设在不同条件下稳定相关的基因组对可能是健康相关公会的核心成员,可能因其在人体健康中的关键作用而受到进化力量的塑造。通过构建来自不同环境扰动(包括饮食干预和健康状态差异)个体的HQMAGs共丰度网络,发现了一组稳定相关的核心HQMAGs。这些HQMAGs形成了两个竞争公会(TCGs)的强大网络,并被用作开发机器学习模型的核心特征。这些模型在涉及15种不同疾病的26个数据集中区分病例与对照,并预测四种不同条件下对免疫疗法的反应,取得了中等到优良的表现。这个TCG模型代表了由稳定微生物相互作用驱动的关键健康相关公会的核心微生物组结构。这些发现可能通过利用微生物相互作用的稳定性作为生物标志物,推动精准微生物医学的发展,改善疾病的诊断和管理。
通讯作者
彭永德,上海市第一人民医院内分泌代谢科主任、主任医师、医学博士、教授、博士生导师、糖尿病研究室主任、大内科教研室主任。上海交通大学医学院附属第一人民医院内分泌代谢科学科带头人、甲状腺疾病诊疗中心主任、骨质疏松症联合诊疗中心主任,上海市级新冠肺炎救治专家组成员 现任《上海医学》副主编,《J Clin Endocrinol Metab》、《中华内分泌代谢杂志》、《中华糖尿病杂志》、《中国糖尿病杂志》、《中华器官移植杂志》及《中国临床保健杂志》杂志编委,《Metabolism》、《Microbiome》、《J Diabetes & Complications》、《China J Med》等杂志特邀审稿人 已发表论文433篇(SCI 90篇,包括Science、PNAS、JCEM等),主编《系统内分泌学》等教材专著6部,参编教材专著12部。
Liping Zhao,罗格斯大学生物化学与微生物学系教授。研究方向:开发分子和基因组工具,用于系统理解和预测操作人类和动物肠道中复杂的微生物群落。了解饮食与肠道微生物群在肥胖和糖尿病等慢性病的发作和进展中的相互作用。制定营养干预措施以调节肠道微生物群与人类之间的关系,以实现预防性保健。实验室目前的研究项目主要集中在开发肠道微生物群靶向干预措施,以恢复和改善人类健康。我们提出了一种“以健康为中心”的方法来操纵肠道微生物群——建立或恢复一个健康的肠道生态系统,该生态系统能够提供有益于人类宿主的所有功能(例如,短链脂肪酸生产),并维持肠道环境,防止有害细菌进入。我们的工作涵盖广泛的研究,从产品开发、基础科学研究到临床试验,以开发建立在微生物生态学和系统生物学基础之上的干预措施,最重要的是适用于临床环境。我们的团队在微生物学、营养学、临床营养学、食品科学和生物信息学方面拥有专业知识。我们还与广泛的本地和国际合作者网络合作,开展针对肠道微生物群的代谢健康、胃肠道功能、癌症护理和婴儿健康方面的多学科研究。
施羽,启东市人民医院内分泌代谢科主任医师。
张晨虹,上海交通大学生命科学技术学院 ,微生物代谢国家重点实验室研究员。人体及动物肠道菌群的研究,主要进行人体及动物肠道菌群的研究。以元基因组学、转录组学、代谢组学等手段,分析肠道菌群的结构与功能,节食及功能性食品对肠道菌群的影响,肠道菌群与宿主之间的互作,研究肠道菌群在肥胖等复杂代谢性疾病以及衰老中的作用。