【Cell】核心微生物组特征作为健康指标

文摘   2024-11-04 08:00   中国澳门  
2024年10月07日上海交通大学生命科学与技术学院Cell发表研究性文章“A core microbiome signature as an indicator of healthQ1, IF=45.5),文章确定了核心微生物组特征,该特征作为整体健康指标和增强健康的潜在共同目标


背景介绍



肠道微生物组类似于一种重要的器官,在宿主健康中发挥着关键作用,影响着从营养代谢到免疫功能和行为等多种过程。随着高通量测序技术的发展,这一复杂生态系统得到了广泛的特征描述,揭示了其组成和功能的详细信息。然而,传统的分析方法,如基于分类学和基因中心的方法,常常产生不一致的结果。例如,像乳酸菌或厚壁菌门这样的分类群在不同研究中与肥胖或糖尿病等疾病的关联表现出正相关、负相关或无相关性。因此,迫切需要一种新的方法框架,以稳健地识别关键的微生物组成员作为健康维护和疾病管理的生物标志物。传统方法常依赖于低分辨率特征,如分类标签,这无法区分微生物群落中同一分类群内的微妙遗传和功能变异。为了提高微生物分析的分辨率,我们提倡使用全新组装的高质量元基因组组装基因组(HQMAGs)HQMAGs 通过采用1% 的平均核苷酸相似性(ANI)区分阈值,能够实现接近菌株级别的分辨率,这显著细于通常用于物种定义的5%–6%。此外,为便于跨不同研究和样本对微生物实体的数据库独立跟踪,为每个 HQMAG 分配一个通用唯一标识符(UUID)。这一策略将新型或研究不足的微生物纳入分析,并通过将这些 UUID 作为基因组标签来增强不同项目之间数据的比较和整合。HQMAGs 通过分析其基因组上下文中的所有基因,提供对健康相关微生物功能的更深入理解,甚至能够对未注释基因进行功能分析。这种微生物基因组分析的战略性改进为更精确地识别和理解微生物在健康和疾病中的作用奠定了基础。

此外,传统分析方法常常聚焦于单一特征的差异分析,忽视了微生物之间复杂的相互作用。这种做法忽略了肠道微生物组作为复杂适应系统(CAS)的现实特征,其中的组成部分或代理以动态和非线性方式相互作用。这些相互作用导致系统层面的涌现特性,这些特性无法仅从单个代理的行为中预测。在这一微生物 CAS 中,微生物形成称为“公会”的结构模块,支撑着支持宿主健康的肠道生态系统的涌现特性。同一公会的成员可能来自不同的分类背景,但共同繁荣或衰退,表现出共丰度行为。我们通过 HQMAGs 的共丰度分析来描绘基于微生物相互作用的公会级组织,揭示了这一复杂生态系统中“谁与谁合作”。通过这种视角,每个公会与人类临床参数相关联,提供了对它们对健康和疾病影响的深入见解,并体现了“整体大于部分之和”的 CAS 原则。

利用这一创新方法,我们之前的研究阐明了与肥胖、II型糖尿病、糖尿病肾病、糖尿病神经病和 2019 冠状病毒病(COVID-19)等状况相关的功能组。这些研究强调了微生物相互作用在微生物组功能动态中的关键作用及其对宿主健康的更广泛影响。因此,本研究采用公会基础框架,强调基因组特异性、数据库独立性和以相互作用为中心的分析。这一方法改变了对微生物实体的看法,从将其视为独立单元转向探索其复杂的互动模式。这种视角对于探讨肠道微生物组的系统层面功能以及理解其对宿主健康的影响至关重要。这一基础理解引导探索这些复杂微生物网络如何影响整体健康结果。

文章亮点


1. 在相同的分析框架内整合多样的微生物组数据集

2. 揭示了肠道细菌在不同干预和疾病状态下的稳定关系

3. 发现了跨人群和健康状态的两个竞争公会的核心结构

4. 提供了稳定相互作用的微生物公会作为健康调节的新目标


图文赏析


图 1. 研究方案和所使用的数据集。(A 和 B) 在 (A) QD 试验和 (B) 病例对照数据集收集 I (CCDC-I) 中识别出两个具有稳定关系的竞争公会 (TCGs)。(C) 通过基因组级别的去重(99% ANI)整合 (A) 和 (B) 中发现的 TCG,并进行特征选择以找出 TCG 的核心成员,称为 CC-TCG。CC-TCG 进一步用于在病例对照数据集收集 II (CCDC-II) 中对病例与对照进行分类。随后,基于 CC-TCG 构建了一个通用模型,以区分 CCDC-I 和 CCDC-II 中的所有样本的病例与对照。此外,CC-TCG 还用于基于治疗数据集收集 (TDC) 中的预治疗肠道元基因组预测治疗反应。

图 2. 高纤维饮食引起的肠道微生物群的可逆变化与 2 型糖尿病患者的代谢表型相应变化相关。(A) QD 试验的研究设计。在适应期后,基线(M0)、高纤维干预(W)或标准护理与常规饮食(U)后的 3 个月(M3)以及干预停止后的 1 年(M15)进行了医学检查和样本收集。(B) 纤维摄入量的变化。(C 和 D) (C) 基于 Bray-Curtis 距离的主坐标分析显示的肠道微生物组的全球变化,涉及 1,845 个 HQMAGs,(D) 各组之间的平均 Bray-Curtis 距离。采用 PERMANOVA 测试(9,999 次置换)比较各组。∗p < 0.05 和 ∗∗∗p < 0.001。方框的颜色强度表示平均 Bray-Curtis 距离的大小。(E–H) (E) HbA1c 的变化,(F) 达到适当血糖控制的参与者比例,(G) 空腹血糖,以及 (H) 餐后耐糖试验 (MTT) 中曲线下面积 (AUC) 的变化。对于 (E)、(G) 和 (H),数据以基线的百分比变化表示(± 标准误)。使用 Friedman 测试,随后进行 Nemenyi 事后检验以比较同组内的差异;紧凑字母反映显著性(p < 0.05)。W 组 n = 67,U 组 n = 28。使用 Mann-Whitney 测试(双侧)比较 W 和 U 在同一时间点的差异,∗p < 0.05,∗∗p < 0.01,和 ∗∗∗p < 0.001。W 组在 M0 时 n = 74(对于 H,n = 72),M3 时 n = 74,M15 时 n = 67;U 组在 M0 时 n = 36,M3 时 n = 36,M15 时 n = 28。

图 3. 尽管高纤维干预引起肠道微生物组发生了显著的全球变化,但稳定的基因组对形成了与 HbA1c 水平相关的 TCGs(QD-TCG)。(A) 在试验期间 W 组中 477 个流行 HQMAGs 的共丰度网络,分别在 M0、M3 和 M15 时表示为 GM0(442; 4,231)、GM3(421; 2,587) 和 GM15(429; 4,592),括号中的数字为网络的顺序和大小。HQMAGs 之间的相关性使用 FastSpar 计算,n = 67 名患者。所有显著相关性(p ≤ 0.001)均被包括在内。节点之间的边表示相关性。红色和蓝色分别表示正相关和负相关。节点大小表示 HQMAG 的平均丰度。边加权的弹簧嵌入布局根据相关系数作为权重确定节点和边的布局。(B) 在试验期间基因组对不同类型相关性的分布。三个字母表示 M0、M3 和 M15 时基因组对的相关性(N 表示负相关,P 表示正相关,U 表示无相关性)。时间点之间的稳定相关性,NNN 和 PPP,用星号表示。(C) 具有稳定相关性的 HQMAG 被聚类为 17 个簇(C1–C17),采用连通分量聚类分析。C1 进一步通过基于负相关和正相关的平均链接和 WGCNA 分析聚类为 C1A 和 C1B。(D) 使用 MaAslin2 包的线性混合效应模型分析基因组簇与 HbA1c 之间的相关性。丰度进行了对数转换。个体作为随机效应使用。n = 67。p 值使用 Benjamini & Hochberg 方法进行了调整。∗ BH 调整后的 p < 0.05,∗∗∗ BH 调整后的 p < 0.001。(E) QD-TCG 的网络。

图 4. TCGs(QD-TCG)中的基因组预测 QD 试验中 2 型糖尿病患者的代谢健康结果,并在 CCDC-I 中区分病例与对照。(A) W 组中 C1A、C1B 及其比率在试验期间的均值范围缩放稳健中心对数比(rclr)转化丰度的变化。使用 Friedman 测试,随后进行 Nemenyi 测试以分析时间点之间的差异。紧凑字母反映显著性(p < 0.05)。数据以均值 ± 标准误表示。(B) 使用 TCGs 中的基因组预测生物临床参数。基于 M0 和 M3 时 C1A 和 C1B 的均值范围缩放的 rclr 丰度以及临床参数训练线性混合效应模型,以个体作为随机效应。使用 M15 时 C1A 和 C1B 的均值范围缩放 rclr 丰度根据训练模型预测临床参数。柱状图显示预测的临床参数与 M15 时测量值之间的 Pearson 相关系数。参数名称前的星号表示显著的 Pearson 相关性。p 值使用 Benjamini & Hochberg 方法进行了调整。∗ 调整后的 p < 0.05,∗∗ 调整后的 p < 0.01 和 ∗∗∗ 调整后的 p < 0.001。(C) 从 11 个不同数据集收集的七种疾病的数据作为病例对照数据集收集 I。左侧面板中每个病例对照数据集的样本大小分别以红色和绿色数字显示。对于集合中的每个数据集,元基因组读数被招募到 141 个 QD-TCG 基因组中,以估算每个样本中基因组的丰度。(D) 基于这 141 个基因组的丰度矩阵,训练了一个带有留一交叉验证的随机森林分类模型,以在每个数据集中对病例和对照个体进行分类。这里显示了接收者操作特征曲线下面积(AUROC)。

图 5. 从特定于某种疾病的数据集中识别的形成 TCG 的基因组,在 CCDC-I 中对不同疾病的独立数据集进行病例与对照的分类表现出显著的有效性。(A) 在 CCDC-I 中识别 TCGs。左侧面板中每个病例对照研究的样本大小分别以红色和绿色数字显示。CCDC-I 包含 11 个已发布的七种疾病的元基因组病例对照数据集。三个结直肠癌(CRC)数据集被合并以分析 CRC。三个炎症性肠病(IBD)数据集被合并以分析 IBD。遵循 TCGs 模式的相关性百分比(即每个公会内的正边,两个公会之间的负边)以黄色显示。矛盾相关性的比例,即每个公会内的负相关和公会之间的正相关,在 100% 堆叠条形图中以黑色显示。(B–H) 在 CCDC-I 中发现的 TCGs。(I) 在一个数据集中发现的 TCG 被用作预测因子,以在同一数据集和其他十个数据集中分类病例与对照。在每个数据集上,针对每组 TCGs 应用带有留一交叉验证的随机森林分类模型。ROC 曲线下面积(AUC)值在热图中显示。


总结与意义


利用公会基础方法,本研究集中于稳定的相互作用以识别与健康相关的微生物实体。受到系统生物学原则的启发,即稳定的相互作用标志着核心系统组件,我们假设在不同条件下稳定相关的基因组对可能是健康相关公会的核心成员,可能因其在人体健康中的关键作用而受到进化力量的塑造。通过构建来自不同环境扰动(包括饮食干预和健康状态差异)个体的HQMAGs共丰度网络,发现了一组稳定相关的核心HQMAGs。这些HQMAGs形成了两个竞争公会(TCGs)的强大网络,并被用作开发机器学习模型的核心特征。这些模型在涉及15种不同疾病的26个数据集中区分病例与对照,并预测四种不同条件下对免疫疗法的反应,取得了中等到优良的表现。这个TCG模型代表了由稳定微生物相互作用驱动的关键健康相关公会的核心微生物组结构。这些发现可能通过利用微生物相互作用的稳定性作为生物标志物,推动精准微生物医学的发展,改善疾病的诊断和管理。

通讯作者

彭永德,上海市第一人民医院内分泌代谢科主任、主任医师、医学博士、教授、博士生导师、糖尿病研究室主任、大内科教研室主任。上海交通大学医学院附属第一人民医院内分泌代谢科学科带头人、甲状腺疾病诊疗中心主任、骨质疏松症联合诊疗中心主任,上海市级新冠肺炎救治专家组成员       现任《上海医学》副主编,《J Clin Endocrinol Metab》、《中华内分泌代谢杂志》、《中华糖尿病杂志》、《中国糖尿病杂志》、《中华器官移植杂志》及《中国临床保健杂志》杂志编委,《Metabolism》、《Microbiome》、《J Diabetes & Complications》、《China J Med》等杂志特邀审稿人       已发表论文433篇(SCI 90篇,包括Science、PNAS、JCEM等),主编《系统内分泌学》等教材专著6部,参编教材专著12部。

Liping Zhao,罗格斯大学生物化学与微生物学系教授。研究方向:开发分子和基因组工具,用于系统理解和预测操作人类和动物肠道中复杂的微生物群落。了解饮食与肠道微生物群在肥胖和糖尿病等慢性病的发作和进展中的相互作用。制定营养干预措施以调节肠道微生物群与人类之间的关系,以实现预防性保健。实验室目前的研究项目主要集中在开发肠道微生物群靶向干预措施,以恢复和改善人类健康。我们提出了一种“以健康为中心”的方法来操纵肠道微生物群——建立或恢复一个健康的肠道生态系统,该生态系统能够提供有益于人类宿主的所有功能(例如,短链脂肪酸生产),并维持肠道环境,防止有害细菌进入。我们的工作涵盖广泛的研究,从产品开发、基础科学研究到临床试验,以开发建立在微生物生态学和系统生物学基础之上的干预措施,最重要的是适用于临床环境。我们的团队在微生物学、营养学、临床营养学、食品科学和生物信息学方面拥有专业知识。我们还与广泛的本地和国际合作者网络合作,开展针对肠道微生物群的代谢健康、胃肠道功能、癌症护理和婴儿健康方面的多学科研究。

施羽,启东市人民医院内分泌代谢科主任医师。

张晨虹,上海交通大学生命科学技术学院 ,微生物代谢国家重点实验室研究员。人体及动物肠道菌群的研究,主要进行人体及动物肠道菌群的研究。以元基因组学、转录组学、代谢组学等手段,分析肠道菌群的结构与功能,节食及功能性食品对肠道菌群的影响,肠道菌群与宿主之间的互作,研究肠道菌群在肥胖等复杂代谢性疾病以及衰老中的作用。

药医肠道菌
生物医药与肠道菌群的前沿研究学术分享
 最新文章