标题:Leveraging genomic information to predict environmental preferences of bacteria通讯作者:Josep Ramoneda, Noah Fierer 现在,基因组信息可用于多种多样的细菌,包括未培养的分类群。然而,对于相对狭窄的细菌多样性,我们对环境偏好(即细菌在氧气、pH 值、温度、盐度和其他环境条件梯度上的生长反应)有相应的了解。我们对细菌生态学理解的这些局限性限制了我们预测组合将如何响应全球变化因素而变化、设计有效的益生菌或指导培养工作的能力。需要创新的方法,利用不断扩大的基因组数据库来准确推断细菌的环境偏好并验证这些推断的准确性。通过这样做,可以拓宽对大多数仍未表征的细菌分类群的环境偏好的定量理解。从这个角度来看,我们强调了为什么从基因组信息中推断环境偏好很重要,并讨论了这样做的潜在策略范围。特别是,强调了如何将不依赖培养和依赖培养的方法与基因组数据相结合以开发预测模型的具体示例。还强调了这些方法的局限性和陷阱,以及需要解决的具体知识差距,以成功扩大我们对细菌环境偏好的理解。环境偏好指细菌在自然环境中,对于不同的物理、化学和生物条件所表现出的倾向性选择或适应性。这些环境因素包括但不限于温度、酸碱度(pH)、盐度、营养物质的种类和浓度、氧气含量等。环境偏好既包括支持某个分类群生长的条件范围,也包括生长最大化的特定条件(即生长最佳和范围)。从本质上讲,环境偏好是分类群在环境梯度上的生长反应。因此,量化环境偏好通常是确定任何给定微生物分类群何时何地生长的关键,这是微生物生态学中长期存在的挑战。此外,环境偏好通常反映了表型性状的复杂组合,例如维持 pH 稳态的能力,或在高温下维持细胞完整性的能力,而其中许多性状尚不清楚。
细菌应对广泛的限制生长的环境因素,这些因素有助于其生态位。提高我们对物种内部和物种之间细菌环境偏好的定量理解,将为微生物生态学领域提供一系列好处。例如,如果我们更准确地了解最有可能最大化目标分类群生长的条件集,就可以提高细菌培养的成功率,并且可以通过定制在特定条件下高效生长的联盟来提高人类益生菌的功效。从根本上说,描述环境适应背后的基因或基因组属性,以及这些适应如何与生物地理模式相关,将改进细菌在时间和空间上分布的预测建模。这在全球变化的背景下尤其相关,因为通常很难先验地预测环境条件的变化将如何改变生态系统中的细菌分布。因此,可以通过提高我们目前对细菌环境偏好和这些偏好背后的适应性的理解来解决微生物生态学中持续而重要的挑战。
对细菌环境偏好的理解存在偏差和使用不依赖培养的方法量化细菌环境偏好
传统上,细菌环境偏好的表征依赖于基于实验室的分离株的生长反应定量,这些生长遵循生长限制因素(如氧浓度、温度、水分、pH值、盐度或气压。细菌培养使我们能够精确调整环境梯度,控制混杂因素,并准确量化细菌生长反应。尽管细菌培养扩大了我们对细菌环境偏好的理解,但有关细菌环境偏好的信息的可用性通常是有限的,对于某些环境因素和分类群,跨环境梯度的生长响应仍然难以表征。为了拓宽我们对细菌环境偏好的理解,需要用不依赖培养的方法补充量化环境偏好的培养依赖性方法。
生物地理学模式的分析是一种可以提供有关细菌环境偏好的新信息的方法。 这种方法的一个关键假设是丰度分布反映了细菌类群的生长反应,并且类群的环境偏好应反映在环境梯度上分类群的丰度特异性变化。这一假设的有效性可以通过使用不依赖培养的方法来量化特定分类群在环境梯度下的原位生长速率来明确检验。
基于基因组、蛋白质结构信息来推断细菌的环境偏好
新基因组信息的生成速度比环境偏好信息快得多。虽然细菌对环境的反应可能具有高度可塑性,但环境偏好的范围可以从基因组数据中推断出来。此类分析可以基于一般基因组特征,无需注释。并非所有环境偏好都必然需要预测全基因组信息,因为偏好通常可以表现出系统发育信号,从而允许仅基于系统发育或分类信息进行预测。由于基因组信息可以在广泛的分类群中生成,而无需分离和培养,因此可以使用基于基因组的创新模型来估计那些仍未表征的分类群(包括给定物种的多个菌株)的环境偏好,揭示这些偏好背后的特定特征,并提高从分类学和系统发育信息得出的推断的准确性。基因组信息只是可用于提高我们对微生物环境偏好的理解的几个信息来源之一。一种有前途的方法是蛋白质结构分析,该方法基于认识到许多蛋白质特性无法根据基因序列直接预测。蛋白质组的氨基酸组成和热稳定蛋白质结构的最佳折叠是对温度的关键适应,给定蛋白质折叠最稳定的 pH 值与经验亚细胞 pH 值呈正相关。这意味着从氨基酸组成重建蛋白质结构可以深入了解细菌的一些最可能的环境适应。此外,通过识别哪些基因受到更强的选择,可以改进用作预测特征的基因集,假设这些基因应该与给定的环境偏好更紧密相关。现在已经有快速重建蛋白质结构的方法,这使得使用单个蛋白质的结构来改进对细菌环境偏好的预测成为可能。偶联基因组和环境偏好信息
代谢或形态学性状通常可以根据代谢途径完整性 或选定基因的存在 进行预测,而代谢或形态学性状通常需要有关多个性状的信息。这使得仅使用基因组信息来预测环境偏好特别具有挑战性,尤其是当我们没有先验知识哪些特定基因或其他基因组属性是环境适应的基础时。然而,有证据表明,基于基因组的方法可以有效地用于推断细菌的环境偏好。图1:生长范围和细菌生长对与不同栖息地的细菌环境适应相关的环境因素的反应。环境因素按细菌环境偏好知识的递减程度排序
图2:目前培养细菌中环境偏好的定量和分类学分布
图3:扩大我们对微生物环境偏好的理解的经验和预测方法。扩大我们目前对细菌环境偏好的理解需要整合基于培养和不依赖培养的方法,以利用日益可用的细菌基因组信息。我们提供了通常用于预测细菌环境偏好的基因组和蛋白质组学特征列表。