大多数细菌被忽视Model microbes such as Escherichia coli hog scientists’ attention, leaving most known bacteria with few publications devoted to them.密歇根大学安娜堡分校的微生物系统生物学家Paul Jensen希望看看人工智能(AI)工具(如大型语言模型)是否能综合不同微生物的研究成果。因此,他查找了所有关于他实验室研究的一种导致龋齿的细菌——唾液链球菌(Streptococcus sobrinus)的相关论文,却发现自己已经读过其中的全部,仅有几十篇。许多微生物学家可能也面临着相似甚至更糟的情况。在上周发布于预印本平台bioRxiv的一项研究中,Jensen发现仅有10种细菌的研究论文数量占总数的一半,而近四分之三的已命名细菌甚至没有一篇论文研究它们。“我们对少数几种细菌了解了很多,”Jensen表示,但“对于很多细菌来说,语言模型和AI根本无研究文献可读取。”研究人员表示,那些对人类和地球健康至关重要的微生物尤其缺乏研究。葡萄球菌是许多传染病的罪魁祸首模式微生物与其他生命科学研究者一样,微生物学家研究模式生物,希望从像大肠杆菌(Escherichia coli)这样的“实验室宠儿”中获得的研究成果能适用于其他生物。在许多情况下,这种方法确实有效:分子生物学的基础正是建立在对大肠杆菌的实验之上的。然而,随着科学家通过皮肤拭子、粪便或土壤样本的测序不断扩展微生物生命目录,揭示新的独特见解的机会也在增加。为了量化微生物学对少数模式生物的偏重,Jensen查阅了一个包含43,409种独特细菌的数据库,并统计了由美国政府管理的生物医学文献数据库PubMed中,在标题或摘要中提到每种细菌的论文数量。毫不意外,大肠杆菌以超过312,000篇论文高居榜首,占总数的21%。排名前十的细菌主要是人类病原体,如金黄色葡萄球菌(Staphylococcus aureus,一种机会性感染菌)、结核分枝杆菌(Mycobacterium tuberculosis)和幽门螺杆菌(Helicobacter pylori,一种可导致溃疡甚至癌症的胃部微生物)(见“研究最多的细菌”)。然而,74%的细菌种类在任何已索引的论文标题或摘要中都未被提及(见“被忽视的微生物”)。在过去的25年中,由于微生物组研究通常对微生物进行整体测序,已知细菌与被研究细菌之间的差距进一步扩大。研究不足的微生物意大利特伦托大学的微生物组科学家Nicola Segata对这项研究的结论感到失望,但并不意外。除了少数例外,健康人类微生物组中丰富的微生物几乎没有进入50种研究最深入细菌的名单。而Segata和其他科学家发现的许多对人类健康重要的微生物甚至还未被命名,更不用说被研究了。“这些物种离获得它们应得的研究水平还有很长的路要走,”他补充道。德克萨斯大学奥斯汀分校的微生物生态学家Brett Baker指出,在海洋和土壤等多样化生态系统中发现的微生物同样明显地被研究不足。“自然界中的主要微生物都不在这个名单上,”他说,“这是一个问题。”研究人员认为,纠正细菌学出版偏差并非易事,但却是享受微生物组研究成果所必需的。一大挑战是如何在实验室中培养研究不足的微生物:大肠杆菌之所以流行,部分原因是它易于生长。许多研究最深入的微生物都具备这一特性。“这些都是‘杂草型’微生物,”Baker说。Jensen对科学家们能够学习培养重要但研究不足的微生物持乐观态度。Baker认为,微生物学家可以从自然中获得灵感,研究实验室中合成的微生物混合物:“这些东西通常不愿意单独生存,”他说。大规模的努力也可能填补这一空白。开放科学非营利组织Align to Innovate刚刚启动了一项耗资100万美元的计划,旨在研究1,000种微生物在1,000种不同条件下的生长表现,包括不同的营养水平、氧气含量和温度。该项目的负责人Shantal Al Habib(位于加拿大多伦多)表示,这些数据将免费提供给科学家们,并可能帮助训练人工智能模型,以进一步挖掘微生物生命的奥秘。位于美国旧金山的该组织科学项目负责人Pete Kelly补充道。同样参与Align to Innovate项目的Jensen表示,答案并不是让微生物学家放弃像大肠杆菌这样的模式生物,转而研究更多“奇特”物种。但他补充说:“如果我们继续以同样的方式研究微生物,我们需要10,000年才能对所有这些不同的微生物有一个良好的理解。”
References
Jensen, P. A. Preprint at :bioRxiv https://doi.org/10.1101/2025.01.04.631297 (2025).