点击上方 环境微生物组学 关注我们
随着宏基因组学的发展,我们可以在不依赖培养的情况下研究微生物群落的组成和功能,这极大推动了环境微生物学和医学研究的发展。然而,组装病毒基因组由于其高度的基因组多样性和高突变率,给现有的宏基因组组装工具带来了巨大挑战。今天将介绍一款名为PenguiN的软件,它通过创新的算法实现了对病毒基因组和细菌16S rRNA的精细组装,帮助科学家们更好地解析病毒在微生物群落中的作用。相关学术成果发表在权威学术期刊Microbiome上,文章题目:Strain-resolved de-novo metagenomic assembly of viral genomes and microbial 16S rRNAs,文章通讯作者是Max-Planck Institute for Multidisciplinary Sciences的Martin Steinegger & Johannes Söding,第一作者:Annika Jochheim。
宏基因组学与病毒组装的挑战
宏基因组学通过直接测序环境样本中的DNA,帮助研究人员揭示微生物群落的组成及其基因功能。然而,病毒的基因组非常小,且在环境样本中往往仅占少量比例,导致在大量的宿主微生物DNA中,病毒序列被“淹没”。加上病毒基因组的高突变率和多样性,组装工具很难将其完全组装并解析到单个菌株水平。传统的de Bruijn图组装器如SPAdes,虽然在宏基因组组装中有广泛应用,但在处理病毒的高度微异性和菌株异质性时表现出局限性,特别是在组装菌株分辨的病毒基因组时,它们通常只能组装共识序列而无法区分不同菌株。
PenguiN 是一种基于重叠组装的工具,专为病毒基因组和细菌16S rRNA的精细组装而设计。与传统的de Bruijn图不同,PenguiN使用重叠序列的方式来组装病毒基因组,这使得它能够更好地处理病毒的微异性和菌株异质性问题。具体来说,PenguiN使用贝叶斯模型来选择最可能的延伸序列,从而确保组装过程中尽可能减少错误,最终可以组装出更长、更完整的病毒contig和细菌16S rRNA。在真实和模拟数据集中,PenguiN表现出了卓越的组装性能。相比于现有的组装工具,PenguiN可以增加3到40倍的病毒基因组完整性,并且在细菌16S rRNA基因组装方面表现出6倍的增长。
更深入的病毒研究潜力
病毒,特别是噬菌体(感染细菌的病毒),在调控环境和宿主微生物群落中扮演着重要角色。研究表明,噬菌体通过影响宿主细菌的组成和动态,驱动微生物多样性。然而,全球的病毒组几乎未被充分探索。PenguiN 的出现为病毒组装提供了新的可能,它可以从复杂的宏基因组数据中高效提取病毒基因组,帮助我们更好地研究病毒在环境和人体肠道微生物群落中的作用。此外,PenguiN还具有处理大规模和复杂数据集的能力。在多个宏转录组样本的组装中,PenguiN能够识别并组装出多达1398个完整的单链RNA噬菌体基因组,这一数字远远超过了其他组装工具的表现。这意味着,我们可以通过PenguiN更加深入地研究水体、活性污泥等环境中的病毒群落。PenguiN 的应用不仅限于病毒基因组,它在细菌16S rRNA组装中的表现同样优异。传统的de Bruijn图组装器在处理16S rRNA基因超出了k-mer的长度,导致组装碎片化。PenguiN则通过其重叠组装技术,成功组装了比现有工具多6倍的16S rRNA序列,为环境样本中细菌多样性的研究提供了更多可能。然而,尽管它在处理病毒和16S rRNA基因组装时表现出色,但在面对含有高重复序列或100%保守区域的原核生物基因组时,其性能可能不如预期。未来,PenguiN的开发者计划进一步优化其算法,以应对这些更具挑战性的基因组组装任务。
PenguiN overview
参考文献
Jochheim, A., Jochheim, F.A., Kolodyazhnaya, A. et al. Strain-resolved de-novo metagenomic assembly of viral genomes and microbial 16S rRNAs. Microbiome 12, 187 (2024). https://doi.org/10.1186/s40168-024-01904-y
更多图形图例、研究内容,推荐阅读原文 !
如若侵犯到原作者任何相关利益,请告知删除!翻译过程存在不准确或表述不清,以及任何疏漏,欢迎大家后台留言指正。