近日,中国农业科学院饲料研究所反刍动物营养与饲料创新团队评估了不同参考数据库和置信度参数对目前物种分类注释的常用工具——Kraken2——的准确度和召回率等方面的影响,对研究人员根据特定需求选择合适参数提供了参考,相关研究发表在《生物技术通报》英文版(aBIOTECH)上。
实现复杂环境中微生物物种组成的准确鉴定是一项极具挑战性的工作。Kraken2作为目前物种分类注释的首选工具之一,其参考数据库和置信度的参数选择直接影响Kraken2物种注释和丰度水平,进而影响研究结果的可靠性。
本研究发现使用较小的参考数据库时,随着置信度的增加,能够被分类的序列显著降低;而使用较大的数据库时,分类率受置信度的影响较小。选择较大的参考数据库时,随着置信度的增加,减少了假阳性物种的出现,物种分类的准确度和F1评分都得到显著提高;召回率基本不会受到置信度的影响。
但置信度的增加会显著影响物种相对丰度的波动,置信度越高,注释到物种丰度与真实丰度差异越大。所以,在使用Kraken2进行物种注释时,建议使用更全面的参考数据库(standard、nt和GTDB数据库),并结合适度的置信度(0.2-0.4)来提高分类的准确性和灵敏度。
该研究得到中国农业科学院科技创新工程、基本科研业务费专项和北京市家畜创新团队等项目的支持。
原文链接:https://doi.org/10.1007/s42994-024-00178-0
获取行业前沿进展和有料资讯