Nucleic Acids Research | OrthoDB数据库及其配套工具BUSCO更新!

文摘   2024-11-14 07:00   奥地利  

点击上方 环境微生物组学 关注我们






OrthoDB数据库及其配套工具BUSCO近期更新,极大提升了基因组多样性覆盖范围,为系统生物学、比较基因组学及功能基因预测提供了强有力的支持。这次更新进一步丰富了基因注释的准确性和广度,为科学家们提供了更具代表性的演化及功能性基因组数据集。

OrthoDB v12的推出显著增加了真核生物基因组的覆盖,尤其扩展了某些特定物种的基因组数据。例如,飞蛾、线虫、旗鞭孢子真菌、鸟类等物种的基因组数大幅增加。这使得OrthoDB现包含5827个真核基因组,为基因组多样性的研究提供了更丰富的资源。OrthoDB的更新不仅扩展了物种的数量,也增加了编码DNA序列(CDS)和基因位置信息,以便于更精确地映射和注释新序列。OrthoDB为每个基因提供了详细的演化和功能特征注释。通过基于物种的广泛采样,OrthoDB能够生成更准确的基因直系同源群(OG),每个OG都能追溯到物种的最后共同祖先,从而为同源基因的功能预测奠定基础。此外,OrthoDB的用户界面提供了便捷的查询和过滤工具,使得研究人员可以快速查询特定基因或基因组的注释信息。OrthoDB为用户提供了便捷的数据访问方式,包括网页接口、REST API以及PythonR的包,这些工具极大简化了数据的集成和自动化处理。BUSCOOrthoLoger工具的DockerConda包进一步提升了软件的易用性,使得这些工具可以在不同计算环境中稳定运行

OrthoLogerOrthoDB的一个配套工具,用于高效预测基因直系同源群。通过依赖物种树的层级方式,OrthoLoger在多个层级上进行基因直系同源分析,使得在不同物种层次上均能保持注释的一致性。ODB-mapper则进一步简化了新基因组的注释过程,尤其在处理转录组或低质量数据时表现出色。

BUSCO作为基因组质量评估的标准工具,在此次更新中新增了多个数据集,以覆盖更多物种。这次更新显著增加了不同物种的代表数量,比如细菌数据集从83个增加到332个,真核生物数据集从67个增加到109个。BUSCO通过测定基因组中保守单拷贝基因的数量,提供了基因组完整性的衡量标准。新版本还引入了更高效的基因识别工具——Miniprot,在基因组评估中提高了速度。


参考文献


Fredrik Tegenfeldt, Dmitry Kuznetsov, Mosè Manni, Matthew Berkeley, Evgeny M Zdobnov, Evgenia V Kriventseva, OrthoDB and BUSCO update: annotation of orthologs with wider sampling of genomes, Nucleic Acids Research, 2024;, gkae987, https://doi.org/10.1093/nar/gkae987



更多图形图例、研究内容,推荐阅读原文 !

如若侵犯到原作者任何相关利益,请告知删除!翻译过程存在不准确或表述不清,以及任何疏漏,欢迎大家后台留言指正。

环境微生物组学
关注生态环境问题和微生物功能,分享环境微生物组学研究动态。
 最新文章