Williams J, et al. (2024). SimpleMetaPipeline: Breaking the bioinformatics bottleneck in metabarcoding. Methods in Ecology and Evolution, doi: 10.1111/2041-210X.14434.
(2024年10月7日发表)
摘要参考翻译:下一代测序技术的普及大大提高了宏条形码测序数据的可用性。然而,为了有效地为后续分析准备这些宏条形码数据,研究人员必须持续应用几种不同的生物信息学工具,包括对读长进行去噪处理、对序列进行聚类以及分配分类学特征的工具。这往往会给非专业人员的工作流程造成生物信息学瓶颈,因为存在以下障碍:(a)整合不同工具;(b)无法轻松修改和重新运行涉及非脚本“点-选(point-and-click)”元素的生物信息学流程;(c)单个数据集可能需要多个输出,如扩增子序列变异(amplicon sequence variants,ASV)和操作分类单元(operational taxonomic units,OTU),这往往会导致用户多次运行流程。本文介绍用R实现的开源生物信息学流程SimpleMetaPipeline,它可以解决这些障碍。SimpleMetaPipeline将现有最强大、最常用的生物信息学工具集成到一个可重复的流程中,简化了参数选择,生成一个包含可选聚类和赋值选项的序列数据表。SimpleMetaPipeline可接受来自多次测序运行的demultiplexed paired-end and single reads。我们描述了这一流程,并演示了如何通过替代注释轻松实现多算法一致性测试以加强推断。SimpleMetaPipeline是对现有流程库的重要补充,它提供了简单、可重复的生物信息学,包括一系列常用的聚类和赋值选项,如OTU和ASV。
SimpleMetaPipeline工作流程
点击下方“阅读原文”可查看英文全文。
声明:本内容未向其他微信公众号投稿。