自达尔文以来,系统发育树(phylogenetic trees)一直被广泛用于表示物种和其他分类群的进化历史。在水平基因转移(horizontal gene transfer)、杂交物种形成(speciation by hybridization)或基因重组(reassortment)等网状进化事件(reticulate evolutionary events)起重要作用的情况下,有时我们会使用系统发育网络(phylogenetic networks)。本文介绍了SplitsTree App,这是一款用于探索和分析系统发育数据的软件,支持树和网络两种表示方式。该应用程序提供了全面的功能集合,包括用于计算距离、系统发育树、分割网络(split networks)、单倍型网络(haplotype networks)、有根系统发育网络(rooted phylogenetic networks)、缠结图(tanglegrams)、共识树(consensus trees)和共识网络(consensus networks)的100多种算法。它引入了更快速的邻近网(neighbor-net)版本,并实现了中位连接(median-joining)算法,这两者是构建系统发育网络的两种最广泛使用的技术。此外,该软件还集成了从Tajima's D到Shapely值的遗传和系统发育指标计算功能,涵盖了从序列到系统发育网络的多个层次。关于软件功能的完整描述可以在附带的用户手册中查阅。
这款新软件旨在适应现代数据集日益增长的规模和复杂性。它扩展、整合并取代了我们早期的应用程序:用于无根系统发育树和网络构建的SplitsTree4、用于有根树和网络的Dendroscope3以及用于单倍型分析的PopArt4。无根网络在系统发育和群体遗传学中被广泛使用,但也可用于其他领域,如语言学和人类学。尽管有根系统发育网络能够明确表示网状进化(reticulate evolution),但由于缺乏适用的软件,其应用受到了限制。为了解决这个问题,SplitsTree App提供了计算这些网络的新方法。
该应用程序被设计为一款多功能工具,可以接受多种来源的数据。它接受多种格式的输入,包括序列、比对、距离、系统发育树和网络,适用于多种数据类型。该软件还支持评估序列数据的质量和特性,使研究人员能够识别因网络状进化、不完全谱系分选(incomplete lineage sorting)、多态性数据或标签错误导致的信号冲突。在进行任何假定的单一树结构的模型分析之前,应首先进行这种关键评估。另一个关键应用是使用系统发育网络方法分析那些可能受网状进化事件(如水平基因转移、杂交,或语言学中的借用)影响的数据集。
图1展示了用户界面,使用了来自一项关于海洋环境中杂交分离的致病真菌进化的单核苷酸多态性(SNP)数据进行说明。
图1 在新的SplitsTree App中,每个数据集由单个窗口表示,对数据集的不同分析则作为该窗口中的不同标签页显示。
a,侧边栏提供对当前工作流的访问。b,这些标签页允许设置参数并执行算法。c,“引用方法”标签提供了方法概述和相关参考文献。d,比对查看器,此处加载了49种真菌分离株中110万个SNP的比对数据。e,从比对中计算的系统发育概述,包含一个QR码,内含可扫描并在SplitsTree App中打开或保存为文本的数字描述。f,中位连接网络,展示了不同单倍型之间的关系。g,缠结图,显示了基于比对到两个不同参考基因组的数据获得的两棵树。基于真菌测序数据。
可重复性、复用性和作者归属是科学软件开发的基本原则。SplitsTree App通过采用工作流驱动的方法体现了这些原则,其中所有数据和分析步骤都明确表示在一个溯源图中。这种设计使用户能够保存并在以后恢复分析的所有中间结果,确保了透明性和可重复性。用户可以交互式地设置工作流,将其导出为文件,并在命令行上对多个数据集执行分析。在工作流的帮助下,该程序维护了一份包含数据、算法、参数和参考文献的可读摘要,便于结果解释和正确归属。在生物学领域的出版物中,系统发育树和网络通常仅以图像形式出现,缺乏可访问的数据。为了解决这个问题,SplitsTree App可以在图像中嵌入二维码。该二维码提供了系统发育树或网络的Newick格式的数字描述,改善了数据共享和复用的体验。该软件的一个局限性是缺乏用于模型推断系统发育网络的算法。开发此类方法是一个具有挑战性的任务,并仍然是一个活跃的研究领域。
客户端页面和不同功能展示
###Code availability
The Java source code and application installers for Linux, MacOS and Windows are available at
https://github.com/husonlab/splitstree6 (GPLv3 license).
Cite this article
Huson, D.H., Bryant, D. The SplitsTree App: interactive analysis and visualization using phylogenetic trees and networks. Nat Methods (2024). https://doi.org/10.1038/s41592-024-02406-3