Collienne L, et al. (2024). Phylogenetic tree instability after taxon addition: empirical frequency, predictability, and consequences for online inference. Systematic Biology, syae059.
(2024年10月25日发表)
摘要参考翻译:在线系统发育推断方法可以将逐步到达的序列添加到推断的系统发育树中,而无需从头重新计算整棵树。尽管已有一些在线方法的实现,但人们仍然担忧新增序列可能会改变原始分类群之间的拓扑关系。我们称这种树拓扑结构的变化为推断树的不稳定性。本文中,我们在最大似然框架下对1000个实证数据集中的单个分类群增加稳定性进行了分析。我们发现,几乎90%的实例中出现了不稳定性,尽管在AU检验下观察到的拓扑差异不总是显著。新增分类群导致的树拓扑变化很少发生在其附加位置附近,更多地出现在支持率较低的更远树枝上。为探究不稳定性是否可以预测,我们提出了不稳定性的可能来源假设,并设计了相应的摘要统计量作为输入特征,用于随机森林机器学习模型。我们成功预测了不稳定性并确定了最具影响力的特征。总之,严格的仅插入式在线推断方法难以生成全局最优树,然而允许少量最终树重排或接受略微次优解似乎是可行的。
点击下方“阅读原文”可跳转至文章页面,下载PDF文件查看英文全文。
声明:本内容未向其他微信公众号投稿。