Lemoine F & Gascuel O. (2024). The Bayesian Phylogenetic Bootstrap, Application to Short Trees and Branches. Molecular Biology and Evolution, msae238, doi: 10.1093/molbev/msae238.
(2024年11月8日发表)
摘要参考翻译:Felsenstein的Bootstrap法是系统发育学中最常用的分支支持度测量方法。当前的测序技术可以实现大量物种的采样(例如SARS-CoV-2)。在这种情况下,序列非常相似,树较短,分支对应的突变数目很少(可能为0)。尽管如此,这些树包含了强信号,虽然有部分未解的部分,但错误分支的比例较低。对于这样的数据,Felsenstein的Bootstrap法并不理想。由于Bootstrap抽样的频率学性质,对应单一突变的分支的预期支持度约为63%,即使该分支极有可能是正确的。在这里,我们提出了一种贝叶斯版本的系统发育Bootstrap法,其中各个位点被赋予非信息性先验概率。此时,分支支持度可以被解释为后验概率。我们不将比对视为大样本位点的一个小子样本,而是认为它包含了所有可用的信息(例如,完整的病毒基因组,现已成为常规数据)。我们给出了完美系统发育假设下的预期支持度公式,分别在频率学和贝叶斯框架下,其中对应单一突变的分支现在的预期支持度约为90%。模拟结果表明,这些理论结果对实际数据是稳健的。对低同源性病毒和非病毒数据集的分析表明,贝叶斯自举法支持度更容易解释,对非常可能正确的分支给出了较高的支持度。随着同源性的增加,两种支持度变得越来越接近,并且高度相关。
Distribution of frequentist bootstrap supports with/without collapse of near -zero branches, using Ebola virus full-genome data.
点击下方“阅读原文”可跳转至文章页面,下载PDF文件查看英文全文。
声明:本内容未向其他微信公众号投稿。