PSMC、Relate、Stairway Plot、SMC++

学术   2024-10-25 10:11   浙江  
一项最近提出的模型表明,在现代人类的随机交配祖先种群中,早期至中期更新世过渡期间存在一个明显的瓶颈。这里展示,该模型相较于不包含瓶颈的随机交配模型对数据的拟合度明显较差。
最近,Hu等人在2023年开发了一种新的基于位点频谱(SFS)的方法,称为FitCoal,用于推断随机交配种群随时间变化的有效种群大小。作者通过将FitCoal应用于来自非洲种群的现代基因组序列,推断出大约100万年前(Mya)现代人类祖先经历了一个严重的种群瓶颈。然而,这项分析和结论存在几个问题。
首先,作者并未评估其模型相对于不包含瓶颈的简单模型对观察数据的拟合程度。在进行种群历史推断时,重要的是要认识到无法精确地确定真实的历史。相反,种群历史推断的主要目标是找到能够拟合观察数据的最简单模型。只有当新增复杂性能更好地解释观测数据时,才应优先采用新的模型。如果没有进行这个关键的模型比较,不清楚Hu等人提出的模型是否提供了额外的解释力。
其次,FitCoal并未在非洲外(OOA)种群中推断出这个瓶颈,尽管100万年前的遗传事件应该为所有现代人类所共享。Hu等人认为这是由于非洲外种群的祖先在大约6万年前离开非洲后失去了大量遗传多样性,即非洲外瓶颈,从而掩盖了对更久远历史事件的推断能力。然而,经历非洲外瓶颈的种群的SFS中仍包含多少关于古老瓶颈的信息尚不明确。
第三,Hu等人通过模拟展示,其他方法如PSMC、Relate、SMC++和Stairway Plot有能力检测到这种瓶颈,如果它真的存在的话,但在实际数据中未能检测到。这引发了对Hu等人报告信号的稳健性的担忧。
在这里,研究人员重新审视了Hu等人的发现。首先,进行了正式的模型比较,以分析Hu等人推断的瓶颈是否比没有瓶颈的模型更好地拟合数据。其次,分析了Hu等人推断的如此大规模的瓶颈是否会在非洲外种群的SFS中留下可检测的信号。
处理了由1000基因组项目高覆盖率测序的约鲁巴人(YRI)数据。过滤掉了基因组中非中性的区域和低质量区域,并生成了一个SFS。使用这个SFS,利用FitCoal推断了有效种群大小的轨迹,并观察到大约100万年前存在一个显著的种群瓶颈,这与Hu等人2023年发表的结果一致(图1A)。接下来,在相同的SFS上运行了mushi,结果发现它未能复制在YRI历史中发现的显著瓶颈,这与最近的另一项研究结果相符。
FitCoal推断出瓶颈而mushi未能推断出的事实,可能反映了FitCoal对古代种群历史的敏感性,或者是拟合过程中存在的统计问题,正如最近有学者所提出的一样。无论如何,模型要比另一个模型更有优势,必须更好地拟合数据。通过计算FitCoal和mushi模型的对数似然值(𝐿𝐿)(图1B,表1)进行了评估。发现mushi拟合的模型对数据的拟合显著优于FitCoal。这一结果表明,没有理由支持一个大约100万年前存在严重瓶颈的随机交配人类历史模型,而不是没有瓶颈的随机交配模型。
Figure 1. (A) Demographic histories inferred by FitCoal and mushi. (B) Site frequency spectra from the data (black) and models.

Table 1. Model comparisons. We report the log-likelihood for the three models in Figure 1 and difference in log-likelihoods with the best fitting model from mushi.

接下来,调查了非洲外种群与非洲种群在更新世瓶颈方面的不一致性。计算了两种种群模型的预期SFS:1)包含更新世瓶颈和非洲外瓶颈的模型,以及2)仅包含非洲外瓶颈的模型(图2A)。发现这两种模型的SFS存在显著差异(图2B)。这表明,如果存在如此大规模的更新世瓶颈,它会在非洲外种群的基因组数据中留下可识别的信号,这与Hu等人的主张相矛盾。FitCoal未能在非洲外种群中推断出瓶颈,进一步加剧了对该推断稳健性的担忧。
Figure 2. Effect of ancient severe bottleneck on site frequency spectra for out-of-Africa populations.

最后,越来越多的证据表明,人类并非起源于单一的随机交配祖先种群。相反,最近的研究表明,人类起源于两个或更多不同的种群,并相互混合。这些研究利用了遗传数据的不同统计方式,包括连锁不平衡、SFS以及全基因组的杂合度,为结构化的进化历史提供了多条证据。特别是,Cousins等人在2024年提出了一个模型,认为现代人类起源于两个祖先种群,这两个种群在150万年前分化,并在30万年前以80:20的比例混合,且多数祖先种群在分化后立即经历了一个瓶颈。然而,研究人员认为这与Hu等人使用FitCoal推断的事件并不相同。这是因为用于推断种群大小历史的方法(包括FitCoal、PSMC、Relate、SMC++、Stairway Plot和mushi)估算的是溯祖率,并假设这一值的倒数反映了种群大小。虽然这一假设在随机交配种群中成立,但在结构化种群中并不成立。Cousins等人的模型中的溯祖率与PSMC、Relate和SMC++的估计一致,然而Hu等人的模型的溯祖率与这些估计值不同。因此,这些瓶颈信号不存在可比性。
总之,研究人员认为没有足够的证据支持一个在大约100万年前经历了严重瓶颈的随机交配种群的人类演化模型。应该证明新提出的模型与传统模型相比,能同样或更好地拟合数据。

MEPGT
Daily updates of molecular evolution and population genomics literature and useful software tools
 最新文章