本文对现有已发表的真核生物生殖系突变率进行了综合分析,涵盖了140余篇相关的研究,涉及了134个真核物种。这些研究均是通过突变累积实验(MA)或者家系亲子代测序的方法(PO)来估计突变率的。
一个群体或者物种的世代突变率是一个非常重要的遗传参数。但是,对它的相关研究并不多。当我们的研究涉及到突变率的时候,经常是借用其他物种的突变率的值,比如研究蚊子的群体进化模型,其中用到的突变率可能是果蝇的。一般认为物种间的突变率差异不是很大,可以相互借用。但是,如果物种关系比较远,那么这种借用可能就会存在问题。比如,有研究物种之间的突变率差异可达40余倍,这种情况下,物种之间突变率的差异显然不能被忽略。
估计突变率的方法有很多。比如,在全基因组测序尚未兴起之前,相关的突变率一般是通过一些表型变化来估计的。还有很多是通过物种之间的分化来估计突变率的,比如一般认为物种之间中性碱基的替换率约等于物种的突变率。当然,这些方法对突变率的估计不是很直接,存在一定的缺陷。
近十余年来,随着全基因组测序的大规模应用,基于实验的估计方法被使用的越来越多,这儿主要包括两种:
突变累积实验:MA,小群体生物在实验室条件下繁育多代,通过比较初代和末代基因组序列,识别出突变位点,进而计算出突变率。该方法适合世代时间比较短,容易在实验室条件下饲养的物种。在传代的过程中,维持了较小的有效群体数量,可以降低自然选择对有害突变的选择作用,使其能够保留在群体中,但是对于那些不育和致死的突变,该方法容易遗漏,进而导致突变率的低估。
家系亲子代测序:Parent-offspring, PO. 该方法是对一个个体的双亲及其本身进行全基因组测序,识别在该次传代过程中产生的突变,并估计突变率。方法直接,适合大型哺乳动物或其他难以实验室饲养的动物,同时能够对突变进行分型,判断突变的来源是父系还是母系。不过,一个代际之间产生的突变数量一般不会很多,识别误差(假阳性或者假阴性)容易对结果造成较大影响。
此外,在研究物种之间某些性状的时候,特别是多个物种,一定要考虑到物种之间不是完全独立的,在建模和统计检验的时候一定要考虑到它们之间的相关性,比如用进化树来表示物种之间进化关系的远近。
结果
研究截止2022年,涵盖了140项相关的研究,涉及134个真核物种。其中有38%的研究集中在灵长类动物中,当然,其中人类占了大多数。此外,还包括了其他哺乳动物,鸟类,鱼类,节肢类,线虫,植物和真菌等。见下图。
【a. 在突变率相关的研究中,各类生物的占比;b. 各年相关研究发表的数量】
相关的研究数量主要集中在近10年,平均每年有11篇相关突变率的研究,其中既有突变累积实验,也有家系亲子代测序(上图)。
研究使用贝叶斯的方法,通过MCMCglmm,对上述突变率拟合了进化广义线性混合模型。模型显示单细胞的真核生物的突变率较低,只有 每碱基每世代(单位下同);而蘑菇一类的真菌的突变率最高,高达 , 二者相差了5000余倍!其他突变率如下:
线虫:
节肢动物:
鱼类:
植物: (不过各个物种差异很大)
哺乳动物:,其中灵长类 ,其中人类
鸟类:
爬行类:
特别注意一下人类的突变率,这是综合了多项研究的结果, 。很多研究使用12.0作为人类突变率,虽然比此处估计结果略低,但也在置信区间内。
【通过进化广义混合线性模型估计的各个物种的突变率大小和置信区间】
文章还比较了突变累积、家系亲子代测序两种方法对结果的影响。突变累积的实验方法一般认为容易低估突变率,但是本研究并没有发现二者对结果的影响有显著性差异。
文章探究了一些可能影响物种突变率大小的因素,比如世代间隔时间、基因组大小等。
【a. 突变率和物种世代间隔时间的关系;b. 突变率和各个物种基因组大小的关系;c. 各个物种核酸多态性水平和突变率大小的关系,虚线表示斜率为1,实线为模型估计的斜率,此处显著性小于1】
确实,世代间隔时间和突变率大小成显著性相关关系,世代间隔时间越长,突变率越大。同时,基因组的大小也显示和突变率大小有相关性,基因组越大,突变率越高。
研究还再次检验了drift-barrier hypothesis, 探究有效群体数量是否会影响突变率的大小,比如有效群体数量越大,突变率越低。但是如何衡量有效群体数量呢?此处用到了各个物种的核酸多态性,该数值是查阅文献的得到,其大小通过DNA序列得到,不依赖于模型或公式。
两边取对数
故,多态性水平高低的对数和突变率大小的对数,它们之间的斜率应该为1,即突变率的增大,多态性水平也应该相应程度的增大。如果斜率小于1,说明对于所有物种,突变率变增大,而相应的核酸多态性水平没有相应程度的增大,(根据上面1式) 说明其有效群体数量变小了,即突变率越大,有效群体数量越小。
本研究确实观测到了斜率小于1,上图(c),进而验证了drift-barrier hypothesis.
此外,文章还分析了短插入删除(indels)的突变率。相对于上文的点突变率,对indel的研究比较少,只有29个物种。同样地,单核生物的indel突变率比多核生物低,一般单核生物的indel突变率为,节肢类为,哺乳动物为,其中人类是最高的,为。
【各个物种插入删除(indel)的突变率大小】
此外,研究还发现,各个物种的点突变率和indel突变率成正相关,即一个物种的点突变率比较高,那么它的indel突变率也一般会比较高。
对于indel,一般删除的发生率比插入高,比如在人类中,删除的发生率是插入的2.6倍。不过研究并没有发现这种发生率的偏差影响到基因组的大小。毕竟相对而言,indel的发生率还是比较低的。
【a. 各个物种的点突变率和indel突变率大小的关系;b. 删除突变和插入突变在各个物种中的发小关系】
总结
对突变率的研究越来越成为一个研究热点,近期又有一些研究关注于新的物种,比如某些鱼类和海星等软体动物。虽然本文涵盖了134个物种的突变率分析,但是还是有很多物种的突变率不得而知,比如某些两栖类动物,相关的研究为零。在整个生命进化树上,还有很多空白等待我们去探索研究,我们的目标是建立一个"突变率之树"(the tree of mutations
),为整个生物的进化提供数据支持,进而帮助我们更好地了解物种进化。
---- THE END ----
资料来源:Yiguan Wang , Darren J Obbard, Experimental estimates of germline mutation rate in eukaryotes: a phylogenetic meta-analysis, Evolution Letters, Volume 7, Issue 4, August 2023, Pages 216–226,