遗传重磅!万字综述:基因组时代的物种形成研究

学术   2024-11-15 21:01   北京  

本文网络首发于《遗传》杂志

物种形成(speciation)指物种起源的演化过程,是演化生物学领域研究的核心科学问题之一。研究物种形成对理解生物多样性的起源与形成机制具有重要意义。对于物种形成的研究伴随着人类文明的发展。


从持续了近20个世纪的“神创论”、“物种不灭论”,到“拉马克学说”的提出,人们开始用唯物主义的思想去理解物种形成过程。达尔文在环球航行中,对物种形成问题展开了系统性的观察与思考,随后提出了对后世产生深远影响的“自然选择学说”(又称演化论)。


随着20世纪上半叶分类学、遗传学等生物学分支的发展,人们综合多学科的研究方法提出了“现代综合演化论”(又称新达尔文主义)。现代综合演化论将物种形成研究从性状水平带入了基因时代,明确了群体(population,又被译为种群或居群)是物种组成和形成的基本单位,指出了生殖隔离(reproductive isolation)是物种形成的必要条件


在此背景下,物种形成研究的核心问题逐渐明晰,具体包括:(1)生殖隔离是如何建立的?(2)哪些基因参与了现有近缘物种之间的生殖隔离?物种形成最初阶段驱动物种独立演化的关键生殖隔离基因(即物种形成关键基因)是什么?(3)物种的起源方式是什么?(4)用于区分近缘物种的形态性状是如何起源与固定的?它们与最初驱动物种形成的关键基因之间有何关系?

1977年,Sanger等开发的DNA测序技术正式面世,使得在序列水平探究物种形成的分子机制成为可能。研究人员开始在DNA水平对伴随物种形成产生的形态学、行为学、生理学等各类性状的关键遗传机制进行解析。然而,由于物种形成历史复杂,自然选择(natural selection)、遗传漂变(genetic drift)、趋同演化(convergent evolution)、杂交(hybridization)、不完全谱系筛选(incomplete lineage sorting)等均有可能在现存物种的遗传信息中造成大量影响,使得从中提取有效遗传变异信息、准确重塑物种形成过程十分困难。因此,物种形成研究也一直是相关领域最具挑战的前沿问题之一。

近年来,基因组学领域快速发展,测序成本不断下降,测序质量与通量大幅提升,测序数据呈现爆炸式增长,生命科学研究进入了基因组时代。本研究介绍了基因组时代物种形成问题的研究进展,重点探讨了相关研究方法及其应用范围与技术特点等,以期为相关研究人员提供参考。

物种概念与物种界定

“什么是物种”是研究物种形成的基础。生物学家开展研究之时,都不可避免根据已有的物种概念和分类学结果为其所研究的材料进行物种定名。但是,“物种”的形态学、生态学、遗传学等特征在不同类群中往往具有不同的表现模式,导致不同类群间的“物种”定义与物种界定标准存在较大的差异,也造成了众多物种概念的相继提出与使用。因此,“什么是物种”、“地球上有多少物种”等被Science杂志列进全世界最前沿的125个科学问题,迄今依然存在争论。

长久以来,在“有性生殖”为主的生物类群中,以姊妹物种(sister species)或近缘物种(closely related species)之间的“生殖隔离”作为标准的“生物学物种概念”(biological species concept)被物种形成研究领域广泛认可。但是,“生殖隔离”本质上是一种数量性状,何种程度的“生殖隔离”可以作为不同物种的界定标准,迄今尚未达成共识。

“生物学物种概念”中的“生殖隔离”常被误解为应是“完全的生殖隔离”(complete reproductive isolation)。然而,自然界中的大多数近缘种间(甚至很多近缘属间)都没有形成“完全的生殖隔离”。如果以“完全的生殖隔离”(尤其是合子后生殖隔离,详见下文)作为物种界定的标准,很多物种(甚至属)都将面临合并。事实上,无论是“生物学物种概念”最初提出之时,还是近年来众多演化生物学家对其进行的深入讨论和总结:“生殖隔离”作为“生物学物种”的主要鉴别依据,从未特指是“完全的生殖隔离”,且均指出存在“生殖隔离”的物种之间可以通过杂交产生种间杂交后代。

在物种形成的过程中,不同群体之间首先会产生一定程度的生殖隔离,使得各群体更易在群体内部交配产生后代,从而形成独立的演化谱系;进而导致等位基因在各自群体内进行谱系筛选(lineage sorting)、固定(fixation)以及新突变(de novo mutation)的积累,在群体水平上形成稳定的遗传分化;不同形态特征也将在各自群体中固定或产生新的性状,导致群体间出现形态特征差异。需要理解的是,物种形成过程是一种动态过程;现存“物种”均处于物种形成过程的某一时刻或阶段。自然界中所有的物种都在“物种分化路上”,处于物种形成的中期或后期;或正在开始新一轮的物种分化,处于物种形成的早期。

为应对实际应用过程中的复杂挑战,强调整合形态学差异、群体遗传分化、生殖隔离、生态位分化、系统发育关系(单系原则)等多类标准共同进行物种界定的整合物种概念( integrative species concept)可能是更为合理的权衡策略。需注意的是,自然界中广泛存在的种间(或群体间)杂交(含回交)后代往往会模糊群体间的差异,而整合物种概念中依据的各类物种界定标准,在群体水平存在统计学差异即可;分化群体(姊妹种或近缘种的群体)不必在全部个体间均存在差异,允许因杂交或回交等导致的无明显差异的个体存在。

因为,一个群体的绝大多数个体都在群体内进行交配、产生基因流并形成一个演化单元(unit),即为一个独立的演化谱系。在整合物种概念的实际应用过程中,无论是各类群DNA条形码(DNA barcode)序列间的固定差异,还是更为理想的数据类型——群体基因组数据揭示的群体间遗传分化,均可用于指示物种间的群体遗传差异,但是必须遵循“种间分化程度大于种内群体差异”的原则。在物种界定时,符合上述界定标准越多的物种,往往拥有越强的辨识度。

而在物种界定的实践过程中,不同物种间应至少在两方面特征(尤其是形态学特征)上存在统计学差异,才能区分为不同的物种;这种情况下的物种通常已处于物种分化的中后期。与此同时,整合物种概念同样适用于种下分类单位(如亚种、变种)的界定。正如达尔文所指出,“亚种”、“变种”等种下分类单位与“种”之间没有本质区别,现存众多类群划分为“种”、“亚种”亦或是“变种”往往是分类学家根据属内形态特征差异做出的主观判断与权衡。根据独立演化谱系作为分类等级的现代分类学标准,这些种下分类单位也需符合上述物种界定标准;只是这些演化谱系可能处于“物种分化路上”更为早期的位置,它们之间的统计学差异与同一属内其他近缘“物种”之间的差异相比可能更小,因而被界定为种下分类等级。正因如此,种下分类等级在很多属中不再使用。

对于不同的谱系,究竟何种程度的形态学和遗传学差异,可以将其界定为不同的物种呢?不同类群间不存在统一标准,更无法对其进行定义。这不仅与“物种分化阶段”密切相关,还与类群的有效群体大小、选择(自然选择或人工选择)压力程度等相关。人工选择可以视为特殊的“自然选择”,在物种驯化过程中远比自然选择具有更强的效力。

动植物的驯化群体大多作为独立的物种,与其野生祖先群体相区别。这些驯化物种由于受到人类的定向选择,且有效群体非常小,因此会在短时间内迅速积累形态、遗传和生殖隔离等差异。对于同一个驯化物种的不同品种,短时间内人类强选择导致的趋异演化(divergent evolution),可能远大于自然状况下近缘物种之间的差异。例如,不同狗(Canis lupus familiaris)品种之间的形态差异远大于犬属野生物种之间的差异;同样,较大程度的形态差异和生殖隔离也出现在亚洲栽培稻(Oryza sativa)的两个亚种——籼稻(O. sativa subsp. indica)和粳稻(O. sativa subsp. japonica)之间。籼稻与粳稻可能分别驯化自亚洲广义野生稻(O. rufipogon)同一个物种的两个分化群体,或亚洲狭义野生稻与尼瓦拉野生稻(O. nivara)两个物种;尽管存在强烈、但不完全的生殖隔离,籼稻与粳稻之间仍然存在人为介导的杂交和广泛的基因流,并通过杂交相互引入了优异等位基因。如果基于整合物种概念标准(考虑单系性、生殖隔离程度以及与同属其他物种的形态差异等),籼稻与粳稻作为两个不同的独立物种更为合理,它们将分别与野生稻和尼瓦拉野生稻组成祖先-衍生物种对。但是在物种界定时,很少详细衡量上述亚种(或品种)之间的差异程度,不再将其作为物种界定的依据。因此,上述谱系大多作为驯化物种的种下亚种(或品种)处理。物种界定实际上是近缘物种分化形成的各类差异与物种界定后使用中便捷程度之间的权衡。因此,在物种界定的实践过程中,重点要注意两方面的问题。

首先,现在很多志书采用的物种概念是模式标本物种概念:采集的材料与模式标本存在形态差异就可能被界定为不同的物种,而没有考虑群体水平上的统计学差异;这些形态特征差异可能是群体内基因型不同导致的变异。因此,志书中描述和记载的部分物种可能不是独立演化谱系,不同物种(谱系)间的杂交个体(hybrids,又称杂种)也有可能被命名为独立的物种。此外,由于基因组等遗传数据的增多,对于根据独立演化谱系定义的物种,种内可能分化出亚遗传谱系;但是,应避免在缺乏形态特征差异的情况下,将这些亚遗传谱系定名为独立的物种。若缺乏肉眼可见的形态特征差异,界定的物种难以供其他领域的研究人员或大众使用。

生殖隔离

物种(群体)之间存在生殖隔离是指:当它们同域分布(即不存在地理隔离)时,物种内通过有性繁殖、遗传重组产生的有效后代,显著多于物种间杂交产生的相应后代,导致每个物种各自形成独立演化谱系。探索生殖隔离的存在及其起源与演化过程是物种形成研究的关键。生殖隔离的种类繁多,根据其存在之时合子是否形成,可将其分为合子前隔离(prezygotic isolation)与合子后隔离(post-zygotic isolation)。生境隔离(habitat isolation)、花期隔离(flowering time isolation)、传粉者隔离(pollinator isolation)、性选择(mating choice)、配子不亲和(gamete incompatibility)等都属于合子前隔离,而合子后隔离则包括杂种不活(又称杂交衰亡,hybrid inviability/hybrid necrosis)、杂种不育(hybrid sterility)、杂种衰败(hybrid decay)等。除此之外,根据遗传机制,同样可以对生殖隔离进行分类,例如:植物的雄性不育(male sterility)可被分为细胞质雄性不育(cytoplasmic male sterility, CMS)和细胞核雄性不育(nucleic male sterility)。其中,细胞质雄性不育广泛存在于高等植物之中,往往受到细胞质基因与细胞核基因的共同控制,是研究核质互作的经典体系,也是作物人工育种过程中杂种优势利用的重要手段。

正如前文所述,现存的多数近缘种(或姊妹种)之间还没有形成完全的生殖隔离。同时,生殖隔离的程度也受物种分化时间等因素的影响存在强度差异:处于物种分化早中期的近缘种(或姊妹种)间,生殖隔离程度相对较弱;而随着独立演化时间的增长,各自积累的遗传分化位点增多,处于分化后期的近缘种(或姊妹种)间的生殖隔离则会增强。地理隔离可导致来自共同祖先的不同群体各自独立演化,受本地环境的自然选择、遗传漂变等作用形成群体间的遗传差异、形态区别和生殖隔离。但是,地理隔离并不是唯一可以导致独立演化谱系形成的因素。达尔文指出,自然选择(包括性选择)在独立演化谱系的形成过程中发挥了更为重要的作用。即使在完全地理隔离的情况下,自然选择对遗传与形态差异以及生殖隔离的作用效果,可能在某些情况下依然强于遗传漂变。然而,目前对于生殖隔离的比较研究与综合研究仍然相对较少,相关研究主要集中于:评估近缘(或姊妹)物种(或群体)之间存在哪些生殖隔离机制?其生殖隔离的总程度如何?哪些生殖隔离机制对于物种间最终的总生殖隔离强度起到了更为关键的作用?生殖隔离类型与程度为物种形成研究提供了重要的生物学/生态学先验背景,为其研究思路提供了方向指引。

野外观测与同质园实验

野外观测在生殖隔离的研究中十分重要,可以初步、直观的对自然状态下生殖隔离的类型与程度进行考察与评估。对于植物类群而言,结合其分布区域的环境因素可以对生境适应性隔离进行初步推断,而对传粉者类型、花期差异等合子前生殖隔离性状的观测同样具有重要意义。然而,环境差异可能会对植物的生长状态、花期等生理性状造成明显影响。因此,在相同环境条件下开展的同质园实验(common garden experiment)对于部分类型生殖隔离(如花期隔离、生境适应性隔离等)的准确衡量十分重要;也是排除地理隔离后,检测是否存在生殖隔离的重要手段。动物类群中的生殖隔离情况与植物类群中基本相似,现存的许多近缘种(或姊妹种)间并没有形成完全的生殖隔离,合子后生殖隔离程度也相对较弱。性选择等合子前生殖隔离在动物类群中十分重要,通过对同域(生活在一起,类似植物同质园实验)或邻域近缘种(或姊妹种)的繁殖行为等进行观察,将帮助人们深入了解它们之间的合子前生殖隔离状况。

生理实验与种间杂交实验

生理实验与种间杂交实验同样也是种间生殖隔离研究的重要手段,可以帮助人们揭示或验证近缘种(或姊妹种)间的合子前/后生殖隔离类型与程度。在植物类群中,可对相同生长条件下(如温室中,亦可视作室内同质园实验)长势相对一致的近缘物种植株进行胁迫处理(如高温、干旱、金属元素胁迫等),通过形态观测、生理指标测定,观察并评估物种间环境适应性相关的生殖隔离类型与程度;而种间人工杂交实验及对其杂交后代适合度(fitness)的研究,则是评估其合子后生殖隔离程度的重要指标之一。在动物类群中,生理实验同样可以帮助评估环境适应性相关的种间生殖隔离程度;种间杂交是否可产生与种内交配同样高比例的可繁育后代,是评价其合子后生殖隔离程度的重要指标之一。但需要特别注意的是,动物中的生理实验与行为实验等(尤其是种间杂交实验)需要严格遵循动物实验伦理原则。

生殖隔离基因与物种形成基因

随着分子生物学与基因组学等技术的发展,近年来对于生殖隔离的分子机制研究日益增多。调控生殖隔离性状形成的关键基因被称为生殖隔离基因;这些生殖隔离基因的等位变异,可导致明显的生殖隔离性状差异,或造成种间杂交后代适合度(生存率、繁育率等)的降低。目前关于生殖隔离基因的报道非常多,这里仅列举几例加以说明。例如,在果蝇属(Drosophila)中鉴定到的Odysseus合子后生殖隔离基因,该基因在果蝇属近缘物种之间发生了快速的遗传等位分化与谱系筛选,导致近缘种间杂交后代的雄性不育,是这些近缘种合子后生殖隔离(雄性不育)的主要遗传基础。在植物类群猴面花属(Mimulus)近缘物种中,YUP基因的遗传分化调控了其花色变化,导致其种间传粉者不同,从而形成合子前生殖隔离。在亚洲栽培稻的两个亚种——籼稻和粳稻之间鉴定到了众多合子后生殖隔离基因,如导致其杂交后代雌性不育的S5S7HSA1以及导致雄性不育的SaScRHS12等。必须指出的是,上述生殖隔离基因都没有导致物种之间的完全生殖隔离,如:Odysseus基因可能与其他基因共同作用,导致果蝇属近缘物种之间的杂交F1代个体雄性大多不育,但其雌性个体完全可育,不是完全的生殖隔离。这种种间杂交雄性不育、雌性可育的不完全合子后生殖隔离现象,还存在于较多其他的动物类群中,如亲缘关系较远的牦牛(Bos grunniens)和黄牛(B. taurus),正反杂交后雌性都完全可育,只有雄性不育。

猴面花属近缘物种的合子前生殖隔离与合子后生殖隔离也均不完全,在自然状态下或通过人工杂交均能产生杂交后代,但杂种衰败导致其种间杂交后代的成活率与结实率均明显低于种内杂交后代;尽管亚洲栽培稻的两个亚种之间存在较强的合子后生殖隔离,但它们之间仍然能够产生杂交后代。事实上,多数近缘物种间均能部分产生杂交后代,并建立性状分离群体;可基于数量性状基因(quantitative trait locus,QTL)及重组自交群体,通过GWAS等方式定位生殖隔离性状关键基因,并对其等位变异导致的生殖隔离进行分子机制研究。

两个近缘种(或姊妹种)之间的生殖隔离往往是由多个生殖隔离性状共同导致的,而每个生殖隔离性状也大多由多基因共同控制。关于不同物种之间的同一生殖隔离性状(如植物种间花期或杂交结实率的差异、动物中由毛色或行为差异导致的性选择以及动植物类群中的种间杂交雄性不育等)是否是由相同基因控制,迄今依然缺少比较分析或整合分析。尽管如此,依然可以推测,即便近缘种(或姊妹种)之间的同一生殖隔离性状是由相同通路上的同源基因控制的,由于这些基因间的等位遗传变异往往是由随机突变产生后、通过自然选择而留下的,因此多数情况下这些等位遗传变异的位置和突变类型并不一致。那么,在近缘种(或姊妹种)之间鉴定到的生殖隔离基因,是否即是物种形成基因呢?

事实上,生殖隔离基因的概念与范畴要明显广于物种形成基因。只有在物种形成最初阶段对于群体分化起到重要推动作用的生殖隔离基因,才是严格意义上的物种形成基因(speciation gene,又称成种基因)(图1)。一些生殖隔离基因的等位遗传分化与固定,可能是由“成种基因”在物种形成早期推动群体分化后,再通过遗传漂变、新突变和自然选择而形成的。因此,对物种分化中后期的近缘种(或姊妹种)开展生殖隔离基因研究时,由于很难追溯鉴定到的生殖隔离基因在物种分化早期是否发生了谱系筛选、遗传分化并推动了群体的进一步分化,因此对于鉴别其是否是“成种基因”难度较大;对物种分化早期(刚开始群体分化或只在部分个体之间存在生殖隔离)的材料(如出现新花色的新基因型植株或不同生态型等)进行生殖隔离基因研究时,则又无法确定这类基因与其遗传变异能否推动独立演化谱系的形成,即推动所研究的群体达到物种形成的中后期阶段,成为多个物种界定标准都认可的“好种”。物种形成早期刚刚分化的群体,如果没有新积累的遗传差异导致生殖隔离的进一步加强,很有可能在选择压力减弱或消失之后,由于生殖隔离程度较弱,初步分化群体将再次融合为一个谱系,从而无法形成分化的独立演化谱系(即“独立物种”)。因此,无论是采用姊妹或近缘“好种”,还是采用刚开始分化的群体开展研究,鉴定“成种基因”都存在较大的挑战。

图1 | 生殖隔离基因与物种形成基因示意图。


正如达尔文指出,自然选择对于新物种的形成具有关键性作用。因而,对于大多数类群,合子前生殖隔离基因可能才是更为重要的物种形成基因。因为合子前生殖隔离基因控制的性状(如环境适应性、交配行为等),即使在完全异域分布(地理隔离)的情况下,也会首先受到自然选择,导致其等位变异率先实现谱系筛选和群体分化。根据BDMI模型(Bateson-Dobzhansky-Muller incompatibilities),合子后生殖隔离基因需要两个及以上基因位点的等位分化,可导致合子不育、生存率下降以及繁殖率降低等合子后生殖隔离现象。这些位点的等位分化可能是由于完全异域分布(地理隔离)条件下,遗传物质随机漂变(random drift)后在群体间固定的产物,但更可能是来自合子前生殖隔离相关性状或等位变异的选择性分化产物。当然,合子前生殖隔离相关的同一位点或多个基因的等位分化,也可同时导致合子后生殖隔离,如猴面花属的一个物种在适应铜污染环境时,受到选择的适应性等位基因,也同时导致其群体间杂交结实率显著降低。因此,合子后生殖隔离基因的等位分化或固定,完全可以不需要地理隔离,可直接由同域或邻域群体各自的自然选择导致。此外,在现有近缘种(或姊妹种)之间,合子前生殖隔离对总生殖隔离的贡献要远高于合子后生殖隔离,因为若后代无法存活或交配,合子发育就不能发生。所以,合子前生殖隔离基因及其等位变异,在物种形成初期可能发挥了更为重要的作用,不仅有助于合子后生殖隔离的形成,也符合达尔文新物种形成的自然选择学说。

二歧式物种分化

由一个祖先物种分化为两个物种的二歧式物种形成(bifurcating speciation)可能是自然界中较为常见(或目前已知物种中较为常见)的物种形成方式之一。祖先类群的不断分化(表现为二叉状的物种分化树)被认为是地球上丰富的物种多样性的主要来源。目前对于二歧式物种形成的研究多为对其物种多样化历史和地理分布格局的探索,较少关注其物种分化关键性状的遗传分化以及生殖隔离基因的形成机制,尤其是对物种形成早期发挥关键作用的“物种形成基因”的研究较少。相关研究进展在前文(见“生殖隔离”部分)已有介绍。因此,本节将重点介绍二歧式物种分化(或多样化)历史方面的研究方法。

系统发育分析

系统发育分析(phylogenetic analysis)是二歧式物种多样化研究中的常用方法之一,主要用于对物种多样化历史与地理分布隔离的检测,可利用性状数据或分子数据,基于系统发育树的拓扑结构、枝长、支持度等信息推断物种之间的二叉状演化关系。常用的分子数据包括:单基因、全基因组(核基因组)、质体基因组等序列的单碱基变异位点(single nucleotide polymorphisms,SNP)或插入缺失(insertion/deletion,InDel)。常用的系统发育分析算法包括最大似然法(maximum likelihood,ML)、邻接法(neighbor joining,NJ)和贝叶斯法(Bayesian inference,BI)等。

最大似然法的应用范围较为广泛,但基于全基因组数据的系统发育分析往往数据量较大,其计算速度相对较慢的特点因此被放大。随着近年来分析算法的优化,这一问题正逐渐被克服。

邻接法的计算速度相对较快,但易出现长枝吸引现象(long branch attraction,LBA),从而影响分析结果,导致不相似的序列聚为一支。

邻接法与最大似然法的准确性可通过自举法(bootstrap)进行检验,而贝叶斯法则是基于后验概率(posterior probability)对其进行评估。在相当长的一段时间内,构建物种树往往采用将不同基因(或序列片段)首尾相接构成矩阵的串联法(concatenate method)。然而由于不同基因(或序列片段)的演化速率、演化历史等可能存在差异,在同一数据矩阵中可能会相互干扰,影响结果的准确性。

近年来,在基于全基因组数据的系统发育分析中,数据量的大幅增加导致计算成本的明显提升,溯祖法(coalescent method)的出现很好的解决了这一问题。溯祖法基于溯祖理论对所有基因树进行整合并推断物种树,可以很好的克服基因间差异化的演化历史导致的系统发育冲突。

迄今为止,大量可用于(或可辅助进行)系统发育分析的软件先后被开发,值得一提的是中国学者在相关领域做出了巨大的贡献。例如,陈程杰等开发的TBtools软件、张东等开发的PhyloSuite软件、余光创等开发的ggtree等R包和余岩等开发的Easy353软件等,因其便捷、用户友好的使用方式以及强大的功能被广泛使用并备受好评。使用上述方法或软件,既可以利用直接鉴定的直系同源基因数据,也可以基于参考基因组,利用基因组重测学数据提取同源基因的位点变异信息进行系统发育分析。

在基于分子数据的系统发育分析中,多种因素可能会对分析结果产生影响。首先,碱基替换模型(base substitution model)的选择十分重要,在构建系统发育树时可基于序列进行最优模型的选择。然而,随着序列长度的增加,有效信息位点逐渐增多,碱基替换模型对系统发育分析结果的影响也将逐渐降低。

此外,外类群(outgroup)的选择在系统发育分析中也至关重要。若外类群与内类群(ingroup)的亲缘关系较远,遗传差异的增大将使得可用于系统发育分析的位点数量大大降低,从而影响结果的准确性;反之,若外类群与内类群的亲缘关系过近,则易受到杂交、渐渗(introgression)、不完全谱系筛选等影响,导致系统发育分析结果出现偏差。通过对动物、植物、真菌等不同类群公共数据的研究发现,前期开展的系统发育分析中约9%~18%的结果无法得以重现。因此,为提升系统发育分析的准确性,可对同一数据集采用不同的方法进行交叉验证。

谱系支分歧时间

分歧时间(divergence time)评估对物种形成研究具有重要意义,利用不同类群之间的核苷酸歧义度(  )、碱基同义替换率(  )、四重简并位点颠换率(4 fold degenerate transversion,4DTv)等遗传学参数均可对其进行计算。分歧时间评估的常用软件包括BEAST2PAMLr8s等。以上方法或软件大多基于被广泛应用的分子钟(molecular clock)模型。

基于分子钟模型,DNA或蛋白质序列的演化速度在近缘类群中被视为近似恒定,遗传距离(位点差异水平)与分歧时间因此一定程度上呈线性关系,结合时间校准信息(calibration point)可对不同类群的分歧时间进行评估。常用的时间校准信息包括化石记录、碱基替换速率以及基于前期研究结果的二次校准信息等。然而,不同类群之间或不同基因组区域之间演化速率的差异性和化石记录的准确性等因素往往会对分歧时间的评估造成影响。

因此,在相关计算中对于化石记录以及不同序列信息(如核基因组序列与质体基因组序列、全基因组序列与部分基因序列、4DTv或基因间区等中性位点区域与其他基因组区域)的合理选择至关重要。分歧时间评估可应用于不同的分类单元或谱系支之间(如不同的目、科、属、种等),分析过程中样本的选择同样十分重要。物种内部可能存在复杂的群体遗传结构(population genetic structure),在没有对独立演化谱系全面取样(多群体、多个体取样),尤其是取样到杂交渗入个体时,可能会导致谱系支之间的分歧时间评估存在较大误差;而对一个属或科进行分歧时间评估时,对其所含种或属取样不完全也会造成较大影响。因此,一个物种或谱系支内全面的取样往往有利于获取更加准确的分歧时间评估结果。

群体遗传结构分析

基因组群体遗传结构分析是物种形成研究中的常用方法之一,旨在通过群体遗传学数据初步揭示群体内部和群体之间的亲缘关系、祖源成分、亚群分化等群体遗传结构特征。常用的群体遗传结构分析包括三类:(1)群体水平的系统发育分析,可以初步、直观的揭示研究类群不同个体间的亲缘关系;(2)主成分分析(principal component analysis,PCA),通过数据降维的方法推断群体内的群体分层与离群样本;(3)祖源成分分析(structure分析或admixture分析),基于基因型数据推断群体的内部遗传结构以及每个个体的遗传组成来源,祖源成分的混合往往可作为杂交、渐渗、不完全谱系筛选等演化事件的重要指征。此外,祖源成分分析可对群体的最优祖源亚群数目(K值)进行评估,所得结果可作为群体遗传学分析的参考,但并不代表自然界中真实的群体最优分层方式。对于群体遗传结构分析,群体样品的选择十分重要。研究表明,祖源成分分析受样品影响较大,当不同类群的样本数量差距较大或所用样本的遗传组成无法全面表征研究类群(如样品选择不充分或群体间遗传分化过大导致过滤后得到的数据无法全面表征群体间的真实差异)时,均可能会对结果造成影响。必须指出,目前的祖源成分分析方法,对于经历过奠基者效应(founder effect),尤其是因驯化等过程导致群体扩张的研究群体,揭示的杂交或群体分化等结果在很多情况下可能存在严重的误导性,应结合其他方法进行验证、讨论和深入评估。

群体遗传学参数计算

群体遗传学参数用来表征类群的群体遗传学特征。常见的群体遗传学参数包括衡量群体间分化水平的固定系数(fixation index,  )、衡量群体间遗传多样性绝对差异程度的核苷酸歧义度(  )、衡量群体遗传多样性的核苷酸多样性(  ,或写作Pi)、检验中性演化的统计量(Tajima's D)、有效群体大小(effective population size,  )、连锁不平衡程度(linkage disequilibrium,LD)、群体杂合度(heterozygosity)、近交系数(inbreeding coefficient,F)、群体重组率(  )、等位基因频率(allele frequency)和基因型频率(genotype frequency)等。可用于群体遗传学参数计算的软件或程序众多,如PopGenome、VCFtools、PIXY、ANGSD、PyPop和FastEPRR等。在以往研究中被广泛使用的VCFtools由于仅基于SNP位点进行计算,可能导致    等参数的错误估算;而PIXY(基于所有位点信息进行计算)与ANGSD(基于基因型频率进行计算)则能更好的反映真实情况。

群体动态历史模拟

群体动态历史(population demographic history)可帮助人们深入理解所研究类群的物种分化历史。目前较为常用的推断群体动态历史的方法主要分为3类:
(1)基于串联马尔可夫溯祖法(sequentially Markovian coalescent,SMC),利用基因组中的纯合与杂合位点信息对有效群体大小(  )随时间变化的过程进行推断,较为熟知的软件包括PSMC(Pairwise Sequentially Markovian Coalescent)以及在其基础上改良的MSMC(Multiple Sequentially Markovian Coalescent)和SMC++等。PSMC可对2万年前至300万年前范围内的群体大小进行有效推断,对超出此区间的过于近期或过于古老的时间范围内的推断准确性将大幅降低;而SMC++对于近期时间范围内的推断准确度则较高。
(2)基于近似贝叶斯算法(approximate Bayesian computation,ABC),其代表性软件包括较为熟知的DIY-ABC,可基SSR标记、Sanger测序序列、细胞器序列等多种数据类型,对复杂的演化模型进行模拟,对分歧时间、分化或杂交事件、基因流、有效群体大小等群体动态历史参数进行评估,通过对不同模型的比较确定最优模型,并确定各群体动态历史参数的最优值和置信区间。为了适应基因组时代数据通量的增长,最新版本的DIY-ABC2通过算法改良提高了模拟效率,可以较好的支持全基因组SNP这一数据类型。
(3)基于位点频谱(site frequency spectrum,SFS),利用SNP位点的频率分布特征对群体动态历史进行推测。考虑到不同个体/群体间的遗传差异,为获得较为准确的SNP频谱,每个类群所用的个体数量不易过少,能够客观、全面的表征该类群的遗传组成为最优。其常用软件包括fastsimcoal2和δaδi等,均可对复杂的演化模型(及其群体动态历史参数)进行模拟、比较与评估。需要注意的是,目前用于群体动态历史推断的软件大多都仅支持可自由杂交的二倍体类群的数据,支持多倍体类群数据的软件较少;而对于高度自交的类群(如拟南芥、小麦等),可基于不同个体的基因组数据人工创制模拟杂合数据(pseudo-diploid genotypes)开展相关分析。除上述3类方法外,基于贝叶斯方法的G-PhoCS和BPP等软件同样在群体动态历史模拟中被广泛使用。以上各类算法各有优劣,应结合研究背景综合考虑或交叉验证。

基因组分化

基因组分化是物种形成研究的重要问题之一。物种形成早中期,生殖隔离关键基因等位变异的谱系分选和固定会导致不同群体间生殖隔离机制的最初建立,从而一定程度上对基因流产生阻碍,促进物种形成和维持每个群体的相对独立演化。随后,在连锁遗传(linkage inheritance)、搭载效应(hitchhiking effect)、自然选择等众多因素的共同影响下,基因组分化区域的大小、所包含分化基因的数量、基因组分化的程度等均逐渐增大,类群间的表型等差异会逐渐增大,生殖隔离程度也会逐渐增强。是衡量群体水平基因组分化程度较为经典且重要的指标用于表征群体间基因频率的差异,而则指示群体间每个位点上平均核苷酸差异的程度,两者的范围均为0~1,数值越大表明群体间分化程度越高。然而,的趋势可能不同,受类群内变异水平的影响较大, 而则受其影响较小。当类群内的变异水平较低时,同样可能较高,而则可能较低;反之, 较低时,也有较高的可能。因此,基因组分化特征要结合多种参数综合判断。
基因组的整体分化水平可以作为判断群体间遗传结构的重要参考,不同基因组区域之间分化水平的比较分析在物种形成研究不可或缺。基因组高度分化区域(含高度分化位点、高度分化基因或正选择基因、基因组岛等)往往作为类群间产生分化的功能性状相关的候选区域,常常受到自然选择类型之一的正选择(positive selection)作用在物种形成过程中扮演重要角色。最初,对于高度分化基因(或/与正选择基因)的鉴定往往基于    、Pi和Tajima's D等群体遗传学参数。随着研究的深入,基于中性理论(neutral theory)的众多方法,如利用SNP的HKA检验(Hudson-Kreitman-Aguadétest)、MK检验(McDonald-Kreitman test)以及利用基因型(genotype)频率的XP-CLR等;基于连锁不平衡理论和基因单倍型(haplotype)的EHH、iHS和XP-EHH等方法相继涌现并表现良好。负选择(negative selection,又称纯化选择)作为自然选择的另一形式,通过对有害突变(deleterious mutation)的清除而维持基因组的保守性,可导致较低的基因组分化水平。基于等位基因频率的Tajima's D以及基于基因组杂合度的ROH等群体遗传学参数可对其进行检验。在选择分析中,单一方法往往具有较高的假阴性(false negative)或假阳性(false positive)错误,多种方法的联合使用常被作为重要的交叉检验手段。特别需要指出的是,群体遗传事件(如奠基者效应等)也会严重影响基因组高分化区域或基因组岛的鉴定。
然而,这些高分化基因能否直接影响生殖隔离,甚至导致关键生殖隔离性状的演化?揭示上述问题不仅需要生化实验和转基因实验等基因功能验证,更应与前文所述的生殖隔离基因鉴定手段相结合。比如,可利用种间不完全生殖隔离建立的性状分离群体,定位相关生殖隔离性状关键基因,与基因组分化研究中获得的高分化基因进行相互验证;也可同时对等位变异进行基因编辑,对其导致的生殖隔离性状进行检测。只有通过多方面的相互验证,才能将群体分化历史与生殖隔离基因的演化有机联系起来。而如何从二歧式物种分化相关的生殖隔离基因中进一步对物种形成基因进行鉴定,则需要进行更多的方法学探索。

杂交物种形成

人们一度认为自然界中只有“二歧式”的物种分化,随着20世纪30年代染色体技术的兴起,才逐渐认识到多倍体物种(polyploid species)的存在,并发现部分多倍体物种的多套染色体可能分别来自不同的祖先物种;自此,通过杂交多倍化(hybrid polyploidization)形成新物种也被认为是物种形成的重要方式之一,该物种形成方式又称异源多倍化(allopolyploidization),在植物中较为普遍。基因组数据显示,很多谱系(如科、目等)都发生过古多倍化事件,尽管鉴别其为同源多倍化还是异源多倍化仍较为困难。近年来,随着分子生物学等技术的广泛应用,研究人员发现两个物种杂交(hybridization)发生谱系融合,不仅可以通过异源多倍化产生新物种,也可以在染色体不加倍的情况 下,通过同倍体杂交物种形成(homoploid hybrid speciation,HHS)的方式产生新物种。这两类杂交物种形成方式都可以导致更快的遗传演化速度和更大的性状变异(或重组),对表型多样化与物种多样化具有更为重要的意义。

种间杂交、渐渗和同倍体杂交物种形成的区别与联系

杂交既可以发生于同一独立演化谱系内的不同个体之间(即种内杂交),也可以发生于不完全生殖隔离的不同独立演化谱系(物种)之间(即种间杂交);既可以在自然状态下发生,也可以由人工操作或人类活动导致,如通过人工杂交、引种或人工养殖等方式打破地理或生态隔离。

种内杂交是自然界中维持一个谱系的独立演化、遗传一致性及其与近缘谱系之间差异的重要方式。种内不同基因型或分化群体之间的杂交,可以导致不同遗传信息的重新组合,从而产生新的基因型、表型以及杂种优势。在自然界中,与种内杂交相比,种间杂交可以看作是两个分化程度更高群体(谱系)之间的杂交,其与种内杂交的主要区别是:(1)杂交机会更少(由于生态位、花期、性选择等合子前生殖隔离以及可能存在的地理隔离等影响);(2)杂交结实率或产仔率锐减;(3)F1代成活率低,且F1代之间杂交产生后代的概率进一步降低。
其中,(1)属于合子前生殖隔离;而(2)和(3)两方面都属于合子后生殖隔离。自然界种间杂交产生的F1代杂交个体,常常与拥有更多个体的亲本同域分布,从而有更多与亲本回交的机会;它们的回交后代之间由于遗传差异和生殖隔离程度降低,可以更快恢复育性,使得产生回交后代的机会增大,也将进一步减少种间杂交后代之间交配、产生后代和发展为独立演化谱系(物种)的机会。若这种F1代杂交个体与亲本种之一发生多轮回交(backcross),就会导致渐渗,这也是远缘种间杂交育种的主要方式。渐渗群体有可能长期存在,也可能在反复回交的过程中与亲本种逐步融合,最终湮灭。杂交个体(如F1-FN、BC1-BCN以及BC1-D1-BC1-DN等)也被称为“杂种”。若具有相似基因组组成的同一代(如F1、BC1或BC2等)个体间相互交配、恢复育性并继续产生后代,形成一个可自我繁殖并与亲本物种同时存在生殖隔离(非完全)的独立演化谱系,就会导致广义的同倍体杂交物种形成。
这类广义同倍体杂交物种(homoploid hybrid species)的大部分群体和个体,包含具有相似比例的来自两个亲本物种的基因组混合(genomic admixture)(图2);但对于不同的杂交物种,来自两个亲本的混合比例可能并不相同。例如,由F1代杂交个体相互杂交、恢复育性、形成独立演化谱系的同倍体杂交物种,其来自两个亲本物种的基因组比例应维持在50%:50%左右(由于基因丢失以及亲本物种间部分基因组区域缺乏等位差异等情况无法估算,该比例并不严格);从回交一代群体(BC1)演化而来的同倍体杂交物种,则维持在75%:25%左右;而由回交多代群体(如BC3、BC4、BC5等)演化而来的同倍体杂交物种,两个亲本物种贡献的基因组比例差异则会越来越大。自然界的同倍体杂交物种中,来自两个亲本谱系遗传组成成分比例为50%:50%的情况实际上较少,大多并不均衡,甚至极为悬殊。例如,袖蝶属(Heliconius)的同倍体杂交物种H. elevatus中,来自两个亲本种的遗传组成成分比例分别为99.3%(H. pardalinus)和0.7%(H. melpomene)。此外,不完全谱系筛选同样可能会造成遗传组成成分在不同物种中的非均匀分布,给渐渗的界定以及同倍体杂交物种形成研究带来挑战。需要注意的是,对于严格(或狭义)的同倍体杂交物种,还要证明杂交导致了该独立演化谱系与两个亲本谱系的生殖隔离;除此(严格的同倍体杂交物种)之外的具有基因组杂交混合的独立演化谱系(物种、属或科等),通常被一些研究归入广义的杂交渐渗(hybridization introgression)。实际上,这些经历杂交渐渗的独立演化谱系,多数情况下可能是同倍体杂交物种形成的产物,而种间杂交是否导致了其杂交后代与两个亲本物种产生生殖隔离仍有待进一步证明。
图2 | 同倍体杂交物种形成示意图。

从过程上看,杂种是同倍体杂交物种起源过程中的“中间过渡状态”,但是很多类群在进行分类和命名时,由于演化历史并不清晰,经常导致二者的混淆。把“杂种”命名为一个独立物种(独立演化谱系)的情况较为常见。例如:麻核桃(Juglans hopeiensis)目前被界定为一个独立物种,实际上其所有现存的自然个体均为种间杂交产生的F1代杂种,由于遗传分化较大形成了合子后生殖隔离与生殖衰败,导致这些F1代个体(即麻核桃)胚胎、花粉的败育率极高,几乎不能通过有性生殖产生后代,无法形成能自我繁殖的独立演化谱系。因此,这些F1代个体是典型的杂种,应将其命名为“Juglans × hopeiensis”。与此同时,也存在另外一类相反的情况,可能将杂交物种命名为“杂种”。
例如:世界各大学广泛栽培的法国梧桐(Platanus × acerifolia,又名二球悬铃木)是自然分布于美洲的一球悬铃木(P. occidentalis)和欧洲东南部的三球悬铃木(P. occidentalis)杂交产生的后代。两个亲本物种被植物学家于19世纪引进到英国的植物园,随后产生杂交后代,这些杂种在多年的栽培之后逐渐克服了杂交衰败,完全恢复了正常结实,且已经通过有性生殖独自繁衍了多代,形成了一个独立演化的谱系。因此,法国梧桐实际上应作为杂交物种,应命名为“Platanus acerifolia”。
杂种与杂交物种有明显区别,应在分类和命名时加以区分,以便理解其演化地位。杂种处于种间杂交发生的早期,存在生殖衰败;杂种包括回交一代(BC1)、回交二代(BC2)等群体,可以是不同杂交或回交后代的混合群体,也可以是单一纯合的F1代群体(如前文所述的麻核桃)。在自然界中,作为独立演化谱系的两个近缘物种和它们杂交产生的杂种,可能同时存在;而在研究材料采集和标本鉴定时,很少对其进行区分,可能导致前文指出的两种情况:把杂种定名为独立物种或把杂种鉴定为其中的一个亲本物种。无论是上述何种情况,都会影响研究对象的准确界定,可能会导致演化、系统发育和物种形成等相关研究结果出现差错。若将被错误界定的研究材料作为单一研究对象,开展基因组、生理或生态学等研究,并不影响其研究结果和结论;但该类研究很少保留凭证标本(voucher specimens),给后续相关研究材料名称的更正造成了困难。而杂交物种的形态学与演化地位均具有非常显著的特征:杂交物种的后代具有相同的遗传组成,通过相互交配的有性生殖方式演化了多代,且已经克服了生殖衰败,恢复了正常结实,是包含多个个体和群体的独立演化谱系;杂交物种与两个亲本物种存在稳定的形态学特征与生殖隔离,通常还存在地理分布、生态位等差异。
此外,种内(或狭义)的渐渗,亦可视为同倍体杂交物种形成过程中的“中间过渡状态”。在遗传表征上看,同倍体杂交物种的全部群体或个体中具有稳定的杂交组成成分,而渐渗群体中的杂交组成成分在不同个体中存在差异(图2)。受限于传统分类学等方法的局限性,在实践过程中同倍体杂交物种常与渐渗群体相混淆。研究发现,岷江柏木(Cupressus chengiana)的岷江谱系同倍体杂交起源于其白龙江谱系与大渡河谱系,两个亲本谱系对其杂交组成成分的贡献分别为62%(白龙江谱系)和38%(大渡河谱系);3个谱系之间存在明显的地理隔离与一定的形态学差异,是3个独立演化谱系,且杂交起源谱系的全部个体具有稳定的杂交组成成分。目前,岷江柏木的3个谱系已被广泛认为是3个独立物种,其杂交起源的谱系可认为是广义的同倍体杂交物种。若要将其鉴定为严格(狭义)的同倍体杂交物种,还需要证明杂交是否直接导致了该物种与两个亲本物种的生殖隔离。
对青藏高原代表性物种猎隼(Falco cherrug)的研究发现,其不同区域的群体之间具有明显的遗传分化,可分为西部谱系(包括来自摩尔多瓦、斯洛伐克和克里米亚等地的群体)和东部谱系(青藏高原群体等)2支(亦可视为2个亚种);东部谱系的全部个体具有稳定的杂交组成成分,其杂交组成成分大部分来自于猎隼的近缘物种——分布在北极及其附近地区的矛隼(F. rusticolus),小部分(超过20%)来自于猎隼的典型西部谱系。演化历史分析与群体遗传学分析结果表明,矛隼在末次盛冰期自北向南的迁移过程中与猎隼西部谱系在西伯利亚南部发生了杂交,其杂交后代在约1万年前从蒙古拓殖至青藏高原地区,快速适应了青藏高原地区的环境并发生了快速的适应性演化,形成了独立的演化谱系(即猎隼青藏高原谱系,下文称高原猎隼)。在此过程中,高原猎隼继承了来自矛隼的SCMH1SCARB1等位基因,使其继承了北极矛隼较大的体型和较强的低温适应能力,从而可以适应青藏高原地区的低温环境,与猎隼西部谱系可能形成了性选择(体型差异)和环境适应性相关的合子前生殖隔离;而高原猎隼的遗传组成成分大部分来自猎隼西部谱系,使得其形态特征相关的更多等位基因同样来自猎隼西部谱系,导致其(除体型大小外)形态特征与猎隼西部群体更加相似,可能造成与矛隼间的合子前生殖隔离(形态性状差异的性选择),较大的遗传差异同样可能导致其与矛隼间存在一定程度的合子后生殖隔离;以上因素导致高原猎隼更多在群体内进行交配,从而形成独立演化谱系。因此,即便参照严格(狭义)的同倍体杂交物种形成标准,高原猎隼也可能是猎隼西部谱系与矛隼杂交产生的典型同倍体杂交物种(图3)。
图3 | 青藏高原猎隼同倍体杂交物种形成示意图。

同倍体杂交物种形成研究方法

严格的同倍体杂交物种形成,需要满足3个标准。由于这3个标准过于严苛,完全证实为同倍体杂交物种的研究案例相对较少。随着近年来组学技术的快速发展,相关研究逐渐成为演化生物学领域的研究热点。对同倍体杂交物种的证实,应紧密围绕3个标准来开展,并对杂交物种形成关键基因进行鉴定,对其等位基因的功能分化及其导致生殖隔离的分子机制进行验证。

标准一:“ 杂交物种与亲本种间存在生殖隔离”

正如前文所述,除稳定的形态学差异外,生殖隔离的建立是界定一个独立演化谱系(物种)的重要标准之一。事实上,同倍体杂交物种形成研究往往需要首先检验所研究的3个谱系(杂交谱系与两个亲本谱系)是否均为独立演化的谱系(物种)。一个独立的演化谱系应与两个亲本谱系有一定程度的生殖隔离,且具有与两个亲本谱系存在显著区别的独立的遗传组成。因此,首先需要检测3个谱系是否都具备独立的群体遗传结构:在系统发育关系上各为单系;在主成分分析(PCA分析)中各自聚为一类;在祖源成分分析中各自拥有明确的群体遗传结构。但需要注意的是,由于同倍体杂交物种具有复杂的演化历史,Admixture分析并无理论上最优的祖源亚群数目(K值),多数情况只需考虑K=3时3个类群的群体遗传结构是否清晰即可;若同倍体杂交物种形成发生的时间较为古老,类群的群体遗传结构内部可能产生亚结构,当K>3时也许才能将3个类群相互区分。虽然群体遗传学分析结果可以作为间接的生殖隔离证据,但直接对生殖隔离机制的检测显得具有更为重要的意义。生殖隔离的种类繁多,可以结合文献调研、野外考察、同质园实验、生理实验等方法对所研究类群之间的生境适应性、合子后生殖隔离、花期、传粉者、性选择等诸多生殖隔离形式进行全面研究。
在桦木科虎榛子属(Ostryopsis)的相关研究中,研究人员对虎榛子(O. davidiana)、居中虎榛子(O. intermedia)和滇虎榛子(O. nobilis)3个物种进行了形态学特征统计、分布区域调查、群体遗传结构分析,证实了其稳定的形态学、生态位差异以及相对独立的群体遗传结构;通过同质园实验(移栽存活率观测、花期观测、人工杂交实验)与生理实验等,揭示了虎榛子属3个物种间强烈但不完全的生境(铁元素)适应性、花期以及合子后生殖隔离(种间杂交结实率显著低于种内)。基于上述结果,证实了虎榛子、居中虎榛子和滇虎榛子是处于分化后期的3个好种(good species),在其物种形成过程中,合子前生殖隔离对其种间总生殖隔离具有更多贡献。这是迄今为止对于非模式杂交物种相对较为全面的生殖隔离研究。

标准二:“ 同倍体杂交物种群体间存在稳定的亲本遗传混合信号”

杂交起源分析是研究同倍体杂交物种形成的重要内容,其基本原则是检验杂交谱系的全部群体是否都具有稳定(相对一致)的来自两个亲本谱系的杂交贡献。
系统发育分析
系统发育分析是同倍体杂交物种形成研究最基础且最有效的方法之一。核基因组(双亲遗传)和质体基因组(单亲遗传的叶绿体基因组与线粒体基因组)不同的遗传方式可能会(但不一定)导致相关类群之间出现核质系统发育冲突(nuclear-plastome conflict),表现为杂交谱系的核基因组与亲本谱系之一具有更近的亲缘关系,而其质体基因组则与另一亲本类群亲缘关系较近。核质系统发育冲突是同倍体杂交起源的重要遗传信号,根据不同类型遗传信息的遗传模式可以对杂交起源历史中的父本或母本类群进行推断。然而,核质系统发育冲突并非同倍体杂交起源的必备表征。此外,同倍体杂交物种的每个个体通常都具有“马赛克”式的基因组特征,且一致性强;来自不同亲本谱系的遗传信息在其基因组上交替分布,使得基因组不同区域之间同样存在系统发育冲突。若不考虑不完全谱系筛选等因素的影响,全基因组不同区域之间将呈现两种主要的系统发育拓扑结构,即杂交谱系分别与亲本谱系之一聚为一支(Topology I和Topology II);而受到不完全谱系筛选或谱系特异性演化的影响,部分基因组区域中两个亲本谱系之间的亲缘关系可能更近(Topology III)(图4)。
理想状态下的同倍体杂交物种形成中,Topology I和Topology II在基因组中的比例应较为接近,且明显高于Topology III。然而,杂交谱系的部分个体也可能由于不完全的生殖隔离,与亲本再次发生回交、渐渗等,从而使得杂交谱系部分个体中Topology I和Topology II的比例出现变化。若Topology I和Topology II均占据较大比例,且结合模拟分析(如利用DendroPy、QuIBL等软件)可排除不完全谱系筛选在演化过程中的主导作用,则可初步对同倍体杂交起源事件进行确认。研究人员利用同源基因数据集对禾本科竹亚科(Bambusoideae)的11种代表性物种进行了系统发育分析,基于其主要拓扑结构,揭示了竹亚科物种的不同亚基因组之间的网状演化关系,发现其B和C亚基因组祖先之间的杂交事件可能导致了A和D亚基因组共同祖先的起源,而其H与A亚基因组之间同样存在杂交事件。在剑尾鱼属(Xiphophorus)的系统发育基因组学研究中,研究人员发现其线粒体基因组系统发育树与核基因组系统发育树存在冲突,揭示了其属内潜在的种间杂交起源事件。此外,考虑到个体水平系统发育分析的不稳定性,群体水平系统发育分析的结果往往更加令人信服。基于ITS序列和叶绿体DNA序列揭示的群体水平核质系统发育冲突表明,江孜沙棘(Hippophae gyantsensis)可能同倍体杂交起源于云南沙棘(H. rhamnoides ssp. yunnanensis)和肋果沙棘(H. neurocarpa)。
图4 | 同倍体杂交物种形成中3种主要的系统发育拓扑结构示意图。

Admixture分析
Admixture分析是群体水平上检测相对稳定的杂交信号的重要方法。当K=2时,若两个亲本谱系拥有独立的群体遗传结构,而杂交谱系则显示出稳定的(全部个体中比例相近的)祖源成分混合,则可作为其杂交起源的重要群体遗传学证据。若亲本谱系内部存在群体亚结构,可能在K>3时才能检测到稳定的祖源成分混合现象,此时同倍体杂交谱系的亲本谱系可能为亲本谱系的部分群体。杂交谱系中不同祖源成分的比例并不固定。若F1代个体间发生相互交配形成一个独立演化谱系,可能导致不同祖源成分的比例各占50%,这种情况相对较少。而当两个亲本谱系分化时间较长,积累的遗传差异和生殖隔离程度较大时,生殖衰败将导致其产生后代的机率降低,造成F1代个体数量过少的情况,从而很难形成一个能相互交配的群体。然而,回交可以降低生殖隔离和生殖衰败的程度,因此回交一代(BC1)或回交多代(如BC2-BCN等)后的个体存在相互杂交后产生独立演化谱系的可能,在此情况下两个亲本谱系对杂交谱系的遗传贡献可能十分不均衡。当同倍体杂交物种形成发生的历史时间相对较近时,杂交谱系易检测出稳定的杂交信号。
若同倍体杂交物种形成发生的时间相对古老,或相关谱系突变速率较快时,杂交谱系与亲本谱系可能在完成同倍体杂交物种形成后,各自积累大量特异的遗传变异,导致杂交信号在Admixture分析中被湮没;若某一亲本谱系的祖源成分占比较低,也可能导致类似现象。研究发现,同倍体杂交物种黔金丝猴(Rhinopithecus brelichi)群体显示出稳定的来自两个亲本谱系的祖源成分混合,其比例分别为69%和31%;而在居中虎榛子和桦木科鹅耳枥属千金榆组(Carpinus sect. Distegocarpus)等杂交谱系的Admixture分析中,则均无法检测出祖源成分混合现象。研究表明,Admixture分析对于数据异常灵敏、不同群体间取样数量不均或取样完整性欠缺均有可能影响结果。因此,对同倍体杂交谱系和亲本谱系进行相对全面的取样工作,选取相对接近的群体和个体数量,将有助于Admixture分析的准确性。特别需要注意的是,Admixture分析揭示的祖源成分混合现象可提示杂交事件的潜在可能,但不完全谱系筛选等演化事件同样可能导致相似现象,故仅依赖Admixture分析无法对杂交事件进行证实。然而,Admixture分析依然是同倍体杂交物种形成研究的重要方法,分析结果对于杂交事件的提示可为后续研究指引方向。
基因流检验
基因流(gene flow)指遗传物质在不同类群或个体之间的转移。杂交事件会导致基因流的发生,同倍体杂交谱系与亲本谱系之间均有基因流的存在。因此,基因流检验是HHS分析的重要内容。IBD(identity by descent)分析是一种常见的共享单倍型分析方法,可以对来自共同祖先、遗传信息相同、未经历过重组的DNA片段进行鉴定与分析。系统发育分析、Admixture分析以及共享单倍型分析等,均可提示不同谱系间存在基因流的可能,但无法在基因流与不完全谱系筛选造成的相似现象间进行鉴别。常见的3类基因流检验方法包括D检验(又称ABBA-BABA检验)、TreeMix分析和PhyloNet分析,这些方法均可在考量不完全谱系筛选影响的情况下进行基因流的检测。D检验是较早被开发出来的基于位点统计(site pattern)的检验方法,可利用杂交谱系、两个亲本谱系、外类群共4个谱系的遗传信息,对杂交谱系与亲本谱系之间的基因流进行统计学检验。
在HHS分析中D检验存在3个方面的局限:(1)无法对基因流的强弱进行定量;(2)无法判断基因流的方向;(3)基于阳性结果可以证实基因流的存在,但阴性结果不能说明类群间不存在基因流。以D检验为基础开发的一系列方法对此做出了改进,  检验(  和  等)可一定程度反应基因流的强弱,而DFOIL检验则通过考虑更多(5个)谱系的遗传信息实现了基因流方向的检验。TreeMix分析可基于等位基因频率进行最大似然树(ML树)构建,在对分化与杂交事件推断的同时进行基因流方向与强度的评估。而PhyloNet分析则依赖基因系统发育信息,通过模型计算对基因流进行推断。TreeMix分析与PhyloNet分析的结果均可通过系统发育树的形式展示,若存在基因流则呈现为网状树的形式。除此之外,TreeMix软件包还可以进行f3检验(three-population test)和f4检验(four-population test),前者可以计算某一谱系是否与其余两个谱系同时存在基因流,用于推断该谱系是否由杂交产生;而后者亦可对不同谱系间的基因流进行评估。
杂交起源分析
上述分析主要通过基因流检测和群体遗传结构等特征对同倍体杂交起源事件进行间接推断,而HyDe分析可基于遗传信息对新谱系的同倍体杂交起源进行直接检验。HyDe分析的结果具有统计学意义,可对亲本谱系在杂交类群遗传组分中的贡献比例进行评估。群体水平的HyDe分析是推断同倍体杂交起源的重要依据。此外,通过对相关谱系分化时间的评估也是排除不完全谱系筛选、推断杂交起源事件的有效方法。由于杂交谱系的基因组中混杂有两个亲本谱系的遗传信息,基于序列直接对其分化时间进行评估并不合理,可通过系统发育分析等手段鉴定杂交谱系中来自不同亲本的区域,并基于其分别计算杂交谱系与来源亲本的分化时间。若杂交谱系与两个亲本的分化时间相对接近,且明显短于亲本间的分化时间,则可为其杂交起源提供有力证据。然而,该方法不适用于杂交起源时间与亲本分化时间较为接近的谱系,无法对其发生不完全谱系的潜在可能进行排除。实际上,若两个亲本谱系的分化时间较短,在物种分化早期发生的“同倍体杂交事件”,正如“物种界定”时两个亲本谱系不是“好种”一样,也不是典型的“同倍体杂交物种形成”。最后,在证实同倍体杂交起源事件的前提下,可以使用LOTER分析对杂交谱系每个个体中来自不同亲本的遗传组分比例进行评估,不同个体间稳定的比例是印证杂交起源事件的另一重要证据。
群体动态历史模拟
鉴于物种形成历史往往相对久远且较为复杂,群体动态历史模拟在同倍体杂交物种形成研究中至关重要。前文所述的fastsimcoal2、DIY-ABC2和BPP等软件可以对不同演化模型(如HHS模型、渐渗起源模型、不完全谱系筛选模型等)进行模拟与比较,选取最优演化模型,并对其具体演化参数(分化时间、渐渗比例等)进行评估。

标准三:“ 杂交物种与亲本种间的生殖隔离由杂交事件直接导致”

该标准是区分“广义”和“狭义”同倍体杂交物种形成的关键,是严格定义“同倍体杂交物种形成”的基础,也是最具挑战的部分。无法满足此标准的发生遗传混合的独立演化谱系(或物种),应归为广义的“杂交渐渗”,但与种内杂交渐渗有所区别。不同物种间常常具有不同的生殖隔离性状,物种形成早期最初建立的生殖隔离性状的相关基因,在其物种形成过程中发挥最为重要的作用,是典型的物种形成基因。因此,该标准的核心分析需求是对同倍体杂交物种形成基因进行鉴定,分析这些基因是否直接由杂交产生,进而推动了杂交谱系的独立演化,促使其积累更多的遗传变异,产生更多的生殖隔离,从而使得杂交谱系与亲本谱系的生殖隔离程度随时间推移进一步加强。结合前文所述的生殖隔离研究方法,对杂交物种形成关键基因的鉴定,是证实“杂交物种与亲本种间的生殖隔离由杂交事件直接导致”最直接、有效的研究手段。然而,受限于同倍体杂交物种形成的演化特点和前期研究方法的局限,在很长一段时间内研究人员对此束手无策。
在桦木科虎榛子属的研究中,研究人员揭示了同倍体杂交物种形成的分子遗传新机制——亲本物种的生殖隔离关键(等位)基因在杂交后代中重新组合,成为“杂交物种形成”关键基因,促使其与亲本物种快速建立种间生殖隔离,并推动其演化成为新的同倍体杂交物种;并基于该分子机制,构建了同倍体杂交物种形成关键基因鉴定的新方法。该方法利用群体遗传学数据,结合类群分组、自然选择计算(HKA检验)、分化程度评估(群体间基因功能相关的固定差异位点)、系统发育分析等手段, 可以对同倍体杂交物种形成关键候选基因进行鉴定。最后,通过转基因实验和分子生化实验(如酶活实验、LUC实验)等方法,对关键候选基因进行功能验证,筛选得到在同倍体杂交物种形成过程中发挥重要作用的同倍体杂交物种形成关键基因。研究人员利用该方法首次实现了同倍体杂交物种形成关键基因的鉴定,成功鉴定到了虎榛子属的同倍体杂交物种形成关键基因。研究发现,FRO4ZIP5等等位基因的分化和重新组合可能导致了杂交物种居中虎榛子的铁元素适应性与亲本种滇虎榛子相似,与另一亲本种虎榛子形成生殖隔离;而LHY等等位基因的分化和重新组合则是导致居中虎榛子的花期与虎榛子相似,与滇虎榛子形成生殖隔离的主要原因;亲本种间不同类型的生殖隔离在杂交后代中重新组合,促使其与不同亲本种间同时建立生殖隔离,并快速演化成为新的杂交物种。上述同倍体杂交物种形成的分子遗传新机制与关键基因鉴定方法在桦木科千金榆组、黔金丝猴、猕猴属(Macaca)食蟹猴种组(fascicularis group)、亚洲黑熊(Ursus thibetanus)等众多植物和动物的同倍体杂交类群中被反复验证,展现出了较高的普适性。
事实上,多数生殖隔离性状都由复杂调控网络中的众多基因共同控制。利用上述方法鉴定到的同倍体杂交物种形成关键基因作为主效基因,在所研究类群的杂交物种形成过程中发挥了重要作用。然而,即使是同源基因控制的同一性状,在不同类群发生的亲本谱系分化和杂交物种形成事件中,涉及的基因或遗传变异都可能有所差异。除此之外,在杂交物种形成过程中,若导致大量亲本谱系之间固定的SNP和InDel在杂交谱系中重新组合,基于BDMI模型,可导致杂交谱系与亲本谱系之间杂交后代的产生机率与适合度均降低(即导致生殖衰败),造成杂交谱系与亲本谱系间合子后生殖隔离的快速形成,亦可作为“杂交物种与亲本种间的生殖隔离由杂交事件直接导致”的重要证据之一。但是,由于该过程涉及的基因和遗传变异较多,很难利用可靠的遗传、分子或生化证据进行证实。正如前文所述,合子前生殖隔离与合子后生殖隔离相比,相关的等位变异与性状更易在物种形成中受到自然选择而保留,对推动物种形成具有更为关键的作用,同时也对种间总生殖隔离贡献更大。因此,通过上述模型、方法与流程所鉴定到的合子前生殖隔离基因,由于直接继承自亲本物种,且在同倍体杂交物种形成的基因组重新组合过程中最早(最初几代)固定,在同倍体杂交物种与两个亲本物种最初的生殖隔离建立过程中发挥关键作用,应是比较典型的“同倍体杂交物种形成基因”。

杂交多倍化物种形成

不同于同倍体杂交物种形成,若杂交谱系的染色体数目为两个亲本谱系相加之和,则为异源多倍化物种形成(allopolyploid speciation)或杂交多倍化物种形成。多倍化物种形成中,生殖隔离主要源自多倍体物种与亲本物种染色体数目不同导致的配子配对失败(失败率极高,但并非是完全失败),因而更易在多倍体后代内部之间进行交配并产生后代,从而快速形成一个新的独立演化谱系(物种)。杂交多倍化谱系与亲本谱系相比往往具有更强的环境适应性与生存能力,因此杂交多倍化技术也被广泛应用于人工育种等领域。对于杂交多倍化物种形成的研究开始较早,相对比较成熟。杂交多倍化物种形成中,如果两个亲本谱系仍然存在,通过核型分析就能阐明杂交多倍化物种(或谱系)的形成过程。杂交多倍化物种形成较为经典的案例包括十字花科芸薹属(Brassica)中最具代表性的“禹氏三角”(U's triangle)物种——3 个二倍体物种白菜(B. rapa,2n=20,AA)、黑芥(B. nigra, 2n=16,BB)和甘蓝(B. oleracea,2n=18,CC)相互杂交后分别产生了四倍体物种芥菜型油菜(B. juncea,2n=36,AABB)、甘蓝型油菜(B. napus,2n=38,AACC)和埃塞俄比亚芥(B. carinata,2n=34,BBCC);而六倍体物种普通小麦(Triticum aestivum,AABBDD)的物种形成历史更是错综复杂:首先由二倍体物种乌拉尔图小麦(T. urartu,AA,又称一粒小麦)与拟山羊草(Aegilops speltoides,BB)分别通过杂交多倍化形成四倍体物种二粒小麦(T. turgidum,AABB),再与二倍体物种节节麦(A. tauschii,DD,又称粗山羊草)通过第二轮杂交多倍化形成了普通小麦(AABBDD)。
已有分析表明,全基因组加倍(whole genome duplication,WGD)或多倍化(polyploidy)事件广泛存在于众多生物谱系中。随着HiFi、Hi-C、长读长测序等技术的开发、推广以及迭代升级,基因组的整体质量得以大幅提升,有助于解析杂交多倍化谱系与近缘谱系之间的演化关系。近年来,研究人员通过异源多倍化谱系与近缘谱系的全基因组分析,先后确定了短柄草属(Brachypodium)、小麦属、棉属(Gossypium)和芸薹属等众多类群中的杂交多倍化过程。然而,很多类群的全基因组加倍是由同源多倍化还是杂交多倍化导致的仍然有待探索。鉴定古老的杂交多倍化物种形成是此类研究的难点,尤其是当其中的某一亲本谱系已经灭绝时。通过原位杂交、系统发育分析等发现,四倍体物种中华山蓼(Oxyria sinensis)可能是现存二倍体物种山蓼(O. digyna,2n=14)与某一灭绝的二倍体祖先物种(2n=28或26)形成的异源多倍体。
值得指出的是,Sun等提出了一种基于染色体水平基因组数据识别祖先染色体核型以及古基因组的新方法,通过将现有物种的染色体与祖先染色体进行比较,能够确定每个物种自祖先核型以来所经历染色体结构变异的类型和次数,从而可对发生核型变化的杂交物种形成过程与二歧分化等演化关系,进行独立追溯并建立其系统发育演化关系。该理论和方法已经被整合到基因组分析软件WGDI中,适用于鉴定古老的同倍体杂交物种形成和杂交多倍化物种形成,特别是对某一亲本谱系已经灭绝的杂交多倍化物种形成表现出非常高的鉴别能力。利用该方法,研究人员揭示了锦葵科(Malvaceae)各亚科之间由于级联杂交多倍化导致的网状演化关系,即反复的杂交多倍化物种形成过程。从梧桐亚科(Sterculioideae)祖先类群(异源四倍体),到山芝麻亚科(Helicteroideae)祖先类群(异源六倍体),再到木棉亚科(Bombacoideae)和锦葵亚科(Malvoideae)的祖先类群(异源十倍体),它们似乎以一种吞噬的方式不断演化成“新物种”,这些“新物种”再经历漫长的时间,演化为若干个现存物种,形成一个亚科谱系,且该过程似乎还在进行之中。此外,在杂交多倍化的研究过程中,表观遗传变异常被作为关注的重点。研究表明,在表观遗传变异与基因丢失、染色体重排、基因表达偏好等因素的共同作用下,异源多倍化物种的不同亚基因组之间常会发生分化,并可能导致亚基因组优势(subgenome dominance)现象;而多倍化物种的亚基因组优势与杂交后代的杂种优势间也可能具有相似的调控机制。在小麦、棉花、鱼等众多植物和动物的异源多倍体类群中,研究人员对表观遗传变异等因素在杂交多倍化物种形成过程中的作用机制开展了大量研究,揭示了其对于异源多倍化物种的关键性状演化、环境适应性能力以及物种形成过程的重要作用。

其他物种形成方式

同源多倍化物种形成

并非所有的多倍体物种均通过杂交多倍化的方式起源,同一物种通过染色体加倍亦可形成多倍体物种,由于其染色体组均来自于同一物种,因此被称为同源多倍体(autopolyploids),该物种形成方式被称为同源多倍化物种形成(autopolyploid speciation)。同源多倍化物种形成中,低倍体祖先物种与新起源的同源多倍体物种可形成祖先-衍生物种对。与异源多倍化一样,由于祖先-衍生物种对之间染色体数目不同,其种间杂交后代可能为奇数倍型个体(如三倍体),无法正常进行减数分裂与染色体配对,导致同源多倍体物种与低倍体祖先物种之间建立生殖隔离。但是,这种生殖隔离也不是完全的生殖隔离,因为特定情况下其种间杂交后代也可能与同源多倍体物种或低倍体祖先物种的染色体数目相同,从而能够相互杂交,进而导致低倍体祖先物种与多倍体物种之间的基因流。由于克隆繁殖等原因,奇数倍型个体也可能在大量保留。自然界的同源多倍体物种中,同源四倍体与同源三倍体均有存在,前者通常由二倍体通过染色体加倍直接形成(如沙生拟南芥,Arabidopsis arenosa);而后者则可能由减数分裂失败的配子与正常配子结合形成,或由二倍体与四倍体物种相互杂交产生,如香蕉(Musa nana)和人们熟知的三倍体无籽西瓜等;三倍体的育性发生下降,从而保证了二倍体祖先和四倍体衍生物种分别形成独立的演化谱系。
然而,通过人工方式产生的无籽西瓜等类群,往往被界定为品种而非物种。需要指出的是,自然界的很多属中都存在大量的种内二倍体-多倍体物种复合体。尽管它们之间存在生殖隔离,但由于形态差异较小,这些种内多倍体谱系没有独立为物种。例如,猕猴桃属(Actinidia)的同一物种内便存在二倍体和多倍体谱系,虽然大多认为其多倍体谱系是同源多倍化、而非异源多倍化的结果,这一结论仍需进一步确认。需要指出的是,这些多倍体和低倍体谱系之间,经常产生非常明显的杂种,例如三倍体(3×)和五倍体(5×)等。而同倍体物种之间,也可产生杂种。例如,浙江猕猴桃A. zhejiangensis实际上便是杂种,应命名为A. × zhejiangensis。这些杂种由于克隆繁殖和多年生等特性,在自然界大量存在,有时其分布区范围和个体数量可能还会超过其纯合的祖先亲本,导致大量杂种的标本被采集或将其误认为是独立的物种。过去对其不合适的物种界定和命名不仅影响对于物种界定与进化关系的理解,也给种质资源的有效交流和使用带来不便;更为重要的是,在基于整合证据的物种界定与命名,以及对其野外分布区域充分调查的情况下,可以将这些自然杂种作为种间杂交后代直接使用,充分利用其杂种优势。
不同于异源多倍化物种,同源多倍化物种的不同染色体组之间具有高度相似性,其高质量基因组的获取长久以来成为一项艰巨的挑战。早期发表的同源多倍化物种基因组,由于大量塌缩(collapse)现象的存在,通常并不完整,甚至只能组装出一套未拆分的基因组。与此同时,研究表明虽然同源多倍化物种的不同染色体组高度相似,同源染色体之间的差异对其表型往往具有重要的意义。单套基因组(或不完整的基因组)显然无法包含同源多倍化物种全部的遗传信息,无法满足全面、准确的物种形成研究的需求。
近年来,随着测序与分析等组学技术的快速发展,研究人员基于HiFi与Hi-C等测序技术产生的高质量数据,结合HifiasmALLHiCHapHiCAutoHiCVerkko等软件,使得单倍体基因组分型组装的质量效果大幅提升。越来越多的同源多倍化物种的单倍型基因组(haplotype-resolved genome)相继发表,如紫花苜蓿(Medicago sativa)、甘蔗品种割手密(Saccharum spontaneum Np-X)以及马铃薯品种“合作88”(Solanum tuberosum Cooperation-88)等,为物种形成以及作物育种等研究奠定了良好的技术基础与数据支撑。在此基础之上,研究人员围绕同源多倍化物种进行的演化历史分析以及同源亚基因组之间在遗传变异、转录调控、表观调控、三维基因组互作等方面的差异分析(含亚基因组优势的分析)等相继开展。然而,与其他物种形成方式相比,同源多倍化物种形成研究依然略显薄弱。随着未来研究技术的持续发展,更多的研究方向有待深入探究。

同倍体祖先种-衍生种物种形成

同倍体祖先种-衍生种物种形成指通过自然演化或人工过程,祖先种的部分个体或群体逐渐演化形成的新物种(衍生种)。该物种形成方式常见于驯化过程中,若驯化后的群体与原群体之间产生了稳定的形态学与环境适应性差异、明显的群体遗传学差异以及一定程度的生殖隔离等,被驯化群体作为一个独立演化谱系逐渐演化为新的物种(即衍生种),而原群体则作为祖先种。野牦牛与家养牦牛、野生稻与栽培稻等均为祖先种-衍生种物种形成的典型案例。同倍体祖先种-衍生种物种形成的重要演化环节是对祖先群体进行的选择以及衍生群体的扩大。家牦牛与野牦牛群体的基因组遗传分化,主要集中在与神经系统发育等方面相关的基因(如DISC1VWC2SNX3等),说明牦牛最初的驯化过程中,温顺性等特征是其主要的人工驯化选择目标,从而导致了家牦牛与野牦牛的分化;而与近缘物种黄牛相比较,家牦牛与野牦牛中很多与高海拔适应性相关的等位遗传变异,则参与了低氧、能量代谢、紫外辐射及心血管发育等过程,与环境适应性自然选择高度相关。
此外,来自黄牛的遗传渐渗对部分家牦牛品种的毛色等表型特征变异产生了重要影响。但是,这些遗传渐渗只影响了其部分群体(品种),而非整个物种全部群体的形态差异,没有导致生殖隔离与独立演化谱系的形成。因此,该过程与杂交物种形成存在显著区别。而亚洲栽培水稻两个亚种(粳稻与籼稻)之间的合子前与合子后生殖隔离(结实率低)均十分明显,它们同时与祖先物种也存在一定的生殖隔离。驯化过程可导致明显的奠基者效应,人工选择可加快突变位点(或等位变异)的纯合,共同促进了祖先种与衍生种之间合子前/后生殖隔离程度的提高;而育种过程则可通过种间杂交,导致部分品种或群体间的杂交渐渗。总之,在人类活动影响下的祖先种-衍生种物种形成过程中,环境适应性自然选择、驯化和人工种间杂交渐渗可能相互组合,过程复杂;厘清众多演化事件在物种形成中的作用是一项艰巨的挑战。
图5 | 不同的物种形成方式示意图。

结语与展望

基因组时代的快速发展极大地推动了物种形成研究的开展。基于来源丰富、构成合理的研究对象及其高通量的组学数据,物种形成历史的重塑愈发精准。然而,由于物种形成方式多样、过程复杂、涉及基因多等特点(图5),物种形成研究依然充满挑战。虽然组学分析已然成为物种形成研究的重要手段,但野外调查、同质园实验、生理研究、分子功能研究等传统或现代的研究方法依然不可或缺,它们为组学分析提供了重要的先验知识或结果检验,共同在物种形成研究中发挥了重要作用(图6)。随着组学测序技术与分析方法的不断升级与完善,越来越多的研究方向得以被关注并深入探索。例如,核型演化、基因组结构变异、表观调控等在物种形成过程中究竟扮演了何种角色,相关研究逐渐兴起。然而,对物种形成基因的鉴定方法与物种形成的分子机制等领域的探索依然步伐缓慢、挑战艰巨,它们将继续作为未来研究中的重点方向,相关的技术与方法创新仍然倍受期待。
图6 | 物种形成研究内容与研究方法示意图。

“种间杂种”与“同倍体杂交物种”在理解和实践中经常被混淆。前者存在杂交衰败,是一个非独立演化的谱系;而后者为繁殖和生存能力正常的独立演化谱系。此外,“渐渗”和“同倍体杂交物种”在一些研究实例中也不易区分。对于严格的同倍体杂交物种,必须证明杂交对其与两个亲本物种的生殖隔离发挥了重要作用;不能提供此证据的“基因组遗传混合”物种(或独立演化谱系),可暂时归入种间杂交渗入。中文背景下,“杂种”、“杂交种”和“杂交物种”三个名称均有使用。“杂种”有时指 “种内杂种”,有时指“种间杂种”,目前无法利用其他简短术语对以上两种情况进行区分,要根据上下文背景进行理解。“杂交种”多指“种间杂交物种”,但有时仍被用来指代“种间杂种”;为了减少混淆,建议尽量不使用“杂交种”这个术语。此外,严格的种间杂交渐渗是指:渗入的基因和遗传成分不会导致被渗入群体与其他群体产生生殖隔离,往往被渗入群体是一个更广义物种的部分个体或群体。但是,很多物种中被杂交渗入的基因参与了被渗入群体与其他群体的生殖隔离(如环境适应性的合子前生殖隔离),由于它们之间的生殖隔离程度与分化程度均较小,可视为“同倍体杂交物种形成的早期”,但仍然只能作为“杂交渐渗群体”来处理。
除这些概念和术语在未来研究中要加以区分外,我们建议还应重点关注如下5个方面的内容:
(1)利用整合物种概念和方法,对现有记载的物种进行群体水平上的差异性统计、验证和分类修订,判断不同物种间是否具备多种物种界定证据(越多越好),重点关注其是否具备群体水平上形态学、遗传学和生态位(含地理分布)的统计学差异;如有条件,也可检测其是否具备生殖隔离;特别是在野外采集或室内标本鉴定时,要重视“种间杂种”的概念,不要试图把所有个体均界定为某一物种:有些分布区域(尤其是两个物种的分布接触区)的个体,甚至大面积分布的群体,都有可能是杂种,物种界定时应正确使用杂种名称;
(2)对于二歧式物种分化研究,要加强生殖隔离主效基因的研究;特别是将生殖隔离等位基因分化与群体分化历史相结合,开发新分析方法,对推动群体最初分化的“物种形成关键基因”进行鉴定与甄别;
(3)对于同倍体杂交物种形成研究,已有的研究方法可对通过杂交发生重新组合(交替继承自亲本谱系)的“同倍体杂交物种形成基因”进行鉴定,但对于杂交谱系独立演化之后获得的生殖隔离机制及其他关键表型相关基因(或遗传变异)的关注较少,对于杂交谱系如何克服杂交衰败、恢复正常繁殖能力的遗传机制也鲜有报道;
(4)目前对于高级分类单元(如包含多个现存物种的目、科、属等)存在的古老同倍体杂交物种形成的研究依然报道较少;建议利用 WGDI等软件和方法对广泛存在的古老基因组加倍谱系进行杂交历史鉴定(或确认),同时对古老杂交多倍化影响表型创新、物种辐射演化的遗传机制进行深入解析;
(5)在驯化物种的形成与演化历史研究中,人类选择效应与杂交渐渗相互交替,极其复杂,也是未来研究中的重要方向。
此外,基于二歧式的基因组系统发育树,很多节点都存在严重的拓扑结构冲突。排除不完全谱系筛选等因素的影响后,杂交物种形成应该是造成该现象最为重要的原因。若能证明杂交(同倍体杂交或杂交多倍化)广泛存在于生命演化中的诸多节点,则说明“生命之树”更应表述为“生命之网”。值得注意的是,物种形成研究的意义不应局限于理论贡献,更应关注其应用价值。结合物种形成理论及物种形成关键基因的鉴定等,不仅可以指导濒危物种保护,还将在远缘杂交精确育种等方面具有重要意义。尤为重要的是,因为同倍体杂交物种能聚合双亲物种的优异性状,未来可有目的通过同倍体杂交物种形成方式,创制具有双亲性状的新同倍体杂交物种,最终利用创制的新物种进一步培育新品种进行栽培或养殖。这是一条完全不同于已有(通过反复回交、渗入极少量基因)的远缘杂交育种途径。尽管可能存在很多挑战,但是新创制的同倍体杂交物种杂合度较高,杂种优势将更为明显,未来的突变速率与可塑性均会更大,具有更为广泛的应用价值。

为了不让您最关心的内容被湮没

防止我们一不小心失散

快把“iPlants”设置为星标吧★

只需三步↓↓

文章顶部点击「iPlants」名称进入公众号主页,点击右上角「三个小点」,点击「设为星标」,iPlants名称旁边出现一个黄色的五角星,就设置成功啦~


微信加群
iPlants专注于全球植物科学前沿研究报道,已有二十万多学者关注。现已组建了30个500人/群的植物科学研究的研究生/教授的实名认证交流群,其都来自全球各大高校和研究所的同学和老师。欢迎从事植物科学相关研究的同学和老师加入我们,一起讨论学术和梦想。温馨提示:iPlants助手微信号(ID: iplants-1)或长按下面二维码进群时,请备注一下学校+专业+学生/老师,以便我们能拉你进相应的交流群,否则不予通过)
投稿、商务合作、转载开白名单等事宜请联系微信ID:iplants或18321328797 或邮箱:703131029@qq.com

生信宝典
学生信最好的时间是十年前,其次是现在!10年经验分享尽在生信宝典!
 最新文章