本研究通过比较杏-桃-李-梅(APPM)复合体的群体基因组分析,揭示趋同和趋异选择的基因组信号。利用HiFi和Hi-C reads组装李子品种的T2T参考基因组,获得两个单倍体型(251.25和251.29 Mb)。比较基因组发现杏基因组中约1.17 Mb的染色体易位,涉及影响酸度、pH和糖含量的D位点。群体遗传分析显示李子和杏之间存在显著基因流,渗入区域富集于胚胎后发育和花粉萌发过程。比较群体遗传分析揭示了对胁迫耐受、花发育和果实成熟的趋同选择,以及对特定作物性状(如李子的体细胞胚胎发生、梅的花粉萌发、桃的激素调节)的趋异选择。特别是染色体7上的选择性清除与基因组比较中的共线性一致,影响关键果实软化基因(如PG,受ERF和RMA1H1调控)。
研究为APPM复合体的遗传多样性、进化历史和驯化提供见解,对李属作物遗传研究和育种有重要意义。
前言
物种主要通过生殖隔离定义,但许多物种在自然和人工条件下会发生杂交和基因渗入(introgression),影响表型变化。基因组数据证实物种间频繁的基因流。高重组率区域更易发生基因渗入。趋同选择(convergent selection)和趋异选择(divergent selection)影响基因组区域多样性。选择性清除(selective sweep)和净化选择(purifying selection)降低遗传多样性。李属(Prunus)植物经济重要,包括杏、桃、李、梅(APPM复合体),具杂交和嫁接兼容性。APPM复合体基因组背景了解有限。通过比较基因组和群体基因组分析,探究李属物种的进化历史、基因渗入及趋同和趋异选择,为李属育种提供新视角。
主要结果
李子端粒到端粒单倍型解析参考基因组的组装
我们为李子品种‘Fengtangli’生成了26.84 Gb的PacBio HiFi reads和30 Gb的Hi-C数据,组装了高质量的基因组(图1A-C)。基因组杂合度为0.97%。初始组装的contig N50分别为20.11和19.66 Mb, scaffold N50为28.08和28.37 Mb。BUSCO评估显示核心基因捕获率高达99.2%和98.9%。最终获得两个无间隙单倍体型PS_T2T_hap1(251.25 Mb)和PS_T2T_hap2(251.29 Mb)(图1D)。Hi-C数据验证了组装的准确性(图1E)。重复序列分析确认了着丝粒和端粒位置。重复序列占基因组的45.41%和46.19%,LTR逆转录转座子占29.57%。预测了28,775和28,139个蛋白编码基因,捕获了96.6%和94.0%的BUSCO参考基因。共有48,645个共享基因,876和760个独特基因。此次组装是李子二倍体基因组的首次全面准确组装,显著推进了李子基因组学研究。
杏-桃-李-梅物种的比较基因组学
为验证组装质量,我们以‘Sanyueli’为参考进行比较基因组分析,结果显示大部分区域共线性良好。两单倍体型间存在大量变异,包括1667700个单核苷酸多态性(SNPs)、389962个小插入缺失(InDels)和30698个结构变异(SVs)。选择杏、桃、李和梅的高质量基因组进行共线性比较,显示高度共线性(图2A)。杏染色体7与其他物种相比存在大结构重排(图2B)。重排区域的基因富集于多种生物过程(图2C)。基因家族分析显示,四物种共享14651个基因家族,李独有130个基因家族,富集于信号传导和防御反应等过程。
杏-桃-李-梅复合体的遗传多样性、分化及种群结构
对171份材料(包括桃、杏、梅、李和6个外类群)进行全基因组测序,获得8011197个高质量SNPs。基于系统发育树和PCA分析,将这些材料分为四个类群:桃、李、梅和杏(图3A-C)。群体杂合度分析显示,桃最低(1.33%),李最高(3.31%)(图3D)。FST分析表明梅与桃遗传分化最大(0.419),杏与梅、李最小(0.258)。核苷酸多样性(π)分析显示,桃最低(8.82 × 10−4),李最高(2.17 × 10−3)(图4A)。
杏-桃-李-梅复合体的基因流
FST和混合分析显示李和杏可能有基因交流,但具体模式不清(图3A和4A)。使用Dsuite计算F-branch统计量,发现李和杏有强基因渐渗信号(fb = 0.014,Z = 7.42)(图4B)。20-kb窗口分析进一步证实李和杏间高渐渗水平(图4C)。TreeMix分析显示李和杏间有迁移事件(图4D)。高fd窗口中的基因富集于生物过程,如包括半胱氨酸生物合成过程、后胚胎发育调控(post-embryonic development)、细胞壁组织以及花粉萌发等。最高fd区域包含与TOGT1基因相关的渐渗信号(图4),该基因影响氧化应激和病毒抗性。
杏-桃-李-梅复合体中的趋同和趋异选择信号
通过CLR测试和选择清除分析,发现李属植物在适应环境变化中存在正选择基因。四个类群共享的GO富集类别包括RNA修饰、胚胎发育等(图5B)。特定类群的基因涉及花粉萌发、细胞壁组织等(图5C-E)。染色体7上的趋同选择区域包含与果实成熟相关的PG基因,受RMA1H1和ERF053调控(图5F)。PG基因的60种单倍型在APPM群体中分布不均(图5C-E)。不同类群中存在独特基因,如梅和桃的PG基因、AP2/ERF转录因子等,涉及乙烯响应和生物合成调控(图5F-I)。研究揭示了果实成熟和乙烯响应关键基因的遗传变异,为果实发育和质量调控研究提供依据。
总结与讨论
APPM(李、杏、梅、桃)复合体拥有相近的进化历史,并展现出选择信号的趋同和分歧。候选基因可用于APPM作物的遗传研究和育种计划。本研究首次通过整合HiFi和Hi-C读段,成功组装了李的T2T参考基因组,其平均N50值为19.85 Mb,比先前发表的基因组高出14倍。比较基因组学揭示了李属物种之间共享和独特的基因组区域,揭示了基因获取、丢失和复制的模式,这些模式构成了它们的适应策略。基因组共线性分析显示,李属物种的基因组之间存在强烈的共享关系。
特别是,本研究首次报告了约1.17 Mb的染色体易位(Chr7: 5.10–6.27 Mb),揭示了杏的基因组结构变化。桃果实的酸度和糖分受D位点控制,D位点位于Chr5: 703–1212 kb的509-kb区间内。桃与李、杏和梅有密切的共同祖先,可能在进化过程中由于特定的环境或人为因素而独立进化。研究发现P. brigantina与李类群一致,但在核DNA序列上与杏更接近,表明它可能是李和杏的杂交后代。桃表现出显著较低的杂合度值,历史上桃由于自交亲和(SC)交配系统而与遗传变异性降低有关。然而,在李属中,自交不亲和(SI)是普遍现象,大多数物种部分或完全自交不亲和,从而促进基因流动。引入的发生需要两个物种具有重叠的地理范围,并且足够接近,以便至少有一些杂种后代是可育的。尽管大多数杂种不适合,但一些重组杂种在适应景观中必须具有高适应性。李属中观察到的多样性也可能归因于种间杂交和通过近缘李属物种之间的回交进一步引入。研究提供了李和杏之间遗传交换的有力证据,这与先前的研究相矛盾。根据带有基因流动的物种形成模型,一个关键预测是参与物种形成的位点应该表现出高的相对分化(FST)。最低的FST值(0.258)出现在杏和梅之间以及杏和李之间,表明杏与梅或杏之间有高度的基因流动。在高重组率的基因组区域,如许多其他物种(如三刺鱼)所见,促进有害引入等位基因与相邻位点的解耦,促进基因流动,导致这些区域的分化水平(FST)降低。梅显示出高度的遗传多样性,源于独立的驯化事件,相对较小比例的基因组受到选择的影响。
fb统计结果反映了杏和梅类群之间没有引入的证据(fb = 0),但杏和李类群之间的fb值(0.014)与引入的可能性一致(低FST)。我们利用ABBA-BABA统计量(如fb、fd和f dM)和TreeMix来估计潜在的迁移事件,揭示了杏向李引入的充分证据。鉴于杏和李之间的引入,一个重要的问题是它是否具有适应性基础。
适应性引入在作物驯化中发挥了重要作用,如在玉米、大麦、土豆和水稻等作物中观察到。我们的分析提供了令人信服的证据,表明引入有助于李的重要农艺性状,引入富含524个关键基因,与重要的生物过程相关,包括胚胎后发育和花粉萌发的调节。其他分类群的研究也表明,引入可以通过各种机制促进物种适应。APPM复合体共享最近的进化历史,揭示其基因组在驯化和适应过程中的趋同和分歧选择信号对于种间杂交育种至关重要。在我们的研究中,我们确定了这四个类群中的一系列共享和特定基因,揭示了它们在进化适应过程中的复杂遗传景观。每个基因在响应各种环境线索和发展过程中都发挥着独特的作用(图5,补充数据图S13和S16)。
值得注意的是,染色体7上的趋同选择性清除与比较基因组学的染色体共线性相一致,影响PG等重要果实软化基因。调节网络涉及MdPG1和FcPG12等特定基因,受MdCBF2和FcERF5等ERF的调节,有助于果实软化。番茄中的CRISPR/Cas9应用证明了延迟果实软化的可能性。泛素介导的蛋白质降解途径,由PRT6等E3连接酶代表,影响基因表达,影响ERF调节。转录抑制因子SlERF.F12,已知招募共抑制因子和组蛋白脱乙酰酶,影响番茄的果实成熟。这些发现强调了控制果实发育和采后性状的复杂分子机制。此外,染色体1上桃特异性分歧选择区域的鉴定,受驯化影响,与果实增大相关,为李属作物从野生到栽培品种的转变提供了宝贵的见解。这些候选基因具有未来遗传研究和育种计划的潜力,有助于李属特性的持续改进。两个种群之间杂交和引入的潜力是一个由遗传分化、选择、重组和人口因素塑造的复杂过程。特定等位基因的适应性引入取决于其优势、基因组位置、对受者种群适应度的影响以及最近的人口历史。杂交的结果主要由长期影响决定,包括早期代杂种的适应度和新等位基因组合的出现,这些等位基因组合通过引入适应度变异性作为进化变化的催化剂。在多变的环境条件下,这一过程使种群能够克服挑战,探索新的进化路径,并持续存在。
文献来源:
Xuanwen Yang; Ying Su; Siyang Huang; Qiandong Hou; Pengcheng Wei; Yani Hao; Jiaqi Huang; Hua Xiao; Zhiyao Ma; Xiaodong Xu; et al. Comparative Population Genomics Reveals Convergent and Divergent Selection in the Apricot–Peach–Plum–Mei Complex. Horticulture Research 2024, 11, uhae109, doi:10.1093/hr/uhae109.