中国北方地区是云杉属东亚和北美间迁徙的重要通道,连接着云杉属的次级分布中心青藏高原,在此区域中分布着红皮云杉,白杄,沙地云杉,青杄,大果青杄,云杉,青海云杉,鳞皮云杉。这8种云杉虽然分布区域跨度很大,从中国东北部一直到西北部和青藏高原边缘,但它们的亲缘关系很近且表型相似,本研究将其统称为云杉复合体。由于云杉属种间杂交和重组频繁,而形成了嵌合质体,导致很难由不同质体构建统一的系统发育关系,而少量的核基因包含的遗传信息有限,且全基因组重测序成本过高。因此本研究以蓝云杉和鱼鳞云杉为外类群,研究云杉复合体的群体特征,种间基因流以及物种分化时的受选择基因,以期从全基因组角度来阐述云杉近缘种的系统发育关系,揭示物种分化时受选择基因的功能。
云杉属(Picea)是北半球针叶林的重要组成部分,具有世代时间长、种群规模大以及种间生殖隔离弱的特点,导致多个物种表型出现趋同现象。其中云杉(P. asperata)及其近缘种就是分布在我国北方地区的8个表型相似且亲缘关系较近的物种,包括红皮云杉(P. koraiensis)、沙地云杉(P. mongolica)、白杄(P. meyeri)、青杄(P. wilsonii)、大果青杄(P. neoveitchii)、青海云杉(P. crassifolia)、云杉(P. asperata)和鳞皮云杉(P. retroflexa),其分布区是云杉属物种在北美和东亚之间迁徙的重要通道,连接着云杉属的次级分布中心青藏高原,但其种间关系及分化机制仍存在争议。
本研究以蓝云杉(P. pungens)和鱼鳞云杉(P. jezoensis)为外类群,可将云杉复合体14个群体分为5个进化分枝,其中青杄、大果青杄和红皮云杉各形成一枝,云杉、青海云杉和鳞皮云杉聚为一枝,白杄和沙地云杉聚为一枝。青杄、大果青杄祖先分化时间较早大约在16.74 Mya,与秦岭隆起时间相符;红皮云杉的形成大约在5.06 Mya,与大兴安岭中新世隆起时间吻合;白杄和沙地云杉分化时间大约在4.33 Mya,与蒙古高原抬升时间相符。红皮云杉,白杄,云杉,青海云杉和沙地云杉之间存在着四次基因流。沙地云杉的核苷酸多样性最高,青杄和大果青杄核苷酸多样性较低。青杄和大果青杄与其余6个种遗传分化指数值较大,亲缘关系较远。基因型-环境关联发现共有20808个基因与等温性,最暖月份最高温度,最冷月份最低温度,年降水量相关,关联基因主要与植物对逆境的响应以及植物的花、种子等发育相关。以青杄和大果青杄为背景群,在其余6个种中识别出537个受选择性清除基因,主要与植物抗逆性,生长发育,昼夜节律以及植物开花时间等相关;除共有受选择基因外,不同云杉物种由于分布区域差异都存在有特有的受选择基因。
主要研究结果1:云杉近缘种系统发育和群体结构分析
利用GATK软件从Clean Data中共获得未过滤SNP位点15716973个,在筛选出缺失位点(< 0.5)和次要等位基因频率(> 0.02)后,仍有1678480个高质量SNP用于后续分析。
图1 基于SNP标记的云杉复合体最大似然树和STRUCTURE图、主成分分析以及分化时间估测
由图1可知,云杉复合体14个群体划分为5个类群。青杄和大果青杄与其余6个云杉物种亲缘关系较远。各种地质事件促进了云杉复合体物种分化。青杄和大果青杄受到秦岭快速隆起的影响其祖先群体分化时间较早,祖先在中中新世先分化,16.74 Mya;二者大约在11.66 Mya分化;红皮云杉在晚中新世分化,6.44 Mya;白杄和沙地云杉祖先在早上新世分化,5.20 Mya;白杄和沙地云杉在早上新世分化,4.33 Mya。
主要研究结果2:云杉复合体种间基因流及其环境适应性研究
图2 云杉近复合体种间基因流、ABBA-BABA测试树模型、遗传变异和环境变量的RDA分析,以及与云杉复合体环境变量相关的潜在候选基因的GO富集和KEGG富集分析
红皮云杉,白杄,沙地云杉,云杉和青海云杉存在四次基因流。
年平均降水量对大果青杄(陕西)、青杄、云杉的遗传变异贡献最大;等温性和最冷月份最低温度解释了青海云杉、白杄、大果青杄(甘肃)、鳞皮云杉中大部分遗传变异;最热月份最高温度对红皮云杉、沙地云杉遗传变异贡献最大。使用RDA分析共识别出20808个候选基因,TAO1, RPP1,FLS2, RCH2参与植物对逆境的响应,TT7参与植物UV光保护作用,GA1、HSL1与植物形态发育相关。
主要研究结果3:云杉复合体种间分化的选择清除分析
图3 云杉复合体中受选择性清除的基因组区域与选择清除分析筛选基因的GO分类与KEGG注释通路图
识别策略为π radio和FST的top 5%组合策略,背景群为青杄和大果青杄,红皮云杉中识别出73个候选基因,鳞皮云杉中识别出231个候选基因,云杉和青海云杉中识别出101个候选基因,白杄中识别出78个候选基因,沙地云杉中识别出54个基因。
对照群体中均发现了与植物热胁迫相关基因HMGB7;与植物昼夜节律和光周期依赖性开花基因LNK1;与植物根系、叶和花发育相关基因HK5,LNK1,RIC1,SC35。在红皮云杉中发现与植物热胁迫相关基因HIT4;在鳞皮云杉中发现与外表皮细胞相关基因ATML1和HTH,毛状体相关基因RR21和CPL3;木质素调节相关基因IRL;叶颜色基因MYB6、ERF017;叶形态发育基因SLC1和DTX54;在青海云杉和云杉中发现与维管束发育相关的基因ATHB-15和DNA损伤修复相关基因 PARP2;在白杄中发现与根系生长相关的基因 APSR1;在沙地云杉中发现与植株高度相关的基因CYP90D2。
研究结果以题为" Species divergence and environmental adaptation of Picea asperata complex at the whole genome level "在线发表于Ecology and Evolution 2024,14(8),中国林业科学研究院森环森保所博士研究生刘逸夫为该论文的第一作者,中国林科院林业所王军辉研究员和贾子瑞副研究员为论文通讯作者。该研究得到了“十四五”国家重点研发计划“林木良种智能化高效繁育技术”项目子课题(2023YFD2200605-02)和国家自然基金青年项目(No. 31500540)资助。