红皮云杉(Picea koraiensis)属于云杉属云杉组(Sect. Picea),是中国东北平原主要造林与用材树种,其分布区是云杉属历史迁移的重要过渡带。红皮云杉不同种群间遗传分化水平高,但种群遗传结构和分化机制尚不明确。该研究利用GBS简化基因组测序技术获取红皮云杉9个不同地理种群的全基因组水平上的SNPs位点,用所得523761个核苷酸多态性位点(SNPs)进行系统发育、群体遗传结构、群体多样性和选择清除分析。发现:①红皮云杉划分为3个Group,对应3个地理气候区:(I)大兴安岭北部气候区,(II)小兴安岭气候区和(III)长白山气候区;气候区I的蒙克山种群与同域种鱼鳞云杉(P. jezoensis)之间存在种间基因交流;蒙克山种群和气候区II的乌伊岭群体是分化较大的2个群。②与长白山种群相比,蒙克山种群受选择基因与开花及光形态建成、细胞对缺水的反应及对活性氧的反应相关;乌伊岭种群受选择基因与金属离子转运、类黄酮等大分子生物合成、植物激素信号转导及DNA修复相关。
127个样本的GBS测序,共鉴定出523761个SNPs,进行后续分析。 系统发育树(图1A)以鱼鳞云杉P. jezoensis、丽江云杉P. likangensis和蓝云杉P. pungens为外类群, 9个红皮云杉种群形成3个类群:大兴安岭类群(蒙克山(MKS)种群),长白山类群(海林(HL)、穆棱(ML)、临江(LJ)和天桥岭(TQL)种群)和小兴安岭类群(伊岭(WYL)、爱辉(AH)、高峰(GF)和沾河(ZH)种群)。第二类群和第三类群是姐妹分支。系统发育树的结果和地理分布相吻合。 群体遗传结构由图1B可知,最优分群数是K=3,当K=2~4时,分群数较为合理。结果表明,基因渐渗发生在蒙克山种群(MKS)和外群体中,乌伊岭种群(WYL)与其他种群有较大的分化。 主成分分析(PCA)显示(图1C),红皮云杉群体划分为3个主要类群:蒙克山种群,乌伊岭种群和其余种群。这与admixture分析结果一致,进一步说明蒙克山种群(MKS)和乌伊岭种群(WYL)发生了较明显的分化。
图1.红皮云杉127个个体的NJ系统发育树、群体遗传结构和主成分分析图
注:PUN,Picea pungens; LIK, Picea likiangensis; JEZ,Picea jezoensis. I,大兴安岭类群;II,长白山类群;III,小兴安岭类群;(a)PC1和PC2;(b)PC2和PC3.
红皮云杉的9个不同地理种群的多样性和遗传分化的结果如表1所示。红皮云杉种群的核苷酸多样性π在0.00194~0.00231之间,不同地理种群之间的Fst 为0.0254~0.1569。结果显示,乌伊岭和蒙克山这2个种群与其它种群的分化程度较高,这2个种群可能产生了隔离,在进化中受选择程度高经历了瓶颈效应。临江、天桥岭、沾河种群的分化程度较低,这3个种群与其它种群的基因交流频繁。与群体遗传结构和主成分分析的结果是一致的。9个种群的Tajima's D 值都为正值(均值0.1554),说明这9个种群可能经历了平衡选择。 选择性清除分析主要目的是寻找种群受选择基因,进一步揭示出种群演化的适应机制。以长白山地区的Group II作为背景群,以和其它种群分化较大的蒙克山和乌伊岭种群作为对照群,鉴定自然选择信号,探索不同种群的适应性分化机制。蒙克山种群与背景群对比进行选择清除分析,共确定646个受选择的基因(图2a)。乌伊岭种群与背景群对比进行选择清除分析,共确定1127个受选择的基因(图2b)。
表1红皮云杉核苷酸多样性、群体分化和中性检验
图3.基于GO数据库的富集分析
图4.KEGG富集分析的受选择基因
注:颜色代表P值的显著程度;(a)蒙克山种群(MKS);(b)乌伊岭种群(WYL).
蒙克山种群基于GO富集和KEGG Pathway分析(图3a和图4a),在受选择的基因中,发现了与光周期、开花以及光形态建成相关的基因(例如CUL4,GATA9,SBH2,MBD9);参与细胞对缺水的反应的基因(例如RPK2,CYT1,MGL),这可能与蒙克山种群对大兴安岭北部的气候适应相关。还发现了与活性氧反应相关的基因(例如HSP15.7,DNAJB1,SODCC,CPN60-2,CYT1),信号转导相关基因(例如CTR1,ATlg67720),氧化应激防御相关基因(例如MYB家族基因),说明蒙克山种群受到了逆境的胁迫。此外,还发现了与DNA修复相关的基因(例如CUL4,MNAT,RFA1,MLH3,POLD2),这说明蒙克山种群可能在逆境中产生了DNA损伤。
乌伊岭种群受选择基因GO富集和KEGG Pathway分析(图3b和图4b),发现了金属转运基因(二价金属离子运输基因,例如TL17, VHA_D, SAUR32, AGT1, TIP2-1, GLR3.3)和(一价金属离子运输相关基因,例如YMF19, HAK家族基因, VHA-D, VHA-a1, VHA-C, AVP1, OEP64);植物激素信号转导相关基因(例如IAA, SAUR, ARR-B, GID1, MPK6, EBF1_2);类黄酮生物合成相关基因(例如ANS, FLS, ANR, LAR)和DNA修复相关的基因(例如TOP3, RFA1, BRCA2, MLH1, PMS2, RBX1)。说明乌伊岭种群可能受到了环境因子的胁迫,其分布区的土壤中金属离子可能高于其它种群分布区。