背景
染色体倒位是基因组结构进化的主要驱动力,可以对生物表型产生直接或间接的影响,并且可以是适应性的、有害的或中性的。如果想确定哪些进化驱动力作用于倒位,可以通过它们对基因组特征的影响来评估,例如核苷酸替代率、转座元件插入情况、基因表达水平等。倒位主要改变基因与其调控元件的位置关系或破坏基因,从而改变基因的表达。目前,倒位对处于其中的基因功能的影响以及其发生倒位后的有害结果仍知之甚少。姜黄属物种以其药用和食用价值闻名,该属植物的染色体基数多变,多倍化现象普遍,是研究染色体倒位的良好材料。研究团队选取了3种姜黄属植物姜黄(Curcuma longa,2n=3x=63)、女王郁金(Curcuma petiolate,2n=2x=42)、姜荷花(Curcuma alismatifolia,2n=2x=32)为研究对象,进行了后续的研究分析(Fig1 a)。
结果
三种姜黄属植物的单倍型水平基因组组装
研究人员选取了3种不同倍性和染色体数目的姜黄属物种(Fig1 a),基于hifi和hic测序数据组装得到高质量染色体水平的基因组,其contig N50值和BUSCO值均高于已报道的基因组(Table 1)。随后完成了基因结构注释和TE注释(Table 1)。
姜黄属物种普遍存在倒位现象
研究人员首先基于单拷贝同源基因构建了姜科物种的进化树(Fig1 b)。随后,利用WGDI软件,构建了姜科物种11条祖先假染色体。姜科祖先染色体与科内物种之间的1:2共线性进一步验证了姜科中常见的WGD事件(Fig1 b)。同时,与姜科祖先染色体相比,姜黄物种经历了至少40次染色体分裂和融合事件,形成了目前的核型(Fig1 b)。此外,在女王郁金20号染色体、姜黄8号染色体与姜荷花11号染色体之间,检测到倒位并且通过hic互作信号(Fig1 c-d)进行了验证。然后,研究人员基于10条染色体的一对一共线性分析,鉴定了三种姜黄物种之间的倒位,结果显示种间倒位的总长度占这10条染色体长度的约32%至39%(Fig1 e)。以上发现表明,染色体倒位在姜黄物种的核型演化过程中频繁发生。
姜黄属物种单倍型间也普遍存在倒位现象
研究人员关注了3个姜黄物种各自单倍型基因组间的染色体倒位情况,鉴定到姜荷花中有63个倒位,女王郁金中有47个倒位,姜黄中分别有54(HapA/HapB)、49(HapA/HapC)和59(HapB/HapC)个倒位(Fig2 a)。接下来选取了已发表的植物单倍型基因组进行比较,发现姜黄物种中的倒位比例很高(Fig2 b),同时位于倒位中的基因数量也比多数其他物种高(Fig2 c)。
倒位内基因表现出低表达水平、高核苷酸替代率和高TE含量
随后研究人员关注了处于倒位中基因的情况,发现这些基因具有较低的表达水平(two-sided Wilcoxon rank-sum test, p < 0.001),较高的核苷酸替换速率(Ka/Ks,two-sided Wilcoxon rank-sum test, p < 0.001)以及较高的TE含量(two-sided Wilcoxon rank-sum test, p = 0.189)。
为了确定倒位区域内基因低表达和高核苷酸取代率的潜在原因,研究人员比较了倒位区域内基因和富集LTR区域基因之间的统计数据。结果发现,即使与LTR含量较高的基因组区域相比,倒位中观察到的较低的基因表达和较高的核苷酸替代率情况仍然存在(Fig3 b)。由于姜荷花的种内倒位率最高,研究人员研究了其基因表达水平、核苷酸替代率和LTR含量在远离倒位区域时的变化情况,发现基因表达水平逐渐升高(R2=0.91,p=0.001),而核苷酸替代率(R2=0.84,p=0.004)和LTR含量(R2=0.45,p=0.102)逐渐降低到基因组背景水平(Fig3 c-e)。
姜荷花居群内倒位富集了有害突变
种群结构分析显示姜荷花品种可以分为g1和g2两个主要类群,两个类群在花序、株高和叶片等性状上有区别,因此它可以作为检测选择信号和SNP的适宜群体(Fig4 a)。随后,通过交叉群体复合似然比(XP-CLR)、长度分离位点数(nSL)并结合核苷酸多样性(π)和种群差异(FST)联合分析的三种方法,在非混合g1-L和g2-L样本之间检测正选择的SNPs(Fig4 b)。结果发现,在所有三种方法中,被选择的SNPs显著减少了倒位(two-sided χ2 test, p<0.001)。接下来,还发现倒位区内基因中多等位SNP(等位基因数≥2)的多态性信息含量(PIC)显著高于倒位区外基因(two-sided Wilcoxon rank-sum test,p<0.001)(Fig4 c)。随后,研究人员检测了姜荷花群体的基因组重组率,发现倒位区域的重组率明显低于基因组背景,甚至低于富集LTR的基因组区域(two-sided Wilcoxon rank-sum test,p<0.001)(Fig4 d),这意味着交叉事件减少,倒位区间的联系加强。最后对姜荷花群体里的有害突变进行了分析,结果表明倒位区域内的有害突变数量更多(two-sided Wilcoxon rank-sum test,p<0.001)(Fig4 e)。以上结果表明,姜荷花内的倒位抑制了异核型倒位中的重组,导致有害突变的积累,并且包含足够多的多态性位点,同时这些位点不太可能被选择(Fig4)。
倒位通过TPS基因的假基因化影响萜类化合物合成
为了进一步确定倒位如何影响功能或性状,对倒位内的基因进行了KEGG富集分析,发现三个姜黄物种的倒位内基因在萜类化合物生物合成途径中显著富集(Fig5 a)。随后,研究人员发现在姜荷花8号染色体的倒位区域中,TPS基因显示出不完整的基因结构域且大多数不表达,而倒位区以外的基因结构正常并表达正常(Fig5 b)。另外,这两个单倍型倒位区域内的不完整基因丢失的是不同的结构域,说明这两个单倍型是独立进化的。进一步研究基因表达数据发现,18个基因结构完整的TPS基因在姜荷花苞片和幼花中表达量高,而在茎中表达量低,这些基因在幼花发育过程中表达量下调,与1-β-榄香烯的含量水平一致(Fig5 c)。随后研究人员对这些基因的两个代表(Chr08HA727和Chr08HA736)进行了功能验证和结构分析(Fig5 d-f)。结果发现倒位区域内的萜类基因会失去功能,成为假基因,而倒位区域外的TPS基因则保留了正常的催化活性,仍可合成对植物具有重要生态和适应意义的萜类化合物。
姜科植物TPS基因的进化历史
为了进一步探究姜属其他植物中是否也存在串联重复杰玛烯(Germacrene)合成酶基因,研究人员首先对所有TPSs进行了鉴定,并根据其在姜科植物中的功能进行了分类。结果表明,杰玛烯合成酶基因在姜黄属物种中显著扩增(Fig6 a)。另外,在姜黄和女王郁金之间的共线区域也检测到了另一种串联重复的杰玛烯合成酶基因,该区域横跨倒位的内部和外部(Fig6 b-c),这表明杰玛烯合成酶基因的串联重复可能发生在姜黄属的共同祖先上。功能验证实验表明生姜和姜黄属中的基因均具有催化活性(Fig6 d)。
最后,研究人员用一个模型总结了本文的发现,说明了倒位是如何影响基因组特征的(Fig7)。倒位打破了串联重复的TPS基因,并导致倒位中的基因经历较少的遗传约束。具体来说,倒位内的重组被抑制,导致TEs的低效去除和有害突变,进而导致倒位内的假基因化和基因表达减少。尽管倒位中有足够多态位点,但其中的SNP不太可能受到选择。
总结
姜黄属以其药用和食用价值而闻名,其根茎中富含具有抗癌、抗炎、抗氧化作用的活性化合物。本文团队构建了高质量的单倍型姜黄属基因组,鉴定了物种间、物种内单倍型之间、物种内群体间的染色体倒位。这些倒位区域内的基因表达水平普遍较低,并具有更高的进化速率和TE含量。群体分析发现倒位抑制了重组、积累了有害突变,并含有更少的受选择位点。倒位区域内的萜类基因会经历假基因化而丧失功能。这种通过染色体倒位实现的调控机制有效调控了TPS基因的数量和功能,从而影响姜黄属植物中的萜类化合物的含量。这一研究不仅为姜黄属植物的功能基因组学研究提供了重要参考,也为其他植物中对于基因组结构变异如何影响次生代谢途径的研究开辟了新路径。该研究表明,由顺式调控变异介导的转录失调在某个亚基因组可能会引起同源表达偏差。尽管在纤维发育过程中同源基因的分区表达非常普遍,但在实际的育种过程中,只有不到三分之一与纤维质量相关的同源基因拷贝能够同时获得有利等位基因。这表明,通过亚基因组优化,即利用与同源表达分配相关的遗传调控位点的基因组修饰,纤维质量可能得到优化。最后研究人员指出,在分析农艺性状的遗传基础或鉴定功能基因时,应考虑多倍体作物的亚基因组对应物。
评论人:何青泰
校正:冯佳珺
编辑:曾新颖