油茶基因组助力物种进化及农艺性状研究

科技   2024-11-09 18:45   湖北  

近日,中国林业科技大学袁德义团队及中国农业科学院深圳农业基因组研究所张兴坦团队在《Cell Reports》上发表了题为“The teraploid Camellia oleifera genome provides insights into evolution, agronomic traits and genetic architecture of oil Camellia plants”的文章,报道了四倍体油菜的高质量单倍型分辨基因组,其中基因组进化、单倍型变异、等位基因失衡和群体遗传学的综合分析为油茶植物的进化、农艺性状发育和遗传结构提供了重要的见解。


Background

油茶(Camellia oleifera)是中国特有的木本食用油料树种,与油橄榄、油棕、椰子并称世界四大木本油料植物,油茶在中国已有2300多年的种植历史,在食用、药用、工业和生态等多个方面具有重要的价值,其研究对于提升油茶产业的科技含量、增加经济效益和保障国家粮油安全等方面具有重要的意义。

多倍体化是指某物种通过染色体倍增的方式导致多套染色体共存于同一细胞核中,形成稳定遗传的新物种的现象,一直以来多倍体化都是基因组学研究中的重点问题。油茶主要包括四倍体(COL-tetra)和六倍体(COL-hexa),目前已经报道的二倍体基因组Nanyongensis虽然与油茶密切相关,但不足以全面研究多倍体基因组进化和重要农艺基因背后的复杂遗传基础,为此,本研究为COL-tetra生成了单倍型分辨的染色体水平基因组组装。


Results

1.基因组测序、组装、注释/多轮WGD驱动的多倍体进化

COL-tetra的体细胞有60条染色体,作者通过整合来自PacBio CCS HIFI读数的序列数据和来自Hi-C的物理作图信息来组装成为11.06 Gb(96.85%)的基因组序列包括15个同源组,具有四组单倍体染色体:A、B、C和D。

BUSCO(用于评估基因组组装和注释的完整性的工具)分析显示90.4%的保守基因被识别。三种方法确认COL-tetra为同源四倍体,共注释了56,609个基因和135,431个等位基因。BUSCO分析显示基因组完整性为95.0%。

作者使用来自7个物种的2085个单拷贝基因构建了最大似然(ML)树,表明COL-tetraC.lanceoleosa之间比茶树更接近,估计差异约为650万年,COL-tetra经历了三次全基因组复制(WGD),其中WGD1与山茶科共享,WGD2是近期事件,与脂肪酸代谢相关。COL-tetra与葡萄和C. sinensis、C. lanceoleosa有1-4和1-2的共线性关系。WGD1发生在46.88-63.02百万年前,而WGD2约在4.46-5.99百万年前。作者发现,尽管COL-tetra与茶树的基因组有强共线性,但存在大规模倒位。


2.基因组扩增和基因组重甲基化/与甲基化水平相关的等位基因失衡

COL-tetra基因组包含9,034 Mb重复序列,其中长末端重复逆转录转座子(LTR-RT)最丰富,占基因组的49.76%,共识别出48,538个完整LTR-RTs,插入时间分布显示LTR-RTs在0.1万年前爆发。

作者还发现,转座子元件(TE)密度与甲基化水平正相关,基因组中CG、CHG、CHH甲基化水平分别为94%、82%、13%,TE区域甲基化水平高于非TE区域,DNA甲基化有效抑制TE活性。因此LTR-RTs爆发驱动了COL-tetra基因组扩张,高含量TEs导致基因组高甲基化和基因区域甲基化水平改变,不同插入时间的TE活性被DNA甲基化有效沉默。

COL-tetra作为同源四倍体,其四种单倍型在非编码区、编码区和等位基因数量上表现出高相似性,但不同亚基因组间表达水平存在显著差异,揭示了同源染色体间的非平衡表达。这种非平衡表达在不同组织中均有观察到,包括不同发育阶段的种子。在叶组织中,约50%的四联体有一个被抑制的等位基因,而在其他组织如根、花中,平衡四联体的比例更高。

CHG和CHH甲基化水平在表达活跃的等位基因中较低,而CHH甲基化与基因表达正相关。这些结果表明DNA甲基化变化有助于四分体的表达差异,非CG甲基化与基因表达呈负相关,而基因上游区域的部分CHH甲基化与表达正相关。


3.与高CHH甲基化相关的种子发育和油脂生物合成

COL-tetra的种子发育过程中,DNA甲基化水平随着种子成熟而逐渐增加,与其他两个阶段相比,在种子1阶段的基因区间和2-kb侧翼区域中观察到较低水平的甲基化,尤其是CHH甲基化。此外,种子2中74%的平衡四分体来源于种子1中受抑制的四分体,表明从种子1到种子2的四分体表达发生了剧烈变化。此外,无论四分体中的等位基因表达是减少还是增加,启动子区域CHH甲基化水平会出现升高。

有1,242至1,444个等位基因在种子发育过程中CHH甲基化增加而表达减少,这些基因与种子油脂体生物合成、脂肪酸代谢和种子发育相关。COL-tetra种子中油脂含量丰富,主要为三酰甘油(TAGs),油含量高达40.35%。TAG生物合成途径中13个关键酶的22个基因与CHH甲基化变化相关。油酸是油脂含量的主要贡献者,尽管CHH甲基化水平从种子1到种子3阶段增加,但油酸生产的关键酶SAD表达无显著变化,而FAD2/3的表达则因CHH甲基化水平升高和转座子插入而显著下降。据推测,FAD2FAD3基因转录物中CHH甲基化和转座子插入引起的高表达SAD和较低表达水平的影响可能是油酸在油菜中较高积累的原因。


4.COL-tetra涩味的遗传基础

       与茶树相比,油茶因涩味而主要作为食用油源,其叶中含有与茶叶相似的成分。COL-tetra叶中富含原花青素(PAs),主要通过无色花青素还原酶LAR和花青素还原酶ANR合成,这些酶在成熟种子中低表达,可能有助于油茶油的脱涩味。CHH甲基化水平在这些基因的启动子区域在叶中较低,而在成熟种子中高,暗示DNA甲基化可能影响LAR和ANR的表达。COL-tetra叶中特有的高度没食子酰化可能是其不适合制饮料的原因。参与没食子酰化过程的丝氨酸羧肽酶样酰基转移酶(SCPL)基因在COL-tetra中显著扩增,与茶树92个SCPL、葡萄11个、拟南芥19个和杨树8个相比,COL-tetra基因组中有117个SCPL,且在油茶的年轻叶中偏好表达。Tajima’s D分析表明,这可能是油茶科植物中共同的定向选择。


5.油茶植物群体结构与遗传分化

通过对18种不同倍性的山茶属个体进行基因组重测序,产生了8.9 Tb的数据后,作者利用最大似然法构建的系统发育树将68个样本分为七个主要簇,显示了油茶属和亚属之间的密切关系,其中COL-tetraCOL-hexa被分入不同的簇。C. brevistylaCOL-tetra混合,表明COL-tetra可能起源于C. brevistyla的基因组多倍化。这一假设得到了GISH分析和IS分析的支持。PCA结果与系统发育树相似,COL-tetraCOL-hexa紧密但可区分。个体祖先分配估计显示,当K=4时,COL-tetraCOL-hexa无法区分,C. hainanicaC. vietnamensis呈现出五个二倍体物种的混合模式,当K值增至8时,除了C. sasanqua的一个样本外,所有多倍体物种都被分配到其祖先组分中,而C. brevistylaCOL-tetra仍然无法区分。

遗传分化(FST)估计和绝对分化(dxy)分析显示,C. yuhsienensis与其他群体存在高水平的遗传分化,其中1,424个高度分化区域的基因大多在C. yuhsienensis和其他油茶植物间共享。GO分析表明,这些共享基因中有19个和13个分别涉及分生组织从营养生长到生殖生长的转变和光周期性。C. yuhsienensis的花期比其他五种油茶植物晚,它们在前一年的10月至12月开花。遗传分化分析识别了C. yuhsienensisCOL-tetraCOL-hexa之间涉及光周期或春化过程的25个和22个高度分化基因,例如FT、CRY2、SOC1、FLCSVP等同源基因。其中,19个基因在两种比较中都有共享。所有28个基因的启动子和基因区域的基因型显示,C. yuhsienensis的模式与其他五种油茶植物不同,一些基因型在C. yuhsienensis中是固定的。


6.六种油茶植物的全基因组渐渗评价

       叶绿体基因组树显示C. brevistylaCOL-tetra聚类,但核基因组与叶绿体基因组树存在显著不一致,表明油茶植物间复杂的网状进化和基因流。TWISST分析揭示了油茶植物间常见的基因组拓扑结构。TreeMix分析鉴定了三个基因流事件。Patterson’s D和f4比率分析显示油茶物种间广泛的种间渗入。f-branch统计量显示C. oleiferaC. sasanqua间发生了祖先渗入事件。渗入片段分析揭示了与油脂生物合成、花器官发育和耐寒反应相关的基因,表明C. oleiferaC. sasanqua间的种间渗入可能影响了农艺性状和环境适应性的发育。


Discussion

该研究为加速油茶遗传改良、加深对油茶植物物种进化和利用的认识提供了宝贵资源和新工具。但如作者在文中提出,研究仍存在一些局限性,如尽管COL-tetra的单倍型分辨的染色体水平基因组组装质量很高,但由于高度重复的序列和高度相似的同源区域,它仍然具有数百个缺口和错误。此外,尽管系统发育和属级关系分析涵盖了山茶植物最全面的倍性分布,但可能仍然缺乏来自其他倍性的样本,如奇数倍性和超倍性,这些在山茶物种中尚未探索。 


原文链接:https://doi.org/10.1016/j.celrep.2024.114902


END

评论/编辑:王可婧

校对:吴智浩






















Autumn

Equinox



林木科学评论
聚焦林木科学与技术前沿,分享创新热点评论,服务林业科技提升。
 最新文章