单倍型解析的九倍体基因组为竹子的体外开花提供了新见解

文摘   2025-01-13 21:00   江苏  
摘要
木本竹类(Bambusoideae)以其多倍体和稀有的开花而闻名。乌脚绿竹Bambusa odashimae)是该亚科中染色体数最高(104条)的竹类之一,且在目前已测序的竹类基因组中具有最高的杂合度。与其他竹类相比,它能够有效利用外源激素调节体外开花,为竹类开花的激素调控提供了宝贵的见解。
本文生成了乌脚绿竹的单倍型解析基因组组装,尽管其基因组复杂且染色体数量较高,同时利用组织培养系统补充了来自11个发育阶段的33个转录组。
组装的基因组可分为单倍型I、单倍型II和单倍型III,每个单倍型包含A、B和C亚基因组。单倍型I可能源自牡竹属(Dendrocalamus),而单倍型II和III则与簕竹属(Bambusa)密切相关,表明乌脚绿竹的起源涉及属间和种间的杂交。高杂合度使得检测到丰富的等位基因特异性表达(ASE)成为可能,ASE基因在与细胞分裂素相关的通路中富集,可能与细胞分裂素促进开花的高效性相关。值得注意的是,研究发现CONSTANS(CO)基因可能是乌脚绿竹体外开花的关键调控因子。
总体而言,基于体外系统和高质量参考基因组的结合,本研究为揭示这种九倍体竹类的起源提供了重要见解,并将杂交与竹类的体外开花联系起来。
前言
Bambusoideae(竹类亚科)是禾本科(Poaceae)的一大类群,广泛分布于东亚、东南亚、非洲和拉丁美洲,约有1700种。作为一种快速生长、可再生的多年生森林资源,木本竹类在替代木材和碳固定方面具有高潜力。然而,与其草本亲属不同,木本竹类是异源多倍体,具有独特的开花行为,包括不可预测的开花时间、在长时间的营养生长阶段后群体开花,以及随后的竹丛死亡。了解木本竹类的多倍化和开花机制具有重要的理论和实践意义。
木本竹类的多倍体水平尚不明确,某些古热带木本竹(PWB)种,如乌脚绿竹(B. odashimae),在细胞学研究中被发现具有104条染色体,这也是竹类中报告的最高染色体数。根据PWB的染色体数,推测它们可能表现为非倍性(3n = 9x ≈ 104),并且这些物种还显示出非整倍性,例如,B. odashimae的染色体数为96、98、102或104
尽管多倍体植物具有抗逆境和增强活力等显著优势,B. odashimae因其美味的竹笋而备受欢迎,且在培养基中表现出良好的活力和开花与再生能力。细胞分裂素在竹类开花中起促进作用,而生长素则在体外开花中促进再生。然而,这些激素在调控竹类开花中的分子机制尚未探讨。
此外,缺乏该物种的基因组序列限制了对其体外开花的深入研究。早期的竹类基因组组装主要依赖于Illumina平台,而最近的单分子实时测序技术已用于组装不同多倍体水平的竹类的染色体级基因组。尽管技术有所进展,九倍性竹类的基因组尚未被测序。
为研究B. odashimae的多倍性和开花模式,本文通过结合第二代测序、Nanopore测序和Hi-C技术,报告了一个单倍型解析的染色体规模参考基因组。通过在独特的体外系统中进行基因组组装十一阶段的转录组测序,获得了有关九倍性竹类起源和木本竹类体外开花激素调控的重要见解。
结果
基因组组装和注释
本研究生成了总计105 Gb的短双端测序数据。根据k-mer分析,乌脚绿竹(B. odashimae)的估计单倍体基因组大小为1.04 Gb(补充图S1A),约为流式细胞术分析估计的基因组含量的三分之一(3.38–3.64 Gb)(表S1)。估计的基因组具有7.3%的杂合率。结合短双端读取、176 Gb的ONT(Oxford Nanopore Technology)长读取和352 Gb的Hi-C双端读取,最终生成了3.36 Gb的染色体级别组装,contig N50长度为14.81 Mb(表S2)。利用Hi-C数据,99.50%的contig成功分类并排列成104个染色体scaffold(图1A),这些染色体的大小从16到61 Mb不等(表S3)。
在基因组中共鉴定出141,732个蛋白编码基因(图1B),其中94.6%已进行功能注释(表S4)。此外,识别到2.37 Gb的重复序列,占基因组的70.54%,其中1898.41 Mb(55.18%)为完整的长末端重复序列(LTRs),包括563.85 Mb(16.39%)的Copia和618.31 Mb(17.97%)的Gypsy元素(表S5)。
为了评估乌脚绿竹基因组的完整性,进行了基准通用单拷贝直系同源基因(BUSCO)分析和核心真核基因映射方法(CEGMA)。结果显示BUSCO值为98.39%(表S6),CEGMA完整性评分为96.77%(表S7)。乌脚绿竹基因组的GC含量为44.5%(补充图S2A)。超过90%的组装转录本能够映射到基因组(表S8),LTR组装指数(LAI)评分为16.6(补充图S2B)。综上所述,这些结果确认了组装的高质量。
九倍体起源

本文通过水稻(Oryza sativa)与乌脚绿竹(B. odashimae)之间的全基因组基因顺序分析,推测乌脚绿竹可能是九倍体,显示出约1:9的比例(图2A和补充图S1B)。

乌脚绿竹与麻竹(Dendrocalamus latiflorus)和巨龙竹(D. sinicus)之间存在约3:1的同源关系(补充图S3和S4)。分析结果表明,乌脚绿竹的基因组由三个单倍型基因组组成,每个基因组包含A、B和C亚基因组。NUCmer的点图结果显示,在乌脚绿竹的同源染色体组中,有一条染色体与麻竹和巨龙竹的相似性高于其他染色体,从而推测其一个亲本物种可能来自牡竹属,并将这些染色体指定为单倍型I(Hap I)。

为探讨乌脚绿竹在簕竹属–牡竹属–巨竹属(Bambusa–Dendrocalamus–Gigantochloa)复合体中的可能关系,本文构建了一个叶绿体系统发育树,结果显示乌脚绿竹与绿竹(Bambusa oldhamii)为姐妹关系,且支持度较高(图2D)。

随后,利用来自绿竹的75 Gb细菌人工染色体(BAC)文库的Illumina测序数据,对乌脚绿竹的基因组进行映射,观察到Hap II与Hap III之间的同源染色体覆盖度存在显著差异(图2E),覆盖度差异超过10%的情况占88.2%。根据染色体的覆盖值(表S9),可以区分出Hap II(平均53.5%)和Hap III(平均35.8%)。

为进一步揭示三个单倍型基因组之间的关系,本文基于单拷贝直系同源基因重建了每组同源染色体的35个系统发育树,以水稻作为外群(图2B)。结果显示,Hap I(Bod∗1)与牡竹属的染色体形成一个支系,而Hap II(Bod∗2)和Hap III(Bod∗3)则在32个系统发育树中分别聚类。这些发现表明Hap I源自麻竹或其近缘种,而Hap II和Hap III则具有不同的起源。此外,本文在乌脚绿竹、绿竹、麻竹、巨龙竹、芸香竹(Bonia amplexicaulis)和水稻中识别出411个直系同源基因用于系统发育推断。分析结果显示,Hap I与麻竹的关系更为密切,而Hap II与绿竹关系更近(图2C)。

基于完整叶绿体基因组序列重建的系统发育树(图2D)提示,乌脚绿竹的母本可能是绿竹或与其密切相关的物种。

综上所述,研究结果表明,Hap I源自牡竹属,而Hap II和Hap III则源自簕竹属,其中Hap II来自与绿竹密切相关的物种,Hap III则来自更远缘的物种。

Hap I、Hap II 和 Hap III 的比较分析

本文对单倍型I(Hap I)、单倍型II(Hap II)和单倍型III(Hap III)的组装大小进行了分析,结果分别为1.24G、1.06G和1.03G。值得注意的是,Hap I的染色体在同源组中大多数为最大(补充图S5)。BUSCO分析显示,Hap I、Hap II和Hap III的保守基因覆盖率分别为99.3%、93%和94.5%(表S10),表明Hap I的基因组在三种单倍型中最大且组装最好。单倍体基因组的顺序分析显示不同单倍体基因组对之间具有较高的顺序保守性(补充图S6和S7)。
然而,等位基因对的相似性分析显示,Hap II与Hap III的等位基因对在34组等位基因中表现出显著更高的相似性(补充图S8),表明这两个单倍型来源于同一属,具有更高的相似性。此外,相较于Hap I,Hap II和Hap III分别检测到93和154个缺失、111和149个插入,以及22和29个倒位,表明Hap III在结构变异(SVs)方面比Hap II更为丰富。
体外开花与再生

本文对乌脚绿竹(B. odashimae)的节点外植体进行了诱导生长,采用添加细胞分裂素的Murashige和Skoog(MS)培养基,成功实现了大约5个月内的体外开花。根据亚培养时间、解剖分析、石蜡切片检查以及叶片和芽的数量,诱导的开花被分为三个阶段(补充图S9A、S9B和S9F)。

前四代(TM01–TM04)代表营养阶段,第五和第六代(TM05和TM06)标志着花的过渡,而后两代(TM07和TM08)则表示生殖阶段。对穗的进一步检查显示出完整的花结构(图3A)。

应用生长素诱导了乌脚绿竹的营养芽再生。在TM08的花序簇中,施加生长素于MS培养基(NM),成熟后掉落,随后出现新的营养芽(补充图S9E),表明乌脚绿竹植株重新转回营养生长。开花后再生的芽在不添加任何植物生长调节剂(CK)的MS培养基中可维持营养生长超过3年而不开花(补充图S9D)。同时在MS培养基中添加细胞分裂素和生长素(BNM)会延迟开花诱导的时间(补充图S9C),至少推迟6个月,且开花时间有所变化。

本文在11个时期/处理下收集了芽,并随后进行了转录组测序。

同源表达模式

为了理解体外开花和再生过程中的亚基因组表达模式,本文在Hap I、II和III的三个亚基因组中分别识别了4299、3223和3299个同源基因三元组(1:1:1)。

在Hap I中,与A和B亚基因组相比,C亚基因组的表达基因比例更高,平均表达水平最高,尽管其基因数量最少(图3D,表S11)。在Hap II和Hap III中也发现了类似的结果(补充图S10A和S10B),与其他已测序的六倍体竹类植物的发现一致[3]。

主成分分析(PCA)显示,转录组主要按亚基因组聚类,其次是不同样本(图3B)。

在每个单倍型基因组中,大多数同源基因表现出平衡表达,而少数基因则表现出表达偏倚(表S12)。然而,三个单倍型之间的表达偏倚并不一致。例如,来自A和C亚基因组的同源基因的差异表达分析表明,在Hap I中,C亚基因组在所有样本中均表现出较多的上调基因。相反,Hap III则表现出相反的模式(图3F)。

因此,乌脚绿竹(B. odashimae)的亚基因组表达模式与其他六倍体竹类植物相似[3],但在不同单倍型之间存在轻微变化。

大量的ASE基因

本文研究了乌脚绿竹(Bambusa odashimae)中大多数基因的三种等位基因的遗传情况,分别来自其父本基因组Hap I、II和III。通过分析25,953个等位基因的表达,主成分分析(PCA)显示转录组受单倍型基因组影响(图3C)。

尽管Hap I来自牡竹属(Dendrocalamus),其基因数量最多,但表达水平明显低于Hap II和Hap III(图3E)。此外,B. odashimae的A亚基因组中,3号染色体缺失同源染色体,其平均表达水平在A亚基因组中最高(补充图S10C)。

为探讨等位基因特异性表达(ASE)基因的特征,本文将其分为三类

1)无差异的平衡型(P ≥ 0.05);

2)大ASE基因(差异倍数(FC)> |2|,在任一对等位基因中P < 0.05);

3)其余为小ASE基因(FC ≥ |2|,P < 0.05)。

在开花和再生过程中,大ASE基因的比例最小(14%–19%)(图3G)。在三对大ASE基因中,有两对表现出显著的ASE,占56%–59%(表S13)。

在所有阶段,共有10,313个基因表现出大ASE,占总等位基因的40%,远高于高度杂合的苹果(19%)和栽培姜(22.7%)[19][20]。开花诱导期间,ASE基因的平均数量(33.90%)高于再生诱导期间(28.77%),表明在开花过程中等位基因的差异表达更为显著。小ASE基因的绝对转录丰度高于大ASE基因(图3H),这表明等位基因表达水平的下降可能导致大ASE基因的出现。

此外,本文调查了转座元件(TE)与等位基因表达差异的关联,发现大ASE基因的等位基因与TE的距离显著更近(图3I)。

Hap I与Hap II/Hap III属于属间杂交,而Hap II与Hap III则属于种间杂交,进一步分析显示Hap I与Hap II/Hap III之间的大ASE基因数量远多于Hap II与Hap III之间的大ASE基因(图3J),这表明属间杂交更容易产生更多的ASE基因。对ASE的TE距离分析发现,Hap I的ASE与TE的距离显著更近(图3K)。

此外,大ASE基因在细胞分裂素代谢过程和激素水平调控中也表现出富集(补充图S10D)。

细胞分裂素相关基因在诱导开花中发挥着重要作用

在已发表基因组的12种竹类植物中[3, 14, 16]*,仅有三种植物,即乌脚绿竹(Bambusa odashimae)、勃氏甜龙竹(Dendrocalamus brandisii)和麻竹(D. latiflorus)能够通过细胞分裂素(cytokinin)诱导体外开花[9, 11, 21]。乌脚绿竹、勃氏甜龙竹和麻竹共享2412个独特基因(正交组)(图4A)。

对这些基因进行KEGG富集分析显示,它们富集于关键通路,如植物激素信号转导(与细胞分裂素相关的基因)(补充图S10E和S10F)。研究发现,与细胞分裂素相关的基因表现出不同类型等位基因特异性表达(ASE)。例如,CKX9和RR8基因在开花再生的各个阶段均表现出偏倚表达,而RR4和CKX2基因则在某些阶段表现出等位基因特异性表达(图4C)。

这些结果表明,与细胞分裂素相关的基因对诱导开花至关重要,且ASE显著影响细胞分裂素的表达。

为了更好地探讨外源细胞分裂素的影响,本文识别了五个与细胞分裂素相关的基因家族并建立了表达谱(图4B,补充图S11)。响应调节因子(RRs)基因家族的基因数量相较于巨龙竹(D. sinicus)及其他相关物种更为丰富,表明该基因家族发生了扩展(表S14)。

此外,研究发现,在细胞分裂素诱导的开花过程中,许多基因在细胞分裂素通路中上调,而在生长素诱导的再生过程中则下调(图4B,以及补充图S11和S12)。

*原文中写道是12种,其实按照参考文献[3, 14, 16]应该是13种竹子。

COLs基因家族与开花和再生的激素调控相关

本文对乌脚绿竹(Bambusa odashimae)在不同体外开花阶段(TM01–TM08)和MS培养基上的营养芽(CK)进行了差异表达分析,识别出总共13,962个共享差异表达基因(补充图S13)。通过加权基因共表达网络分析(WGCNA),识别出14个WGCNA模块(图5A和补充图S14)。

结果表明,“蓝色”模块可能与激素介导的开花和再生调控密切相关。在细胞分裂素诱导的开花过程中(TM01–TM08),该模块显著下调,而在再生过程中(NM)显著上调,且在细胞分裂素和生长素共同施用时(BNM)表现出中等表达水平。

此外,“绿色”模块在细胞分裂素诱导的开花过程中逐渐上升(图5B),与开花基因FLOWERING LOCUS T(FT)和MADS15同源基因的表达模式相关,而“蓝色”模块则与CO、COL10和COL4的表达模式紧密对齐(图5A),表明细胞分裂素和生长素影响关键的开花基因(图5C)。

“蓝色”模块包含2051个基因,并根据KEGG富集分析显示在光合作用和生物钟中富集(补充图S15)。在“蓝色”模块中,CONSTANS-like(COL)基因家族的COL4、COL5和COL10与CO基因共表达(图5D)。

研究表明,COL基因参与光周期依赖性开花[22]。在乌脚绿竹基因组中识别到91个COL基因拷贝,并构建了邻接树(补充图S16)。热图(补充图S17)显示COL基因的表达模式与CO基因相似,受细胞分裂素抑制而受生长素促进。

为验证RNA测序(RNA-seq)结果,本文通过实时反转录PCR(qRT-PCR)确认了20个相关开花转变基因的表达模式(补充图S18)。CO基因在昼夜节律与开花控制之间起媒介作用[23]。识别了六个CO等位基因(BodCO_1–BodCO_6),其中BodCO_1、BodCO_2和BodCO_3位于B亚基因组,而BodCO_4、BodCO_5和BodCO_6位于C亚基因组。

表达模式显示BodCO_4、BodCO_5和BodCO_6受激素严格调控(图5E),而BodCO_1、BodCO_2和BodCO_3在不同培养基中的变化不显著。这表明BodCO_4、BodCO_5和BodCO_6在激素调控开花和再生中发挥作用,而BodCO_1、BodCO_2和BodCO_3则不同。

通过对水稻(Hd1)和乌脚绿竹六个CO等位基因的蛋白质序列进行全局序列比对,发现BodCO_4、BodCO_5和BodCO_6等位基因相比于BodCO_1、BodCO_2、BodCO_3和Hd1缺失了11个氨基酸(图5F),这一缺失可能影响蛋白质的结构和功能。

此外,BodCO等位基因的顺式调控元件(CRE)可能在基因表达调控中发挥作用。CATbox(GCCACT)存在于BodCO_4、BodCO_5和BodCO_6中,但在BodCO_1、BodCO_2和BodCO_3中缺失。同时,光响应CRE(Box 4,ATTAAT)存在于BodCO_1、BodCO_2和BodCO_3中,但在BodCO_4、BodCO_5和BodCO_6等位基因中缺失(补充图S19)。

这些结果表明,CAT-box和Box 4是潜在的调控因子,可能导致这些CO基因的差异表达。

讨论

本文探讨了多倍体在木本竹类起源和进化中的广泛存在,特别是乌脚绿竹(Bambusa odashimae)作为一种九倍体竹类的基因组为进一步研究竹类的异源多倍体化事件提供了参考。除了乌脚绿竹外,其他五种木本竹类(PWB)也被报告具有104条染色体,这可能与相似的起源模式有关。Bambusoideae的基本染色体数推测为12[24]。重建的古竹类核型(ABKs)显示热带木本竹类的C亚基因组经历了频繁的染色体重排[3]。根据PWB的70条染色体,2n配子与1n配子的组合可能导致九倍体(105)

九倍体的乌脚绿竹在亚基因组中表现出三倍体特征,并且是一个单倍体。因此,假设九倍体可能在异源多倍体形成中起桥梁作用,而单倍体则作为中间体,这是竹类多倍体化的一个可能机制。文献回顾表明,竹类的体外开花通常伴随杂交,主要来自于复杂进化历史的Bambusa和Dendrocalamus属[27]。在已测序的竹类基因组中,乌脚绿竹、勃氏甜龙竹(Dendrocalamus brandisii)和麻竹(D. latiflorus)能够进行体外开花,并且具有较高的杂合度。

它们的共享独特基因富集于与细胞分裂素相关的基因。本研究发现,杂交的乌脚绿竹在细胞分裂素相关通路中富含许多等位基因特异性表达(ASE)基因,可能影响对外源施加的细胞分裂素的响应。40%的等位基因在体外开花和再生过程中表现出ASE,表明ASE对基因表达的影响值得关注[19]。

此外,ASE基因在杂交竹类中的作用长期被忽视,主要是由于缺乏单倍型基因组。研究结果建立了杂交与乌脚绿竹开花诱导之间的潜在联系,为体外开花系统增添了价值。木本竹类具有独特的开花行为,长期以来被视为植物中的“谜”[2]。目前关于竹类开花的报告仍然较少[28, 29]。乌脚绿竹是研究竹类体外开花的良好范例,尽管其基因组复杂。通过基因组测序,可以为识别基因、转录组分析和理解等位基因表达差异提供参考,这有助于揭示分子机制。

研究发现,细胞分裂素和生长素对关键开花基因(如COL基因)的表达具有相反的影响,表明细胞分裂素通过抑制COL基因表达促进开花,而生长素则通过增强COL基因表达促进再生。在自然界中,CO基因的表达在竹类开花期间下降[30],在体外开花中也表现出相同趋势。推测木本竹类的长期营养生长可能与其保持高水平的CO基因表达有关,从而抑制开花过程。这些发现为研究竹类开花和营养再生的遗传和分子机制提供了宝贵工具,尤其在竹类植物的生命周期较长的情况下。

总之,乌脚绿竹的体外开花系统与参考基因组为研究异源多倍体化、属间和种间杂交及木本竹类的开花机制提供了良好机会。本研究为解决竹类开花的“谜”提供了重要见解,并为进一步的基因功能分析奠定了基础。

参考文献

Yu-Jiao Wang; Cen Guo; Zhao Lei; Ling Mao; Xiang-Zhou Hu; Yi-Zhou Yang; Ke-Cheng Qian; Peng-Fei Ma; Zhen-Hua Guo; De-Zhu Li. Haplotype-Resolved Nonaploid Genome Provides Insights into in Vitro Flowering in Bamboo. Horticulture Research 2024, uhae250, doi:10.1093/hr/uhae250.

智慧识竹
和小周周一起学习新知识,探索更多的未知世界吧
 最新文章