Nature Genetics | 中科院昆明植物所李德铢团队构建11个竹子基因组解析亚基因组优势动态演化机制

文摘   科学   2024-03-16 00:11   湖北  

  点击蓝字 关注我们        



多倍性(基因组复制)是进化的关键力量,然而,多倍体细胞核中亲本基因组之间的相互作用(通常涉及亚基因组优势)研究甚少。人们通常所说的禾草为均为草本植物,而同属于禾草家族的竹子却是其中一个另类的木本成员。竹子隶属于禾本科竹亚科(Bambusoideae),全球约有1700种,经历了两个独立的四倍体化、然后六倍体化事件。竹子本身的演化有着许多未解之谜,如常用的“雨后春笋”来形容其生长速度之快,而竹子“捉摸不定”的开花周期,且开花后成片死亡的现象则被经常赋予某种神秘色彩。如何从一个小小的草本植物演化出高大、一次性开花的竹子,例如世界上最高大的巨龙竹最高可达37米以上,变化创新之剧烈在整个植物界所少见。因此,竹子为研究古代多倍体起源植物的亚基因组优势的演化提供了一个理想的模型。

2024年3月15日,中国科学院昆明植物研究所李德铢研究员团队在国际顶级期刊《Nature Genetics》上在线发表了题为“Genome assemblies of 11 bamboo species highlight diversification induced by dynamic subgenome dominance”的研究论文。该研究从头组装了11个代表性不同倍性的竹子高质量参考基因组,结合比较基因组、甲基化组和转录组等多组学联合分析,发现木本竹子基因组表现出惊人的核型稳定性,四倍体分支中具有平行的亚基因组优势,而在六倍体分支中逐渐转移优势;异源多倍化和亚基因组优势塑造了木本竹子的木质化茎秆、快速生长和同步花期特征的演化。


该研究选择了11种具有代表性的竹子为研究对象,包括2个草本竹子(HBs、2x)和9个木本竹子(WBs),其中木本竹子包括3个分支:温带(TWBs、4x)、新热带(NxWBs、4x)和古热带(PWBs、6x),古热带木本竹子Dendrocalamus sinicus是世界已知最大竹子,与草本竹子 Raddia guianensis形成鲜明对比。研究利用ONT+Hi-C的策略从头组装了这11个竹子的高质量染色体水平参考基因组,基因组大小平均分别为625.9 Mb(二倍体)、1,628.3 Mb(四倍体)和1,122.4 Mb(六倍体)不等Contig N50的平均值和最大值分别为5.3 Mb和17.5 Mb,平均94.1%的序列被分别一致锚定到二倍体、四倍体和六倍体的11、24和35条假染色体上。短读长数据的比对率、LTR组装指数(LAI>=10)和BUSCO值(93.2~99.0%)等评估均支持了这些基因组组装的高连续性和完整性。

图1 竹子的多样性及11个竹子基因组特征和共线性图谱

竹子的亚基因组是基于系统发育和序列相似性的策略来鉴定的。研究组建了两个同源基因数据集(“完美拷贝”和“低拷贝”同源基因)用于系统发育分析,WB中的A、B、C、D和HB中的H亚基因组在两个数据集中均得到一定的支持。由于基因树之间存在广泛的拓扑结构不一致,研究推断系统发育网络和假定的渗入事件,确定了B和C祖先之间的杂交,渗入分析也表明了H和A祖先之间的第二个网状结构事件。总的来说,研究提出了一个关于竹子起源和多倍体化的精细模型:木本竹类在起源演化历史上经历过数次多倍化事件,并且木本竹类二倍体祖先之间还发生过古杂交,全面阐明了竹类起源演化的网状络线。一举解决了困扰竹类研究多年的木本是否为单次起源的问题。

图2 主要竹子的起源与演化

虽然木本竹类的多倍化事件集中在21至12个百万年之间,可称之为古多倍化,但却展现出非常保守的核型演化特征,在亚基因组层面基本维持了禾本科祖先的12条染色体状态。大多数裂变和融合事件发生在H和C亚基因组中,HB中的这些事件在很大程度上是物种特异性的,但在C亚基因组中的许多基因分别由热带和温带分支中的不同物种共享,这表明尽管核型普遍稳定,但多倍体化在诱导基因组重排中可能起了作用。研究考察了亚基因组大小、重复基因丢失、转座子和甲基化结果发现C亚基因组在WB的四个亚基因组中展现出显著不同。大小上比 A 和 B 亚基因组小,但和D基因组差不多,这与TE含量密切相关深入分析发现亚基因组以及多倍体化后的四倍体和六倍体分支之间存在广泛不同的TE动力学。基因进化可以通过多倍体化突然改变,同时许多全基因组复制也会广泛丢失,结合上述分析结果共同表明,C亚基因组在两个四倍体分支中占主导地位,而A亚基因组的加入改变了六倍体竹子中的这种优势。

图3 竹子基因组的研究特征与演化

为了研究多倍体化后转录图谱的变化,随后,研究对11个竹子不同发育阶段不同组织的476个样本进行了转录组测序分析亚基因组在两个四倍体分支中,跨组织和物种的同源基因之间显示出一致的基因上调或下调模式,而在六倍体中差异很大。研究对分别代表TWBs和NWBs的P. edulisG. angustifolia的表达模式进行比较分析,结果表明C亚基因组比D或B亚基因组具有更多的上调基因此外,几乎所有采样组织中,这种偏差在所有四倍体竹子中都是一致的。在六倍体中,C亚基因组可能在早期(但不是后期)PWB进化中占主导地位。研究采用WGCNA分析探究了有偏向性的亚基因组的基因是否更有可能共表达,结果发现与四倍体中的B和D亚基因组相比,C共表达的基因更多。更重要的是,网络中的枢纽基因在C亚基因组中也过度表达;而在六倍体中,A亚基因组逐步含拥有更多的枢纽基因。这些结果进一步支持C亚基因组在具有独立起源的TWB和NWB分支中的优势,而在PWB进化过程中,优势似乎逐渐从C转移到A亚基因组。此外,显性表达可能在多倍体化后不久形成,并在WB中不断积累。

图4 多倍体竹子同源基因表达模式

在禾本科植物中,WB已经进化出独特的性状,包括木质化的茎秆和不频繁的开花。为了揭示WBs特殊性状起源的基因组基础,研究最后分析了WB演化过程中的基因家族、新基因和正选择基因(PSG)特征,结合萌发枝条和花序特异性表达基因鉴定到开花相关潜在基因,功能富集分析表明,在全基因组和亚基因组水平上,特别是C亚基因组的扩张基因家族主要与植物营养生长和发育有关(例如,“植物激素信号转导”和“苯丙素生物合成”)。研究进一步探究了竹子中木质素生物合成途径中的基因组变化,结果发现,相对于HBs,WBs中几乎所有的木质素相关基因都通过多倍化衍生出多拷贝,且COMTF5H1还呈现出串联重复现象,该途径中有31个基因,其中大多数经历了基因组变化,其中重点关注的COMT,在巨型竹子D. sinicus新枝木质化发挥了关键作用,它主要控制S单木质素的生物合成,这对禾草秸秆的强度至关重要。

图5 WBs的基因组演化基础

总之该研究首次在多倍体植物类群中报道的可能存在的亚基因组优势转移现象,为理解多倍体植物的演化机制开辟了研究新方向。通过扩张基因家族、特异表达、正选择和新基因等,优势亚基因组在木本竹类独特性状的形成上发挥了更加重要的作用,催生了木本竹类的适应性演化和大规模物种分化,使其成为整个禾草类群中的独特一支。

中国科学院昆明植物研究所马朋飞、刘云龙、郭岑、金桂花和郭振华博士为论文共同第一作者,李德铢研究员为论文通讯作者。该研究得到中国科学院战略性先导科技专项、国家自然科学基金、云南省领军人才计划等项目的资助。

原文链接:https://doi.org/10.1038/s41588-024-01683-0

内容编译:NoYoung
内容排版:水笔仔
校对审核:Mable

END


关注公众号



遗传、进化、育种
组学最新成果、案例
新闻资讯



遗传育种与组学
分子生物学组学技术(基因组学、转录组学、表观遗传、蛋白组学、代谢组学等高通量组学技术)在生物基因组遗传、进化、育种、疾病等领域的交叉应用介绍,传播最新的研究方法、成果及新闻资讯。