摘要
双星藻纲植物(Zygnematophyceae)是陆生植物的藻类姐妹谱系。在这里,我们对四份丝状双星藻纲植物的基因组进行测序,就包括三份环脊双星藻(Zygnema circumcarinatum)不同藻种的染色体水平的基因组。我们推测双星藻纲植物和陆生植物的祖先就已经具有了用于登陆的性状:包括信号级联(signaling cascades),环境响应和多细胞生长相关的基因发生扩张。双星藻纲植物和陆生植物共享细胞壁合成和再修饰的所有主要酶,基因增益(gene gains)塑造了这个工具包。共表达网络分析揭示了将环境信号转导与多细胞发育程序相结合的基因队列(gene cohorts)。我们的数据揭示了6亿多年前的链型藻类(streptophyte)在进化过程中平衡环境响应和生长调节的分子基础。
引文
植物的登陆改变了地球的表面环境。大约5.5亿年前,第一批陆生植物(有胚植物,Embryophyta)开始出现,它们属于链型植物(Streptophyta)中的一个分支。在链型藻类的六个纲(classes)中,双星藻纲植物是陆生植物最近的近亲,该纲包括超4000个已被描述的种,并分成5个目(orders)。到目前为止,仅有单细胞的双星藻纲植物基因组序列可获取。
双星藻纲植物具有抵御和适应陆地环境压力的能力,这些陆地环境压力包括干燥缺水,紫外线辐射,低温冻害及其他非生物胁迫。这些对胁迫响应的特性在生物学上具有非常重要的意义:曾经被认为是陆地植物特有的各种蛋白所对应的直系同源基因群(orthologous groups,OGs)最近被推断在有胚植物起源之前就已经存在。准确推断第一批陆生植物祖先的发育和生理程序取决于我们在其姐妹谱系——双星藻纲植物中能否发现存在类似的发育程序。
在这篇文章中,我们报告了首批四份丝状双星藻纲植物的基因组,包括第一个链型藻类染色体水平的基因组组装。基于比较基因组学分析,我们指出了最早期的陆生植物在遗传上的创新。我们的网络分析揭示了陆生植物和双星藻纲植物最近共同祖先中(last common ancestor, LCA)扩张和新获得的因的共表达(co-expression)情况。我们揭开了平衡环境响应和多细胞生长机制背后的进化根源,即这些特性最早是从哪个谱系中起源的。
结果
1、第一份链型藻类染色体水平基因组
图1 双星藻的细胞结构,基因组特征,以及与其他植物和藻类基因组的比较分析
2、最小的已测序链型藻类基因组
3、双星藻纲植物中富集到的直系同源群和结构域
图2 藻类与陆生植物的比较基因组学分析
4、通过基因扩张提高复杂性和抗逆性
5、多细胞特性与蛋白结构域组合
图3 绿色植物谱系中单细胞与多细胞物种中的蛋白结构域
6、新获得基因促进了重大的细胞壁创新
图4 蛋白家族分析揭示了细胞壁创新
7、共表达分析将环境与多细胞生长联系起来
图5 陆生植物标志性的特化代谢和TFs的系统发生分布与基因共表达模块
8、植物激素通路的进化
9、植物登陆期间微外显子的进化
图6 在16份植物和藻类基因组中微外显子的预测
讨论
我们组装了陆生植物的姐妹谱系——四份丝状藻类植物的染色体水平基因组,并进行了全面的比较基因组学和共表达网络分析。我们发现了与信号转导、环境响应和生长相关的分子创新,并通过沿着链型植物的系统发育骨架来追踪扩张的基因家族,并确定它们的进化史。祖先基因内容重建是解释植物形态和功能进化,以及生物学创新的有力手段。我们的数据揭示了双星藻纲植物基因组的进化动态 (图2a) ,强调了了对系统多样性物种集(phylodiverse species set),以及互补比较的整合方法来理解陆生植物和藻类最近共同祖先的本质的需求。
在它们的进化历史上,双星藻纲植物在多细胞和单细胞之间经历了数次转变。一个简单的解释是,链型植物共享一个古老的多细胞工具箱,这个工具箱在丝状植物属中发挥作用,但仍然作为遗传潜力在双星藻类植物(zygnematophyte)的单细胞谱系中存在。事实上,我们关于共享OG扩张的数据恢复了双星藻纲植物的Z + E最近共同祖先中增加细胞复杂性的几个重要调控基因。虽然我们恢复了一些新获得的,丢失的,重新组合的特定的蛋白结构域,可能支持了丝状生长,但似乎更有可能的是,来自共享的多细胞工具箱的调节是丝状藻体进化的关键因素。
陆生植物的一个决定性特征是它们的多细胞体的可塑性发育,并通过调整以适应环境。参与多细胞和环境应激反应的基因之间的高度连通性为多细胞形态发生的适应性优势奠定了基础,在多细胞形态发生中,细胞分化可以通过微调以适应环境信号。
共表达的基因通常是功能相关的,并在遗传中通过协同发挥作用。我们恢复了内在的生长发育程序,如生长和发育,细胞分裂和细胞壁的生物合成/重塑,以及由外部输入触发的在环境感知和信号传导中起作用的基因。在一个相互连接的模块中,有一个隐含的方向性(从外部或从环境到内部)。就其性质而言,信号蛋白必须在遗传层次中起作用(通过激酶级联转导),转录因子(TFs)也是如此 (必须有上游和下游) 。两者都与内在的生长程序共表达,从而揭示了内部和外部之间的联系,表明基因共同作用于感知环境和调节生长,并揭示了植物和藻类细胞中分子信息处理的遗传网络。这个网络有很深的进化根源,至少可以追溯到Z + E的祖先。
我们的数据证明了感知环境信息并作出响应的植物信号级联的深层进化起源,并表明在有胚植物开始征服土地之前,来自外部环境信息的输入和内在发育程序之间的相互联系与生长调节之间存在着很深的保守性。
About this article
相关推荐:
关于
Forestry Research
赶紧加入
ForRes交流群