MBE | 不稳定环境和全面基因丢失的适应性:基于May-Wigner理论的小而稳定的基因网络

科技   2024-12-03 23:39   四川  

2024年3月20日,中山大学生命科学学院生物防治国家重点实验室与植物资源重点实验室何子文教授团队于Molecular Biology and Evolution上发表了一篇题为“Adaptation in Unstable Environments and Global Gene Losses: Small but Stable Gene Networks by the May–Wigner Theory”的研究论文,该研究以生长在复杂潮间带环境中的红树林为研究对象,使用红树林与内陆近缘种之间基因组、转录表达比较以及基于May-Wigner理论模型推测的方法,提出了红树林大规模基因丢失在适应性进化中发挥关键作用的预测假设,创新性的讨论了红树林为了维持基因网络稳定而发生的进化变化。



背景

人们所熟知的遗传改造是通过基因重复或全基因组重复(WGD)增加遗传物质,即通过增加基因表达或进化出新功能来促进适应。而另一个概念,基因丢失被认为是一个退化过程,是指不再使用的特定基因和性状。比如:寄生植物非肉食性营养获取和光合作用相关基因的数量显著减少。许多研究表明,基因丢失的基因拷贝数变化能够改变基因剂量,在适应性进化中具有巨大潜力,被称为“少即是多”的假设。但目前大规模的基因丢失是中性还是适应性的仍然存在争议,难以解释的是,一般性的基因丢失似乎并不与环境相关。例如,在后生动物和细菌中发生的成千上万的基因丢失,以及植物在经历WGD后发生的广泛基因丢失。那么,大规模基因丢失的适应潜力到底是什么呢?

红树林是生长在潮间带环境中的木本植物。作为动态的陆海交界面,潮间带是最不稳定的环境之一,表现出波动的盐度、水涝等特征,这种复合环境几乎是独一无二的。由于红树林植物能够忍受广泛的环境压力,很多人倾向于假设红树林是通过增加基因组复杂性来实现复杂环境耐受的。然而,先前的研究表明,红树林植物的基因组大小和基因组已经简化。因此,研究人员以红树林为模型,探讨解释大规模基因丢失的可能驱动力。

之前的研究表明,与表型性状进化相关的基因丢失数量应该是有限的。因此,研究人员假设红树林栖息的最不稳定的环境可能是主要的驱动力。研究人员基于生态网络稳定性的May-Wigner理论(MWT),该理论认为大型且高度连接的网络,如食物链,是不稳定的。并且随着网络连接互动强度或变量数量的增加,不稳定性也趋于增加。而基因丢失对应着较小的网络,则可能会增加基因调控网络的稳定性。即在持续的环境扰动下,保持基因调控网络(GRN)的稳定性可能是红树林应对波动剧烈的潮间带栖息地的主要挑战。

在这项研究中,研究人员进行了以红树(Rhizophora mangle)为代表的红树林比较基因组分析。研究发现,在七个独立的红树林类群中,基因数量减少的趋势较为普遍。因此研究人员通过首先识别出与关键适应性性状相关的基因丢失,然后测试大规模基因丢失是否可以增加基因调控网络(GRN)的稳定性来解释红树林强环境适应是否与基因丢失有关。

研究内容


结果一:快速基因丢失和抑制基因重复在红树林中的作用

研究人员对四个红树林物种(Ceriops tagalCeriops zippelianaKandelia candelRhizophora mangle)以及一个关系很近的内陆物种旁杞木(Carallia pectinifolia)进行了基因组测序,这些基因组具有高质量和完整性(表1)。研究人员查阅资料发现红树林物种分化分为四个属:Rhizophora(六个物种)、Bruguiera(五个物种)、Ceriops(五个物种)和Kandelia(两个物种)。通过使用单拷贝基因家族序列重建了系统发育树,并通过化石对分化时间进行了校准推测,研究人员发现红树林物种侵入潮间带大约发生在5080万至4780万年前(Ma),这一时间与之前研究的结论一致(图1)。这一时期与早始新世的高温事件(55至51 Ma)相吻合,海平面上升可能促进了红树林的扩散并扩大了它们的栖息地。随后的气温下降使海平面下降,隔离了存活的种群,促进了它们演化成不同的物种。结果还表明了潮间带的高波动及其对红树林生存和分化的广泛影响。

研究人员发现红树基因组远少于它们的内陆亲缘物种(图1)。将其与82种核心双子叶植物进行比较后,发现这八种红树林物种是基因数最少的物种之一。与具有同样WGD事件的内陆近缘植物相比,红树林平均少了8400个基因。

基因数量的减少可能是由于基因加速丢失或起源缓慢引起的。研究人员通过检查串联基因重复来评估基因重复率。在4种内陆物种中平均鉴定出约5101个串联重复,而在8个红树林中仅鉴定出约1603个,表明红树林基因重复率较低。研究人员通过识别WGDs后的基因丢失来粗略评估基因丢失,发现红树林比具有相同WGD事件的旁杞木保留了更少的基因重复,表明基因丢失率较高。结果表明,基因丢失和抑制基因复制减少了红树林的基因数量。



结果二:多个红树林物种间基因数量广泛减少的共同趋势

研究人员调查了除红树外,其他6个分支红树林进化支系的基因含量。在分析的20棵红树林中,19个基因组的基因数量比内陆近缘种少,这些进化枝的基因数量有显著下降的趋势(图2,P = 1.04×10−7),这一趋势在同一类群的在红树林中是保守的,不受不同类群进化情境的影响。不管有没有经历WGD事件,所有这些红树林物种的基因数量都少于它们的内陆亲缘物种。

此外,6个红树林分支都具有较低的串联基因复制率。并且研究人员检查了叶片中表达基因的数量发现了红树林物种的基因数量较少,这一结果确认了红树林类群中基因数量减少的共同趋势。这个共同的趋势使得假设基因数量的减少是环境进化中的一种适应性策略变得合理。


结果三:基因丢失和高盐度耐受性

红树的一个重要创新性性状是胎生种子,即在种子与母体植物分离之前就开始萌发(图3a),这种特征增加了种子的存活率。研究人员发现,相较于其内陆亲缘物种,红树中参与种子休眠和成熟的基因拷贝较少。四个参与种子贮藏的基因家族几乎在红树中完全丢失或显著减少(图3b和3c)。与抗干旱耐受性相关的基因也在红树中显著减少(图3b)。调控种子成熟和休眠的途径在红树中经历了基因丢失。比如,LAFL网络是种子成熟调控过程中的关键组成部分,包括LEC1LEC2FUS3ABI3等基因。在红树中,LEC1/2基因的减少可能改变了这一网络,导致种子停止积累贮藏物质,并更早开始萌发。

脱落酸(ABA)是植物主要的激素,控制着种子休眠。研究人员发现调控ABA信号转导的基因,如DOG1GEA6,在红树中缺失(图3b和3c)。DOG1蛋白通过结合AHG1并释放SnRK2,积极调节ABA信号和种子休眠(图3c)。GEA6蛋白则在干燥阶段保护胚胎。这些途径中的基因丢失可能会阻断种子休眠,导致胎生种子的产生。尽管一些如CYP707A1这类基因扩展了它们在ABA代谢中的作用,但基因家族大小的减少在红树的胎生种子进化中起到了更为关键的作用。



结果四:基因丢失与高单宁含量

单宁是植物中常见的类黄酮聚合物,其抗氧化活性是应对潮间带环境氧化应激的主要机制。研究人员比较发现,红树的叶片和茎部的单宁含量显著高于内陆亲缘植物(图4b),但暂未发现导致不同物种单宁生物合成的基因拷贝数发生显著变化。在表达水平上,研究人员发现红树中大多数单宁生物合成关键基因的表达量明显较高,如LARANR基因(图4c)。并且红树中消耗单宁的基因拷贝数显著减少(图4a)。这些基因通过消耗单宁的前体来合成黄烷醇和黄酮,比如编码黄烷醇合成酶II(FNS II)、黄酮合成酶(FLS)的基因以及促进类黄酮氧化聚合但TT10LAC15基因。在内陆亲缘植物中,TT10通过串联复制扩增至3至12个拷贝,而在红树中仅保留了1个拷贝(图4a)。减少TT10家族基因可能会减缓无色单宁的氧化过程,从而积累更多单宁。同时,红树中FNS II基因在叶片和茎部的表达水平,TT10在茎部的表达水平,均显著低于内陆亲缘植物(图4c)。因此,单宁合成基因的高表达,消耗单宁或其前体的基因拷贝数和表达的降低,共同促成了红树中高单宁含量的形成。




结果五:基因丢失对红树林环境耐受及其进化的影响

寄生植物、食虫植物等由于性状退化,已被报道存在显著的基因数目减少,包括大多数内陆植物中共同保守的核心位点。然而,在红树中,尽管基因数量较少,大多数(95.2%至97.8%)核心双子叶植物的基因仍然以完整的结构存在。受剂量平衡的限制,参与核心过程和维持基本功能的基因家族在拷贝数和序列上高度保守,而较大的基因家族更可能包含冗余基因。研究人员通过使用变异系数(CV)测量了基因拷贝数的变异性,发现在内陆植物中拷贝数变异性最大的基因家族更容易在红树中丢失重复基因(图5a)。所以,红树更倾向于丢失非必需基因,但会保留基本过程所需的基因。

研究人员接着分析了与基因丢失相关的分子功能和生物通路。鉴定了2670个基因家族,这些家族在红树中的基因数量比内陆近缘植物少了两倍以上。在基因减少的家族中,六种生物过程格外显著:对生物刺激的响应、缺氧响应、激素响应、次生代谢过程、细胞壁组织以及细胞死亡(图5b)。这种与生物胁迫响应相关的基因丢失可能是有益的,因为在这些压力大且波动的环境中,病原体相对较少,并且非生物胁迫通常会诱导生物胁迫响应基因,导致不必要的表达波动。脱落酸(ABA)和水杨酸(SA)参与多个胁迫过程,而响应这些激素的基因也有所丢失。这些结果表明,基因丢失集中在与环境相互作用密切相关的过程中。

红树林起源于约5000万年前,随后分化为18个物种。那广泛的基因丢失是否与栖息潮间带的环境有关,或者是否在红树林进化过程中持续发生?研究人员根据基因家族树上的基因存在或缺失信息推测了基因丢失事件。在17,352个基因家族中,发现红树的平均丢失事件高于内陆近缘种(图5c)。推测红树林在分化为四个属的阶段,基因丢失持续以高频率发生。相应地,研究人员发现不同红树林物种的基因丢失有所不同。只有30%的基因丢失事件在四个属的物种中是共享的(图5d)。因此,红树林的大规模基因丢失并不是一个发生在共同祖先中的单一事件,而是随着红树林进化的持续过程中的现象。


结果六:基于May-Wigner理论框架的基因丢失和GRN稳定性

May-Wigner理论(MWT)核心观点是,大型且复杂的系统是不稳定的。研究人员基于该理论的公式,通过模拟测试了小型网络更稳定的假设。在模拟中,研究人员改变了基因数目和网络的复杂度,与假设一致,GRN的稳定性随着基因数目或网络复杂度的增加而下降(图6a)。红树林中的基因丢失模式与模型预测一致,表明基因丢失通过减少关键基因的数量,简化了基因调控网络(GRN),并可能缓解环境波动对网络稳定性的影响。当研究人员将基因丢失映射到拟南芥时,发现基因丢失事件中有2,624次发生在一个包含6,411个基因的可靠连接网络中。并且这些丢失主要集中在超过一半的多拷贝大型基因家族中。因此,基因丢失导致的子网络的简化可能最小化了对生长和发育的影响。更重要的是,基因丢失从潮间带栖息地到近期物种分化过程中持续发生,这表明基因丢失可能主要是由波动的环境驱动的,而不是与表型特征相关的。

研究人员直接测试了红树林基因调控网络(GRN)在经历基因丢失后是否更稳定。他们观察到了红树林中广泛的转座子(TE)丢失。短期环境胁迫会激活TE,诱导胁迫响应转录本并导致GRN的不稳定性。所以,TE和基因丢失可能在环境变化下促进了GRN的稳定性。为了检验这一假设,研究人员在不同盐度条件下研究了TE和基因的表达。红树林的基因组较小,包含的TE数量也比大多数植物类群少。其完整长末端重复反转录转座子(LTR-RTs)的数量也显著少于内陆近缘种C. pectinifolia。研究人员用0和250 mM NaCl处理C. pectinifoliaRhizophora apiculata(红树林中的一个种),比较了两种盐浓度下的基因表达变化。250 mM NaCl处理后,C. pectinifolia的TE表达发生显著变化(与其他植物类似),69.05%的TE表达变化超过两倍(图6b)。相比之下,R. apiculata 只有41.39%的TE表达变化超过两倍。

蛋白编码基因的表达可塑性差异则更为显著:C. pectinifolia中38.47%的转录本表达变化超过两倍,而R. apiculata仅有7.79%发生了类似变化(图6c)。研究人员进一步研究了2,670个基因家族的表达水平,其中红树林的基因数目不到四个内陆亲缘物种的一半。这些基因数目减少最显著的红树林基因在C. pectinifolia中的同源基因具有最高的表达可塑性,表达变化显著高于其他基因(图6d)。这些结果表明,红树林在盐度变化下能够保持GRN的稳定性,可能是由于GRN的简化。




讨论

本研究发现,一小部分基因丢失主导了适应性特征的创新,而大多数基因丢失可能有助于在剧烈波动的环境中维持GRN的稳定性。小规模基因丢失参与了红树林表型特征的进化:种子休眠、种子干旱耐受和储存积累相关的基因丢失,有助于形成胎生种子。在高盐响应和单宁生物合成途径中,也发现了类似的负向调控这些过程的基因丢失。这与“少即是多”假说一致,该假说认为基因丢失通过改变大分子复合物或生物途径的剂量平衡,最终影响表型和进化适应性。本研究发现,内陆植物的GRN在这些环境波动下受到了严重干扰,但红树林的GRN则保持了较高的稳定性。红树林中独特的广泛基因丢失事件与GRN稳定性之间可能通过MWT假说相互关联。由于MWT已被证明对其他类型的网络的稳定性起着重要作用,所以研究人员认为该理论可能更好地解释了红树林基因家族减少的普遍趋势。但研究人员也提出,基因组缩小可能会降低红树林适应未来气候变化和人类活动的潜力。在漫长的进化过程中,单调的基因丧失和GRN简化可能不是适应不稳定环境的最佳方案。实际上,已经提出了一种双相模型的突变基因组进化。短暂的爆发性阶段伴随着广泛的基因复制(如WGD),导致基因组复杂度的快速增加,随后是一个较长的阶段,基因组复杂度减少。生活在最为波动环境中的红树林可能加速了基因组减少的速率。这也表明,栖息地保护对于红树林的保护至关重要。


评论人:朱艺漫

修改人:冯佳珺

编辑人:赵智鹏



林木科学评论
聚焦林木科学与技术前沿,分享创新热点评论,服务林业科技提升。
 最新文章