2024年7月23日,Nature Communications上线了一篇关于大豆开花机制的研究论文,“Subfunctionalisation and self-repression of duplicated E1 homologues finetunes soybean flowering and adaptation”。该研究建立了大豆全基因组复制事件后三个E1基因的功能命运模型,完善了高纬度适应的分子机制,并提供了潜在的分子育种资源。大豆(Glycine max)作为一种短日照植物,对光周期极为敏感。大豆的光周期响应和开花诱导,对其纬度适应性和籽粒产量有很大影响。在现代栽培大豆的驯化过程中,降低光周期敏感性和提早开花成为了目标性状,这使得大豆能够适应更高的纬度。其背后的遗传机制是,对两个PSEUDO-RESPONSE-REGULATOR(PRR)基因(Tof11和Tof12)的功能丧失等位基因进行逐步选择。驯化之后,光周期开花时间仍然是大豆改良的主要目标,从而使大豆种植逐渐扩展到从北纬53°到南纬35°的广阔纬度范围内。在栽培大豆全球扩张的过程中,豆科作物特有的E1家族光周期开花途径中的组分积累了多态性。在这个独特的开花途径中,E1 是一个核心成分,编码含有B3结构域和潜在双组分核定位信号(NLS)的转录因子。E1有四个主要的隐性等位基因:e1-as(单个错义突变),e1-fs(导致移码的1bp缺失),e1-nl(约130kb的缺失,包含E1基因本身),以及e1-b3a(B3结构域中间的三个SNP和2bp缺失)。由于大豆经历了两次全基因组复制,E1便有了两个同源基因,即E1 LIKE a (E1La) 和 E1 LIKE b (E1Lb)。然而,这三个大豆E1同源基因之间的功能和进化关系尚不明确。
E1家族本身及其正向调节因子(如PHYTOCHROME A的同源基因E3和E4、E2(GIGANTEA)、Tof11/Tof12(PRR3a/b)、FKFs(Flavin-binding, Kelch repeat, F-box))的功能障碍,有助于栽培大豆适应高纬度地区。然而迄今为止,仅报道了三个基因有助于野生大豆向高纬度扩展,即E1家族的增强子(E3)、E1家族成员(E1La)和受E1家族调控的元件(Tof5/FRUITFULL)。因此,野生大豆适应高纬度的遗传基础,值得进一步研究。图1. Tof4b位点的鉴定及其因果基因E1Lb的验证该研究首先利用Wm82和DN50的杂交后代群体,在第4号染色体的着丝粒附近,鉴定到了一个开花时间位点Time of flower 4b(Tof4b)。该区域包含一个E1家族成员E1Lb(Glyma.04G143300),它是一种控制夜间中断反应的花发育抑制因子,与非诱导性长日照光周期下的晚花相关(图1a)。Wm82和DN50中的E1Lb编码序列相同,但在亲本的E1Lb启动子中发现了三种变异:DN50中存在一个50碱基对的缺失和两个单核苷酸多态性(SNP)(图1b)。50碱基对的缺失中,包含了一个光响应元件Box-4,该元件在光控制的转录活性中发挥作用。来自Wm82的Tof4b近等基因系(NILs)中的E1Lb表达量,显著高于来自DN50的Tof4b NILs(图1c),这表明Tof4b的效应可能是由启动子活性的差异引起的。对不同报告基因载体的研究发现,50个碱基对的缺失(而非其他SNP)降低了E1Lb启动子的活性(图1d、e)。因此得出结论,E1Lb是Tof4b位点的因果基因,而50碱基对的启动子缺失导致了这种突变效应。随后使用CRISPR-Cas9基因编辑技术,在Wm82和DN50两种遗传背景下生成了Tof4b的缺失突变体,分别命名为tof4bCR-DN50和tof4bCR-Wm82。这两种tof4bCR突变体,在长日照条件下相对于各自的野生型提早开花(图1f–i)。综合这些数据,确认了E1Lb作为一个开花抑制因子的功能,并且它就是导致Tof4b位点效应的基因。图2. Tof4b受E3/E4和E2的上调,直接抑制FT2a和FT5a的表达已知在依赖于E1的大豆光周期途径中,E2、E3和E4是E1的上游调控因子。在长日照条件下,NIL-E2和NIL-E3/E4中的Tof4b表达水平,都分别高于NIL-e2和NIL-e3/e4植株,表明E2、E3/E4促进了Tof4b的表达(图2a, 2b)。
之前的研究表明,病毒诱导的E1Lb沉默,上调了两种大豆成花素(FT2a和FT5a)的表达。在这里也观察到了相似的趋势,即在突变体tof4bCR-Wm82中FT2a和FT5a的表达水平高于野生型Wm82,证实了E1Lb是FT2a和FT5a的抑制因子(图2c, d)。进一步的ChIP-qPCR实验表明,E1Lb蛋白与它的同源物E1和E1La一样,直接结合到了FT2a和FT5a的启动子区域。综上所述,Tof4b编码一个E1家族蛋白E1Lb,并且它与其同源物具有相似的遗传机制:它受到E2和E3/E4的增强,并直接抑制FT2a和FT5a的表达,以延长大豆在长日照条件下的开花时间。通过比对E1、E1La(Tof4)和E1Lb(Tof4b)的氨基酸序列,发现在接近NLS的N端(Ω区域),它们之间存在四个氨基酸的替换(图3a)。随后构建了一系列E1/E1L-GFP融合蛋白(图3b),并通过在烟草叶片中的瞬时表达追踪它们的亚细胞分布。
共聚焦显微镜显示(图3c),E1-GFP主要分布在细胞核内。而E1La-GFP和E1Lb-GFP分布在细胞核和细胞质中,分布模式与NLS突变了的e1-as相似。当用E1的N端肽替代E1La/E1Lb的N端肽(分别命名为“E1Ω–E1La–GFP”和“E1Ω–E1Lb–GFP”),这两种蛋白都特异性地定位在细胞核内,表明N端肽影响核定位。同样地,将E1La/E1Lb的N端肽转移到E1上(命名为“E1La/bΩ–E1–GFP”),这种融合蛋白像E1La-GFP和E1Lb-GFP一样定位在细胞核和细胞质中。
综上,E1La和E1Lb的氨基酸序列与E1相比发生了改变,从而影响了它们的核定位。E1保持了完整的蛋白活性,而E1La和E1Lb的活性减弱。E1La和E1Lb突变后抑制FT2a基因的能力部分受损,这表明E1家族经历了亚功能化。
通过droplet digital PCR (ddPCR)的分析显示,E1在Wm82-E1中的表达比E1La和E1Lb更为强烈(图3d)。而E1La、E1Lb和E1在Wm82 (e1-as)中的转录本拷贝数,分别高于它们在Wm82-E1中的拷贝数(图3e,3f)。ChIP-qPCR的结果表明,E1-3xFLAG与E1及其两种同源物的启动子相结合(图3g-i)。这些结果表明E1具备自我抑制能力,并且还能抑制其同源基因E1La和E1Lb的表达。通过对Tof4b启动子和编码区域的多态性分析,鉴定了四种高置信度的单倍型H1–H4(图4a, b)。H1是功能性的Tof4b等位基因,也是最常见的单倍型;H2 (tof4b-1)是上文表征的tof4b等位基因,具有50 bp的启动子缺失;H3 (tof4b-2)是一种已知的功能丧失单倍型,有一个1 bp的缺失导致移码突变,使得Tof4b蛋白从192个氨基酸截短至73个氨基酸,此外还包含上述50 bp的启动子缺失。H4(tof4b-3)在编码区有一个碱基替换,导致第53位氨基酸残基从丝氨酸变为精氨酸。中间连接网络分析表明,tof4b-1和tof4b-3可能源自Tof4b,而tof4b-2来源于tof4b-1(图4b)。具有50 bp启动子缺失的等位基因(tof4b-1或tof4b-2)在中国广泛栽培的大豆(地方品种和品种)中存在,并且在中国北方的野生大豆中也存在,但在黄淮核心驯化区域中纬度的野生大豆种质中不存在(图4c)。这意味着栽培大豆中具有这种突变的等位基因是从中国北方的野生大豆中引入的,而不是在后来的驯化和改良过程中发生的。随后通过重构的系统发育树,确认了栽培种质中50 bp的缺失突变源自野生大豆的引入。随后在携带不同tof4b等位基因的大豆群体之间,进一步计算了第四号染色体上的遗传多样性(FST值)。携带tof4b-1/2等位基因的栽培大豆与携带tof4b-1等位基因的野生大豆之间的FST值曲线在16.1–26.3 Mb区域内有一个明显的低谷,表明在这个区域中,携带tof4b-1/2的栽培大豆与携带tof4b-1的野生大豆之间的遗传分化极低。在同一区域内,携带tof4b-1/2的栽培大豆与携带Tof4b的栽培大豆之间的分化程度要高得多(图4d)。第四条染色体上的SNP图谱支持了这些两两FST比较的结果(图4e)。这表明携带Tof4b启动子缺失的栽培大豆源自一个引入事件,在此期间,第四条染色体上16.1–26.3 Mb的10.2 Mb片段从携带缺失的野生大豆中引入。综上所述,推测Tof4b基因的进化轨迹如下:在高纬度地区,野生大豆有两个突变,一个是50 bp的启动子缺失,另一个是氨基酸替换,分别对应tof4b-1和tof4b-3。其中,tof4b-1等位基因首先被引入这些地区的栽培大豆中,在那里随后演化成了tof4b-2(图4b)。图5. Tof4b遗传多样性的地理分布及野生大豆适应高纬度的遗传基础总之,该研究提供了Tof4b如何影响大豆开花时间的机制见解,追踪了Tof4b的进化轨迹,并探讨了它在栽培和野生大豆高纬度适应性中的作用。所有的E1基因都具有自我抑制和抑制同源基因的能力,并且在进化过程中经历了亚功能化,形成了参与光周期开花途径的罕见遗传模块。这些结果细化了大豆高纬度适应性的分子机制,并提供了一个潜在的分子育种资源。