2024年11月15日,中国科学院大学肖军教授团队发表了一篇题为“Natural variations of TaMYB7-A1 regulate PHS resistance and specify wheat geographic adaptation”的预印版文章,揭示了小麦中TaMYB7基因的自然变异调控种子休眠来获得PHS抗性的分子机制,为开发平衡PHS抗性与不同环境和种植系统的发芽需求的小麦品种提供了基础。
研究背景
穗发芽(PHS),即收获前发芽,指的是弱种子休眠所导致的母株上新鲜成熟的种子不必要的早期发芽,这会导致谷物重量和营养成分含量下降,是一个严重但被忽视的全球农业问题。PHS是一种复杂的现象,受温度、降雨和光线等环境因素,以及种子休眠的内部强度的影响。种子休眠调节发芽时间,为了确保与农作时节保持一致,作物驯化过程通常会降低休眠强度,从而增加PHS风险。全球气候变化驱动的降雨量和温度波动则进一步加剧了PHS对小麦、玉米和水稻等主要谷物作物的粮食产量和质量构成的威胁。因此,平衡PHS抗性与不同环境和种植系统的发芽需求是一个关键的育种目标。然而,种子休眠作为控制谷物中PHS抗性的主要内源因素,由复杂的生长激素相互作用所驱动,其分子机制尚不清楚。
研究结果
为了探究小麦种子PHS抗性变异的遗传基础并鉴定优良等位基因,本研究对192个田间种植的具有不同PHS抗性水平的小麦品种群体进行了GWAS分析,识别出了五个在统计学上显著关联的稳定位点,其中qPHS.3D(TaMYB10-D)和位于2A染色体末端的QTL簇被认为是关键位点(Fig 1a)。这个QTL簇包含了先前报道的PHS抗性基因TaP14K-2A,该基因略低于统计显著性阈值,以及两个新的位点qPHS.2A.1和qPHS.2A.2(Fig 1b)。qPHS.2A.2位点位于一个包含了TaAIRP2-A1基因的连锁不平衡区块,尽管过表达该基因的单倍型植株提高了PHS抗性,但同时也降低了千粒重、粒型和植株高度,导致TaAIRP2-A1在育种中的应用受限,因此研究者将重点转向qPHS.2A.1位点。
qPHS.2A.1位点位于一个2.02 Mb的连锁不平衡区块,该区块包含37个高置信度的候选基因(Fig 1c)。在候选基因中,有3个在种子中表现出较高的表达,尤其是在休眠建立的后期。其中,TraesCS2A02G554200(一个水稻转录因子MYB6的同源基因)和一个假定蛋白编码基因TraesCS2A02G553100在不同单倍型的种子中,尤其是在授粉后20天时,表现出统计学显著的表达差异(Fig 1e)。TraesCS2A02G554200的表达在休眠建立过程中增加,并在吸水后6小时内急剧下降(Fig 1f),而TraesCS2A02G553100的表达则与休眠或吸水没有明显关联。基于这些观察,TraesCS2A02G554200被确定为qPHS.2A.1的候选基因,并被命名为TaMYB7-A1。
为了评估TaMYB7-A1在PHS抗性中的功能,研究者在具有较强的遗传转化适应性和中等的PHS抗性的Fielder品种背景下生成了敲除突变体和过表达株系(Fig 1g,h)。敲除株系表现出比野生型更强的发芽能力和更低的PHS抗性(F 1g-i)。而过表达株系表现出更强的PHS抗性(Fig 1g,h),和吸水后2天更低的发芽率(Fig 1i)。值得注意的是,与许多抗逆基因对产量或质量产生不利影响不同,TaMYB7-A1CS过表达并没有显著影响休眠解除后种子的发芽,也没有影响其他重要的农艺性状。这些发现表明,TaMYB7-A1与PHS抗性密切相关,并且是一个有前景的候选基因,可以在不降低主要产量性状的情况下提高小麦的PHS抗性。
为了研究TaMYB7-A1调控的分子通路,对休眠建立期间野生型Fielder和过表达系TaMYB7-A1CS的种子进行了RNA-seq分析。主成分分析显示,Fielder与过表达株系之间存在显著的转录组差异,并确定了554个差异表达基因(Fig 2a,)。GO富集分析显示,与ABA信号传导、ABA代谢和乙烯信号通路相关的基因在TaMYB7-A1CS过表达株系中上调,而参与GA生物合成、淀粉代谢和淀粉酶抑制的基因则下调(Fig 2b)。转录组和RT-qPCR分析进一步显示,ABA信号传导基因,如TaPYL9和TaABI5,以及参与GA和ABA去活化的基因,如TaGA2ox、TaEUI和TaABAox8,在过表达株系的种子成熟过程中上调。值得注意的是,像TaNCED和TaABA2这样的ABA生物合成通路基因没有显著变化(Fig 2c)。这些结果表明,在TaMYB7-A1CS过表达株系中,ABA信号传导发生了改变,且ABA与GA的稳态失衡。授粉后35天的种子中的激素定量分析佐证了转录分析结果:过表达株系中,活性ABA和GA形式(GA12、GA19、GA53)减少,而不活跃形式GA34增加(Fig 2j)。
在DEGs中,还识别了53个可能的TaMYB7-A1CS的直接靶基因,包括核心的ABA信号传导基因TaABI5和TaPYL9(Fig 2a)。EMSA实验证实了TaMYB7-A1CS与TaABI5和TaPYL9的启动子区域结合,尤其是在保守的GATAA基序上(Fig 2f)。LUC实验结果进一步验证了这一结论(Fig 2d)。TaMYB7-A1CS过表达株系的TaABI5及其下游基因TaEM6在谷粒中显著上调(Fig 2c)。此外,过表达株系表现出增强的ABA敏感性,种子萌发实验进一步验证了这一点(Fig 2j)。这些发现表明,TaMYB7-A1通过直接上调关键的ABA信号传导因子,如TaABI5,增强ABA信号传导。
考虑到TaMYB7-A1在种子成熟过程中逐渐增加的表达,研究者进一步探索了其上游调控因子。ATAC-seq数据揭示了TaMYB7-A1启动子中的一个保守的近端可接近区域,包含了如ABI4、HBs、BBM和MYBs等转录因子的结合位点。其中,TaABI4在种子成熟过程中表达增加,而TaHB20则表现出早期上升后下降的表达模式,呈现出与TaMYB7-A1不同的表达模式(Fig 2g)。LUC实验证实了TaABI4激活,而TaHB20抑制了TaMYB7-A1CS启动子的活性(Fig 2h)。多个Taabi4缺陷突变体中的TaMYB7-A1表达的减少,进一步支持了TaABI4作为TaMYB7-A1的激活因子这一结论(Fig 2i)。
综上,TaMYB7-A1通过直接上调ABA信号传导,并间接调控ABA和GA的稳态,增强了种子对穗发芽的抗性,这可能通过强化种子休眠机制发挥作用的。
为了识别可能影响TaMYB7-A1等位基因表型的自然变异,对81个小麦品种的基因区进行了Sanger测序,涵盖了编码区和转录起始位点上游约2.5 kb的启动子区域。识别出了位于编码区的11个SNP和1个InDel位点,同时在启动子区域发现了7个InDel和多个SNP(Fig 3a)。这些多态性将样本群体划分为三个明显不同的单倍型:TaMYB7-A1Hap-1、TaMYB7-A1Hap-2和TaMYB7-A1Hap-3(Fig 3a,b)。其中,Hap-1显示出最强的PHS抗性,而Hap-3则表现出最弱的抗性(Fig 3b),这突显了自然变异在调控TaMYB7-A1功能中的作用。
这些单倍型的五个编码区多态性导致了四个氨基酸的替换和一个Gly-Ala-Gly-Ala的InDel(Fig 3a, c)。功能研究表明,Hap-1和Hap-2编码的TaMYB7-A1蛋白能够结合并激活TaABI5的启动子(Fig 3d)。相比之下,Hap-3未表现出任何可检测到的效应活动或结合亲和力,说明它可能是非功能性的。支持这一假设的证据是,TaMYB7-A1Hap-3过表达株系在收获前萌发或种子萌发率方面与野生型相比没有显著变化(Fig 3e–g),且这些株系中TaABI5的表达水平未发生改变。
为了确定导致TaMYB7-A1不同单倍型之间功能差异的多态性,研究者生成了Hap-1和Hap-3的重组TaMYB7-A1–MBP蛋白,并构建了包含特定突变(M1–5)的Hap-1系列突变体(Fig 3c)。EMSA和LUC实验表明,Gly23和Gly92是TaMYB7-A1–MBP结合TaABI5启动子中GATAA基序的关键位点。具体而言,突变M2(Gly23Ser)和M3(Gly92Cys)完全阻止了结合,而M1、M4和M5则没有影响(Fig 3h)。值得注意的是,Gly23Ser和Gly92Cys的替换使得Hap-2与非功能性的Hap-3区分开来(Fig 3a,c),这与Hap-2具有功能性而Hap-3不具有功能性相一致(Fig 3d)。
总之,TaMYB7-A1中的自然变异,特别是Gly23Ser和Gly92Cys的替换,影响其靶基因特异性,并调控与ABA信号传导相关的下游基因。这种变异对休眠强度和穗发芽具有明显的生理学影响。
除了编码区的差异,TaMYB7-A1单倍型还展示了不同的启动子序列,这些序列可能影响基因的表达(Fig 3a)。对授粉20天后的种子的全转录组分析显示,TaMYB7-A1在Hap-1的表达量上高于Hap-2和Hap-3(Fig 4a)。授粉25天和30天后种子RT-qPCR的结果进一步表明了Hap-1中TaMYB7-A1的高表达可能有助于其较强的PHS抗性。
为了找到导致这种差异的特定启动子元件,研究者通过交换Hap-1与Hap-3的启动子片段,生成了包含多个SNP和七个InDel的突变体(Mut1-4),包括Hap-1中特有的一个221 bp的MITE插入,用于测试启动子活性,LUC实验表明,该插入驱动了单倍型间的表达差异(Fig 4b),且可能是一个增强子(Fig 4c)。
MITE插入被认为能够影响染色质状态,进而改变邻近基因的转录。在胚乳发育过程中进行的表观基因组分析显示,TaMYB7-A1Hap-1启动子中的MITE插入位于开放染色质区域(ATAC-seq峰值)和活性组蛋白标记H3K27ac、H3K4me3附近(Fig 4d),这与种子中TaMYB7-A1的高表达一致。为了评估MITE插入是否改变了TaMYB7-A1近端启动子区域的染色质可及性,对不同单倍型的品种进行了ATAC-qPCR分析。在带有MITE插入的Hap-1的近端“ATAC-peak”区域中,观察到染色质可及性增强,而无MITE插入的Hap-3的染色质可及性较低(Fig 4d, e)。
MITE插入可能引入新的转录因子结合位点,进而影响基因的调控。在MITE插入区域内识别出多个转录因子结合位点,包括DOFs、AZF1、RGA1和HBs。共表达分析发现,TaAZF1(一种与胁迫反应相关的锌指转录因子)是TaMYB7-A1的关键激活因子。具体而言,TaAZF1强烈激活TaMYB7-A1Hap-1的报告基因,而仅微弱激活TaMYB7-A1Hap-3报告基因(Fig 4f),这可能是因为在Hap-1的MITE区域内额外存在一个TaAZF1结合位点。
ATAC-peak和MITE插入的近距离使研究者进一步探讨了转录因子间的物理相互作用。BiFC和酵母双杂交实验确认了TaAZF1与TaABI4之间的相互作用(Fig 4g),两者共同作用于TaMYB7-A1的激活。无论是增加TaAZF1还是TaABI4的效应因子,都能显著提高TaMYB7-A1Hap-1报告基因的活性,而缺少MITE相关结合位点的TaMYB7-A1Hap-3,即便在增加TaAZF1水平时,也未显示出明显的激活(Fig 4h,i)。
总的来说,Hap-1中的MITE插入序列作为功能性增强子,通过调节染色质可及性和促进关键转录因子TaAZF1的结合,从而增加TaMYB7-A1的表达。
在TaMYB7-A1启动子和编码区内显著的连锁不平衡不符合自然种群中变异随机性的假设。为了理解这一连锁不平衡片段的起源,作者推测这一片段通过野生亲缘物种的基因流被现代六倍体小麦所获得,且携带着优越的TaMYB7-A1Hap-1。通过Triticum的重测序分析,识别出来自野生一粒小麦(T. monococcum)的小片段插入,这些片段位于小麦2A染色体的长臂上,精确对接了与qPHS.2A.1相关的全基因组关联分析(GWAS)信号(Fig 5a)。随后,在不同的二倍体小麦物种中进行的检查发现,TaMYB7-A1Hap-1等位基因仅在野生一粒小麦和驯化一粒小麦中存在,而在乌拉图小麦(T. urartu)中则没有发现该等位基因(Fig 5b)。进一步的编码序列比较分析显示,TaMYB7-A1Hap-1与野生一粒小麦序列之间具有显著相似性,而与乌拉图小麦的相似性较低(F 5e)。通过KASP标记和Sanger测序,在71个野生二粒小麦样本中发现了2个携带TaMYB7-A1Hap-1的野生二粒小麦(T. turgidum ssp. dicoccoides),表明TaMYB7-A1Hap-1最早出现在野生二粒小麦中。地理模式分析表明,TaMYB7-A1Hap-1可能起源于塞尔维亚或土耳其西北部,可能是通过从驯化一粒小麦向野生二粒小麦的基因流获得的(Fig 5d, e)。
相比之下,TaMYB7-A1Hap-2在所有乌拉图小麦样本中都有发现。此外,TaMYB7-A1Hap-1和TaMYB7-A1Hap-2在二倍体和六倍体小麦中都有,而另一个单倍型TaMYB7-A1HapWE则仅限于一粒小麦,并未进入六倍体小麦(Fig 5b, e)。在驯化二粒小麦中,TaMYB7-A1Hap-2的关键DNA突变(G56A和G274T)导致了通过自然变异的TaMYB7-A1Hap-3的出现(Fig 5e)。
此单倍型网络进一步阐明了TaMYB7-A1Hap-1与TaMYB7-A1Hap-2/3的起源和进化轨迹。TaMYB7-A1Hap-1似乎来源于一粒小麦,并在小麦驯化过程中几乎没有自然变异的证据。相反,TaMYB7-A1Hap-2/3可以追溯到乌拉图小麦,在二粒小麦中的自然变异,形成了不同的单倍型,这些单倍型随后在现代小麦品种中得以保留(Fig 5e)。总体而言,这些发现为TaMYB7-A1等位基因的复杂进化历史提供了见解,突显了来自野生亲缘物种的基因流和自然选择过程在小麦物种形成中的作用。
随着小麦向全球传播,区域温度、光周期敏感性和降水等环境因素广泛影响其适应性遗传多样性。TaMYB7-A1与基因渗入和季节性降水信号显著相关,强调了其在促进区域适应方面的重要性。事实上,小麦从新月沃土传播的过程中,影响了TaMYB7-A1单倍型在地方品种中的频率:Hap-1在温暖湿润的南欧向西增加,在干旱的西南亚向东减少,在湿润的东亚再次上升,这种分布模式和Hap-1频率与传播路线上的年降水量之间的正相关一致(Fig 6a)。
为进一步探讨了TaMYB7-A1单倍型分布与降水量,尤其是收获季节降水量之间的关系,在全球3132个小麦品种中,包括1160个地方品种、1842个栽培品种和130个其他小麦品系,使用重测序数据和基于MITE和CDS区域多态性的KASP标记鉴定了TaMYB7-A1单倍型。在现代小麦生产地区,强PHS抗性等位基因Hap-1在栽培品种中的频率通常低于地方品种,这可能是由于栽培品种选择均匀同步的发芽,而地方品种表现出跨周或月的错期发芽。不同地区在中等(Hap-2)和弱(Hap-3)PHS抗性等位基因的选择上也存在差异。
在中国、美国和欧洲考察TaMYB7-A1单倍型与收获季节降水量之间的关系揭示了区域特定的相关性。在中国和美国,Hap-3与收获季节降水量呈负相关,而Hap-2在中国,Hap-1在美国则与收获季节降水量呈正相关。在欧洲未观察到TaMYB7-A1单倍型与降水量之间的显著相关性,说明可能选择了其他PHS抗性基因(Fig 6d)。
PHS抗性是由多个基因控制的复杂数量性状。为了更好地理解PHS抗性的区域变异,作者进行了TaMYB7-A1与其他PHS抗性基因(如TaAIRP2-A1、TaMYB10-D)全面的单倍型分析。具有更多PHS抗性等位基因的小麦品系,通常表现出较低的种子发芽率(Fig 6f),表明了种子休眠的加性效应。进一步分析在地方品种和栽培品种中,PHS抗性等位基因与不同TaMYB7-A1单倍型之间的共选择模式,揭示了不同地区的趋势(Fig 6e)。在所有三个地区的地方品种中,PHS抗性基因TaAIRP2-A1R与TaMYB7-A1Hap-1密切相关,但这种关联仅在中国和美国的品种中存在,而在欧洲则不存在(Fig 6e)。TaMYB10-D在中国和欧洲的地方品种中较为丰富,而在美国则较为稀有。值得注意的是,在欧洲栽培品种中,TaMYB10-DR在所有三种TaMYB7-A1单倍型中占主导地位,表明在欧洲对TaMYB7-A1的育种选择压力较小。然而,在中国,TaMYB10-DR频率与TaMYB7-A1的强PHS抗性之间呈现反向模式(Fig 6e),说明这些位点可能存在替代性的选择偏好。在美国,栽培品种普遍显示出比地方品种更高的TaMYB10-DR频率,特别是在含有TaMYB7-A1Hap3的栽培品种中,这一模式与中国相似(Fig 6e)。
总的来说,TaMYB7-A1的自然变异通过驯化和育种塑造了小麦对区域性PHS条件的适应性。TaMYB7-A1与其他PHS抗性基因一起,为开发适应不同环境的区域性PHS抗性小麦品种提供了基础,并增强了小麦的多样性与适应性(Fig 6g)。
总结
这篇文章通过深入研究TaMYB7-A1基因在小麦穗发芽PHS中的作用,揭示了该基因在不同气候条件下的适应性及其与其他PHS抗性基因的协同效应。研究发现,TaMYB7-A1的不同等位基因在全球不同区域的小麦中具有不同的分布模式,反映出其在适应气候变化中的重要性。特别是来自野生一粒小麦的TaMYB7-A1Hap-1等位基因,因其较高的表达量和较强的PHS抗性,在降水量较多的地区具有较强的选择优势。文章还强调了基因渗入和多基因调控的作用,提出通过整合遗传变异和气候适应性,可为小麦育种提供新的思路,以应对日益严峻的气候变化挑战。
评论人:周欣奕
修改人:侯豫康
编辑人:赵智鹏