Plant Communications|使用跨条件多组学关联分析在玉米中识别盐响应遗传变异

2024-12-27 14:26   湖北  

玉米 / 耐盐性 / 关联分析 / 遗传变异

多组学关联分析是作物种质研究中的关键方法,有助于阐明农艺性状的调控机制。然而,大多数现有的多组学关联研究集中在单一条件下的组学数据,而在识别与胁迫相关的农艺重要基因方面仍存在挑战。主要原因在于涉及对照和胁迫条件比较时,多组学关联分析的复杂性增加。
在大规模胁迫相关的多组学关联分析中,第一步是比较对照和胁迫条件下的分子特征和分子数量性状位点(molQTLs),目的是识别胁迫响应的molQTLs。随后,将不同类型组学数据中的胁迫响应molQTLs整合起来,以剖析作物胁迫响应的调控机制。然而,在大规模组学数据中,自然变异的遗传效应和胁迫响应效应常常混杂在一起,这使得识别胁迫响应分子QTL变得困难。
因此,有效地将自然变异的胁迫响应效应与遗传效应分离对于识别胁迫响应molQTLs至关重要。对比性主成分分析(cPCA)作为一种新兴的机器学习算法,已被证明能够有效地从混杂因素中提取有意义的数据,显示出其在识别遗传变异的胁迫响应效应方面的潜力。
2024年12月9日Plant Communications上线了一篇关于识别玉米中盐响应遗传变的Correspondence文章,“Identification of salt responsive genetic variants using cross-condition multi-omics association analysis in maize”。该文章发布了一个用于大规模多组学关联分析的新工具MODAS2,并表明了它在揭示植物复杂性状背后的分子调控机制方面的重要潜力
首先,该文章介绍了MODAS2,这是之前开发的多组学关联分析软件工具MODAS的扩展。这个扩展通过整合对比性PCA,促进了涉及植物条件比较的多组学关联分析。MODAS2由五个分析模块组成:
  • 首先,MODAS2通过Bray–Curtis(BC)距离转换分子特征。这种转换可以反映自然变异对分子特征的影响,并有助于在后续分析中提取胁迫响应的影响。

  • 其次,MODAS2通过cPCA分析植物在胁迫和对照处理中的分子特征,并使用cPCA的主成分作为分子特征的胁迫响应指数。

  • 第三,MODAS2对分子响应指数进行GWAS,然后进行双向方差分析以识别胁迫响应molQTLs。

  • 第四,使用近似图像匹配算法,MODAS2对多组学胁迫响应molQTLs进行共定位分析。这一分析揭示了影响多组学分子特征胁迫响应的共享遗传变异,使得不同组学层面的信息可以用来剖析复杂性状背后的调控机制。

  • 最后,MODAS2使用孟德尔随机化分析估计胁迫响应molQTLs对表型性状的贡献。这种推断有助于揭示作物中分子特征与复杂性状之间的因果调控关系。此外,MODAS2识别的候选基因可以通过CRISPR/Cas9基因编辑和转基因过表达进行验证。

图1. 跨条件多组学关联分析方法的开发
为了评估MODAS2在识别胁迫响应molQTLs方面的性能,作者分析了一个属于DEAD-box RNA解旋酶家族的基因ZmRH3(其在拟南芥中的同源基因AtRH3,已被证明在响应盐胁迫中发挥作用)。
首先,使用BC距离转换了ZmRH3在盐胁迫(100 mM NaCl)和对照(水)处理下的转录水平数据。不同单倍型对ZmRH3表达的影响各不相同,在盐处理下的差异比在对照处理下更大(图1A)。这一结果指向了不同单倍型对ZmRH3调控效应的分歧。
接下来,使用cPCA对两种处理下转化的ZmRH3表达水平进行降维分析。在cPCA主成分为正的自交系中,ZmRH3的表达水平在对照和盐处理之间存在差异。相反,在cPCA主成分为负的自交系中,ZmRH3的表达水平在对照和盐处理之间的差异较小(图1C)。这些结果表明,cPCA的主成分反映了不同自交系中ZmRH3对盐胁迫响应的变化。
随后,对cPCA的主成分进行了GWAS。值得注意的是,这识别了一个显著的关联,峰值SNP信号位于第5条染色体的1,991,212 bp处,且被精确在ZmRH3的一个内含子内(图1E)。使用峰值SNP进行单倍型分析,确定了不同单倍型对ZmRH3表达的影响在两种处理之间有所不同(图1D)。这些结果表明,该文中的方法识别了一个调节ZmRH3盐胁迫响应的顺式QTL。
图S1. MODAS2的工作流程和功能模块
接下来,将上述策略扩展到组学数据集中,来识别胁迫响应molQTLs。然而,对比性PCA的一个限制是它无法提供显著性P值,这可能导致包含非胁迫响应的分子特征。为了克服这个限制,作者开发了一个两步法来识别胁迫响应molQTLs。
  • 在第一步中,计算了对比性PCA组分与对照和胁迫条件下分子特征表达之间的回归系数。通过评估两个系数之间差异的显著性,识别了捕获分子特征胁迫响应效应的对比性PCA组分,并随后将其定义为胁迫响应指数(SRI)。

  • 在第二步中,对SRI进行GWAS,并应用双向方差分析来过滤结果,从而准确地识别组学数据集中的胁迫响应分子QTLs。

图S2. 受盐响应eQTLs影响的基因表达模式
在将两步法应用于玉米盐胁迫和对照处理下的转录组时,识别出了与2283个基因相关的2666个盐响应表达量性状位点(eQTLs,图S2)。GO富集分析揭示这些基因在与信号传导和非生物胁迫响应相关的术语中显著富集,包括对渗透胁迫、盐胁迫和细胞钾离子运输的响应(图1B)。
此外,孟德尔随机化(MR)分析被用来将这2666个盐响应eQTLs与盐耐受相关的表型联系起来。MR结果对于Na⁺含量识别了21个与Na⁺含量显著相关的盐胁迫响应eQTLs,其中ZmHAK4对Na⁺含量的贡献最显著(图1F)。
单倍型分析揭示,在盐胁迫下,具有TT单倍型的ZmHAK4被上调,导致具有该单倍型的玉米自交系中Na⁺含量较低(图1G、1H)。
以前的研究已经证明ZmHAK4通过介导Na⁺从茎部排除来增强玉米的盐耐受性。这些发现不仅验证了两步胁迫响应molQTL识别方法在准确检测胁迫响应molQTLs方面的有效性,而且突出了识别的胁迫响应molQTLs在促进盐耐受基因发现方面的潜力。
图S3. 受盐响应mQTLs影响的代谢物表达模式
代谢物作为代谢过程和生理途径的最终产物,在植物对非生物胁迫的抗性中扮演着关键角色。为了剖析与玉米盐胁迫耐受性相关的代谢途径,作者进一步将盐响应eQTLs与盐响应代谢物数量性状位点(mQTLs)联系起来。
最初,执行两步胁迫响应molQTL识别方法来分析玉米在盐胁迫和对照处理下的代谢组,识别了与1173个代谢物相关的1323个盐响应mQTLs(图S3)。随后,使用近似图像匹配算法,进行了盐响应eQTLs和盐响应mQTLs之间的共定位分析。结果表明,ZmGB1Zm00001d040958与甜菜碱的共定位分数最高(图1I)。
进一步的功能分析揭示,ZmGB1编码一个C-4甾体甲基氧化酶,与甜菜碱合成密切相关,而Zm00001d040958编码一个tRNA修饰酶GidA。基于这两个基因的功能角色,确定了ZmGB1是与甜菜碱合成相关的因果基因。
图S4. 过表达ZmGB1赋予了玉米耐盐性
为了进一步调查ZmGB1是否与甜菜碱水平和盐耐受性相关,产生了两个独立过表达ZmGB1的转基因株系,并分析了这些植物中的甜菜碱水平(图1J,图S4A)。ZmGB1OE植株中的甜菜碱含量显著高于野生型(图S4B)。此外,过表达ZmGB1的植株保持了更大的生物量,并且比野生型更耐盐胁迫(图S4C)。
这些结果证实ZmGB1是甜菜碱含量的候选基因,增加甜菜碱含量,从而赋予了玉米盐耐受性。

后台留言,可索取原文
欢迎转载
- The End -

点“在看”给我一朵小黄花 










AIBioPioneer
分享人工智能,生物信息与植物生理的点点滴滴
 最新文章