大麦泛基因组揭示结构变异驱动适应性进化和育种改良

科技   2024-11-30 09:00   湖北  
2024年11月,德国莱布尼兹植物遗传和作物研究所Murukarthick Jayakodi等人在国际著名期刊“Nature”在线发表了题为“Structural variation in the pangenome of wild and domesticated barley”的研究论文。该研究通过对大麦的泛基因组分析发现结构复杂位点的等位基因多样性可能有助于作物适应农业生态系统中新的选择性机制。

研究背景

农作物产量的促进可以推动人类文明的崛起,随着人们接受了新的生活方式,栽培植物也必须适应人们的需求。其中大麦(Hordeum vulgare)六棱大麦的谷物数量是其祖先两棱大麦的三倍,这种变化是由于敲除突变导致的花序发育差异。因此,六棱大麦在大多数大麦种植区占据主导地位。大麦不仅在野外需适应不同环境线索以触发发芽,还在麦芽加工中需快速均匀发芽以满足行业需求。此外,抗病性、植物结构和养分利用等性状也是育种家关注的焦点。尽管大麦遗传分析在20世纪上半叶因技术难题而停滞,但随着DNA测序技术的进步,大麦作为温带谷物二倍体模型的研究再次得到广泛关注。最近,已组装出多种大麦基因组的高质量序列,并转向泛基因组研究,包括76个染色体规模序列和1,315个大麦基因组的短读长序列数据,这些数据为理解作物进化和适应提供了见解。

研究结果

76 种大麦的基因组序列

本研究选择20多种具有代表性的野生和驯化的大麦材料进行测序,获得76份大麦基因组的长读长序列和1,315 个大麦基因型短读长序列测序数据。利用PacBio HiFi和Hi-C技术,将这76份材料的基因组序列进行组装,获得高质量的参考基因组。

结构变异图谱

为了量化基因变异程度,构建了直系同源框架,鉴定到了95,237个分层直系同源组(HOGs),其中16,672个为“核心基因组”,它们包含来自 76 种基因型的至少一个同源基因;78,067个为“壳基因组”,它由至少一种基因型中不存在但至少存在于两种基因型中的基因组成;每个基因组平均有819个“云基因”。

为了扩展存在/不存在变异、插入、缺失和多态性倒位的数据库,将基因组序列进行比对并检测其结构变异(SV)。值得注意的是两个相互的染色体间易位,第一个在伊朗地方品种 HOR 14273 中,第二个在来自土耳其的野生大麦 HID055 中。这些变异可能会影响大麦的育种过程。

Fig. 1: A species-wide pangenome of H. vulgare.

结构复杂的位点

许多复杂的位点与抗性基因的进化紧密相关。如大麦的抗白粉病位点Mla,包含多个耐药基因同源抗性基因家族,并且每个家族在此位点上都有多个成员。在RGT Planet品种中,一个40kb区域重复了四次,但在泛基因组中未发现完整拷贝。迄今为止,已经报道的 29 个功能相似的Mla 等位基因有27个,但是在泛基因组中仅鉴定到 7 个等位基因。泛基因可以同时解析多个基因组中 Mla 位点的结构,将有助于大麦和其他作物中复杂抗性基因位点的解析。
进一步扫描Morex基因组,发现169个结构复杂的位点,大小从20kb至2.2Mb不等,拷贝数在泛基因组中是可变的。结构复杂的位点参与多种生物过程,其富集于远端染色体区域,与遗传多样性和重组频率梯度一致。它们与特定转座子类型无关,而是由非等位基因同源重组导致的插入和缺失。分子钟定年分析表明,许多基因拷贝在过去300万年内获得,62个位点在驯化后至少复制一次,其中43个位点的扩增很相近,以至于它们包含的基因是相同的重复拷贝。尽管重复片段很相似,但转座子插入、缺失和突变导致基因拷贝多样化或假基因化。
TB1是TCP转录因子,影响谷类的分蘖和植物结构。在大麦中,敲除TB1的突变体分蘖和侧穗数量增加。泛基因组分析发现,TB1在多数种质中为单拷贝,但六棱大麦中可达四个拷贝,且Morex中有三个错误折叠的副本。此外,泛基因组还发现了六种新的TB1蛋白变体,而玉米中TB1过表达导致分蘖减少,大麦泛基因组将有助于探究六棱大麦中拷贝数增加是否有类似效应。

Fig. 2: Structurally complex loci in the barley pangenome.

淀粉酶基因位点amy1_1的结构多样性

进一步研究发现6H染色体上的amy1_1位点是大麦中具经济意义的复杂位点,影响幼苗活力和大麦酿造过程。该位点包含α-淀粉酶基因,负责将淀粉转化为糖,其对幼苗生长和麦芽酿造至关重要。长读长序列分析揭示了该位点复杂的结构变异,包括拷贝数差异和基因序列差异。在76个完整基因组中,发现2到8个amy1_1拷贝,且存在全球分布的SNP单倍型。此外,鉴定了9个氨基酸变体,其中一些可能影响蛋白质稳定性和酿造过程。大麦泛基因组发现的amy1_1序列变异模式为育种中靶向部署和设计单倍型提供了可能。

Fig. 3: Structural diversity at the amy1_1 locus and its importance in malting.

SVs调控毛状体发育

谷物和芒的毛状附属物有利于野生植物的种子传播,但驯化过程中会影响毛状体的发育。进一步分析发现长毛和短毛基因型都存在于大麦泛基因组中。通过精细定位,确定了5H染色体上一个113kb的区间存在变异。尽管该区间内没有注释的基因模型,但找到了拟南芥中调控毛状体发育的SMR基因的同源物SRH1。序列比对发现所有短毛基因型都缺乏一个4,273bp的序列片段,该片段在长毛类型中保存良好,并包含一个与SMR表达调节因子识别的序列。这些结果证实了缺失SRH1导致短毛表型。
Fig. 4: A deletion in an enhancer motif is associated with Srh1-dependent trichome branching.
本研究探讨了野生和驯化大麦的泛基因组结构变异,揭示了与适应性和品质相关的遗传多样性。通过对不同品种大麦基因组的系统性分析,研究指出了具有重要的 α-淀粉酶基因 (amy1_1) 的结构变异,这对酿造过程中的糖化效果具有潜在的影响。此外,研究还讨论了与毛状体发育相关的基因如何受到驯化过程的影响,提供了作物驯化与进化的基础框架。

END

编辑 | 周婷婷

校对 | 廖晓利



林木科学评论
聚焦林木科学与技术前沿,分享创新热点评论,服务林业科技提升。
 最新文章