Science| 野生二粒小麦基因组结构和多样性阐明了小麦的进化和驯化

文摘   2024-09-15 22:45   陕西  

2017年7月,以色列特拉维夫大学等单位合作在国际著名期刊Science在线发表题为“Wild emmer genome architecture and diversity elucidate wheat evolution and domestication”研究论文,该论文对野生和驯化品种之间基因组多样性的研究揭示了带有驯化选择特征的基因组区域。该参考组将作为加速现代小麦品种基因组辅助改良的重要资源。

小麦是新石器时代的奠基农作物之一,约 10,000 年前被驯化。异源四倍体野生二粒小麦的初步驯化[WEW;基因组 BBAA] 和带壳驯化二粒小麦(DEW)的后续进化导致了自由脱粒硬粒小麦 [T. BBAA] 的选择。随后,六倍体面包小麦(T. aestivum L.,基因组 BBAADD)由驯化的二粒小麦与二倍体节节山羊草杂交产生(基因组DD),表明WEW是所有经济上重要的驯化小麦的直接祖先。作物驯化的特点通常是关键性状的快速改变,随后进行后续进化,进一步引入形态生理性状的增量变化。野生二粒小麦的驯化涉及的性状主要与种子休眠、穗形态和籽粒发育有关。例如,虽然 WEW 的穗在成熟时破碎,但所有驯化的小麦穗均保持完整,从而更容易收获。表征小麦驯化和改良的遗传机制可以为基础小麦生物学和人类文化进化提供见解。迄今为止,涉及野生二粒小麦驯化的基因很少被发现,这主要是由于缺乏全面的参考基因组。小麦参考基因组由于其多倍体性质、大尺寸(估计四倍体小麦约 12 Gb,六倍体小麦约 17 Gb)和高重复含量(约 80%)而难以获得。尽管已经描述了小麦的基因空间,但大多数基因间区域仍然是碎片化的并且未分配给染色体位置。

选择野生二粒小麦种质“Zavitan”用于该基因组组装,以利用已为此品系收集的遗传数据。WEW 参考基因组通过对各种插入片段大小的文库进行全基因组鸟枪法测序构建,产生 57,378 碱基对 (bp) 的重叠群和6,955,166 bp 的支架。该支架通过遗传数据进行验证,并与三维染色体构象捕获测序数据相结合,从而能够构建染色体规模的组装体。由此产生的 10.5-Gb 基因组组装由代表 WEW 14 条染色体的 14 个伪分子序列 (10.1 Gb) 和一组未分配的支架 (0.4 Gb) 组成。支架之间的间隙估计代表约 1.5 Gb 的基因组,很可能是技术上难以测序或难以组装的区域造成的。尽管存在这些差距,这种组装策略的优势在于它能够构建具有正确支架方向的假分子,从而能够以高物理分辨率对多倍体小麦进行全基因组分析。

图1 10.1 GB 野生四倍体小麦 (WEW) 基因组的组装过程示意图

除了来自其他草类的基因模型之外,还使用从 WEW 组织和发育阶段的 20 种不同组合生成的 RNA 测序读数来注释 WEW 组装中的蛋白质编码基因。作者鉴定了 65,012 个高置信度基因模型,并使用 BUSCO基因集进行验证,表明该装配捕获了 WEW 补体的 98.4%。与染色体臂的着丝粒周围区域相比,远端的高置信度基因密度高达 14 倍,证实了报道的沿着丝粒轴的基因密度梯度。在分配给染色体的62,813个基因中,30.4%在所有20种条件下表达,48%在至少一种条件但不是在所有条件下表达,21.6%基因在低表达水平或根本没有。对于染色体臂近端区域的基因,每个基因的平均表达水平和表达宽度(即检测到基因表达的条件数)都较高。远端区域的平均较低表达水平可能是由于这些染色体区域中低水平表达的条件特异性基因的比例较高,而在近端区域中,可以发现较高比例的高表达管家基因。每个亚基因组表达的基因总数大致相当,并且仅观察到来自A亚基因组的基因表达比率较高。这支持了之前的发现,即面包小麦中单个亚基因组缺乏全基因组转录优势。两个WEW亚基因组之间的同源分析揭示了大多数基因的不同同源对(45,386,72.3%),另外9123个(14.5%)由其中一个亚基因组内可能重复的基因组成,以及未分类的其余基因。同源基因对的表达显示所有样本之间存在很强的正相关性。两种同源物在 18,306 对(36,612 个基因)中至少表达一次,但有 2188 对在任何样本中均未检测到表达。部分同源基因对仅在两个亚基因组之一中表达,其中仅表达 A 亚基因组基因 1084 对,仅表达 B 亚基因组基因 1115 对。这些基因在蛋白质磷酸化和一般代谢过程方面功能丰富,表明亚基因组调节的基因表达可能有助于小麦品种的适应。大多数 (82.2%) WEW 组装被注释为转座元件 (TE),两个亚基因组的总体 TE 含量似乎相似。大多数 (7.1 Gb) TE 衍生自长末端重复逆转录转座子。B亚基因组还表现出较旧的Ty1/copia样最大值,可追溯至大约1.2 Ma,表明杂交之前存在亚基因组特异性扩增波。

图2 野生野生二粒小麦 14 条染色体的结构、功能和保守同线性图

为了说明这种组装在农艺重要性状遗传解析中的潜力,作者使用来自 Zavitan 和驯化硬粒小麦(品种“Svevo”)杂交的群体,针对不破碎穗的驯化性状。该分析揭示了调节 BR 表型的基因组区域,包括 WEW 染色体 3A 和 3B 上的两个主要位点(分别为 15.5 和 32.5 Mb),它们与控制大麦中 BR 的 Btr1 和 Btr2 基因具有同源性。在复杂的基因重复簇(A 和 B 亚基因组中每个基因有 3 或 4 个拷贝)中,作者鉴定了直系同源小麦基因。驯化的(即 Svevo)TtBtr1-A 和 TtBtr1-B 等位基因携带突变,预计会破坏编码蛋白的结构,并且可能是功能丧失的等位基因。值得注意的是,在 Zavitan 和 Svevo TtBtr2-A 或 TtBtr2-B 等位基因的编码区之间没有检测到多态性,这使作者推测两个 TtBtr1 基因中的突变组合可能是互补的,以实现非 BR 驯化表型 。因此,作者开发了一对近等基因系(NIL),每个系在 Svevo 背景下携带一个功能等位基因(TtBtr1-A 或 TtBtr1-B)。两种 NIL 均表现出中间 BR 表型,其中刺突的上部是脆性的,下部是非脆性的。扫描电子显微镜证实了两个NIL上部轴的小穗的疤痕组织中存在典型的WEW小穗的光滑脱落部位,而下部的非脆性小穗具有与Svevo类似的粗糙脱落部位。因此,Btr1 基因的直系同源物中的这两个纯合隐性突变(但 TtBtr2 中没有)似乎是转化 WEW 的 BR 形态所需的最低限度。对 113 个 WEW、85 个 DEW 和 9 个硬粒小麦种质的多样性分析表明,所有驯化种质均携带 TtBtr1 基因的功能丧失等位基因。相对于大麦中非 BR 表型的固定,仅需要 Btr1 或 Btr2 基因中的一个突变,作者推测小麦中非 BR 表型的选择可能更加渐进,因为它至少需要两个纯合隐性突变。这得到了考古记录的支持,考古记录表明穗状不裂需要几千年才能形成。

图3 通过基因组深入了解小麦穗脆性

为了检测驯化选择下 WEW 基因组的其他区域,作者通过外显子组捕获测序检查了一组野生和驯化二粒小麦种质的 DNA 变异。这些基因型的系统发育树显示了驯化小麦和野生小麦种质之间的明显区别。总体而言,与其野生祖先相比,DEW 基因型仅出现轻微的遗传多样性损失。与玉米和大麦的观察结果一致。与番茄类似,四倍体小麦从野生形式向驯化形式的转变也伴随着等位基因频率向更常见等位基因的转变,这可能是由于最近的种群瓶颈。作者研究了整个基因组的遗传多样性、位点频谱和遗传分化模式。与选择对遗传多样性模式的预期影响一致,包含 TtBtr1-A 和 TtBtr1-B 基因的区域在三个多样性扫描中的至少一个中是异常值。根据多样性扫描,32 到 154 个基因组区域可能会成为受选择影响的区域。在所有三个选择范围中检测到的小麦基因组区域均显着富集(>95%)非同义单核苷酸多态性(SNP),表明驯化优先富集了编码区域中可能具有功能效应的变体。对多样性扫描中确定的区域中的基因进行基因本体论(GO)富集分析,包括参与生长素刺激反应的基因(GO:0009733),这与对生长素响应基因的强选择性扫描的证据一致。因此,与大麦和小麦的非 BR 表型一样,趋同进化可能在作物驯化中发挥了作用。

图4 全基因组多样性分析

总之,面对全球挑战,农业研究和植物育种对于提高农作物产量至关重要。增强型基因组资源(如 WEW 组装)的可用性,可捕获基因和基因间区域,将支持并加速全球在基因发现、功能表征和育种方面的进程。




 最新文章