导论
自从19世纪格里高尔·孟德尔通过豌豆杂交试验揭示了遗传学原理以来,豌豆就被作为遗传模型进行各项遗传学研究。孟德尔通过研究豌豆的七种特征(种子形状、子叶颜色、豆荚颜色、花颜色、茎长、豆荚形状和花的位置),建立了分离和独立杂交的规律,是现代遗传学的开端和基础。迄今为止,已经利用分子技术对豌豆R/r14、Le/le15、16、17、18、I/i19、20和A/a21位点的孟德尔性状进行了表征,但包括7个孟德尔性状在内的许多关键农艺性状的基因组基础尚未完全了解。目前已经完成了2个豌豆基因组的测序。改良的豌豆参考基因组和118个栽培和野生豌豆材料的基因组多样性突出了豌豆的基因组特征和进化特征。然而,蔬菜豌豆和谷物豌豆的进化比较和基因组分化以及豌豆许多关键农艺性状的遗传基础尚未探索。
摘要
豌豆对人类的营养至关重要,在发现孟德尔遗传规律方面发挥了至关重要的作用。本研究从染色体水平对优质菜豌豆品种浙皖1号的基因组进行了组装,并对314份材料的重测序数据进行了分析,建立了豌豆遗传变异的综合图谱。通过全基因组关联研究,确定了与57个重要农艺性状相关的235个候选基因座。值得注意的是,确定了4个孟德尔性状的致因基因单倍型:茎长(Le/Le)、花颜色(A/ A)、子叶颜色(I/ I)和种子形状(R/ R)。此外,还发现了控制荚果形状(孟德尔P/ P)和种脐颜色的基因构建跨22个组织的基因表达图谱,突出显示与豆荚和种子发育相关的关键基因模块。这些发现提供了有价值的豌豆基因组信息,并将促进未来豌豆作物基因组知情改良。
01
蔬菜型豌豆优良品种ZW1的基因组组装和比较基因组分析
蔬菜豌豆与谷物豌豆在形态和生理上有显著差异,蔬菜豌豆主要用作食用未成熟种子或豆荚,而谷物豌豆则以成熟种子为食。中国是蔬菜豌豆的主要消费和生产国。研究中使用的自交豌豆品种'ZW1'是一种优质的蔬菜种子豌豆,具有干皱种子的特点。通过HiFi和Hi-C技术,构建了高质量的染色体水平ZW1参考基因组,注释了43,957个蛋白质编码基因和多种非编码RNA,重复序列占基因组的87.27%,其中LTR元件最为丰富。
图1: ZW1基因组的染色体特征。
Illumina NGS reads比对到PeaZW1基因组上,显示高比对率和均匀覆盖率。基因组与遗传图谱共线性良好,BUSCO评估基因注释完整。PeaZW1基因组质量高,无细菌或真菌DNA污染。与PeaZW6基因组比对显示高度共线性,鉴定出大量SNPs和InDels,影响多个基因,富集在碳水化合物代谢等生物学过程中。
02
豌豆基因组变异图谱和群体结构
314份豌豆材料的重测序分析,包括野生物种,揭示了497,546,431个SNPs,其中28,912,046个优质SNPs用于群体遗传分析。Faststructure分析将豌豆分为六个群体结构,其中P. sativum I主要由野生祖先组成,P. sativum II和III包括不同表型的豌豆品种。P. sativum III表现出最低的核苷酸多样性和最高的连锁不平衡(LD)衰减。P. sativum II与P. sativum III之间存在显著的群体差异,分化最大的基因组区域与共生真菌和脂质运输有关。
图2:Pisum物种的系统基因组关系、种群结构和基因组多样性。
03
与孟德尔性状相关的候选基因位点
对237份豌豆重测序材料进行了两年的表型分析,并利用GWAS对57个重要农艺性状进行了量化分析,鉴定出235个与性状显著相关的基因座。通过GWAS,表征了6个孟德尔性状的候选基因,包括Le基因(PsGA3ox1)与茎长相关,a基因(pshlh)与花色和多种表型相关,i基因(PsSGR)与子叶颜色相关,R基因(PsSBE1)与种子形状相关,以及GP基因与豆荚颜色相关。研究发现了多个与这些性状相关的变异,如PsGA3ox1的Ala到Thr变化、pshlh的剪接供体位点变异、PsSGR的非同义变体和剪接区域位点变异、PsSBE1的内含子区域变异,以及Psat0s4355g0080启动子中的SNP变异。这些发现为理解豌豆的遗传多样性和表型多样性提供了重要信息,并为分子育种提供了潜在的基因资源。
图3孟德尔性状的GWAS分析。
04
通过GWAS分析,揭示了控制豌豆荚果型(V/P)的遗传位点,蔬菜豆荚豌豆,蔬菜种子豌豆和谷物豌豆三者之间的豆荚壁结构不同。显著的GWAS信号位于Chr1(373-393 Mb),与F2群体的BSA结果一致,指向PsCLE42基因,该基因编码一种CLE蛋白,参与干细胞身份和细胞分裂的调节。PsCLE42的一个有害突变导致过早终止密码子,且该突变主要出现在蔬菜豆荚型豌豆中,表达量显著高于其他类型。
图4:基于GWAS和bsa的荚果形成候选基因鉴定
此外,还发现了控制种脐颜色的位点,位于Chr1(454-457 Mb),与编码多酚氧化酶的PsPPO1基因相关。PsPPO1的外显子缺失导致移码突变,与白色种脐相关,且这一无功能单倍型在多数豌豆品种中固定。
图5:整合GWAS和BSA鉴定负责种脐颜色的候选基因。
05
对22个不同组织的RNA-seq分析和WGCNA鉴定出19个基因模块,其中3个模块与荚果发育紧密相关,涉及次级细胞壁合成和木质素代谢。发现了可能调控次级细胞壁生物合成的基因网络,包括多个关键基因。另外两个模块与种子发育高度相关,涉及可溶性糖、淀粉、脂质和蛋白质代谢。k-means聚类分析揭示了种子和荚果发育过程中的6种表达模式,为理解调控网络提供信息。还发现了284个GWAS位点附近的基因在种子发育中特异性表达,以及ZW1与ZW6品种间在代谢相关基因表达上的差异。
小编总结
豌豆作为孟德尔遗传研究的模式植物,不仅在科学上有重要地位,也是全球重要的豆类作物。本研究成功组装了高质量蔬菜豌豆ZW1的参考基因组,并对237份材料进行了重测序,结合已有数据,构建了314个豌豆的遗传变异图谱。通过GWAS,鉴定了与57个农艺性状相关的235个候选位点/基因,包括与荚果形状、颜色和种子形状等性状的孟德尔基因的新单倍型。特别地,PsCLE42基因被认为是控制荚果形状的P位点的候选基因,而PsPPO1基因与种子门部颜色相关,为育种提供了重要基因资源。此外,时空转录组数据为豌豆的功能基因组学研究提供了全面基因表达图谱。本研究不仅加深了对豌豆遗传多样性的理解,也为蔬菜豌豆的基因组选择和改良奠定了基础。
往期回顾
Nat Genet | 豇豆驯化和改良塑造了基因组标记的差异选择
今年4月22日,浙江省农业科学院李国景研究员团队与浙江大学张明方教授团队合作的豇豆基因组研究成果以“Differential selection of yield and quality traits has shaped genomic signatures of cowpea domestication and improvement”为题。文章通过三代PacBio HiFi数据成功构建了1个粮用豇豆和1个菜用豇豆的高质量基因组,并对全世界收集的344份核心种质进行重测序,揭示了豇豆驯化和改良的基因组选择印迹,阐明了豇豆产量和品质协同提升的遗传机制。
群体遗传学术交流讨论群