文献分享 | 葡萄无籽性状的研究揭示植物育种经典思路

文摘   2024-08-26 11:43   北京  


2024年8月,中国农业科学院深圳农业基因组研究所在Current Biology在线发表了一篇题为“Integrative genomics reveals the polygenic basis of seedlessness in grapevine”的研究。本研究组装了两个无籽葡萄品种“Thompson Seedless”和“Black Monukka”的单倍型基因组,通过比较基因组学识别了无籽品种的特异性基因组结构变异(SVs),并且通过群体遗传学探究了无籽性状的进化历史,同时通过全基因组关联研究(GWAS)识别了与种子发育相关的QTLs和候选基因。最后分析鉴定出与种子发育相关的339个核心候选基因,通过基于机器学习的基因组选择(GS)技术,可使无籽性状的预测准确率高达97%。该研究为理解葡萄无籽性状的遗传基础提供了深入的见解,并为未来的葡萄育种工作提供了有价值的遗传资源和方法。


文章标题:Integrative genomics reveals the polygenic basis of seedlessness in grapevine


期刊名称:Current Biology

影响因子:8.1

发表单位:中国农业科学院深圳农业基因组研究所

研究对象:葡萄

研究方法:比较基因组学分析、群体进化分析、GWAS、整合组学分析



文章简介

无籽果实在水果市场上取得了巨大成功,因此无籽葡萄一直以来也是葡萄育种工作中的研究重点。通过遗传育种获得无籽葡萄品种相比传统用植物激素获取无籽葡萄的方法更加安全高效。但是种子发育涉及复杂的调控,种子败育的多基因基础尚不清楚。


本文通过整合比较基因组学、群体遗传学、数量遗传学等方法,揭示了葡萄无籽性状的进化和多基因基础,有助于提高对无籽性状多基因基础的理解,促进葡萄基因组育种的改进。



研究思路




研究结果

1、有和无籽葡萄的比较基因组学研究

研究者首先利用高深度PacBio HiFi测序(120x)和Hi-C(116x)组装了两个无籽品种TS和BM的单倍型解析基因组。通过比较基因组,在无籽品种中发现了一个特异的杂合倒位(Chr10: 23.8–25.4 Mb),并通过Hi-C热图和IGV进一步验证了这一倒位的真实性。在倒位区域的断点处鉴定到了与种子发育相关的基因VvTT16和VvSUS2,这些基因可能对无籽性状有重要影响。

图1 与PN_T2T(参考基因组)比对的单倍型解析的基因组的可视化


2、基因渐渗而非趋同进化推动了葡萄无籽性状的进化

对548个葡萄品系(含46个无籽葡萄品系)的全基因组测序数据进行群体遗传分析,构建了包含六个主要群体分支的系统发育树,结果表明无籽葡萄的两个独立谱系分别嵌套在驯化葡萄(VV)与杂交种葡萄(VV×VL)分支中。使用fd统计量进行了全基因组的渐渗分析,发现在VV和VV×VL无籽葡萄之间存在显著的基因组渐渗信号,表明是基因渐渗而不是趋同进化推动了葡萄无籽的进化历史。

图2 6个种群的系统发育树分析


根据IBD分析结果构建了一个包含46个无籽葡萄品种(35个 VV 和11个 VV×VL )的遗传网络,发现无籽性状的起源可以追溯到无籽葡萄品种“Sultania”(TS)。“Sultania”已被广泛用于与当地葡萄品种杂交,以提高质量和开发新的无籽葡萄品种。频繁的基因渗入促进了 VV 和 VV×VL 群体无籽的形成。


图3 46个无籽葡萄的IBD分析

3、种子败育性状GWAS研究

对三个不同的葡萄群体进行了全基因组关联研究(GWAS)分析:VV群体(35个无籽和317个有籽葡萄)、VV×VL群体(11个无籽和81个有籽葡萄)以及混合群体(46个无籽和398个有籽葡萄)。共鉴定出110个QTLs,涉及634个基因,其中包括VV群体特有的20个QTLs(126个基因)、VV×VL群体特有的18个QTLs(106个基因),以及混合群体中的72个共有QTLs(402个基因)。VV×VL特有的基因富集在防御反应和木质素分解过程,而VV群体特有的基因则富集在以种子休眠结束的胚胎发育和木聚糖代谢过程。


图4 三个群体中的无核相关基因组位点和基因


在三个群体中都发现了两个高度一致的共有区域:Chr07上的8.85–8.86 Mb和Chr18上的29.40–35.54 Mb。在Chr07基因座(SDI2)鉴定出两个与种子生长相关的基因(LOC104880636和SMC1),位于高连锁不平衡(LD)值的紧密连锁区域内;在SDI2上游50 kb区域内,鉴定出三个串联重复的11S球蛋白种子萌发蛋白基因,基因组对比发现该基因在无籽葡萄中存在特异性的缺失和非同义突变。


图5 Chr07中14个葡萄基因组中3个11S球蛋白种子萌发蛋白基因的序列比对


在Chr18上,重新定义的SDI基因座(SDInew)发现8个QTLs,并揭示了多个与无籽性状相关的基因。将Chr18_30874059位点用于预测自然群体中的无籽葡萄和有籽葡萄,准确度达到97.8%和94.22%。通过分析特定于每个群体的基因组区域,发现种子败育受多基因协同作用。


4、综合基因组分析确定了339个无籽候选基因

利用转录组学分子、种子发育相关的GO注释基因、先前报道的家族基因和分子标记以及GWAS候选基因的整合基因组分析鉴定与种子败育相关的核心候选基因。最终候选出339个核心候选基因,并分为13个基于功能的基因组。其中77个基因与种子发育相关的GO同源基因直接相关。结果表明多个基因在种子败育过程中具有累积效应,导致不同程度的无籽。


图6 GWAS、转录组学分析、报告基因和分子标记以及GO同源基因重叠


5、基于机器学习的无籽葡萄基因组选择

从全基因组关联研究(GWAS)中提取了794个高质量的变异位点(包括77个InDels和717个SNPs),构建了一个基于混合人群(n=444)的无根系统发育树,发现无籽性状存在复杂性。


图7 基于来自GWAS分析的794个显著变体(77个InDel和717个SNP)的系统发生聚类


研究者采用了基于机器学习的基因组选择方法来提高预测准确性。使用了794个变异位点和444个混合样本的表型数据作为训练集,并评估了九种经典模型对无籽性状的预测准确性,通过100次重复的随机五折交叉验证。通过筛选和降维,LogisticRegression和ElasticNetCV模型可在较少变异位点下达到100%的准确性。


图8 基于GWAS分析结果的基因组选择流程



总结

基因组学技术的发展使育种者能更精确地选择和改良具有特定性状的品种,从而提高育种效率和效果,本文提供了一种分子育种的经典思路。通过整合基因组分析,探讨了葡萄无籽的多基因基础,并通过建立基于机器学习的基因组选择方法,实现了无籽表型的准确预测。


参考文献

Wang X, Liu Z, Zhang F, et al. Integrative genomics reveals the polygenic basis of seedlessness in grapevine.Curr Biol. 2024;34(16):3763-3777.e5. doi:10.1016/j.cub.2024.07.022

Pras



北京格致博雅生物科技有限公司(简称“格致博雅”)是国内领先的高通量测序和生物信息学技术研发企业,自成立以来始终秉持着“让生命可知”的愿景,专注于动植物多组学测算服务,致力于为育种 4.0 提供智能化解决方案。格致博雅具备完整的基因检测技术链,拥有自动化的样本前处理平台、超高通量 DNBSEQ-T7 测序平台以及配备有大量自研数据处理流程的高性能计算中心,以“大数据+生物技术”为核心竞争力。格致博雅搭建有多基因分型检测、高通量测序和动植物多组学数据挖据的生物育种底层技术平台,提供基因组测序与分析、单细胞及多组学测序与分析和宠物基因检测三大技术服务。格致博雅现已获得北京市“专精特新”中小企业、国家高新技术企业、中关村高新技术企业、北京市“创新型”中小企业、ISO9001 质量体系认证等多项荣誉资质。 


格致博雅生物科技
Make Life Predictable
 最新文章