葡萄作为一种拥有重要经济价值的多年生水果作物,不仅可以直接作为鲜食,也是制作葡萄酒的重要原料,其驯化历史超过一万年,在此期间积累了大量的不利突变。由于葡萄育种周期较长,加之对其育种特性的遗传学研究不够深入,以及缺乏成熟的遗传转化体系,导致多组学技术和人工智能等前沿科技的应用相对滞后,葡萄的生物育种进展落后于一年生粮食作物。过去的研究因技术限制未能充分探讨结构变异及其对性状的影响,而这些影响极为关键。此外,传统的单参考基因组分析方法也带来了参考基因组偏差的问题。然而,随着第三代基因组测序技术的发展,完整的基因组及泛参考基因组的建立,为深入理解葡萄的关键农业性状开辟了新的途径。
2024年11月,中国农业科学院深圳农业基因组研究所(岭南现代农业科学与技术广东省实验室深圳分中心)周永锋团队在《自然·遗传学(Nature Genetics)》上在线发表了题为“Grapevine pangenome facilitates trait genetics and genomic breeding”的研究论文。该研究首次构建了驯化葡萄的泛参考基因组Grapepan v1.0,有效解决了单参考基因组带来的偏差问题。利用这一泛基因组,研究人员创建了一个涵盖单核苷酸多态性(SNP)、插入/缺失变异(InDel)和结构变异(SV)的葡萄基因型图谱,以及一系列重要育种性状的表型图谱。通过全面的群体遗传学和数量遗传学分析,该研究揭示了葡萄复杂农业性状的遗传基础,并确定了29个与农业性状相关的数量性状基因座(QTLs)。研究还发现,大多数结构变异与单核苷酸多态性之间不存在连锁关系,结构变异对农业性状的遗传力有显著贡献。通过结合机器学习算法、基因型与表型图谱及数量遗传学分析,研究团队提出了一种针对葡萄多性状的全基因组选择育种模型,成功建立了葡萄的全基因组选择育种系统。这一体系能够有效减少育种时间、降低成本并提升育种效率,形成葡萄育种的新生产能力,为我国解决葡萄种业面临的挑战奠定了坚实的基础。同时,这项研究提供的方法和模型也为其他多年生作物的遗传改良提供了有价值的参考。
构建首个驯化葡萄图形泛参考基因组(Grapepan v1.0)长期以来,单参考基因组因其无法全面反映物种内部的遗传多样性,而导致变异识别不足、映射偏差等问题,限制了对基因组变异类型的全面理解和准确分析。然而,图形泛基因组技术的兴起显著缓解了这些问题,它能更好地展现物种的遗传多样性,消除参考基因组带来的偏差,并整合各种基因组变异,从而实现对基因组变异更为彻底和精确的识别。在这项最新的研究中,科学家们对九个二倍体葡萄样本(包括野生种和栽培品种)进行了精细组装,获得了18个端粒到端粒(T2T)水平的单倍型基因组。研究团队进一步整合新组装和已发表的基因组,成功构建了葡萄图形泛参考基因组(Grapepan v1.0),其总长度达到1.43 Gb,是现有单参考基因组的2.88倍。通过泛基因组,共检测到236,449个可靠的结构变异。这一成就意味着,通过构建图形泛基因组,可以更加广泛地捕捉和整合葡萄中的遗传变异,为深入探究葡萄的遗传机制及其育种策略提供了极其宝贵的资源和支持。图1 | 葡萄T2T基因组组装及泛参考基因组的构建该研究通过利用图形泛参考基因组及466份样本的重测序数据,成功构建了葡萄的基因组变异图谱,其中鉴定了8,591,919个单核苷酸多态性(SNPs)、513,969个短插入(Indels)和236,449个结构变异(SVs)。为了进一步构建葡萄的关键性状图谱,研究团队对324份栽培葡萄的29个核心农艺性状进行了为期两年(2016年和2017年)的详细观察记录。这些性状主要分为五个大类:果穗大小、浆果内含物、浆果特性、浆果大小和浆果果皮特征。研究结果显示,不同的性状之间存在着显著的相关性。例如,在浆果内含物方面,果糖(Fru)、葡萄糖(Glu)和可溶性固形物(SSC)之间表现出显著的正相关关系(P < 0.001)。这种性状间的关联提示,它们可能受到相同或相似基因座的调控作用,这为基于全基因组选择的多性状优良葡萄育种提供了重要的理论依据(图2)。复杂农艺性状的遗传基础:该研究采用了数量遗传学分析方法,成功鉴定了148个与农艺性状显著相关的遗传位点,其中包括136个基于SNPs数据的位点和12个基于SVs数据的位点,这些位点总计占葡萄基因组的大约5.58%(图3)。值得注意的是,其中26个位点已在先前的研究中有所报道,包括18号染色体上与无籽性状关联的位点;而其余122个位点则是本研究首次发现的新位点。研究者还观察到,一些性状的QTL候选位点间存在显著的相关性,例如可溶性固形物含量和浆果宽度相关的位点位置相近,且该区域出现了选择性清除的现象。此外,利用XP-EHH方法的分析揭示,不同类型的葡萄群体(如酿酒用、鲜食型以及美洲鲜食杂交种)间存在显著差异化的基因组区域,这些区域内含有多个与浆果颜色、果皮口感、浆果形态、果穗重量、果肉硬度、果实尺寸及代谢产物等性状相关的QTL位点,这表明针对特定农艺性状的选择压力促进了酿酒用与鲜食型葡萄之间的分化。图3 | 与农艺性状相关的候选基因座及其人工选择印记结构变异贡献缺失的遗传力:历史上,由于技术限制,结构变异(SVs)往往未得到充分关注,尽管它们对性状的影响同样重要。本研究通过使用泛参考基因组和重测序数据,获得了精确且全面的葡萄SVs数据集。研究发现,SVs与SNPs之间的连锁不平衡迅速下降,暗示着葡萄数量性状的部分“缺失遗传力”可能潜藏于SVs之中。进一步的研究显示,SVs对多数农艺性状的遗传力有着显著贡献,并且在某些性状上的影响甚至超过了SNPs。比如,全基因组范围内的SVs能够解释74.6%的浆果宽度遗传变异,而SNPs仅能解释0.5%;对于可溶性固形物含量而言,SVs贡献了35.8%的遗传力,相比之下,SNPs的贡献仅为0.6%(图4)。因此,传统的仅依靠SNPs进行农艺性状预测的方法效果有限,而本研究中结合SVs和SNPs数据的全基因组选择模型则显著提高了预测的准确性。为了建立遗传变异与表型之间的联系,研究人员采用机器学习方法计算多基因评分(PGS)。在植物育种中,PGS的应用允许育种者在早期阶段筛选出优秀的基因型,从而能够从大量的育种材料中快速挑选出具有高遗传潜力的个体[4, 10]。本研究中,团队利用全基因组选择(GS)方法来进行表现预测分析。具体操作上,将包含表型和基因型的数据集分为三个部分:训练集、验证集和测试集(图5)。通过机器学习算法来解析基因型与表型数据之间的复杂关系,使用训练数据集构建GS模型,然后利用验证集对模型参数进行调优,最后通过测试集评估模型的最终性能。研究结果表明,当结合结构变异信息与机器学习模型时,PGS评分的预测准确率平均超过50%,较之以往的研究有了显著提升,特别是在预测浆果长度和可溶性固形物含量等性状方面表现尤为突出。这证明了利用全基因组选择技术进行葡萄遗传改良不仅是可行的,而且具有巨大的应用潜力(图6)。与传统的杂交育种方法相比,全基因组选择育种能够将育种效率提高四倍,极大地加速了葡萄育种的过程,革新了葡萄育种的策略(图7)。全基因组选择育种在育种周期、育种规模以及育种成本等方面展现出明显的优势,能够有针对性地培育出高品质的葡萄新品种。因此,本研究构建的葡萄全基因组选择育种体系,不仅能有效促进关键农艺性状的高效筛选,加速新种质的创造,大幅缩短育种周期,降低育种成本,还将为我国葡萄育种提供强有力的技术支持,为实现葡萄分子设计育种奠定理论基础,并为其他多年生作物的遗传育种提供参考。该研究构建的葡萄图形泛基因组(Grapepan v1.0)及其变异图谱,为葡萄的基因组学研究和育种工作提供了重要的资源。通过对结构变异(SVs)在葡萄基因组内的分布、与其它遗传元素的相互作用及其对农艺性状遗传力的贡献进行深入分析,揭示了SVs在葡萄遗传多样性及育种中的关键作用。研究中发现的葡萄农艺性状的遗传基础和性状间的遗传相关性,为实施多性状的全基因组选择育种提供了坚实的理论支持和实际指导,有助于加快葡萄品种的创新,使其更好地满足种植需求、市场变化和应对气候变化。展望未来,基于本研究的成果,预计将能培育出品质更优、抗逆性更强、产量更高的葡萄新品种,促进葡萄产业的可持续发展。此外,本研究的方法和成果也为其他作物的生物育种研究提供了有益的参考。中国农业科学院深圳农业基因组研究所(岭南现代农业科学与技术广东省实验室深圳分中心)周永锋研究员、肖华副研究员和南京农业大学房经贵教授为该文章的通讯作者,基因组所(大鹏湾实验室)博士后刘众杰、王楠,博士生苏颖、龙颀明,彭艳玲副研究员和南京农业大学上官凌飞教授为该文章的共同第一作者,基因组所(大鹏湾实验室)博士后张帆、薛辉、马志尧、刘文文、徐小东、李超超、曹雪瑾、Bilal Ahmad、金仲鑫、王怡雯,博士生王旭、刘镇亚、硕士生曹硕、侯婷、苏相年、刘玉婷、黄贵州、独梦蕊、甘宇等周永锋团队成员参与了此研究,中国农业科学院深圳农业基因组研究所、中国热带农业科学院黄三文院士、加州大学尔湾分校Brandon Gaut教授对这项研究提出了宝贵的指导。中国农业科学院郑州果树研究所刘崇怀研究员、樊秀彩研究员、孙磊博士,新疆农业科学院园艺作物研究所伍新宇研究员、钟海霞副研究员参与了该研究。该研究获得了国家重点研发计划、国家优秀青年科学基金(海外)、国家自然科学基金、中央政府引导地方科技发展专项资金项目等项目的支持。周永锋团队长期专注于葡萄全基因组设计育种工作,开展了葡萄驯化的群体遗传学研究,揭示了克隆繁殖作物的群体遗传学特性;探索了葡萄驯化中基因渗入与驯化成本;深入解析了葡萄重要农艺性状与抗性性状的遗传基础,建立了葡萄全基因组选择育种体系;鉴定了重要农艺与抗性性状相关的有益变异、有害变异与结构变异,为葡萄全基因组设计育种奠定了基础。近五年在国际学术期刊发表论文60余篇,其中以第一作者或通讯作者在Nature Genetics, Nature Plants、PNAS、Molecular Biology and Evolution、Current Biology等期刊等杂志发表SCI论文60余篇。研究成果被Nature Genetics、Nature Plants、Science Daily、科技日报等多家科研媒体报道。SMBE,GSA,ESEB,ISHS等学会会员;欧盟科学研究基金(ERC)评委;Horticulture Research副主编,Journal of Integrative Agriculture,BMC Genomics和《果树学报》等期刊编委成员。