专题报道:郑万钧先生诞辰120周年纪念专题Ⅱ ||河南农业大学尚富德教授团队开展基于表型性状构建桂花主要品种资源的分子身份证研究
学术
科学
2024-09-18 19:15
江苏
基于表型性状和SNP标记构建桂花主要品种资源的分子身份证
王一涵1,刘姣姣1,金沛权1,李书情1,魏建芬2,郭 朋1,尚富德1*
1. 河南农业大学生命科学学院,河南省桂花种质创新与资源利用工程研究中心;2. 杭州桂花国家种质资源库
关键词:桂花;品种鉴别;单核苷酸多态性;表型性状;分子身份证
基金项目:国家自然科学基金项目(32371911);河南省重大公益专项(201300110900)。
引文格式:王一涵, 刘姣姣, 金沛权, 等. 基于表型性状和SNP标记构建桂花主要品种资源的分子身份证[J]. 南京林业大学学报(自然科学版), 2024, 48(4): 12-24.WANG Y H, LIU J J, JIN P P, et al. Construction of molecular ID for Osmanthus fragrans cultivars based on phenotypic traits and single nucleotide polymorphisms (SNPs)[J]. Journal of Nanjing Forestry University(Natural Science Edition), 2024, 48(4): 12-24 DOI:10.12302/j.issn.1000-2006.202405026.
尚富德,河南农业大学生命科学学院教授,博士生导师,河南省桂花种质创新与资源利用工程研究中心主任,中国花卉协会桂花分会名誉会长,长期致力于木犀属植物分类和系统进化、桂花芳香物质的生物合成和调控等研究。
王一涵,河南农业大学生命科学学院副教授,硕士生导师,中国花卉协会桂花分会理事,主要研究方向为桂花品种分类及分子鉴定、桂花野生种质资源保护与利用。
【目的】筛选核心单核苷酸多态性(single nucleotide polymorphism,SNP)位点,建立基于KASP平台的桂花(Osmanthus fragrans)品种基因型快速检测方法,构建品种特异性分子身份证,为桂花品种鉴定、溯源、知识产权保护等提供理论基础。【方法】实地调查主流桂花栽培品种的重要表型特征。通过两轮严格筛选,从基因组SNP中保留一组能够完全鉴别测序品种的最优SNP标记,计算SNP 位点的多态信息含量(PIC)、期望杂合度(He)等信息。以‘日香桂’(‘Rixianggui’)基因组为参考,设计桂花特异性KASP引物并进行批量扩增,根据基因分型结果建立品种指纹图谱,评估核心SNP标记的品种鉴别力。结合品种表型信息码和品种分子指纹码构建桂花品种资源的分子身份证。【结果】筛选出14个能够完全鉴别测序品种的核心SNP位点。各位点PIC值的变化范围为0.246~0.375,平均值为0.335;He的变化范围为 0.288~0.500,平均值为0.431。针对核心位点设计的KASP引物基因分型准确。根据扩增结果构建DNA指纹图谱,可区分全部包括未测序品种在内的90个参试品种。对品种表型特征赋值,结合指纹码构建由34位数字组成的桂花品种资源分子身份证。【结论】确定了SNP1—SNP14共14个核心SNP位点,能够实现至少90个桂花品种的有效鉴别。结合品种群类型、表型特征和分子指纹码构建了90个桂花品种的唯一分子身份证,并生成对应的条形码和二维码。
桂花(Osmanthus fragrans)隶属木犀科(Oleaceae)木犀属(Osmanthus),为中国传统名花,在秦岭淮河流域以南、南岭以北的广大中亚热带和北亚热带地区广泛栽培。经过两千多年的自然变异和人工繁育,桂花形成了丰富的种内变异和品种资源。根据花期、花色和叶色的不同,桂花可分为金桂(Luteus group)、银桂(Albus group)、丹桂(Aurantiacus group)、四季桂(Asiaticus group)和彩叶桂(Caiyegui group)五大品种群,已知品种有近300个。近年来,随着野生资源的开发和杂交育种工作的系统深入,新优桂花品种不断涌现。然而,在引种和品种资源交换过程中,“同物异名”和“同名异物”的现象时有发生。国家标准《植物新品种特异性、一致性和稳定性DUS测试指南 桂花》的颁布为桂花品种鉴别和新品种测试提供了技术方法和标准。该标准确定了41个较稳定的特征(如花枝长度、叶腋内花芽数量、花色、花期等)作为DUS测试的性状特征。但由于表型性状极易受环境影响,国际植物新品种保护联盟在2013年提出了基于表型距离和分子距离联合筛选近似品种的模式。但是目前在桂花品种认定中,除性状特异性外,仅要求其遗传稳定性与一致性,尚未在分子标记鉴定与分子条码上进行规范。
分子标记不依赖表型性状,稳定性强,是探索植物遗传变异、开展品种鉴别研究的重要工具。桂花现代栽培品种的遗传背景复杂,由于高质量基因组资源的缺乏,前期研究者主要采用传统标记进行品种鉴定、分子指纹图谱的构建和遗传连锁图谱的绘制,比如相关序列扩增多态性(sequence-related amplified polymorphism,SRAP)、简单重复序列间扩增(inter-simple sequence repeat,ISSR)、扩增片段长度多态性(amplified fragment length polymorphism,AFLP)、微卫星(simple sequence repeats,SSR)等。近年来, ‘日香桂’(‘Rixianggui’)、‘柳叶金桂’(‘Liuye Jingui’)、‘状元红’(‘Zhuangyuanhong’)和‘玉莲银丝’(‘Yulian Yinsi’)4个桂花品种染色体水平的高质量基因组陆续公布,为挖掘和开发全基因组范围内的多态性分子标记(SSR、InDel、SNP等)提供了重要平台。与SSR和InDel相比,SNP标记更适合大量标记的高通量基因分型、数据库整合和数据共享,并且具有数量大、变异来源丰富、经济高效的优势,是BMT分子测试指南中构建DNA指纹数据库的推荐标记。Chen等基于重测序技术检测了桂花主流栽培品种基因组内的SNP标记,基于全基因组关联分析挖掘了与花色相关的SNP位点和候选基因。但仍亟须严格筛选全基因组的高多态性、非冗余的SNP位点,建立鉴定准确、检测高效的桂花品种分子鉴别技术。
新一代测序技术的发展推动了全基因组SNP标记的挖掘及其在观赏植物品种指纹图谱构建和品种鉴定上的应用,如月季(Rosa hybrida)、鸢尾(Iris tectorum)、波斯毛茛(Ranunculus asiaticus)。研究者通过建立竞争性等位基因特异性PCR技术(competitive allele-specific PCR,KASP)、SNP芯片技术(gene chip)等可以进一步提高已有SNP的使用效率和分析通量。这些技术在作物、蔬菜等植物品种和种质资源的基因分型、功能基因克隆与鉴定等领域有广泛的应用,为桂花高效品种鉴别技术的研究提供了参考。
在前期研究的基础上,本研究采用严格的过滤参数从桂花60个品种的全基因组重测序数据中筛选能够区分各品种的核心SNP位点,开发基于KASP平台的品种基因型快速检测方法,并建立品种特异性分子指纹图谱和分子身份证,以期为桂花品种鉴定、溯源、知识产权保护等提供理论参考。
试验所用的90个桂花品种,涵盖了4个桂花品种群,其中金桂30个、银桂28个、丹桂23个、四季桂9个,保存于浙江省杭州市余杭区的桂花国家级花卉种质资源库、河南省信阳市潢川金桂园和河南大学金明校区(附表1,nldxb.njfu.edu.cn,下同)。于2019—2020年采集各品种的新鲜嫩叶,用硅胶充分干燥后置于4 ℃保存。采用改良的CTAB法提取供试基因组DNA,采用1%(质量分数,下同)琼脂糖凝胶检测DNA的完整性,用NanoDrop 8000分光光度计(Thermo Fisher, DE, 美国)精确定量DNA浓度。提取的基因组DNA置于-20 ℃保存备用。
桂花的花色、花香、花量和结实性状是品种分类的重要依据,也是产业上品种价值体现的核心品质特征。本研究选取花色、花香、新梢顶芽和腋芽总数、着花密度和结实性共5个表型性状作为品种身份证中商品码的组成部分。参考《中国桂花品种图志》《中国桂花》和《桂花新品种DUS测试指南》制定调查标准,于2022—2023连续两年在样品采集地进行实地表型观测。调查时每个品种取3株重复,每株测定3次。
具体调查标准如下:
1)花色。在花初开放至全株1/3全开放期间观测,在晴天、自然光环境下,先把握全株整体的景观色彩,再细观向阳面树冠中上部花枝上的花瓣颜色,以英国皇家园艺学会(Royal Horticultural Society,RHS)出版的比色卡(RHS Color Chart)为标准(图1a),进行“白”“黄”“橙”3色的定性描述。
2)花香。采用鼻闻定性法在品种头茬花的初花期首日进行花香鉴定,根据香气程度分为浓香、中香、微香、不香4种类型。
3)花量。采用新梢顶芽和腋芽总数、着花密度(即每花序小花数)两个指标反映。新梢上的芽除了顶端少数是来年或当年秋季萌发的枝芽,绝大多数都是腋生的花芽。本研究于圆珠期随机选择9个1年生新生枝条,统计各枝条的顶芽和腋芽总数并计算平均值,根据结果将各品种划分为少花低产(<20枚/梢)、中花平产[[30)枚/梢]、多花丰产(≥30枚/梢)3个等级。此外,于盛花期统计从新梢顶端向下第2对叶腋处花序的小花数量,判断各品种的着花密度为稀疏(<5朵/花序)、中等[[5,8)朵/花序或稠密(≥8朵/花序)](图1b)。
4)结实性。根据雌蕊发育状况和花后结实与否判断,是品种内的稳定性状。雌蕊发育状况常因品种而异,有3种情况(图1c):一是雌蕊完全败育,属于雄花,常完全无雌蕊分化,或子房细长条形、柱头缺失;二是雌蕊退化,花内子房较狭长,呈长卵形,柱头短小,不能正常授粉受精或者果实发育异常;三是雌蕊和雄蕊均发育良好,为两性花,子房膨大呈圆球形或卵球形,能正常结实。雌蕊完全败育和雌蕊退化两种情况均记录为不结实品种。
前期李书情对60个桂花品种的重测序研究获得了1 599 694个高质量基因组SNP。本研究利用软件VCFtools V.0.1.13对上述SNP进行严格过滤,过滤标准如下:最小等位基因频率(minor allele frequency,MAF)≥0.05、样本分型缺失率为0、多态性信息含量(polymorphism information content,PIC)为 0.2~0.5、独立遗传[连锁不平衡过滤参数为LD独立性过滤(indep) 与使用成对的LD计算方法(pairwise)窗口大小50、步长10、阈值(r2)0.2]、SNP位点前后50 bp无其他变异、SNP位点前后100 bp的侧翼序列在染色体上有唯一比对,SNP位于外显子区且尽量在染色体上均匀分布(密度按至少100 kb/SNP)。对于第1轮过滤后的SNP位点,采用李梓榕等开发的R语言脚本,经过“初筛”和“精简”两步流程作进一步过滤,筛选出数量最少、能够完全区分60个桂花品种的5组SNP标记。通过后续引物设计和基因分型实验,保留一组KASP转化成功、分型准确的位点作为品种鉴定的核心SNP标记,并明确每个位点在各样本中的基因型。
基于KASP平台,以‘日香桂’基因组为参考,在每个核心SNP位点前后100 bp序列范围内设计引物。每个SNP位点分别设计3条引物:2条等位基因特异性的上(或下)游引物和一条下(或上)游通用引物。引物由北京擎科生物科技有限公司合成。KASP反应体系、反应程序和荧光信号判断方法按照Shen等的方法进行。对于预实验中分型效果和准确率较好的核心标记组合,在60个测序品种的基础上进一步扩大样本(加入30个未测序品种),进行KASP 批量扩增,用于评估核心SNP标记的品种鉴别力,并获得90个受试桂花品种在核心SNP位点的基因型数据。利用PowerMarker V.3.25软件计算各核心位点的次要等位基因频率(MAF)、多态信息含量(polymorphism information content,PIC)和期望杂合度(expected heterozygosity, He)。
通过KASP实验获得各品种在核心SNP位点的基因型数据后,将A、G、C、T依次转换为1、2、3、4,构建每个品种的分子指纹图谱,即分子指纹码。结合品种信息编码与分子指纹码,利用条码生成器和二维码生成器(http://qr-batch.com/)构建90个桂花品种的分子身份证。
2022—2023年连续2年对杭州市国家桂花种质资源库、信阳市潢川金桂园和河南大学金明校区的90个栽培桂花品种进行了花色、花香、花量和结实性的表型调查及图片拍摄。在调查的90个品种中,74个品种不结实,占比83.15%。浓香型桂花品种有23个,多集中在金桂和银桂品种群;四季桂品种群中,‘日香桂’和‘橙黄四季桂’(‘Chenghuang Sijigui’)花香较为浓郁,适合多季的香景营造。就花色而言,白色系桂花品种较少,代表的有银桂品种‘中华龙桂’(‘Zhonghua Longgui’)和‘串银球’(‘Chuanyinqiu’);金桂品种‘小花金桂’(‘Xiaohua Jingui’)和‘山茶金桂’(‘Shancha Jingui’)等;丹桂品种‘状元红’(‘Zhuangyuanhong’)和‘满条红’(‘Mantiaohong’)的花色最为鲜艳。桂花开花以当年新梢为主,各品种的花量与新梢花芽数和每花序小花数目有关。综合考虑这两项发育指标,调查品种中的‘柳叶苏桂’(‘Liuye Sugui’)、‘玉玲珑’(‘Yulinglong’)和‘速生金桂’(‘Susheng Jingui’)在调查年份花芽量大(平均30~36/梢)、着花稠密(7~9朵/花序)且不结实,是适合用于采花的高产花量品种(附表1,nldxb.njfu.edu.cn)。
经过两轮的严格筛选和KASP预实验,最终保留一组由14个核心SNP 位点组成的最精简SNP标记组合,能完全区分60个桂花品种(图2)。
这14个SNP标记都位于基因编码区,包含4个非同义突变和10 个同义突变。6个SNP位点的变异类型是碱基颠换,8个SNP是碱基转换(表1)。经计算,14个SNP位点的多态性水平较高,PIC值的变异范围为0.246~0.375,平均值为0.335;He指数的变异范围为0.288~0.500,平均值为0.431(表1)。提取14个核心SNP位点前后各100 bp的侧翼序列,设计合成KASP引物,携带有FAM荧光标签的引物序列为GAAGGTGACCAAGTTCATGCT,携带有HEX荧光标签的引物序列为GAAGGTCGGAGTCAACGGATT(表2)。
▲图 2 14个核心SNP对60个桂花品种的鉴定效率
2.3 核心SNP鉴定能力检验和品种分子指纹图谱的构建
利用KASP引物对60个已测序品种和30个未测序品种进行批量扩增,通过荧光信号强弱结果判断各核心位点的基因型(图3),从而验证分型准确性。经对比,所有SNP位点的KASP分型结果与重测序结果一致,可用于后续桂花品种分子鉴别中基因型的快速检测。当供试品种数量增多至90个时,该SNP标记组合仍能鉴定所有品种。进一步将14个核心SNP位点在90个品种中的基因型数据转化为分子指纹,结果表明,多个品种间具有较高的遗传相似性(仅1个位点差异),如‘橙香丹桂’(‘Chengxiang Dangui’)和‘红桂’(‘Honggui’)、‘湘金’(‘Xiangjin’)和‘速生银桂’(‘Susheng Yingui’)、‘娇容’(‘Jiaorong’)和‘武夷丹桂’(‘Wuyi Dangui’)等。
▲图 3 14个核心SNP位点的KASP标记基因分型图
将14个核心SNP位点(SNP1—SNP14)在各品种的基因型数据转化为28位指纹码,与品种信息编码联合构建34位分子身份证码。品种信息码为分子身份证的前6位,第1位数字为品种群类型编码,1~4分别代表金桂、银桂、丹桂和四季桂品种群;第2~6位数字为品种特征信息编码,通过对花色、花香、新梢顶芽和腋芽总数、每花序小花数量(着花密度)、结实性(雌蕊发育状况)5个品种表型特征赋值后生成。赋值方式如下:第2位“0、1、2”表示 “白、黄、橙”3种花色类型;第3位“0、1、2、3”表示 “不香、微香、中香、浓香”4种花香等级;第4位“1、2、3”依次表示新梢花芽数“少、中、多”;第5位“1、2、3”依次表示着花密度“稀疏、中等、稠密”;第6位“0、1”分别表示“不结实、结实”。以‘状元红’为例见图4)。
由图4可见,其分子身份证号码为3221102134211133223411334144333422,表示该品种属于丹桂品种群,花色为橙色,中香,新梢顶芽和腋芽总数少,着花密度稀疏,花后不结实,14个核心SNP标记的基因型依次为GA、CT、GA、AA、CG、GG、CT、AA、CC、TA、TT、CC、CT、GG。按照此方法完成90份桂花品种分子身份证的构建(表3)。最终利用条码在线生成器分别制作出品种特异的条形码和二维码(图5),90个桂花品种的分子身份证详见附图1(nldxb.njfu.edu.cn)。
▼表 3 90份桂花品种的种质资源信息编码与指纹码转换
SSR和SNP分子标记是国际《UPOV-BMT测试指南》和中国《植物品种鉴定DNA指纹方法总则》(NY/T 2594—2016)中推荐的最佳分子标记。SSR标记因通量有限、操作耗时、数据整合困难等问题,正逐渐被SNP标记取代。基于第3代SNP标记的品种身份证构建在观赏物种中报道不多,仅在兰科(Orchidaceae)、山茶(Camellia japonica)等少数花卉中有应用,目前在桂花中尚无相关研究。桂花遗传背景复杂,基因组杂合度(1.02%~1.45%)和重复序列比例(49.35%~54.41%)较高,多态性位点的信息量大且解析难度较高。因此,以高质量基因组为参考,从海量的全基因组变异中发掘可靠且有“鉴别力”的共显性SNP标记是建立品种基因型快速检测体系的关键。
从降低检测成本的方面考虑,用于构建分子指纹图谱的位点选择原则是用尽可能少的SNP鉴定全部样本。常规的SNP筛选流程主要关注位点检出率和多态性指标。前期桂花重测序研究在121个品种中检测到SNP位点数约160万个,PIC值为0.2~0.5的SNP约有41万个。采用传统的高PIC值方法从基因组数据中筛选核心位点操作难度大,且常有精简优化的空间。为克服该问题,本研究选择近期开发的新方法,经过“初筛”和“精简”两步流程筛选能够鉴定全部60个供试品种的SNP标记组合。经计算,最终保留了14个(SNP1—SNP14)位于基因编码区、在染色体上均匀分布的SNP位点(PIC:0.246~0.375),并进行了KASP标记的转化。对比发现,这一组合的鉴别率明显高于高PIC值筛选的SNP组合(100% vs. 89%),并且当品种数量增多至90个时,仍能鉴定所有品种(1~13个位点差异)。在受试品种中,‘长叶碧珠’(‘Changye Bizhu’)和‘银盏碧珠’(‘Yinzhan Bizhu’)、‘雄黄桂’(‘Xionghuanggui’)和‘堰虹桂’(‘Yanhonggui’)之间的表型差异很小,加之环境影响,在引种栽培中容易混淆。利用本研究的14个核心KASP-SNP标记进行鉴定,两对近似品种分别有5个和9个位点的基因型差异,易于区分。理论上,14个标记区分目前已知的所有桂花品种存在可行性,但具体的实用性有待进一步检验。在实践中也可以重复分析多次,联合多套SNP组合提高鉴定方法的容错能力。总之,本研究针对桂花核心SNP的KASP快速检测体系具有标记数量少、鉴别能力强、操作便捷、成本低的优势,检测结果可为今后桂花品种真实性鉴定和DUS测试标准的制定提供参考。
不同于单纯的分子指纹图谱,本研究将90个桂花品种的重要经济表型和14个SNP位点构建的分子指纹图谱信息结合起来,简化为标准化“身份”编码,再生成对应的条形码和二维码,可被设备快速扫码识别,便于产业上品种身份和品种应用特性的便捷化查询。同时,品种身份证的开发也可用于品种溯源和知识产权保护。例如,根据本研究的基因分型结果,国家地理标识产品‘潢川金桂’(‘Huangchuan Jingui’)在SNP2、SNP3、SNP7具有品种特异性的基因型组合(分别为C/C、G/A和C/T),可作为其在遗传上的明确标识特征,用于地理标志保护。但是,由于前期进行表型观测的种质资源圃中未引种彩叶桂品种,故本研究生成的品种身份证未涵盖该品种群。未来将收集市场主流的彩叶桂品种,如‘云田彩桂’(‘Yuntian Caigui’)、‘紫嫣公主’(‘Ziyan Gongzhu’)等,进一步检验SNP标记组合的品种鉴定力,并扩充桂花分子身份证库。
内容、音频、图片等来源:论文作者
责任编辑:吴祝华
微信制作:贾静雨
如何获取原文?
1.更多精彩敬扫描图片上方二维码请关注南林学报微信公众号、微博号、抖音号、喜马拉雅号、今日头条号
2.扫描下方二维码进入微信的博看网页面
3.原文链接请见于下方二维码