小麦是世界上种植面积最大的粮食作物,全世界有数十万份小麦种质资源保存在基因库中。对小麦种质资源精准基因分型是解锁遗传多样性、加速品种改良的首要步骤。小麦新审定品种数量逐年增加,新品种的遗传相似度高,同质化特征增强;亟需开发适用于高通量、低成本、面向育种应用的小麦种质材料鉴定技术。近年来,DNA分子标记技术迅速发展,然而对于基因组庞大且复杂的异源六倍体小麦而言,这些技术仍然具有检测通量低、成本偏高、技术复杂、敏感性偏低等问题。中国农业大学小麦研究中心团队在前期研究中发现,由于多倍体小麦的基因功能冗余,小麦基因组中存在丰富的长片段的拷贝数变异区块(Yang et al., Plant Physiology, 2022),且此类区块在当前主栽品种中具有高度多态性,具备成为新型分子标记的潜力。
2024年7月1日,中国农业大学农学院小麦研究中心在 Genome Biology 上在线发表了题为“Tagging large CNV blocks in wheat boosts digitalization of germplasm resources by ultra-low-coverage sequencing”的研究论文,实现了基于1Gb超低深度测序数据(50元)对超1000个标记的精准扫描。该研究在泛基因组水平鉴定了了小麦基因组的长片段拷贝数变异区块(CNV block,CNVb),并开发了1240个高质量的CNVb标记,证明CNVb可用作种质资源鉴别的理想的新型分子指纹标记。该策略支持基于超低深度测序数据(0.05×,~1Gbp)对小麦育种材料进行精准种质鉴定,实现了基于低深度测序对r-e-z缺失、Dx5+Dy10、1RS·1BL、2NvS等小麦中已知远缘渗入利用区间及单倍型的鉴定。该研究构建了包含1599个全球小麦育种材料的数字化基因型CNVb图谱,并搭建了在线分析数据库WheatCNVb。该研究为实现数字化的小麦种质管理、精准育种决策提供了新思路。
小麦基因组比对“暗区”
可用于构建小麦数字指纹图谱
鉴于多倍体小麦基因组序列的冗余性,利用重测序数据可在小麦主栽品种中检测到频繁的CNV区块变异(图1a)。和水稻、玉米等二倍体作物相比,小麦育种材料中CNV的数量更高,特别是存在更多Mb尺度的CNV变异区块(图1b)。进一步分析发现,各小麦育成品种的基因组中检测到的CNV大区块在数量和位置上存在明显区别,有望作为小麦育种材料分子指纹的表征(图1c)。因而,通过对小麦群体规模发掘可反映遗传多样性的CNV区块(图1d),有望将这些大的CNV区块开发成新型的分子指纹标记(图1e)。
图1 小麦主栽品种中可检测到丰富的Mb尺度的CNV区块
开发了小麦泛基因组水平的
高质量CNVb标记鉴定策略
为了避免单一参考基因组引起的偏差,研究首先基于map-to-pan策略构建了可比对的小麦泛基因组。研究在中国春基因组IWGSC RefSeq v1.0的基础上,利用16个组装的其他小麦基因组序列进行迭代比对,共识别出975个在中国春基因组中缺失的基因组大区块,将基因组总长度延长了2.7 Gb,构建了用于序列比对的小麦参考泛基因组。基于该参考泛基因组,研究利用528份已发表的、具有代表性的小麦种质的高深度重测序数据,结合HMM模型进行数据降噪、对重复区块合并、过滤低质量区块等步骤,最终筛选得到1240个非冗余的高质量CNVb标记(图2)。饱和度分析表明,这些CNVb标记集足以表征小麦育种材料中CNVb的多态性。
图2 泛基因组水平的CNVb标记鉴定流程
基于CNVb指纹图谱实现
在超低测序深度下的
小麦种质精准鉴定
研究通过整合公开发表的小麦重测序数据,并利用已开发的CNVb标记进行扫描,最终绘制了包含1599份小麦材料的CNVb指纹图谱。研究团队创新性地以“二维码形式”对CNVb指纹图谱进行可视化,既清晰展示了每个样本的CNVb标记分布情况,也同时为每个样本提供了基于CNVb标记的“数字化身份证”(图2a)。例如,轮选987中可扫描到276个CNVb标记,包括“1RS·1BL易位”和“6B近着丝粒倒位(perInv-6B)”标记。统计显示,单个样本中存在的CNVb标记数量从119到322个不等(图2b),且CNVb指纹图能有效推算小麦品种间的遗传相似度(图2c)。特别地,CNVb标记支持对于超低深度测序数据的扫描:如在0.05×覆盖度下,最低召回率和精确率均在99.0%和97.9%以上,证明了CNVb标记具有极高的稳健性(图2d)。在超低测序深度(0.05×)下,CNVb指纹图谱能够准确的实现小麦品种的区分(图2e),表明这一新型标记可支持进行高通量、低成本的种质资源鉴定。
图3 CNVb标记在种质资源鉴定中的性能评估
将CNVb标记与结构变异和
关键等位基因单倍型关联
小麦野生近缘种的基因渗入是提高小麦遗传多样性的重要变异来源。渗入在染色体层面表现为大片段染色体的替换,在测序比对时表现为基因组特定区间测序读段覆盖度的降低。该研究通过关联已知的结构变异和关键等位基因单倍型与CNVb标记,成功将小麦育种利用的外源渗入片段(如黑麦来源1BL/1RS、偏凸山羊草来源的2NvS/2AS、提莫非维小麦来源2B染色体渗入)、结构变异(如半矮秆基因r-e-z缺失单倍型)、倒位(如preInv-6B)、优异等位基因(如高分子量谷蛋白Dx5+Dy10、Sr36)关联到可特异识别的CNVb标记(图4a-f)。PCR验证结果显示,CNVb标记能够准确区分2NvS渗入片段及与之重叠的不同等位基因型,证明了这一策略的有效性(图4g-i)。这些研究结果表明,CNVb标记可以有效识别小麦品种中通过远缘杂交利用的基因组渗入区间及优异等位基因,为实现小麦的精准分子标记辅助选择提供了技术支撑。
图4 关联CNVb标记与已知结构变异和主要单倍型
开发了WheatCNVb数据库网站
便于查询和比较CNVb指纹图谱
该研究开发了小麦WheatCNVb数据库(图5),涵盖了包括1599个普通小麦品种或品系的CNVb指纹图谱和1240个CNVb标记信息。WheatCNVb数据库提供小麦材料CNVb指纹图谱查询(“CNVb Profile”模块)、基于CNVb指纹图谱的品种比较与鉴定(“Variety Compare”模块)、CNVb标记信息及关联的外源渗入片段查询(“CNVb Marker Info”模块)等功能。此外,数据库还允许用户在本地利用低深度测序获得自有材料的读段深度信息,通过文件上传,与数据库中已有品种/品系进行CNVb指纹图谱比较(“Geno Scan”模块)。
图5 WheatCNVb数据库功能示意图
综上,该研究开发了一套基于CNVb的小麦新型分子标记系统,构建了首个全球小麦种质的CNVb数字化指纹图谱。结合超低深度测序,CNVb指纹图谱实现了低成本、高通量、高分辨率的种质资源精准鉴定。CNVb标记支持对重要育种利用等位基因的精准鉴定,为小麦设计育种提供了低成本、高通量、育种可用的分子标记。该新型指纹图谱技术有望为开展小麦育种资源的数字化管理和精准育种决策提供强有力的支持。
链接:WheatCNVb数据库,http://wheat.cau.edu.cn/WheatCNVb/
中国农业大学农学院小麦研究中心 孙其信 院士和 郭伟龙 副教授为该论文的通讯作者。中国农业大学农学院博士生 牛建霞(中国农大三亚研究院)、王文熙 和博士后 王梓豪 为论文共同第一作者。小麦研究中心 倪中福 教授、刘杰 教授、姚颖垠 教授、彭惠茹 教授、辛明明 教授、解超杰 教授对该工作进行了指导和帮助。中国农业大学研究生 陈哲、张晓玉、苗凌峰、杨正钊和已毕业博士 秦震 参与了该研究工作。南京农业大学 亓增军 教授为该工作提供了宝贵建议。崖州湾种子实验室 凌宏清 团队为该工作提供了重要数据支持。该工作得到了国家自然科学基金重大项目、国家重点研发计划、中国农业大学“2115人才培育计划”、拼多多-中国农业大学研究基金和博士后创新人才支持计划的资助。本工作也得到了中国农业大学超算平台的支持。本工作中相关创新方法已申请发明专利。
孙其信 院士作为学术带头人的中国农业大学小麦研究中心长期围绕多倍体小麦广适性的遗传基础和分子机制、小麦产量性状形成、小麦品质性状遗传调控等一系列重要科学问题开展系统深入的研究。该团队在“十三五”期间共获得国家科技进步二等奖1项,国家技术发明二等奖1项,教育部高校科研优秀成果技术发明奖一等奖1项,中华农业科技奖优秀创新团队奖1项;近5年在小麦研究方向发表Nature、Nature Communications、The Plant Cell、Molecular Plant等高水平研究论文50余篇。
藏粮于地、藏粮于技,作物科学是农业发展的关键。为促进作物领域科技创新进展交流,加强创新人才培养,弘扬学科优秀文化,推动现代农业高质量发展,在国内兄弟单位大力支持下,中国农业大学农学院牵头创立“作物科学联盟”公众号,旨在搭建作物科学领域创新思想的交流平台,弘扬科学家精神,传播科技兴农的新理念、新技术、新产品,引领全国作物学学科的创新与发展。