4.更有效利用遗传资源的前瞻性技术
4.1 田间PGR生理特征和疾病筛选的表型组学研究
近几十年来,包括近端、远程和现在基于卫星的传感在内的各种概念证明,结合特征挖掘,为精确定位具有特定感兴趣特征的植物遗传资源(PGR)提供了机会。目前,很难收集到关于收获指数等汇特征及其表达基础的高通量表型学(HTP)数据,包括大多数产量成分和物候。但在严格基于现场的生长分析的基础上,图像分析与DL模型相结合,将很快使更多的汇特征能够根据主要的发育阶段进行估计或建模。更完整的数据集将使育种模型能够确定遗传多样性在精英群体中不是最优的情况下是否需要PGR。PGR的生长习惯、物候和当地适应性往往存在极端差异,所以必须定制实验设计,以避免可能产生误导的混淆效应。设计良好的HTP平台有助于发现和验证PGR中生理特征表达的新水平。许多与辐射利用效率相关的性状在基因型之间可以很好地远程预测,包括光拦截、光合能力和结构、叶片色素组成、生长早期和胁迫下的生物量积累,以及色素含量的动态,这些都会影响光吸收和光保护机制。这些性状在PGR中都有较好的表达。冠层温度可以作为气孔导度、耐旱性和干旱下深层根系质量以及热胁迫下根系容量的高通量指标,这些都是PGR筛选的高优先级目标。它还被用于提高基因组选择的预测能力。近端光谱已被证明可用于估算90年代优质品系的产量和简单的生长分析。然而,结合机器学习(ML)和偏最小二乘等统计方法,该工具可以随机使用以确定多种选择指标,这将为PGR筛选开辟其他新的可能性。多光谱无人机和高分辨率卫星图像已经可以在生长早期评估小麦锈病的严重程度,这是大规模检测PGR产生的抗病能力的潜在潜力(图3)。图3 埃塞俄比亚不同空间分辨率下基于遥感的锈病严重程度筛查
将遥感技术用于育种目的的一些挑战是可操作性的规模、进入研究地点的途径以及国家对操作的限制。为了克服这些限制,可以使用卫星图像。这种规模的遥感将能够不断监测疾病发病率和新病原体的出现。由于全球收集的所有卫星数据将来自同一平台,因此在比较全球站点之间的基因型时,与仪器和人为错误相关的工件将大大减少。4.2 后基因组学:利用新的单倍型和候选基因进行下一代测序,以获得更大的遗传多样性和更好的恢复能力
基因组学驱动方法的研究进展迅速,在小麦方面正在进行多项努力,以解决与作物改良相关的重大挑战。这项研究的前瞻性目标之一与转基因作物的使用有关,是加速表征和利用种子库中保存的小麦作物的“进化潜力”,例如“发现种子”项目(https://seedsofdis covery.org)就证明了这一点。种子库基因组学已经展示了“分子护照”如何通过提供超越经典描述符边界的精确知识,在种子库管理中创造价值。比较(泛)基因组研究也有助于为特定物种的培养基因库提供基因组变异的见解。与现代栽培品种相比,对不同PGR收藏的分析提供了新的机会来识别在作物驯化过程中丢失的、被选择的或很少进入栽培基因库的遗传多样性。分析的主要目的是:(i)检测大规模的结构变异,如存在-缺失变异或拷贝数变异或反转(在可用组装的情况下)。(ii)克隆和功能注释影响选择程序所针对性状表型表达的遗传因素。(iii)量化遗传精英背景和多种环境中的因果QTL的遗传效应。在此基础上,Khan等人定义的超级泛基因组(super- pangenomics)将基因组变异库从初级小麦基因库扩展到更广泛的小麦属,包括来自小麦的二倍体、四倍体和六倍体物种及其野生近缘种的高质量基因组组合(图4)。图4 面包小麦近缘种基因组组装释放时间表
在脱脂或全基因组测序之后,PGR收集可以通过GWAS、嵌套关联图谱或双亲本QTL分析来研究结构群体。在最好的情况下,这些方法通过可用的程序集和注释直接导致候选基因的发现。在确定了致病基因后,等位基因挖掘是寻找进一步有用变异的有效手段,并最终确定和验证单倍型的新颖性,这些单倍型的部署可以扩大精英群体的遗传变异。为了阐明遗传信息如何转化为个体表现出的特征和特征,基因型-表型图谱是一个基本概念。野生亲缘关系中的基因型-表型图谱是指这些野生种群的遗传变异如何产生这些野生物种所观察到的性状和特征;然而,它们同样适用于将理想性状引入优质种质。努力更深入地了解种子中储存的基因组信息如何转化为植物的表现是至关重要的。根据GlobalWheatG2B合作计划(https://www.g2b.com/),对基因型-表型图谱进行简单的数据库查询可以精确估计任何给定野生近缘种与优质小麦品种的遗传价值。越来越多的研究获得了越来越多的多组学数据(如基因组学、转录组学和代谢组学),这进一步为全面了解复杂性状的分子机制提供了难得的机会。组学实验中通过高通量和快速数据生成的多层信息有助于更好地解释基因功能,建立基因与性状相互作用的未来动态模型,以实现作物改良。4.3 PGR影响的大数据分析:使用历史、国际育种试验和环境数据
不同的PGR收集已经在育种中使用了几十年,并且可以获得广泛的表型性能、系谱和基因型数据。IWIN于20世纪70年代启动,对全球产生了重大影响,为全球至少一半的小麦产量贡献了性状。IWIN的合作伙伴包括公共和私营部门,与CIMMYT共享关键数据,包括农艺性状和抗病性(https://data.cimmyt.org/dataverse/cimmytdatadvn)。最近发布的ERA5 和AgERA5天气数据集解决了天气数据缺乏的问题,允许对大型数据集进行全面分析。通过考虑谱系信息、标记和天气数据,大数据分析可以很容易地识别与PGR相关的性能模式。使用这种方法的育种者已经可以获得有关应对全球变暖的信息,还有更多的机会来检测本地、区域和全球的适应模式,以及调查假设。IWIN已经从12个有针对性的苗圃中积累了6000多年的数据,这些苗圃专注于战略特征,即影响区域或全球问题的苗圃,每个苗圃都有大约50个优秀的抗病品系,继续提供丰富的信息,可以建模。虽然大数据分析以前是一个繁琐的过程,但最近的技术使这样的全球数据集变得非常有价值。植物育种技术已经受益于技术进步,特别是那些来自ML方法和人工智能其他分支的技术进步。ML技术,包括DL方法,广泛应用于植物育种研究,分析和评估从DNA序列到植物可观察表型性状的信息传递。HTP的广泛应用和在地块尺度上卫星表型的前景,结合良好的环境数据、基因组数据和DL模型,将揭示PGR的全部影响,并可能提出新的目标,以帮助优先考虑等位基因挖掘和广泛杂交策略。