2024年8月8日,Cell旗下的遗传学顶级综述期刊Trends in
Genetics在线发表了中国农业科学院作物科学研究所/国家南繁研究院李慧慧研究员团队联合国内外多家单位撰写的特邀综述:“Artificial
intelligence in plant breeding”。文章概述了人工智能(AI)作为一门跨学科的普适工具可以应用到植物育种领域的多方面,具备加速数据整合与处理,构建多组学的关联,预测、挖掘植物育种数据等多方面的应用潜力。
• 基因组学、表型组学和分子生物学的快速发展正在加速作物育种进入AI时代。
• 面对海量数据管理的巨大挑战,构建一个能够整合不同数据集的人工智能支持型植物育种集成数据基础设施显得尤为关键。
• 虽然AI技术已经在作物育种的多个方面取得了革命性的突破,包括表型组学分析、变异识别模型构建、基因发现、基因组选择以及基因编辑技术,但目前迫切需要将这些技术要素有机融合,形成一套综合的育种技术体系,以应对未来作物发展的新需求。在现代植物育种过程中,运用尖端技术以提升作物的生产力已成为核心目标。AI以其在大数据分析和模式识别上的卓越能力,正逐步革新包括植物育种在内的多个科学领域。本文深入研究了AI工具在育种流程中的多元应用潜力,这包括高效地收集数据,解锁植物基因库中的遗传多样性,并缩小基因型与表型之间的差异,从而推动作物育种工作的进展。通过这些技术,我们有望培育出能够适应未来环境变化的作物品种。此外,AI工具在提升基因编辑系统的精确度以及预测基因变异对植物表型影响方面也展现出巨大潜力,这将进一步优化作物的性状。借助AI支持的精准育种,我们能够显著提高育种计划的效率,并有望对基层种植体系进行优化。这涉及到确定最佳的间作和轮作模式,以增强田间农业的可持续性与生产力。在全球人口增长和气候变化影响加剧的背景下,提高作物产量仍然是一项艰巨的挑战。根据育种者方程,遗传增益依赖于选择准确性、选择强度、遗传方差和代际周转时间的改进。文章提出AI作为跨学科的普适工具,有望加速遗传增益。当前植物育种的特点是“数据泛滥”,其中通过组学创新产生的数据远远超过了有效管理、归档和分析的能力。与传统方法相比,AI工具能够从高通量测序和成像数据中提取更有用、更小偏差的见解。AI驱动的植物育种路线图
AI使基因库资源的特征化成为可能,从而产生了大量的基因组大数据。这些数据有助于理解作物的遗传多样性,并加速开发适应气候变化的品种。文章讨论了如何使用机器学习算法在预育种策略、区域选择和适应性标记辅助选择中提升遗传多样性,并加快气候适应性品种的开发。表型数据对于作物育种至关重要,但传统方法在数据获取能力上存在限制。植物表型组学的兴起代表了作物育种范式的一个根本转变,它系统地研究表型,有望克服这些限制。文章讨论了如何使用先进的成像传感器和机器学习工具来提取植物图像数据中的模式和特征,从而预测关键的植物性状。
AI在解释生物化学数据方面展现出巨大潜力,有助于深入理解植物逆境生物学。文章举例说明了AI如何用于预测基因组交叉事件、识别和表征基因组区域,以及预测基因启动子和顺式调控元件,从而有助于理解植物代谢调控网络。
在生化层面上,"组学"包括了如基因组学、表观基因组学、蛋白质-DNA相互作用、转录组学、蛋白质组学、代谢组学等多种分子数据源。文章讨论了如何使用机器学习方法来整合这些庞大的数据集,并提出一个路线图,用于在植物育种中利用多组学数据。
文章讨论了AI在非破坏性精确估计作物性状和遗传研究中的潜力。通过AI方法,研究者能够预测作物产量并进行数量基因组分析,识别小麦中的新等位基因,并通过多模态深度学习提高小麦产量的基因组预测准确性。
AI和机器学习技术在解决特定生物学挑战方面发挥了关键作用,尤其是在鉴定植物耐盐基因方面。文章讨论了如何使用基于深度学习的基因功能预测模型来识别盐胁迫下的基因表达差异,并揭示关键途径。
构建遗传网络通常比单一组学应用在揭示生物系统中的复杂关系方面更为强大。文章讨论了如何使用深度学习模型来检查多组学数据,并识别与非模型耐盐植物中的盐耐受性相关的基因。
通过使用AI支持的基因组选择预测表型来进行实用的植物育种文章讨论了如何使用AI技术来提高基于标记的选择(MAS)和基因组选择(GS)的准确性。这些技术有助于表型预测,尤其是在处理大量数据集时,AI提供了一种灵活且有用的替代方案。
基因组编辑技术的发展加速了分子生物学和育种的进步。AI在表征结构信息和优化蛋白质功能方面有所应用,例如使用AlphaFold2预测的蛋白质结构数据来发现新的功能簇,并利用这些信息开发更有效的碱基编辑器。
AI技术在植物育种领域的应用,正在引发一场革命,特别是在“One CGIAR”等国际农业研究项目中,数据驱动的分散育种项目通过AI技术,能够比传统的基因组选择方法更准确地预测作物性能。AI育种平台利用先进的计算和分析算法,加快了育种进程,其在基因发现和等位基因挖掘方面的潜力已经得到了明确的认可。然而,AI的真正价值在于帮助设计未来能够适应预期环境的作物品种。面临的挑战包括:(i) 模拟和表征预测环境中基因库的多样性,以便在不引入连锁阻力的情况下将新性状整合到品种中;(ii) 构建和培训人力资源,以有效利用AI预测育种的计算能力;(iii) 为设计未来作物品种的育种团队提供多学科AI培训;(iv) 建立统一的植物育种网络基础设施,避免形成数据孤岛。AI在预测最佳种植模式和系统方面也显示出巨大的潜力,它通过整合来自物理传感器、无人机平台和物联网设备,在不同基因型×环境×管理实践下获得的大数据。这将补充基于AI的遗传创新,以实现满足未来十年食品和营养挑战所需的遗传增益速率。M. A. Farooq, S. Gao, M. A. Hassan, et al. Artificial intelligence in plant breeding[J]. Trends in Genetics, 2024.