田间高通量玉米雄穗表型测量:背包式激光雷达技术和机器学习算法

学术   2024-09-30 17:51   四川  
愿我们伟大的祖国永远繁荣昌盛!

祝大家国庆节快乐!

在全球人口不断增长,粮食需求日益攀升的背景下,作物生产力却面临着诸多挑战,如生物和非生物胁迫、气候变化以及耕地减少等。植物育种作为提高作物韧性、保障粮食产量稳定的关键策略,其重要性不言而喻。玉米作为世界上广泛种植的重要作物,产量提升趋势近期趋于平稳,进一步挖掘其增产潜力迫在眉睫。通过改良玉米植物架构,尤其是雄穗性状,对适应高密度种植和提高产量具有重要意义。而将作物基因组学、表型组学和统计建模相结合的跨学科方法,为复杂性状的遗传分析带来了新的机遇。

传统的植物性状测量方法劳动密集、效率低下且易出错,成为育种工作的瓶颈。随着技术的发展,机器学习方法为基因组预测模型带来了变革。三维数据能准确呈现作物空间形态,LiDAR激光雷达点云技术在植物三维形态信息提取方面具有优势。最近,一项由圣路易斯大学和唐纳德·丹佛斯植物科学中心的研究人员完成的新研究,成功利用背包式3D激光雷达(LiDAR)技术和机器学习算法,在真实田间条件下实现了玉米雄穗的快速表型分析,并提出了全新的方法来扫描和数字重建玉米雄穗结构。

研究人员选取了来自Ames多样性面板(Ames diversity panel)的500个玉米自交系作为训练群体,在伊利诺伊大学香槟分校进行种植和表型观察。他们使用Leica Pegasus Backpack LiDAR系统采集田间玉米冠层的三维点云数据,该系统配备两个Velodyne LiDAR Puck(VLP)-16激光扫描仪和五个高动态范围(HDR)相机,能实现精确的地理定位,数据精度可达2 - 3厘米。同时,还收集了Trimble R12 GNSS基站数据用于后处理。

在玉米雄穗分割方面,研究采用了基于K-means聚类和DBSCAN的流程。首先对原始点云数据进行预处理,包括去除离群值、分离地面和地上点以及归一化。然后通过数字化地块边界进行地块级点云分割,排除不符合条件的地块。接着利用k-means聚类算法进行地块行级分割和个体雄穗分割,并通过间隙统计方法确定最佳聚类数。最后使用DBSCAN算法精炼分割结果,成功识别了13,190株个体植物,大幅增加了每个基因型的表型数据点数量。

地块和单个雄穗分割流程

A)输入点云数据的预处理和单个玉米雄穗的分割(田间部分,2×2网格 - 2列×2行)。(i)田间输入点云数据,(ii)使用统计离群值去除、布料模拟平滑滤波器和归一化处理后的点云,(iii)使用数字化地块边界在地块级别分割的点云,(iv)在地块行级别分割的点云,(v)基于植物高度使用高度阈值去除植物下部后得到的点云,(vi)使用K-均值聚类分割的单个雄穗点云,并最终通过DBSCAN进行细化。B)在单个雄穗层面实现的分割结果。(i)使用K-均值聚类分割的雄穗,(ii)分割后的单个雄穗,显示仍附着有一些叶片和茎的部分,(iii)DBSCAN结果:单个分割的雄穗被染成蓝色,而非花序部分被染成绿色、棕色和黑色,(iv)使用DBSCAN最终细化后的单个雄穗。C)玉米雄穗形态表型特征的测量。(i)雄穗的表型特征,(ii)雄穗的凸包投影(顶视图)。

对于玉米雄穗形态表型特征的提取,研究人员利用分割后的点云,量化了雄穗紧凑度、长度和宽度三个重要特征。雄穗长度通过点云Z坐标计算,宽度通过在XY平面投影计算,紧凑度则通过雄穗面积与凸包面积之比确定。这些特征测量与不同方法收集的地面真值数据验证结果良好,紧凑度和长度的R²值分别为0.94和0.79。

研究发现,训练群体中三个雄穗性状的表型变异广泛。雄穗紧凑度与长度和宽度不相关,长度和宽度呈中度正相关。在遗传力方面,雄穗紧凑度遗传力较高(0.6083),长度和宽度遗传力较低(分别为0.2802和0.2854)。全基因组关联研究(GWAS)还确定了调控这些性状的基因组区域或位点,尤其是对于紧凑度,发现了多个显著的标记相关位点,揭示了相关的玉米发育调节因子。

基于激光雷达的玉米雄穗形态特征提取及关系

A)热图表示在田间地块水平上雄穗紧凑度、长度和宽度值的估计地块平均值。白色框表示缺失数据。B)估计的雄穗性状之间的皮尔逊相关性。报告了每对表型的相关系数。C)狭义遗传力。

在基因组预测分析中,通过五折交叉验证发现,FDR截止值≤0.1的基因相关标记集的预测能力高于全基因组标记集,紧凑度、长度和宽度的预测准确性分别提高了25%、47%和54%。

玉米雄穗形态特征的关联分析

曼哈顿图表示使用广义线性模型对雄穗紧凑度、长度和宽度进行全基因组关联分析(GWAS)的结果。x轴表示玉米染色体上的单核苷酸多态性(SNP)位置,y轴表示 -log10(P值)。P < 1e - 06的显著SNP以绿色点突出显示。位于基因区域内(见方法)且FDR < 0.1的SNP以紫色点突出显示。

基因组预测模型对雄穗性状的预测能力

A)从玉米训练集中对三个雄穗性状(紧凑度、长度和宽度)进行五折交叉验证获得预测准确性。箱线图突出显示了基于线性回归模型(FDR)的全基因组关联分析(GWAS)中显著基因峰值相关标记的预测准确性高于全基因组标记集(WG)的准确性。B)基于FDR和WG的三个雄穗性状的预测结果与经验零分布相关呈现,该经验零分布由1000次随机选择标记的迭代生成。密度图表示每个性状的零分布,而WG和FDR的预测准确性以箭头表示,同时箭头指示经验零分布的第95百分位数。

这项研究建立了高效的玉米表型平台,能够更准确快速地测量复杂性状。虽然点云分辨率受扫描条件影响,部分雄穗点云数据存在稀疏问题,但通过合理处理保证了数据集的可靠性。研究整合高分辨率表型数据与基因组预测模型,展示了表型技术与基因组预测结合的有效性,尤其对于雄穗紧凑度等遗传力高的性状,为深入理解玉米农艺性状遗传结构提供了有力支持,对其他作物育种也具有潜在应用价值,有望加速培育高产、抗逆的作物品种,为精准育种开辟道路,助力全球粮食安全和可持续发展。这项创新性的研究不仅展示了科技在农业领域的应用潜力,也为我们提供了一个关于如何利用现代技术解决传统农业问题的新视角。随着技术的不断进步,我们有理由相信,未来农业将变得更加智能化、精准化。

—— 原文 ——
Patel A K, Bertolini E, Sagan V, et alGenomic prediction of maize tassel traits through LiDAR point cloud segmentation and machine learning phenotyping[J]agriRxiv, 2024: 20240350550.
相关阅读:
• 精准农业新突破:无人机激光雷达三维作物表型分析

• 激光雷达在草地生物多样性研究中的应用

山河无恙,烟火寻常,可是你如愿的眺望!

AgriPheno平台
植物生理生态、植物表型组学和基因组学、激光雷达探测技术及数据分析、光谱技术、花粉活力分析、生物育种、温室气体、机器人自动化等领域,国内外最新资讯、战略与政策导读。
 最新文章