为了探索高通量植物表型组学在水稻育种中的应用潜力,对中国南方水稻产区的100个优良水稻品种进行了高通量表型分析。利用RGB成像、荧光成像和高光谱成像技术,对水稻分蘖、拔节、灌浆和灌浆后20 d 4个关键生育期的88个参数进行了测定。利用子集选择回归和深度学习神经网络模型,对包括RGB颜色和形态特征、叶绿素荧光特征和水稻表面反射光谱在内的88个参数进行分析,以表征水稻的高产和高品质。共获得39个水稻产量和籽粒品质的显著线性回归模型,r平方值为0.86 ~ 0.15,平均r平方值为0.41。将100个水稻品种的数据分为训练集和测试集,利用预测值与实际值之间的平均绝对误差来评估模型的预测精度。结果表明,深度学习神经网络模型可用于改进线性回归模型,提高预测精度。这些结果表明,高通量植物表型组学可以有效地应用于水稻育种计划中,以选择高产、优质的水稻品种。
图1 工作流图像采集,背景减法,颜色分割,和形态参数计算。
图2 100个水稻品种的特性评价。(A)获得省级品种证书的75个水稻品种的地理分布情况。另有23个品种已获得国家品种证书,未在此地图上显示。地图上的数字表示本研究中使用的各省认证品种的数量。(二)98个水稻品种获得省级或国家级品种证书的年份。超过三分之二(66.3%)的获证品种是在2014年或之后获得证书的。(C) 100个水稻品种成熟期测定的10个产量和品质性状的频率分布。茎重、叶重、穗重、干物质重和精米率呈正态分布,穗数、糙米率、精米率、白垩米率和垩白度不服从正态分布
图3 不同生育期水稻品种RGB图像的颜色分割。(A)三个水稻品种在四个生长阶段的RGB照片说明。(B)九种颜色的演示,包括RGB(34,38,22), RGB(45,54,13), RGB(45,55,36), RGB(57,71,46), RGB(59,71,20), RGB(72,84,58), RGB(73,86,36), RGB(90,98,58)和RGB(110,111,90)。(C) HuRuan 1212水稻4个生育期9种颜色属性的像元值。(D) HuRuan1212水稻像元颜色的百分比分布。第1 ~ 4阶段分别为分蘖、拔节、灌浆和灌浆后20天。
图4 分蘖期88个高通量表型性状的频率分布。
图5 不同荧光参数下,荧光成像站获得的ZhongZheYou 8号水稻俯视图。
图6 5个产量相关性状与水稻不同生育期88个高通量表型性状的相关系数(A)分蘖期。(B)拔节阶段。(C)灌浆阶段。(D)灌浆期后20天。
图7 5个籽粒品质相关性状与水稻不同生育期88个高通量表型性状的相关系数。(A)分蘖期。(B)拔节阶段。(C)灌浆阶段。(D)灌浆期后20天。
图8 SWIR成像(光谱范围900-1700 nm)用于测量水稻叶片水分状况。每张图片上方都标示了品种名称和含水量。WATER1 = R1440 / R960,其中R1440和R960分别表示1440 nm和960 nm处的反射率值。WATER1后面的“avg”后缀表示基于逐像素检查水稻掩膜所定义区域的反射率的平均值。
图9 采用子集选择回归方法确定水稻分蘖、拔节、抽穗和灌浆4个生育期的最佳回归模型,预测水稻成熟期的最终产量和稻米品质。
图10 利用平均绝对误差(MAE)预测分蘖期7个产量和品质相关性状的线性回归与机器学习模型的比较这些性状包括穗重(A)、穗数(B)、糙米百分率(C)、精米百分率(D)、抽穗百分率(E)、白垩米百分率(F)和白垩度(G)。
Haoran Su, Yiding Wang, Weimeng Fu et al. Improving rice yield and quality through high-throughput phenomics, linear regression, and machine learning neural network models, 02 October 2024, under review.
编辑
王春颖
扩展阅读