他山之石|Agric. For. Meteorol结合多个水稻物候模型和基于机器学习的遗传参数回归模型的双集合方法预测水稻抽穗期

学术 2024-11-24 23:15 英国

作物物候是一种重要的生物学表型，主要由作物遗传背景和生长季节气象因子的相互作用决定。物候学可用于预测作物产量和阐明作物对环境变化的响应，因此，准确预测作物物候参数对人类粮食安全具有重要意义。

2023年11月27日，Hiroshi Nakagawa和Satoshi Kawakita等人联合发表在《Agricultural and Forest Meteorology》上的题为“Dual ensemble approach to predict rice tiping date by integrating multiple rice phenology models and machine-learning-based genetic parameter regression models”的文章，采用不同物候模型和参数估计方法，考察了抽穗期预测的差异，提出了一种利用物候学和回归模型来估计其参数的双集成模型，比较了该方法与单个物候模型的预测精度。

采用4种水稻物候模型和3种基于机器学习的参数回归方法对4083种集合模式进行了分析，结果表明，双集合方法可以提高作物物候预测的准确性，并体现了集合参数化和组合多种作物模型在整合基因组预测与作物物候模型时的重要性。

研究结果

第一步：利用生育期的管理和气象数据，为144个水稻品种分别校准了4个水稻物候模型（mBeta、SIMRIW、ORYZA2000、Beta），并确定了每个模型的参数。

第二步，进行10次交叉验证，根据试验品种遗传信息和生育期气象资料，将144个选育品种分为训练和测试两大类进行抽穗期预测（图1）。

图1 两步法水稻物候综合模型及其集合模型的校准和验证过程

1、水稻物候模型参数的预测精度

在训练数据中，与支持向量机和岭回归两种机器学习方法相比，随机森林与水稻物候模型参数的相关性最高（图2），测试数据显示，三种回归方法的相关系数差异不大。ORYZA2000的参数估计在水稻物候模型中估计精度最高，相关系数约为0.7，Beta和SIM-RIW的参数估计性能相对较低，在任何回归方法下都小于0.6。

图2 四种水稻物候模型参数的皮尔逊相关系数以及利用遗传信息通过三种回归模型进行估计

2、水稻物候综合模型的预测精度

在训练数据集中的所有水稻物候综合模型中，采用随机森林回归法回归参数的 mBeta 模型的精度最好，RMSE = 4.27，MAE = 3.12，NSE = 0.94（表1），在两组测试数据中，各综合水稻物候模型的预测结果表明，带岭回归的 mBeta 模型（RIm）在已知环境中最准确（RMSE = 6.12、MAE = 4.73 和 NSE = 0.9），而带岭回归的 ORYZA2000 模型（RIo）在未知环境中最准确（RMSE = 6.79、MAE = 5.18 和 NSE = 0.89），综合模型的预测精度随所用物候模型类型的不同而有很大差异，即使使用相同的物候模型，根据所使用的回归方法，准确性也会相差一天或更长时间。

表1 在已知环境和未知环境下训练和测试数据的综合水稻物候模型的RMSE、MAE和NSE

3、水稻物候综合模型集合方法的预测精度

模型间预测精度的差异随着集合成员数量的增加而减小，精度收敛于一个恒定值（图3）。将单个模型的RMSE与集成模型的RMSE进行比较，结果表明，综合模型的RMSE显著降低。已知和未知测试环境下的测试数据，集成模型的平均RMSE分别趋近于6.2和6.8d，而两种测试环境下单个模型的平均RMSE分别约为7.9（±1.4）d和9（±1.94）d，差异较大。

图3 训练和测试数据中，按单个模型和集成综合水稻物候模型所采用的模型数计算的 MAE、RMSE 和 NSE 的平均值和标准偏差

基于RMSE，训练数据集中集合成员数(2 ~ 12个独立模型)预测精度最高的集合模型，组合，所有组合中最准确的模型是RFm，随着集成成员的增加，预测精度持续下降（表2），然而，对于两个测试数据集，预测精度迅速提高，直到集成模型数量增加到2~5。当组合模型的数量从5个增加到10个时，精度相对稳定，但RMSE从11个开始略有增加。

表2 最佳集合模型组合

训练和测试数据中准确率最高的前30个模型，在训练数据中，RFb、RFm、RFo和RIm被选择的频率最高，而在测试数据中，RIo、SVm and SVo被选择为较好的集成成员（图4）。测试数据集中，RFs被选择为较好的集成成员的频率相对较高，在物候模型中，特别是mBeta模型经常被认为是最好的集合成员。mBeta模型对三种不同方法（RFm， RIm， SVm）的参数进行了回归，得出了最好的集合成员预测之一。

图4 在训练数据集和测试数据集上预测准确率最高的30个模型各组成部分的频率分布

4、单一和双重集合方法的比较

使用单回归模型和使用多个物候模型的多元回归模型的最佳模型预测，在训练数据中，采用随机森林的单一集成模型预测精度最好，整体趋势是随着模型数量的增加，采用单一回归方法的集成模型预测精度降低，双集合模型也有类似的趋势，且预测精度优于基于随机森林分析的单集合模型（图5）。然而，在测试数据中，双集成模型在已知和未知测试数据集上都显示出最高的预测准确率。与单集合模型相比，随着集合个体模型数量的增加，双集合模型的RMSE值始终较低。

图5 根据每个集成的模型数量，在已知环境测试和未知环境测试数据集对单个和双集成模型的预测精度

综合水稻物候模型的预测精度取决于不同的物候模型和基于遗传背景信息的物候模型参数估计回归方法。此外，采用双集合方法将多个水稻物候模型与基于遗传信息的模型参数结合起来，利用多元回归方法进行估计，可以提高模型的精度。选择合适的集成成员模型被发现是特别重要的，因为单个集成模型的预测精度可能取决于所使用的回归方法。线性和非线性参数回归方法可以有效地从遗传信息中估计作物生长模型参数。

本研究包含了4000多个集合模式，为利用遗传信息开发综合作物物候模型、选择合适的作物模型和参数化回归方法提供了有用的信息。

原文链接：

https://www.sciencedirect.com/science/article/pii/S0168192323005117

本公众号免费发布招聘信息和宣传科研成果

已推送文献可提供PDF，如有需要，文章后留言即可

欢迎联系微信：506911145 或邮箱506911145@qq.com

http://mp.weixin.qq.com/s?__biz=MzIwODE4MjUyNA==&mid=2247501188&idx=5&sn=e18ade6f7b67dbead2d027d2196d5e69

植物科学SCI

持续关注植物科学研究进展，每天分享最新研究成果！

PBJ | 法国研究团队通过糖基和蛋白工程策略显著增强植物细胞生产的SARS-CoV-2 抗体效果

JIPB | 南京师范大学钟伯坚团队在植物转座子起源与演化研究取得重要进展

Hortic Res | 成都中医药大学陈江/裴瑾团队在红花品质形成分子机制研究上取得进展

他山之石|Agric. For. Meteorol结合多个水稻物候模型和基于机器学习的遗传参数回归模型的双集合方法预测水稻抽穗期

JIA｜西北农林科技大学张宏研究员课题组卵穗山羊草SY159染色体核型构建和特异性分子标记开发的研究

在Mol Plant、Nat Plants、PBJ、JIPB等一区Top期刊上发表多篇文章，这家专业实验室植物检测项目大全

JIPB | 中国农业大学刘俊峰和彭友良教授团队设计出识别非MAX类效应蛋白的新抗瘟免疫受体

JIA｜福建农林大学邓祖湖研究员等利用oligo-FISH揭示甘蔗杂交后代斑茅染色体的遗传

Hortic Res | 西北农林科技大学赵政阳教授团队构建苹果高质量遗传图谱并揭示果实成熟的遗传调控机制

PBJ｜中国农科院刘斌/南京农大赵团结合作揭示匍匐茎1基因通过调节生长素的定向运输来调控大豆抗倒性

江苏省中科院植物所在薄荷精油生物合成调控研究方面取得新进展

华中农业大学赵小虎团队揭示油菜“搭档”枯草芽孢杆菌提升硒吸收的机制

Nature Communications | 中国农科院作科所野生稻团队首次报道同时提高水稻粒长与耐盐性基因GL12

植物酶活测定实验方法汇总，有实验方法、有案例分析，做实验更有依据

Cell | 华中农业大学严建兵团队解析玉米籽粒脱水机制，为宜机收玉米品种培育找到新“钥匙”

Nature | 黄三文团队发现番茄“糖刹车”基因，揭示果实糖积累调控新机制

中国农业科学｜中国农科院区划所联合北京农学院探析长期施肥黑土phoD微生物群落特征及其对有机磷组分的影响

JIPB | 中国农业大学华金平教授团队揭示miR3367-lncRNA67-GhCYP724B模块调控棉花雄性不育的机制

Hortic Res | 武汉植物园韩月彭课题组揭示桃树品质多样性的演化创新与de novo基因的关键作用

PBJ | 云南农大王莫教授揭示主要光合型铁氧还蛋白OsFd1抑制水稻叶绿体内活性氧积累，进而负调控水稻抗病性的分子机制

中科院副研究员以第一作者在1区top期刊（IF5y=16.3）发表研究论文，发现棉花免疫信号途径协同作用新机制

NC：河南大学宋纯鹏教授团队研究揭示植物耐热调控新机制

JIPB | 武汉大学孙蒙祥教授团队揭示植物PCD起始的调控网络与重要因子

Hortic Res | 沈阳农业大学果树发育生物学团队揭示LED紫光通过促进酚类物质的积累抑制鲜切苹果果实褐变的机制

PBJ | 四川大学油菜研究团队在油菜遗传育种技术方面取得新进展

东北农业大学吴凤芝和周新刚团队研究揭示了挥发物介导的植物种间互作能促进有益细菌根际定殖

山西农业大学农学院气候变化与农业适应课题组在气候变化对作物影响与农业资源利用方面连续取得新进展

Nature Plants | 华中农业大学徐曙彤/密歇根大学单立波合作揭示蛋白质N-糖基化修饰介导植物免疫反应的新机制

最近一个月最受欢迎的文章

Cell：李家洋院士团队王冰等揭示独脚金内酯信号感知在低氮抑制分蘖中的关键作用 | Cell Press对话科学家

原创解读 | European Journal of Agronomy 利用QTL模型分析硬粒小麦开花时间的生理性状

MHOrT | 秋葵黄脉花叶病相关的双生病毒：多样性、传播机制与管理策略

中国农业科学｜山西农业大学农业工程学院郑德聪课题组基于双输出回归卷积神经网络的燕麦株高估测研究

Hortic Res | 南京农业大学菊花遗传与种质创新利用团队发布菊属植物多组学数据库CGD

PBJ | 北京农学院联合首都师范大学揭示SlVQ15招募SlWRKY30IIc偶联茉莉素途径调控番茄响应根结线虫入侵的分子机制

Nature Plants | 柴继杰团队和河南师范大学等多家研究团队合作揭示了N-糖基化修饰促进植物免疫受体激酶激活的新机制

JAFC丨广西科学院谢能中研究员团队通过多糖基化途径促进苦味未成熟罗汉果中甜味剂罗汉果苷的生物合成

Science背靠背 | 分子植物卓越中心何祖华团队、张余团队联合万里团队发现植物免疫激活新机制

aBIOTECH直播倒计时 | 俞皓—RNA修饰对植物发育和逆境响应的影响

中国农业科学｜四川省农业科学院作物研究所蒲宗君课题组分析2000—2020年四川小麦育成品种产量增益

JIPB | 华中农大油菜团队杨光圣课题组揭示STOP2调控硫代谢和菌核病抗性的新机制

JIA｜华南农业大学丝苗香米科技创新中心唐湘如教授课题组辐射利用率驱动下的华南双季稻区产量差评估的研究

中国农科院基因组所王丽课题组在姜黄属植物的功能基因组学研究方面取得新进展

中国农业大学农学院徐明良课题组研究揭示揭示玉米广谱数量抗性的分子机制

【Science Advances】钟雪花/宋吉奎/蒋建军团队合作揭示DNA甲基化酶功能分化机制

NBT | 通过优化Ti质粒载体结构大幅提高农杆菌介导的植物转化效率

中国农业科学｜云南省农业科学院甘蔗研究所探索丘陵山地不同种植模式下甘蔗主栽品种生产的潜力

aBIOTECH | 四川师范大学曾子贤团队建立马铃薯顺式调控元件鉴定、验证和分子编辑的技术体系

PBJ | 河北农大肖凯团队鉴定了调控小麦干旱响应基因TaPYL9，并解析其介导小麦抵御干旱逆境的作用机制及潜在应用价值

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉