人工智能在农业损害评估中的应用

学术   2024-09-30 23:02   北京  

本文节选自:

桂泽春, 赵思健. 人工智能在农业风险管理中的应用研究综述[J]. 智慧农业(中英文), 2023, 5(1): 82-98. doi:10.12133/j.smartag.SA202211004

GUI Zechun, ZHAO Sijian. Research Application of Artificial Intelligence in Agricultural Risk Management: A Review[J]. Smart Agriculture, 2023, 5(1): 82-98. doi:10.12133/j.smartag.SA202211004

官网全文在线阅读

知网阅读

人工智能在农业损害评估中的应用

当前自然灾害和病虫害对农业生产有着巨大的威胁,对农业受损情况进行准确而全面的评估对于农户减少损失和恢复生产意义重大。AI中的深度学习技术通过构建的神经网络模型可以对目标物的图像特征进行识别以判断物体类别或所处的状态,是当前损害评估的主流方法。CNN是图像识别领域的代表算法之一,广泛应用于图像分类、图像分割和物体识别,典型的CNN由卷积层、池化层、全连接层组成,分别负责提取图像中的局部特征、大幅降低参数量以降维、输出结果。随着对CNN的改进,一些新的模型如AlexNet、VGG(Visual Geometry Group)、残差神经网络(Residual Neural Network,RestNet)、GoogLeNet、YOLO(You Only Look Once)、SSD(Single Shot MultiBox Detector)、全连接卷积神经网络(Fully Convolutional Networks,FCN)等也被应用到农业损害评估领域,通过对受损对象的图像检测识别及图像分割,输出目标的受损程度和数量以及患病种类等结果,其应用过程如图1所示。深度学习技术对农业损害评估的应用类型包括图像检测识别和图像语义分割两大方面,图像检测识别是指识别图像里多个物体的类别和位置,位置通常用边缘框表示;图像语义分割则是将图片中的每个像素分类到对应的类别。 

图1   基于AI的农业损害评估过程

Fig. 1   Agricultural damage assessment process based on artificial intelligence

1

图像检测识别

农业损害评估中的图像检测识别的应用先是识别损害农产品的状态,区分出正常农产品和受损农产品,在此基础之上,再对受损农产品进行计数,从而实现对生产状态的定量评估。

深度学习中的神经网络具有强大的特征自学习能力,擅长对图像中的物体特征进行提取从而实现图像识别的能力。Khattak等使用CNN识别健康和患病状态的水果和叶子,测试准确率为94.55%。Singh等提出一种具有19个卷积层的CNN模型识别苹果叶疾病,准确率高达99.2%。Mirzazadeh等采用深度学习模型VGG16和ResNet50对受损油菜数据进行损害评估,其整体分类准确率分别为93.7%和98.2%。Yang等利用CNN模型提取可见-近红外范围内的光谱特征来估算玉米幼苗的冷冻损伤,基于CNN的冷损伤检测结果与化学法检测结果的相关系数为0.8219,证实了使用CNN模型用于玉米冷害检测的可行性。

提高模型的特征提取能力和对比多种模型有助于增强模型的表现。Jiao等将自适应特征融合入特征金字塔以提取更加丰富的害虫特征,其优化后的两阶段的基于区域的CNN在AgriPest21数据集上要明显优于其他图像识别模型,准确率达到77.0%。Bi等从特征注意和多尺度特征融合学习出发,基于Swin Transformer提高对玉米种子的识别能力,实验验证其所提出的MFSwin Transformer模型分类精度最高,其平均精度、召回率和F1值分别为96.53%、96.46%和96.47%。Lyu等将空洞卷积和多尺度卷积相结合以提高特征提取能力,基于AlexNet神经网络设计出DMS-Robust AlexNet神经网络,最终其对玉米叶片病害的分类准确率达到98.62%。Sahu和J使用六种不同的深度学习架构,如优化的DenseNet121、CNN、ResNet50、MobileNet、VGG16 和 Inception-V3 对玉米叶病进行分类,发现使用超参数进行优化的DenseNet121分类性能最佳,准确率为99.35%,且与CNN和ResNet50相比,其参数更少,共计721万个。Gehlot和Saini使用AlexNet、VGG-16、GoogleNet、DenseNet-121和ResNet-10l对番茄叶片病害进行分类,实验发现DenseNet-121 获得了最高的精度,平均验证准确率达到99.694%,并且与所有其他模型相比尺寸更小,只有89.6 MB。Hamidisepehr等为了在恶劣天气事件发生之后及时检测评估玉米的受损区域,采用Faster R-CNN,YOLOv2和RetinaNet算法检测玉米受损区域,后两种算法表现出对玉米损伤较强的识别能力,RetinaNet和YOLOv2的最高平均精度分别为98.43%和97.0%。Shradha等为了应对图像模型在独立测试数据上的性能显著下降问题,以番茄植物和目标斑病类型为例,采用分割的图像数据训练CNN模型,发现相比于使用完整图像数据训练相同的CNN模型,前者表现比后者提高了一倍以上,在独立数据上的性能达到98.6%。

通过迁移学习技术,可以有效缓解建模过程中存在的小样本问题和提高模型训练速度。万军杰等将迁移学习与GoogLeNet模型相结合,该优化模型对害虫的识别精度可达99.35%,危害程度分级精度可达92.78%,同时相比于其他常见模型,该模型验证精度提高了2.38%~11.44%,且收敛速度最快。Chen等使用先前在ImageNet数据集中已经训练好的预训练模型VGGNet来初始化自己模型上的权重,其所提出的方法在公共数据集上实现了91.83%的验证精度,在复杂环境下的水稻病害图像分类预测的平均准确率也达到92%。周维等[96]使用GhostNet结构替换YOLOv4中的主干特征提取网络以优化特征提取的能力,结合迁移学习与YOLOv4网络的训练技巧,将二者结合形成新的改进的YOLOv4-GhostNet算法对水稻病虫害进行识别,改进后的模型平均精确度达到79.38%。

提高图像识别模型的特征提取能力和鲁棒性是建模的主流方向。同时,为了更好地降低模型的使用门槛,设计更加轻量化的模型也是影响AI推广应用的重要因素。

2

图像语义分割

图像语义分割与图像检测识别的应用过程相同,但相比于图像识别,图像语义分割不管是在分割精度上,还是在模型训练量和数据预处理的工作量上,都要高于图像识别。

Reddy和Neeraja采用DenseNet对叶片损伤进行分类,再采用1D-CNN算法对图片进行语义分割,分割准确率达到97%。Yumang等采用Mask R-CNN卷积神经网络模型实现对受损咖啡豆的分割,该模型准确率达到87.5%。Kumar和Kukreja使用Resnet-50用作Mask-RCNN模型的主干对小麦花叶病毒病进行分割,准确率达到88.19%。

分割物体常常容易与背景之间产生混淆是图像语义分割需要重点解决的问题。Das和Bais针对作物叶子损坏的小圆形易与背景中白色石头产生混淆的问题,提出深度学习分割模型DeepVeg,准确率高于0.97,有效解决了受损油菜分割任务中的物体易混淆问题。Loyani等提出了基于U-Net和Mask RCNN的卷积神经网络语义分割模型,在像素级别分割虫害对番茄的影响,其中Mask RCNN实现了85.67%的平均精度,U-Net模型的交集联合为78.60%以及Dice系数为82.86%。Zhang等融合多光谱、植被指数和RGB信息,使用ResNeSt来提高提取特征的质量,引入注意力机制,提出了一种基于Unet++的RSPR-UNet++语义分割模型,用于分割遥感图像中的树皮甲虫和白杨潜叶虫感染区域,其准确率达到85.11%。Nasiri等采用U-Net卷积神经网络架构作为深度编码器用于对甜菜、杂草和土壤的像素级别语义分割,结果发现使用具有适当分布和自定义损失函数的图像数据集可以提高分割精度,模型准确度高达0.9606以及IoU得分为0.8423。Memon等提出元深度学习玉米叶病识别模型,并对比CNN、VGG16迁移学习、ResNet50三种模型,发现其所提出的模型准确率高达98.53%。

由于图像语义分割像素级别的分割精度,分割的目标物体常容易与环境背景产生混淆。针对此问题,在优化模型的结构基础之上,可以更多地引入分割目标相关领域的专业知识以增强对目标的特征学习。另外,像素级别的标注会耗费大量人力物力,降低数据预处理的成本对AI的推广应用至关重要。

3

对农业损害评估方法的评价

图像检测识别对目标进行识别的精度没有像素级别的语义分割算法高,但在生成训练数据的工作量上前者要少于后者,可根据实际应用的场景及成本预算对两种方法进行选择使用。农业生产环境复杂,应用场合多变,在进行模型训练时的场景往往是有限的,是否光照、光照强度、动植物不同生长时期的形态、遮挡以及牲畜之间的重叠等一系列复杂因素会降低模型的识别精度。由此可见,提升深度学习模型的特征提取能力和鲁棒性仍然是未来技术发展需要克服的重点和难点问题。

另外,当前在农业损害评估中,深度学习模型的训练仍然需要大量数据,针对于开源的同类别数据直接进行训练即可,而对于未开源的特定数据的标记往往需要耗费大量人力物力,尤其是图像中的语义分割更是需要进行像素级别的标注,如何减少学习任务中人力物力的投入对于AI的推广应用有着举足轻重的作用。同时,当前深度学习模型仍然属于端到端建模,以往通过对模型本身的优化可以提高模型的学习能力,之后可以更多地考虑引入外部知识,如将识别对象的专业特征融合入学习模型当中以提高模型的特征提取能力。




推荐阅读


农业轮式机器人三维环境感知技术研究进展(《智慧农业(中英文)》2023年第4期)


农业智能知识服务研究框架及数据获取技术


农业知识耦合与知识图谱技术


融合改进UNet和迁移学习的棉花根系图像分割方法(《智慧农业(中英文)》2023年第3期)





智慧农业微信交流服务群

为方便农业科学领域读者、作者和审稿专家学术交流,促进智慧农业发展,为更好地服务广大读者、作者和审稿人,编辑部建立了微信交流服务群,有关专业领域内的问题讨论、投稿相关的问题均可在群里咨询。入群方法:加小编微信331760296备注:姓名、单位、研究方向,小编拉您进群,机构营销广告人员勿扰。

发布征集







欢迎在我公众号发布科研团队介绍、创新科研成果及相关活动等信息。

智慧农业期刊
《智慧农业(中英文)》是国内外公开发行的农业科学类学术期刊。期刊聚焦农业信息技术发展前沿与热点,刊载和传播国内外最新研究成果,通过搭建高水平学术交流平台,引领学术研究方向,服务行业科学决策,培养高水平创新人才,促进学科发展。
 最新文章