An improved lightweight network based on deep learning for grape recognition in unstructured environments
Bingpiao Liu, Yunzhi Zhang *, Jinhai Wang *, Lufeng Luo, Qinghua Lu, Huiling Wei, Wenbo Zhu School of Mechatronic Engineering and Automation, Foshan University, Foshan 528000, China |
https://doi.org/10.1016/j.inpa.2023.02.003
中国的葡萄种植业规模庞大,但由于葡萄生长环境复杂且采摘困难,目前主要依赖人工采摘,费时费力且成本高昂。随着人口老龄化加剧和农业劳动力减少,实现葡萄自动采摘变得非常重要。传统的图像处理算法通过提取浅层特征来识别葡萄,但在非结构化环境中识别准确率显著降低。近年来,随着硬件的改进,深度学习发展迅速,出现了许多高效的目标检测算法。
1.提出了一种新的葡萄检测模型YOLOX-RA;
2.YOLOX-RA模型能够准确检测出生长密集和遮荫的葡萄束,有效提高了葡萄采摘机器人的性能。
在非结构化环境中,葡萄果实生长密集、遮挡的存在会造成识别困难的问题,将严重影响葡萄采摘机器人的性能。针对这些问题,本研究改进了YOLOX-Tiny模型,提出了一种新的葡萄检测模型YOLOX-RA,可以快速准确地识别生长密集和遮挡的葡萄串。提出的YOLOX-RA模型使用步长为2的3×3卷积层来代替焦点层以减少计算负担。骨干层第二、三、四层的ResBlock_Body模块中的CBS层被移除,CSPLayer模块被ResBlock-M模块替代,以加快检测速度。在ResBlock-M模块之后添加了具有剩余网络块的辅助网络(AlNet)以提高检测精度。颈部模块层使用两个深度可分离卷积(DSC)来代替普通卷积以降低计算成本。
此文在grape测试集上评估了SSD、YOLOv4 SSD、YOLOv4-Tiny、YOLO-Grape、YOLOv5-X、YOLOX-Tiny和YOLOX-RA的检测性能。结果表明,YOLOX-RA模型的检测性能最好,达到88.75% mAP,识别速度为84.88 FPS,模型大小为17.53 MB。能够准确检测生长茂密、遮荫的葡萄串,可有效提高葡萄采摘机器人的性能。
图2 绿葡萄的遮挡图像 (a)SSD (b)YOLOv4-Tiny (c)YOLO-Grape (d)YOLOv5-X (e)YOLOX-Tiny (f)YOLOX-RA
这项研究提出了一种新的葡萄检测模型,称为 YOLOX-RA 模型。在减小模型足迹尺寸的情况下,其识别精度和速度仍有显着提升,对于不同密度、不同遮挡程度的葡萄串都有良好的识别效果。我们用卷积层替换焦点层,以减少模型的计算压力;去掉了ResBlock_Body第二层、第三层、第四层的CBS模块,使用ResBlock-M代替CSPLayer,提高检测速度;在ResBlock-M模块后添加AlNet,提高检测精度;Neck的两个卷积层被DSC取代,以减少参数数量。在训练集上进行性能评估,YOLOX-RA的检测性能最好,YOLOX-RA模型的mAP为88.75%,检测速度为84.88 FPS,模型大小为17.53 MB。综上所述,所提出的YOLOX-RA模型具有较高的准确率、识别速度和较小的内存占用,可以在非结构化环境下实现快速、准确的葡萄采摘。
引用格式:
编辑:纪尚一
校对:鲁娜
审核:付学谦
日期:2024年6月26日