引用格式:
叶大鹏, 景均, 张之得, 李辉煌, 吴昊宇, 谢立敏. MSH-YOLOv8:融合尺度重建的蘑菇小目标检测方法[J]. 智慧农业(中英文), 2024, 6(5): 139-152.
Citation:YE Dapeng, JING Jun, ZHANG Zhide, LI Huihuang, WU Haoyu, XIE Limin. MSH-YOLOv8: Mushroom Small Object Detection Method with Scale Reconstruction and Fusion[J]. Smart Agriculture, 2024, 6(5): 139-152.
官网全文在线阅读
知网阅读
叶大鹏1,2, 景均1, 张之得1,2, 李辉煌1, 吴昊宇3, 谢立敏1,2*
(1.福建农林大学机电工程学院,福建福州 350002,中国;2.福建省农业信息感知技术重点实验室,福建福州 350002,中国;3.福建农林大学未来技术学院,福建福州 350002,中国)
摘要:
[目的/意义]为了解决图像尺寸变化和目标尺度变换共存对小目标检测精度的影响问题,本研究提出了一种新的检测模型:Multi-Strategy Handling YOLOv8(MSH-YOLOv8)。
[方法]该模型在YOLOv8的基础上增加一个检测头,以提高小尺度目标敏感度;引入Swin Transformer的检测结构到头部网络,以减少计算冗余;引入包含可变形卷积的C2f_Deformable Convolutionv4(C2f_DCNv4)结构和Swin Transformer编码器结构重构YOLOv8主干网络,优化并增强其特征传递和提取能力,提高小目标敏感度;采用基于规范化的注意力模块(Normalization-based Attention Module, NAM)优化网络检测速度和准确性;用Wise-Intersection over Union Loss(WIoU)代替原损失函数,以提高训练效果和收敛速度;在后处理阶段应用分辨率动态训练、多尺度测试、软非极大值抑制算法(Soft-Non-Maximum Suppression, Soft-NMS)、加权边界框融合算法(Weighted Boxes Fusion, WBF)等方法,提高尺度变化下小目标检测效果。以蘑菇为研究对象,在开放数据集Fungi上开展实验。
[结果和讨论]MSH-YOLOv8的平均正确率(Average Precision50, AP50)和AP@50-95分别达到了98.49%和75.29%,其中小目标检测指标值APs达39.73%。相较于主流模型YOLOv8,三项指标分别提高了2.34%,4.06%和8.55%;相较于优秀模型Transformer Prediction Heads-YOLOv5(TPH-YOLOv5),三项指标分别提高了2.14%,2.76%和6.89%。
[结论]本研究提出的MSH-YOLOv8改进方法可在图像尺寸变化与目标尺度变化条件下有效提高小目标的检测效果。
关键词: 图像尺寸;小目标检测;特征提取;多尺度检测;模型集成
图1 本研究构建的MSH-YOLOv8网络结构
Fig. 1 MSH-YOLOv8 network architecture proposed in this research
图2 对抗生成网络工作流程
Fig. 2 Workflow of generative adversarial network
图3 MSH-YOLOv8工作流程
Fig. 3 Workflow of MSH-YOLOv8
图4 Fungi图像尺寸研究与统计
Fig. 4 Study and statistics of fungi image dimensions
图5 两种固定处理尺寸下的图像尺寸混合训练对比
Fig. 5 Comparison of mixed training of image sizes under two fixed processing sizes
图6 不同尺度目标边界框与图像宽高比统计
Fig. 6 Statistics of target bounding box to image aspect ratio
图7 不同图像尺寸下目标尺度变化分析
Fig. 7 Analysis of the variation of target scale under different image sizes at different scales
图8 MSH-YOLOv8消融实验结果曲线
Fig. 8 MSH-YOLOv8 ablation experiment results curve
图9 消融实验Meth B阶段蘑菇检测优化结果可视化
Fig. 9 Visualization of optimization results for mushroom in Meth B stage of ablation experiment
图10 消融实验Meth D阶段蘑菇检测优化结果可视化
Fig. 10 Visualization of optimization results for mushroom in Meth D stage of ablation experiment
图11 消融阶段不同损失函数的训练对比曲线
Fig. 11 Training comparison curves of different loss functions during ablation stage
图12 尺寸为640的图像在各子模型的验证结果曲线
Fig. 12 Validation result curves of various sub-models with
图13 MSH-YOLOv8的子模型MST结果曲线
Fig. 13 Result curves of sub-model MST in MSH-YOLOv8
图14 MSH-YOLOv8的跨数据集泛化实验可视化结果
Fig. 14 Visualization of cross-dataset generalization experimental results in MSH-YOLOv8
叶大鹏 教授
谢立敏 博士
谢立敏,工学博士,福建农林大学机电工程学院讲师,硕士生导师,福建省力学学会理事,研究方向和领域是非线性系统动力学、机器人运动控制等。主持多项省级项目,发表多篇论文,获得专利1项等。
来源:《智慧农业(中英文)》2024年第5期
转载请联系编辑部授权
本期支持单位
推荐阅读
智慧农业微信交流服务群
发布征集
欢迎在我公众号发布科研团队介绍、创新科研成果及相关活动等信息。