为深化行业交流,拓宽学术视野,丰富信息交流形式,更好地满足读者需求,《农业机械学报》创立“专题报道+融媒体出版”的出版模式:原综述栏目将不定期升级为专栏,每期专栏包括由该期专栏主编撰写的综述论文和多篇与该专栏主题相关的研究性论文;采用“纸媒出版+专栏主编视频讲座”的复合形式,丰富科研成果交流形式,深化科研成果交流内容。2024年第11期为动植物表型计算技术专栏,专栏主编为南京农业大学徐焕良教授。
翟肇裕,张梓涵,徐焕良,等. YOLO算法在动植物表型研究中应用综述[J].农业机械学报,2024,55(11):1-20.DOI:10.6041/j.issn.1000-1298.2024.11.001 摘要:动植物表型是动植物特征与性状的定量描述,表型特征的精准计算与分析是推进数字农业发展的重要基础。得益于深度学习技术的迅猛发展,以YOLO系列算法为代表的计算机视觉模型在动植物表型分析任务中展现出了优良性能和巨大潜力。以家畜类、家禽类、作物类、果蔬类等动植物为对象,分别从目标检测、关键点检测、目标分割3方面概述了YOLO系列算法应用研究进展。最后指出YOLO系列算法未来发展趋势,包括轻量化架构设计、小目标精准检测、弱监督学习、复杂场景部署、大模型目标检测等。关键词:YOLO;动植物表型;目标检测;关键点检测;目标分割;轻量化 |
鲍文霞,赵诗意,黄林生,等.基于轻量级密集多尺度注意力网络的小麦叶部锈病识别方法[J].农业机械学报,2024,55(11):21-31.DOI:10.6041/j.issn.1000-1298.2024.11.002 摘要:人工诊断小麦锈病成本高、效率低,已无法满足现代农业生产的需要。本文提出了一种轻量级密集多尺度注意力网络模型(Mobile-Dense multi-scale attention net, Mobile-DMSANet),用于自动识别田间自然场景中的小麦叶部锈病(条锈病和叶锈病)。该模型在输入层设计了一个快速下采样模块(Fast subsampling block, FSB),它在不增加计算成本的前提下提高模型的特征表达能力。模型的特征提取层使用3个轻量级特征提取模块(Dense multi-scale attention, DMSA)来提取小麦叶部锈病的特征。DMSA模块设计了一个多尺度的3路卷积层(Multi-scale three-way convolution, MSTC)用于获得不同尺度感受野,以提高模型的表达能力和对不同尺寸锈病的感知能力。DMSA模块中6个MSTC层通过密集连接实现特征重用,不仅大大减少了模型的参数量,而且提高了对这两种相似的小麦叶部锈病的特征提取能力。在DMSA模块中还引入了协调注意力机制(Coordinated attention, CA),来提高对病害信息的敏感性,并抑制图像中的背景信息。模型的输出层使用Softmax函数实现小麦叶部锈病识别。结果表明,Mobile-DMSANet模型在测试数据集上的识别准确率为96.4%,高于经典CNN模型(如ResNet50、AlexNet)和轻量级CNN模型(如ShufflenetV2、DenseNet系列)。Mobile-DMSANet参数量为4.54×105,与其他轻量级模型相比大幅下降。本文所设计模型可用于移动端小麦叶部锈病的自动识别。关键词:小麦条锈病;小麦叶锈病;病害识别;轻量级卷积神经网络;Molile-DMSANet |
罗斌,李家超,周亚男,等.基于改进YOLO v8的轻量化稻瘟病孢子检测方法[J].农业机械学报,2024,55(11):32-38.DOI:10.6041/j.issn.1000-1298.2024.11.003摘要:稻瘟病由稻瘟病孢子通过空气进行传播,严重影响水稻产量,因此,稻瘟病孢子的检测对于稻瘟病早期诊断与防治具有重要作用。针对现有方法存在检测速度慢的问题,本研究基于YOLO v8模型提出了一种稻瘟病孢子检测方法RBS-YOLO。首先,该算法在主干网络中引入PP-LCNet轻量化网络结构,减少模型每秒浮点运算次数并降低模型内存占用量,其次在颈部网络中引入高效多尺度注意力模块(Efficient multiscale attention module, EMA),并将原损失函数改进为WIOU损失函数,提高了模型识别稻瘟病孢子的精确率与平均精度均值。改进后的RBS-YOLO模型精确率与平均精度均值分别为97.3%和98.7%,满足稻瘟病孢子的检测需求,模型内存占用量与每秒浮点运算次数分别为3.46MB、5.2×109,同YOLO v8n相比分别降低41.8%与35.8%。RBS-YOLO模型与当前主流的YOLO v5s、YOLO v7、YOLO v8n模型对比,每秒浮点运算次数分别降低67.3%、95.1%、35.8%。研究结果表明RBS-YOLO模型能够满足稻瘟病孢子实时检测的需求,且有利于部署到移动端。关键词:稻瘟病孢子;目标检测;YOLO v8;轻量化;注意力机制 |
王泰华,郭亚州,张家乐,等.基于改进YOLO v5s的水稻害虫识别研究[J].农业机械学报,2024,55(11):39-48.
DOI:10.6041/j.issn.1000-1298.2024.11.004摘要:水稻害虫识别时,受稻田环境影响易出现目标被遮挡、与背景颜色相似、多目标相邻等问题导致识别精度降低。为此本文提出了一种基于改进YOLO v5s的水稻害虫识别模型YOLO v5s-Coordslimneck,通过替换主干网络中的普通卷积为CoordConv,增强了模型对目标位置信息的获取能力;引入CBAM注意力机制,提升了模型对目标区域的关注度;采用Slim-neck减少了计算量并增强了特征处理能力;引入Soft-NMS算法优化相邻目标边框筛选,减少漏检。实验结果表明,改进后的YOLO v5s模型在水稻害虫数据集上的平均精度均值达到94.3%,相比原模型提升3.8个百分点,比其他主流模型YOLO v3、YOLO R-CSP、YOLO v7、YOLO v8s提升1.5、12.7、13.6、1.9个百分点。消融实验进一步验证了改进模型中各个组件的有效性。热力图分析也体现了改进模型能够更好地学习害虫特征。综上,本文提出的改进YOLO v5s模型在提高水稻害虫检测精度方面取得了显著成效,为防控水稻虫害提供了一种精确的识别方法。关键词:水稻;害虫识别;CBAM;Slim-neck;YOLO v5s
|
马铁民,曲浩,高雅,等.基于超分辨率生成对抗网络的玉米病害分类识别方法[J].农业机械学报,2024,55(11):49-56.DOI:10.6041/j.issn.1000-1298.2024.11.005 摘要:深度学习在玉米病害识别领域应用广泛并取得了较好的效果,但存在低分辨率条件下训练效果差的问题,本文提出一种基于超分辨率生成对抗网络的玉米病害分类识别模型。为了实现低分辨率玉米病斑图像到高分辨率图像的恢复,提出基于双注意力机制的增强型超分辨率生成对抗网络模型,该模型生成的高分辨率重建图像与其他超分辨率图像重建模型相比,峰值信噪比(Peak signal-to-noise ratio,PSNR)和结构相似性指数(Structural similarity index measure,SSIM)平均提升2.1dB和0.049;与4种不同的分类网络的结合,准确率均高于低分辨率图像,平均提升28.1个百分点。在模型对比及消融可视化实验中,模型识别玉米病斑准确率平均超出其它模型1.3个百分点,精确率达到97.8%。实验结果表明,双注意力机制的加入和损失函数的改变增加了模型对高频特征的恢复能力和稳健性,提高了玉米叶片病斑分类识别率,可为农作物定点监测或无人机田间监测中低分辨率叶片病害图像的精准识别提供参考。关键词:玉米叶片;病害识别;超分辨率图像重建;生成对抗网络 |
张欢,周毅,王克俭,等.基于MobileViT-PC-ASPP和迁移学习的果树害虫识别方法[J].农业机械学报,2024,55(11):57-67.
DOI:10.6041/j.issn.1000-1298.2024.11.006 摘要:为提高果树害虫识别效果,及时做好防治措施,本研究以6种对果树危害程度较大的害虫为研究对象,针对自然环境下果树害虫识别背景复杂、害虫目标小检测难度大、与不同类别间特征相似度高等问题,提出一种改进的轻量化MobileViT-PC-ASPP识别模型。该模型用PConv(Partial convolution)模块代替原模型MobileViT模块中部分标准卷积模块,其次修改MobileViT模块的特征融合策略,将输入特征、局部表达特征、全局表达特征进行拼接融合;删除网络第10层MV2模块和第11层MobileViT模块,使用改进空洞空间池化金字塔(Atrous spatial pyramid pooling,ASPP)模块进行代替,形成多尺度融合特征;此外,模型用SiLU激活函数代替ReLU6激活函数进行计算,最后基于ImageNet数据集进行迁移学习。实验结果表明,6类果树害虫图像识别准确率达93.77%,参数量为8.40×10.5,与改进前相比,识别准确率提高7.5个百分点,参数量降低33.86%;与常用害虫CNN识别模型AlexNet、ResNet50、MobileNetV2、ShuffleNetV2相比识别准确率分别提高8.25、4.78、7.27、7.41个百分点,参数量分别减少6.03×10.7、2.48×107、2.66×106、5.30×105;与Transformer识别模型ViT、Swin Transfomer相比识别准确率分别提高19.03、9.8个百分点,参数量分别减少8.56×107、2.75×107。本研究适合部署在移动终端等有限资源环境,并且有助于实现对复杂背景下小目标果树害虫进行识别检测。关键词:果树害虫;识别模型;PConv模块;融合策略;SiLU激活函数;空洞空间池化金字塔
|
袁杰,谢霖伟,郭旭,等.基于改进YOLO v7的苹果叶片病害检测方法[J].农业机械学报,2024,55(11):68-74. DOI:10.6041/j.issn.1000-1298.2024.11.007 摘要:针对苹果叶片疾病形态多样、分布密集,导致检测精度不高的问题,提出了一种改进的YOLO v7模型。首先,用双向特征金字塔网络(BiFPN)替代YOLO v7中原有的特征融合方法,以提高模型对苹果叶片上不同尺度病害的检测能力。其次,在YOLO v7的ELAN和E-ELAN模块之后,增加高效通道注意力机制(ECA),以增强模型对苹果叶片病害特征的提取能力,并提高检测精度。最后,将YOLO v7的损失函数改为SIOU损失函数,以加快模型的收敛速度。实验结果表明:改进YOLO v7模型精确率为89.4%,召回率为81.5%,mAP@0.5为90.5%,mAP@0.95为62.1%,与原始YOLO v7模型相比,分别提高4.9、5.2、3.5、4.6个百分点。改进YOLO v7模型与Faster R-CNN、SSD、YOLO v3、YOLO v5s、YOLO v7模型相比,mAP@0.5分别提升40.9、20.3、4.0、2.3、3.5个百分点,单幅图像检测时间为12ms。关键词:苹果叶片;病害检测;YOLO v7;多尺度融合;注意力机制 |
张惠莉,代晨龙,任景龙,等.基于YOLO v8-GSGF模型的葡萄病害识别方法研究[J].农业机械学报,2024,55(11):75-83.
DOI:10.6041/j.issn.1000-1298.2024.11.008 摘要:为进一步提高葡萄病害识别精度及速度,本文对YOLO v8模型进行了改进。首先,引入GhostNetV2主干特征提取网络,提高模型特征提取能力和识别性能。其次,嵌入SPPFCSPC金字塔池化,在保持感受野不变的情况下取得速度上的提升。再次,添加GAM-Attention注意力机制,减小信息缩减并放大特征信息,加快识别速度。最后,使用Focal-EIoU作为损失函数,使检测模型边界框回归性能得到提升,最终形成葡萄叶片病害识别模型YOLO v8-GSGF(YOLO v8+GhostNetV2+SPPFCSPC+GAM-Attention+Focal-EIoU)。经识别试验验证,YOLO v8-GSGF模型识别精度可达97.1%,推理时间为45.3ms,对各葡萄病害都能做到高精度识别。消融试验结果表明,各项改进均对模型识别性能有提升效果,其中,GhostNetV2主干网络对模型提升效果最为明显。YOLO v8-GSGF模型在消融试验中识别精度可达98.2%及推理时间为43.7ms,与原YOLO v8模型相比提升8.6个百分点及20.4ms,改进效果明显,可视化图更加直观地证明YOLO v8-GSGF模型可靠以及性能优越。与目前主流识别模型相比,YOLO v8-GSGF模型有更好的表现,识别精度和速度都更优,曲线图也直观地表明YOLO v8-GSGF模型性能优越,改进效果显著,能够满足葡萄果园病害识别的需求。关键词:葡萄叶片;病害;图像识别;GhostNetV2;YOLO v8
|
黄小平,侯现坤,郭阳阳,等.基于改进YOLO v7-Pose的牛脸关键点检测与姿态识别方法[J].农业机械学报,2024,55(11):84-92.DOI:10.6041/j.issn.1000-1298.2024.11.009 摘要:奶牛脸部关键点检测在牛场智能化中发挥着重要的作用,它可以帮助实现牛脸识别、牛脸对齐、头部动作检测与行为识别等。针对目前奶牛养殖环境中存在牛脸遮挡、弱光照等问题,提出了一种改进的YOLO v7-Pose网络模型的算法,可用于牛脸关键点检测和头部姿态识别。首先通过网络相机在牛场获取奶牛脸部图像并构建数据集。其次,在YOLO v7-Pose网络模型中引入SPPFCSPCL结构,以提高奶牛脸部关键点的特征提取能力;将关键点检测的损失函数OKS替换为WingLoss损失函数,增加奶牛脸部关键点的检测精度;最后,使用L1范数对改进的模型剪枝,使改进后的网络模型参数量降低。试验结果表明:改进模型YOLO v7-SCLWL-Pose检测牛脸关键点较原模型AP提升5个百分点,AP0.5提升2.7个百分点,改进后模型内存占用量仅为106.7MB,减少33.6%。将本文关键点检测用于姿态识别,试验结果对抬头和低头等动作的识别准确率达到95.5%和86.5%。本研究为牧场奶牛行为识别提供了支撑技术。关键词:牛脸检测;关键点检测;YOLO v7-Pose;姿态识别 |
齐咏生,张新泽,张嘉英,等.基于特征掩膜的局部遮挡牛脸识别方法[J].农业机械学报,2024,55(11):93-102.DOI:10.6041/j.issn.1000-1298.2024.11.010 摘要:随着智慧牧业的高速发展,牛脸识别已成为牛场智能化养殖的关键,但现实应用场景中牛脸遮挡问题较为严重,影响识别系统的性能。为此,提出一种遮挡物分割辅助牛脸识别的全新双分支网络结构。首先设计一种改进的轻量级U-Net遮挡物分割模型,通过加入深度可分离卷积和多尺度混合池化模块,有效提高分割网络对遮挡物的分割性能。为更好地衰减遮挡物对牛脸识别性能的影响,引入一种多级掩膜生成单元。以不同层级的遮挡分割为输入,构建识别网络不同阶段所对应的掩膜,通过掩膜运算在特征提取的各阶段有效消除遮挡造成的损坏特征信息。最后在自制数据集上进行算法有效性和实时性验证,并与多种最新的典型识别算法进行对比。实验结果表明,本文算法在遮挡牛脸数据集上平均准确率达86.34%,识别速度为54f/s,且在不同程度遮挡的场景下,识别效果均优于FaceNet网络。关键词:遮挡牛脸识别;图像分割;多级掩膜学习;双分支结构 |
夏元天,寇旭鹏,薛洪成,等.基于改进YOLO-MAO检测框架的笼养白羽肉鸡行为检测方法[J].农业机械学报,2024,55(11):103-111. DOI:10.6041/j.issn.1000-1298.2024.11.011 摘要:在大规模的肉鸡养殖场中,肉鸡行为通常由饲养员或专业兽医观察和分析,以确定肉鸡健康状况和养殖环境状态。然而这种方法耗时且主观。此外,在笼养环境中,由于鸡只的高密度和严重的互相遮挡,行为的视觉特征不明显,传统的检测算法不能准确地识别鸡只的行为特征。因此,本文提出一种改进的笼养白羽肉鸡行为检测的目标检测算法。所提出的算法由2个模块组成:多尺度细节特征融合模块(MDF)和目标关系推理模块(ORI)。多尺度细节特征模块充分利用和提取网络浅层特征映射中包含的多尺度细节特征,并将它们融合到负责相应尺度检测的特征映射中,实现细节特征的有效传输和补充。目标关系推理模块充分利用对象之间的位置关系进行推理和判断,使模型能更充分地利用对象之间的潜在关系来辅助检测。为验证所提出算法的有效性,在目标检测领域具有权威性的COCO公共数据集以及真实的大规模笼养白羽肉鸡养殖环境中自建的行为检测数据集上进行大量对比实验。实验结果表明,与其他最先进的模型相比,本文所提出的改进算法在COCO数据集和自建数据集上均达到最佳识别准确率;对喂食、饮水、移动和张嘴等影响肉鸡健康状况较为重要的行为进行检测,识别精度分别达99.6%、98.7%、99.2%和98.3%。关键词:白羽肉鸡;行为识别;目标检测;多尺度细节特征融合模块;关系推理模块
|
杨断利,齐俊林,陈辉,等.基于改进YOLO v8n模型的散养蛋鸡个体行为识别方法与差异分析[J].农业机械学报,2024,55(11):112-123. DOI:10.6041/j.issn.1000-1298.2024.11.012 摘要:家禽行为与其生理状态密切相关,可利用行为数据对家禽健康状况进行评估。统计个体行为数据需要进行蛋鸡行为识别和个体身份识别,针对行为识别过程中,蛋鸡体型小、聚集遮挡,养殖环境光照变化等因素导致的蛋鸡有效特征表达不足,个体行为识别效果不理想问题,基于YOLO v8n网络构建行为识别模型,同时融合ODConv、GhostBottleneck、GAM注意力和Inner-IoU结构,通过减少图像特征丢失,放大全局交互信息,融合跨阶段特征,增强特征提取及泛化能力对模型进行改进,提升了蛋鸡采食、饮水、站立、整理羽毛、俯身搜索5种行为的识别精度。同时基于YOLO v8n模型构建了个体身份识别网络,并通过引入MobileNetV3模块对个体身份识别网络模型进行优化,提升了个体行为数据统计效率。试验结果表明,优化后行为识别模型对采食、饮水、站立、整理羽毛、俯身搜索行为识别平均精度(AP)分别达到94.4%、93.0%、90.7%、91.7%、86.9%,平均精度均值(mAP)达到91.4%,与YOLO v5n、YOLO v6n、YOLO v7-tiny、YOLO v8n相比,平均精度均值(mAP)分别提高4.8、4.1、5.5、3.5个百分点;个体身份识别模型参数量和运算量与YOLO v8n模型相比,减少1.9651×106和6.1×109。通过分析蛋鸡行为数据发现,行为数据与温度及蛋鸡个体本身有关,温度降低时,采食、站立次数增加,饮水次数减少,整理羽毛、俯身搜索次数几乎无变化,相同温度下,不同蛋鸡个体的行为数据差异较大,且差异值与蛋鸡体型有关。试验结果为依据行为数据评判蛋鸡健康状况、养殖场精准养殖及蛋鸡个体优选奠定了基础。关键词:散养蛋鸡;行为识别;YOLO v8n;多目标识别;MobileNetV3;ODConv
|
张铮,鲁祥,胡庆松.基于图像增强与GC-YOLO v5s的水下环境河蟹识别轻量化模型研究[J].农业机械学报,2024,55(11):124-131,374. DOI:10.6041/j.issn.1000-1298.2024.11.013 摘要:利用机器视觉技术识别水下河蟹目标是实现河蟹养殖装备智能化的有效途径之一。针对水下环境目标识别困难、河蟹包含特征信息少、主流的目标检测模型复杂度高等问题,在YOLO v5s的基础上提出了一种适用于水下环境的轻量级河蟹识别模型GC-YOLO v5s(GhostNetV2-CBAM-YOLO v5s)。利用改进的图像增强算法对水下河蟹图像进行预处理以改善其质量;为降低模型复杂度,提出了基于 GhostNetV2的G3模块以改进模型的特征提取网络,并利用幻影卷积进一步轻量化模型;为了优化模型的河蟹特征学习能力,在Neck层和Head层之间引入卷积块注意力模块(Convolution block attention module,CBAM)。实验结果表明,该模型测试集的平均精度均值(Mean average precision,mAP)、召回率和精确率分别为95.61%、97.03%和96.94%,较YOLO v5s分别提升2.80、2.25、2.28个百分点;而GC-YOLO v5s的参数量、浮点运算量和模型内存占用量仅为YOLO v5s的69.1%、56.3%和58.3%。通过实验对比,该模型在识别精度和模型复杂度上优于其他主流目标检测模型;识别速度仅次于YOLO v5s,可达到104f/s。关键词:水产养殖;河蟹识别模型;图像增强;YOLO v5s;轻量化
|
郑荣才,谭鼎文,徐青,陈大勇,元轲新.基于改进YOLO v7的鲑鱼检测模型轻量化研究[J].农业机械学报,2024,55(11):132-139.
DOI:10.6041/j.issn.1000-1298.2024.11.014 摘要:为实现水下复杂环境下鲑鱼的快速准确识别,提出一种基于YOLO v7轻量化的鲑鱼检测模型YOLO v7-CSMRep。首先,采用Stem模块合并Backbone层的前4个卷积操作,有效降低了模型计算量。其次,使用多尺度重参数化(Multidirectional reparameterization, MRep)模块替代YOLO v7的ELAN和ELAN-H模块,增强了单向特征提取能力,同时大幅减少参数量和计算量。最后,在Backbone层末端集成卷积块注意力模块(Convolutional block attention module, CBAM),提升网络空间和通道特征提取能力。试验结果表明,改进后模型内存占用量、参数量和计算量分别降低4.28%、5.29%、31.30%,F1值、mAP0.5分别提高0.5、0.7个百分点,分别达到93.1%、97.1%,帧率提高15.41%,达到140.8f/s。对比YOLO v5s、YOLO v6s、YOLO v7、YOLO v7-tiny、YOLO v8s模型,mAP0.5分别提高1.0、2.0、0.7、0.8、1.2个百分点。因此,本文提出的方法能够快速而准确地识别鲑鱼,可为深远海养殖生物量监测提供技术支撑。关键词:深远海养殖;鲑鱼检测;YOLO v7;Stem模块;多尺度重参数化;卷积块注意力模块 |
袁红春,李春桥.基于改进可变形卷积的FDC-YOLO v8水下生物目标检测方法研究[J].农业机械学报,2024,55(11):140-146.DOI:10.6041/j.issn.1000-1298.2024.11.015 摘要:水下生物目标检测是实现水下机器人自动化捕捞的关键性技术。针对水下生物目标检测任务中存在的目标重叠、遮挡以及目标尺度小而导致的误检、漏检等问题,提出了一种基于改进YOLO v8n的水下生物目标检测算法FDC-YOLO v8。首先,在主干网络中使用融合可变形卷积网络的FDC模块,以增强模型特征提取能力,提升其提取特征的丰富度。其次,引入融合分数阶傅里叶变换和空间注意力机制的FrSAConv模块,进一步分离多样目标特征,增强模型对多种特征的感知能力。最后,引入Wise-IoU损失函数作为模型边界框损失函数,以更好地解决目标不平衡以及尺度差异的问题。使用RUIE数据集进行实验,水下生物包括海胆、海星、海参、扇贝。实验结果表明,改进后的FDC-YOLO v8的平均精度均值达到85.3%,较基准模型提升2.6个百分点,推理速度达到769f/s,在目标重叠、遮挡以及小尺度目标的水下生物目标检测中有更好的表现。关键词:水下生物识别;目标检测;YOLO v8n;Wise-IoU;可变形卷积网络;分数阶傅里叶变换 |
徐立鸿,黄志尊,龙伟,等.基于MobileViT-CBAM-BiLSTM的开放式养殖环境鱼群摄食强度分类模型[J].农业机械学报,2024,55(11):147-153. DOI:10.6041/j.issn.1000-1298.2024.11.016 摘要:鱼群摄食的精准投喂技术是实现智慧化水产养殖的一项关键技术。大多数精准投喂模型都是基于水质较清晰的室内养殖池,不太适用于开放式养殖环境。本研究通过水上视角采集构建了一套开放式池塘数据集,并对数据集进行数据增强增加其多样性,然后在轻量化神经网络MobileViT基础上,将CBAM注意力模块与MV2模块结合设计了CBAM-MV2模块,并嵌入BiLSTM循环神经网络用于识别分类,提出改进的MobileViT-CBAM-BiLSTM模型,提高了模型预测能力、鲁棒性和泛化性能,实现了鱼群摄食行为的三分类。实验结果显示,改进后MobileViT在采集的视频帧数据集上明显优于改进前的MobileViT,准确率98.61%,宏F1值达98.79%,相对于原始MobileViT准确率提高6.33个百分点,宏F1值提高6.75个百分点。关键词:鱼群摄食强度分类模型;精准投喂;MobileViT;BiLSTM;CBAM |
卢鹏,孙天文,陈明,等.基于YOLO v8和CycleGAN的红掌植株表型参数自动提取方法[J].农业机械学报,2024,55(11):154-159,319. DOI:10.6041/j.issn.1000-1298.2024.11.017 摘要:植株表型参数是描述植物形态、结构和生理特征的定量化指标,可揭示植物生长规律,以及与环境因素之间的关系。现有的人工测量和激光雷达点云植株表型参数提取方法存在数据误差大、易损伤植株、成本高和数据量大等问题。为此,本文提出了一种基于YOLO v8和CycleGAN的红掌植株表型参数自动提取方法,利用双重注意力机制CBAM改进YOLO v8,提高模型特征提取能力,对红掌植株叶片进行检测与分割;通过Grabcut算法去除分割后图像背景区域特征,并利用VGG模型对其进行分类,分出完整型红掌植株叶片和缺失型红掌植株叶片;在CycleGAN的生成器中引入双重注意力机制和特征金字塔,提高模型多尺度特征的提取能力,引入SmoohL1损失函数,提升模型稳定性,对缺失型红掌植株叶片进行修复;提出一种表型参数提取算法(Phenotypic parameters extraction algorithms,PPEA),实现对红掌植株叶长、叶宽和叶面积的自动提取。以650幅自建数据集为例,对上述方法进行了比较与分析,实验结果证明,本文方法在红掌植株表型参数自动提取方面具有良好的效果。关键词:表型参数提取;红掌;目标检测;图像修复;YOLO v8;CycleGAN |
赵文锋,黄袁爵,钟敏悦,等.基于OrchardYOLOP的火龙果园多任务视觉感知方法[J].农业机械学报,2024,55(11):160-170. DOI:10.6041/j.issn.1000-1298.2024.11.018 摘要:现代果园机器人面临复杂环境、光线多变和非结构化环境等问题,需要高效处理大量环境信息,而传统顺序执行多个单一任务的算法受到计算能力的限制,难以满足现代果园机器人的需求。本文针对火龙果园环境中自动驾驶机器人处理多任务时所面临的实时性和准确性要求,基于YOLOP模型引入了焦点融合高效卷积模块,并采用C2F和SPPF模块,同时优化了分割任务的损失函数,从而构建出OrchardYOLOP模型。实验结果表明,在目标检测任务上的精确度达到84.1%;在可行驶区域分割任务上的mIoU达到89.7%;在果树区域分割任务上的mIoU提高到90.8%;推理速度达到33.33f/s,而参数量仅有9.67×106。与YOLOP模型相比,不仅在速度上满足了实时性要求,而且准确性上也有显著提升。这解决了火龙果园多任务视觉感知中的关键问题,为非结构化环境下的多任务自动驾驶视觉感知提供了一种有效的解决方案。关键词:火龙果园;多任务;视觉感知;语义分割;目标检测;YOLOP |
王法安,何忠平,张兆国,等.基于PN-YOLO v8s-Pruned的轻量化三七收获目标检测方法[J].农业机械学报,2024,55(11):171-183. DOI:10.6041/j.issn.1000-1298.2024.11.019 摘要:为实现三七联合收获作业过程中的自适应分级输送和收获状态实时监测,本文针对三七根土复合体特征和复杂田间收获工况,提出一种基于YOLO v8s并适用于Jetson Nano端部署的三七目标检测方法。在YOLO v8s对三七准确识别的基础上,针对其新的模型结构特性,利用通道剪枝算法,制定相应剪枝策略,保证模型精度的同时提升实时检测性能。采用TensorRT推理加速框架将改进模型部署至Jetson Nano,实现了三七目标检测模型的灵活部署。试验结果表明,改进后的PN-YOLO v8s-Pruned模型在主机端的平均精度均值为93.71%,参数量、计算量、模型内存占用量分别为原始模型的39.75%、57.69%、40.25%,检测速度提升44.26%,与其他目标检测模型相比,本文改进模型在计算复杂度、检测精度和实时性方面具有更好的综合检测性能。在Jetson Nano端部署后,改进模型检测速度达18.9f/s,较加速前提升2.7倍,较原始模型提升5.8f/s。台架试验结果表明,4种输送分离收获作业工况下三七目标检测的平均精度均值达87%以上,不同输送分离收获作业工况和不同流量等级下的目标三七计数平均正确率分别达92.61%、91.76%。田间试验结果表明,三七目标检测平均精度均值达84%,计数平均正确率达88.11%,图像推理速度达31.0f/s。模型检测性能和计数效果能够满足复杂田间收获工况下目标三七的检测需求,可为基于边缘计算设备的三七联合收获作业自适应分级输送系统和收获作业质量监测系统提供技术支撑。关键词:三七;复杂收获作业工况;目标检测;通道剪枝;Jetson Nano;YOLO v8s |
李金瑞,杜建军,张宏鸣,等.基于轻量化MLCE-RTMDet的人工去雄后玉米雄穗检测算法[J].农业机械学报,2024,55(11):184-192,503. DOI:10.6041/j.issn.1000-1298.2024.11.020 摘要:玉米制种田遗漏雄穗检测是实现人工去雄质量评估的关键。针对现有玉米雄穗检测模型面临的参数量大、检测效率低和精度差等问题,提出一种基于RTMDet-tiny的轻量级雄穗检测模型MLCE-RTMDet。模型采用轻量级的MobileNetv3作为主干特征提取网络,有效降低模型参数量;在特征提取网络中引入CBAM注意力模块,增强对雄穗目标的多尺度特征提取能力,克服引入轻量化网络可能带来的性能损失。同时,使用EIOU Loss替代GIOU Loss,进一步提高雄穗检测精度。在自建数据集上的试验表明,改进的MLCE-RTMDet模型参数量缩减至3.9×106,浮点运算数降至5.3×109,参数量和浮点运算数分别比原模型减少20.4%和34.6%。测试集上模型平均精度均值增至92.2%,较原模型提高1.2个百分点;同时,推理速度达到41.9f/s,增幅达12.6%。与YOLO v6、YOLO v8、YOLO X等当前主流模型相比,MLCE-RTMDet表现出更好的综合检测性能。改进后的高精度轻量化模型可为实现玉米制种田人工去雄后的遗漏雄穗检测提供技术支撑。关键词:无人机;目标检测;人工去雄;玉米雄穗;RTMDet;轻量化网络 |
付主木,郝英杰,李嘉康,等.基于高光谱成像和GAN-SA-UNet算法的烟叶叶脉分割方法研究[J].农业机械学报,2024,55(11):193-201.DOI:10.6041/j.issn.1000-1298.2024.11.021 摘要:叶脉作为植物的重要特征,包含生理和遗传信息,针对复杂叶面纹理状态下的细小叶脉边缘分割模糊、分割精度低等问题,以烟叶为研究对象,提出了一种GAN-SA-UNet叶脉分割算法。通过高光谱成像技术获取叶脉与叶面光谱信息,并利用主成分分析(Principal component analysis,PCA)对其进行降维,得到合成图。在此基础上,引入空间注意力机制,捕捉关键的空间特征,提高分割精度,同时引入对抗网络,优化生成结果,提高叶脉分割的鲁棒性。结果表明:叶脉与叶面光谱PCA前3个主成分解释率达到95.71%,二者降维后的光谱特征表现出明显的可分性,前3个主成分合成图能够凸显叶面与叶脉之间的差异,突出叶脉特征。GAN-SA-UNet分割算法能够捕捉复杂叶面纹理图像的脉络特征,分割准确率和交并比分别达98.93%和66.23%,与原模型相比,分别提高0.18个百分点和4.21个百分点,单幅图像推理时间为4ms。在对不同产地、部位、等级、类型烟叶验证测试中表现出较强的泛化能力和高效准确的识别能力。关键词:烟叶叶脉分割;高光谱成像技术;U-Net;空间注意力机制;生成对抗网络 |