植物计数在农业的各个阶段中至关重要,包括种子育种、发芽、栽培、施肥、授粉、产量估计和收获。受到人类通过逐步扫描高分辨率图像来计数物体的启发,我们探索了利用状态空间模型(SSMs)处理植物计数任务的潜力,以生成计数结果。本文提出了一种新的计数方法,称为CountMamba,构建多个计数专家,从多个方向同时进行扫描。具体而言,我们设计了一个多方向状态空间组,以多种顺序处理图像块序列,旨在模拟不同的计数专家。我们还设计了全局-局部自适应融合,以样本为基础自适应聚合从多个方向提取的全局特征和从CNN分支提取的局部特征。大量实验表明,所提出的CountMamba在包括玉米穗、麦穗和高粱穗计数在内的多种植物计数任务中表现出色。
图1. 所提出的CountMamba概述。它包含一个由多个堆叠的水平状态空间块(HSSBs)、垂直状态空间块(VSSBs)、对角状态空间块(DSSBs)和反对角状态空间块(ASSBs)并行组成的多方向状态空间组(MSSG),随后是全局-局部自适应融合、计数器和归一化器,以实现植物计数。
图2. HSSM、VSSM、DSSM、ASSM 和 CNN 分支结构的示意图。
图3 在 MTC、WED 和 SHC 数据集上的定性结果。Manual 表示真实值,Inferred 表示预测计数。红点为手动标注。
He H, Zhang Y, Xu J, et al. CountMamba: Exploring Multi-directional Selective State-Space Models for Plant Counting[J]. arXiv preprint arXiv:2410.07528, 2024.
https://doi.org/10.48550/arXiv.2410.07528
编辑
小王博士在努力
扩展阅读