为解决现有方法中提示类型单一及性能受限的问题,本文提出了COMPrompter,一个面向伪装目标检测(COD)的多提示网络。COMPrompter通过调整SAM结构,结合原始框提示与边界提示,实现更精准的分割。边界提示由边缘梯度提取模块(EGEM)提取边缘与梯度信息,而框-边界互引导模块(BBMG)加强了框与边界的连接。此外,引入离散小波变换(DWT)捕捉图像细节信息。实验结果证明,COMPrompter在多个基准数据集上优于现有SOTA方法。
本文的创新点如下:
(1) 提出了一种多提示策略,即将SAM的原框提示和新边界提示结合起来作为COMPrompter的用户提示。
(2) 提出了两种高效的设计:EGEM和BBMG。EGEM从图像和GT中获得边界的梯度掩码。在BBMG,框提示和边界提示共同指导、相互补充以获得准确提示。
(3) 验证了COMPrompter在COD和息肉分割基准数据集上的性能,COMPrompter优于现有的SOTA方法。
本文在四个广泛认可的伪装目标检测(COD)数据集上进行了实验,包括CAMO、CHAMELEON、COD10和 NC4K,以验证COMPrompter在COD任务中的效果。此外,为了更深入地评估模型性能,我们将COMPrompter应用于更具针对性的息肉分割任务,并在五个公开基准数据集上进行了测试,包括ETIS-Larib、CVC-ClinicDB、CVC-ColonDB、CVC-300和 Kvasir-SEG。
实验结果表明,COMPrompter在COD和息肉分割任务中均表现出色,进一步验证了其在不同场景下的有效性与适应性。