首页
时事
民生
政务
教育
文化
科技
财富
体娱
健康
情感
更多
旅行
百科
职场
楼市
企业
乐活
学术
汽车
时尚
创业
美食
幽默
美体
文摘
TGRS 2024 | 面向雾天遥感图像的定向目标检测算法
科技
2024-10-13 10:05
中国香港
论文信息
摘要
目前,大量工作集中在航空目标检测上,并取得了良好的结果。尽管这些方法在传统数据集上取得了有希望的结果,但在恶劣天气条件下捕获的低质量图像中定位对象仍然具有挑战性。目前,结合航空目标检测和雾天条件的方法有限,并且很少有基于真实雾天天气的航空图像的公开可用数据集。为此,我们提出了一个数据集HRSI,真实世界中的雾天遥感图像,主要分为三类:机场、大型车辆和船只。HRSI中的所有图像都来自真实的雾天条件。此外,我们提出了一个目标检测模型DFENet,适用于雾天的雾天遥感图像的去雾特征增强模型。DFENet由两个分支和一个去雾模块组成。两个分支结构有助于充分学习雾天和去雾特征。为了避免去雾模块引起的噪声影响,我们还设计了一个雾预测模块(HPM)来预测图像中包含雾的信息。我们引入了交叉融合模块(CFM),以利用雾的信息指导两个分支的特征融合。通过利用雾的信息,DFENet可以动态调整两个分支中的特征权重,避免去雾模块产生的噪声影响。与传统目标检测方法相比,DFENet不仅在雾天条件下具有良好的性能,而且也提高了晴朗条件下的性能。我们在DOTA、HRSI和Foggy-DOTA上测试了DFENet,证明DFENet在雾天条件下表现更好。
关键词
航空目标检测
雾天目标检测
弱监督
方法
A. 雾掩模
大气散射模型[36]通常用于量化雾天和清晰图像之间的关系,许多方法利用大气散射模型生成模糊图像,其公式如下:
其中
是雾天图像,
表示场景辐射率(清晰图像)。
是全局大气光,
是介质传输图,定义为
其中
表示大气的散射系数,
是场景深度
其中
是我们设置的基本散射系数,
是雾天级别,用于控制雾的浓度。通过控制不同的
值,我们可以获得对应不同雾浓度的
我们从上述公式中获得了对应不同浓度雾天天气场景的雾掩模
。基于此,我们从算法1中获得了雾掩模和复合雾天图像,这些雾掩模将在后续模块中使用。
B. 雾预测模块
基于大气散射模型,雾天图像可以被视为干净图像与雾层的融合。我们希望通过模型学习雾的信息,包括雾的位置信息和雾的浓度信息。首先,将模糊图像通过主干网络和FPN层处理以获得多层特征
,其中
表示不同的层次。如图3所示,我们选择
和
,它们分别包含图像的低级语义特征和高级语义特征。我们将
和
一起送入HPM模块,如图3所示,
和
各自通过一个卷积层,然后上采样
以获得
。我们将
和
在通道维度上进行连接以获得
。最后,我们对获得的
进行三次卷积操作,并用sigmoid激活以获得
。
C. 交叉融合模块
我们设计了一个注意力模块来接收来自两个分支的深度特征。当去雾模块获得的特征丢失了原始图像的大量细节时,模型的性能将严重下降。为此,我们设计了一个交叉燃料模块,对雾密度高的区域给予较低的权重。此时,融合特征将更多地依赖于干净图像的特征。我们希望通过加权注意力平衡清晰和模糊图像之间的关系。如图4所示,我们将从HPM获得的
作为我们的雾注意力,在训练阶段我们使用真实的标签
而不是
。首先,我们融合从主干网络获得的两个特征,其公式如下:
其中
由添加雾算法获得的雾掩模引导,可以充分反映雾浓度的分布。当雾浓度较高时,
更依赖于
,当雾浓度较低时,
更依赖于
。我们尝试以这种方式动态整合
和
,以便模型可以避免去雾模块的噪声影响,即使输入图像中没有雾。
将发送到一个3×3卷积以获得初始融合特征
,我们通过以下公式获得
:
其中Conv1D是1-D卷积,
是逐元素乘法,
表示Sigmoid激活函数。通过通道注意力模块,我们可以进一步减少冗余通道并抑制特征中的噪声。
将被送入检测器进行回归和分类。
D. 动态平衡机制
我们在算法1中获得了
,它是一个介质传输图,可以间接反映算法添加的雾的分布,
表示添加到当前图像中的雾的深度,
越大,
中心位置的权重越小。在训练过程中,每个输入的雾天图像对应一个独特的
。在图5中,我们可以看到
的权重从中心位置逐渐向外辐射。在训练过程中,我们可以使用
引导模型学习
的分布,而在推理过程中,模型可以通过HPM预测对应输入图像的
。在推理过程中,我们根据HPM预测的
平衡输入图像和去雾图像之间的特征融合。并根据以下公式合成特征:
其中
是去雾模块,
表示输入图像特征和去雾图像特征的融合特征。在图6中,我们可以看到输入雾天图像时获得的融合特征
会导致HPM预测的
权重较小,
将更倾向于去雾后的图像特征。当输入图像是清晰图像时,模型预测的
权重较大,
倾向于更倾向于清晰图像本身的特征,从而减少去雾后的清晰图像特征的影响。
G. 雾天遥感数据集
据我们所知,目前世界上公开可用的雾天遥感图像数据集很少。因此,我们提出了一个包含796张图像的HRSI数据集,大小从512×512到4000×4000不等,包括各种卫星放大倍数、方向和形状的图像。所有图像都因雾天条件差而模糊。对于特别模糊的图像,我们有多名注释者共同判断。我们在HRSI数据集中主要注释了三个类别:大型车辆、船只和飞机。这三个类别是主要的交通工具类别。对于飞机类别,我们主要选择机场的客机。对于船只类别,我们主要选择运河里的货船和邮船。对于大型车辆,我们主要选择卡车、公共汽车和卡车。我们主要从汽车站、码头、河流和机场收集图像。所有图像的像素到实际地图的比例是93:0.71(像素:米)和93:1.78(像素:米)。在浏览了大量遥感图像之后,我们进行了严格的筛选,主要选择由雾天场景引起的退化图像,大部分对象都是模糊或被雾遮挡。对于难以辨认的对象,我们已经适当地丢弃了一些。对于模糊的对象,多名工作人员将共同注释。此外,图7展示了HRSI的其他细节。在注释框方面,我们选择了与DOTA相同的OBB注释,OBB回归有五个值(x、y、w、h、a),而HBB回归有四个值(x、y、w、h),其中x和y代表边框的中心点位置,w和h代表边框的长度和宽度,a代表边框的旋转角度。OBB比常规HBB多一个角度信息,飞机、船只和卡车的形状主要是常规矩形,遥感图像中的对象具有高密度特征。直接使用非角度边框将导致边框重叠更大。因此,我们使用与DOTA一样的倾斜边框进行注释,这已被证明优于遥感图像领域的HBB型注释框,更适合遥感方向的目标检测任务。HRSI数据集的具体组成可以在表I和图8中找到我们提出的HRSI样本。
实验
声明
本文内容为论文学习收获分享,受限于知识能力,本文对原文的理解可能存在偏差,最终内容以原论文为准。本文信息旨在传播和学术交流,其内容由作者负责,不代表本号观点。文中作品文字、图片等如涉及内容、版权和其他问题,请及时与我们联系,我们将在第一时间回复并处理。
http://mp.weixin.qq.com/s?__biz=MzU0NjgzMDIxMQ==&mid=2247625226&idx=3&sn=27e1fa069cb7267effdc7586cadf72ed
小白学视觉
哈工大在读博士的公众号,《OpenCV 4快速入门》的作者,面向初学者介绍计算机视觉基础知识、OpenCV使用、SLAM技术,深度学习等内容。
最新文章
有哪些值得计算机专业学生加入的国企?
MIA 2024 | VSmTrans:一种用于医学图像分割的融合自注意力和卷积的混合范式
顶刊解读 IJCV | CAE-GReaT: 卷积辅助高效图推理Transformer用于密集图像预测
浙大高飞老师:读博士有多苦?
为什么我们的研究生提不出问题?
详解图像中的无监督学习
顶刊 IJCV | S2P3:基于偏振光的自监督姿态预测
一文带你搞懂相机内参外参(Intrinsics & Extrinsics)
打kaggle比赛拿奖后,用项目发了ECCV
顶刊 MIA'24 | I2U-Net:用于医学图像分割的具有丰富信息交互的双路径U-Net
PyTorch 源码解读之 :揭秘 C++/CUDA 算子实现和调用全流程
图解深度神经网络的架构
C++版OpenCV里的机器学习
医图顶刊 TMI'24 | FPL+:用于3D医学图像分割的基于过滤伪标签的无监督跨模态适应
顶刊 IJCV | 利用样本间亲和性实现可知晓性感知的通用领域自适应
GANs的优化函数与完整损失函数计算
今年顶会这情况。。。大家提前做准备吧!
正则化方法小结
自动驾驶 | 车道检测实用算法
yolov7正负样本分配详解
为什么要做特征的归一化/标准化?
医图顶刊 TMI'24 | 基于互信息引导扩散的零样本跨模态医学图像翻译
研究生第一篇科研论文常犯问题总结
一文看懂工业视觉与计算机视觉的区别
特征提取:传统算法 vs 深度学习
C++学哪些知识算入门?
TGRS 2024 | 面向雾天遥感图像的定向目标检测算法
清华微软最新力作:用物理学革新Transformer注意力,「大海捞针」精度暴涨30%!
T-Rex Label !超震撼 AI 自动标注工具,开箱即用、检测一切
大快人心!官方公告:暂停聘任,开展核查
TRGS 2024 | 基于混合先验约束的无监督去雾网络
Python实现10大排序算法(附完整源码)
强到离谱的写论文方法
使用YOLO11分割和高斯模糊创建人像效果
TRGS 2024 | 用于红外小目标检测的可分离时空块-张量对补全方法
顶刊 IJCV | 一种通用的基于事件的插件模块,用于降级条件下的视觉目标跟踪
python实现简单的车道线检测
什么是扩散模型(Diffusion Models),为什么它们是图像生成的一大进步?
TPAMI'24 视觉与文本新结合,将CLIP模型转化为场景文本识别器
神经网络训练不收敛或训练失败的原因总结
使用 OpenCV 和 Python 在直播中模糊人脸
学会用即插即用缝合模块,轻松涨点发Paper
如何看待2024年诺贝尔物理学奖,颁给了搞AI的!
用于图像分类的超轻量级特征压缩多头自注意力学习网络
什么是目标检测中的平均精度均值(mAP)?
来了,使用YOLOv11目标检测教程
详解Batch Normalization及其反向传播
什么是目标检测中的旋转敏感度错误?
MFT-GAN:用于无监督泛锐化的多尺度特征引导Transformer网络
如何看待今年比亚迪秋招只要双2以上的?
分类
时事
民生
政务
教育
文化
科技
财富
体娱
健康
情感
旅行
百科
职场
楼市
企业
乐活
学术
汽车
时尚
创业
美食
幽默
美体
文摘
原创标签
时事
社会
财经
军事
教育
体育
科技
汽车
科学
房产
搞笑
综艺
明星
音乐
动漫
游戏
时尚
健康
旅游
美食
生活
摄影
宠物
职场
育儿
情感
小说
曲艺
文化
历史
三农
文学
娱乐
电影
视频
图片
新闻
宗教
电视剧
纪录片
广告创意
壁纸头像
心灵鸡汤
星座命理
教育培训
艺术文化
金融财经
健康医疗
美妆时尚
餐饮美食
母婴育儿
社会新闻
工业农业
时事政治
星座占卜
幽默笑话
独立短篇
连载作品
文化历史
科技互联网
发布位置
广东
北京
山东
江苏
河南
浙江
山西
福建
河北
上海
四川
陕西
湖南
安徽
湖北
内蒙古
江西
云南
广西
甘肃
辽宁
黑龙江
贵州
新疆
重庆
吉林
天津
海南
青海
宁夏
西藏
香港
澳门
台湾
美国
加拿大
澳大利亚
日本
新加坡
英国
西班牙
新西兰
韩国
泰国
法国
德国
意大利
缅甸
菲律宾
马来西亚
越南
荷兰
柬埔寨
俄罗斯
巴西
智利
卢森堡
芬兰
瑞典
比利时
瑞士
土耳其
斐济
挪威
朝鲜
尼日利亚
阿根廷
匈牙利
爱尔兰
印度
老挝
葡萄牙
乌克兰
印度尼西亚
哈萨克斯坦
塔吉克斯坦
希腊
南非
蒙古
奥地利
肯尼亚
加纳
丹麦
津巴布韦
埃及
坦桑尼亚
捷克
阿联酋
安哥拉