推荐阅读| 旋转的秘密：相位移编码器破解目标检测中的边界之谜

文摘 2024-10-09 09:15 北京

论文标题：On Boundary Discontinuity in Angle Regression Based Arbitrary Oriented Object Detection
论文链接：https://www.researchgate.net/publication/379081564_On_Boundary_Discontinuity_in_Angle_Regression_Based_Arbitrary_Oriented_Object_Detection

这篇论文的主要目的是解决任意方向目标检测中由于角度回归带来的边界不连续性问题。具体来说，现有的方法在对旋转角度进行回归时，常常会遇到目标在旋转到某个边界角度时预测结果出现异常的现象。为了解决这个问题，论文提出了一种新颖的编码方法——相位移编码器（Phase-Shifting Coder, PSC），以确保在角度回归过程中能够实现连续、可微的预测，避免边界不连续性。此外，论文还引入了双频相位移编码器（PSCD），进一步提升对不同类型目标（如长方形和接近正方形目标）的检测精度。

回归角度的边界不连续问题

下图思想展示了角度回归中的边界不连续性问题。

左图：

红色框代表预测的边界框，蓝色框代表真实的边界框（Ground Truth）。
这里展示了一个长方形的目标，它的中心点、宽度和高度（x,y,w,hx, y, w, hx,y,w,h）是相同的，唯一的区别是角度（θ\thetaθ）。
真实角度为 60°，而预测的角度为 -120°。尽管从视觉上来看，这两个框在实际物理空间中是等效的（因为旋转180度后，长方形看起来是一样的），但由于角度的周期性差异，损失函数（如L1损失）计算时认为它们有很大的差异，导致误差很大，损失函数的值远远大于零。

右图：

显示的是一个接近正方形的目标（宽度和高度接近相等），同样也是两个等效的框。
真实角度为 60°，而预测的角度为 -30°。由于接近正方形的物体边界的交换性（边缘可以互换），预测的框与真实框其实是等效的，但损失函数仍然给出了较大的误差，因为它没有考虑到这种等效性。

image-20240928132818682

通过这两个例子，Fig 1 旨在说明角度回归中的周期性问题和边界交换问题导致了误差的放大，即使预测的结果和真实值是等效的。这个问题在传统的角度回归模型中经常发生，导致了模型在训练和推理过程中的不稳定性。

如何解决边界不连续问题

下图思想展示了论文中提出的相位移编码器（PSC, Phase-Shifting Coder）如何解决角度回归中的边界不连续性问题。

image-20240928133918444

相位移编码器通过将角度信息编码为连续的相位变化（如余弦和正弦值），然后再通过解码器将这些相位信息解码回离散的角度预测。这种方法允许神经网络输出连续的相位信息（中间蓝色波形），然后再由相位解码器将其转换为离散的角度预测。这样，模型可以在不影响连续性的前提下，解决原本的“角度跳变”问题，从而有效解决边界不连续性。

基于PSC的深度学习目标检测架构

下图展示了如何将相位移编码器（PSC）集成到深度学习目标检测器中的两种不同架构——独立范式（Standalone Paradigm）和联合范式（Joint Paradigm）。

image-20240928134514172

独立范式：

在这个结构中，网络分别预测一个水平边界框和一个旋转角度。模型输出的内容包括边界框的坐标（x,y,w,hx, y, w, hx,y,w,h）和预测的角度（θ\thetaθ）。
角度的损失（Angle Loss）与水平边界框的损失相独立计算。这种方法虽然简单，但没有利用边界框和角度之间的潜在关系。

联合范式：

在这种结构中，PSC作为一个模块与旋转边界框（RBox）回归方法相结合，网络同时优化边界框的坐标和旋转角度。这里，模型不仅输出边界框的坐标，还输出编码的相位数据（m1,m2,m3m1, m2, m3m1,m2,m3），并通过解码器将其转换为旋转角度。
这种方法允许角度和边界框的损失共同优化，从而提高整体模型的性能。通过这种联合优化，模型能更好地学习边界框与角度之间的一致性，提高预测的精度。

对比分析：

图中清晰地对比了两种架构的工作流程，强调了联合范式的优势，特别是在处理边界不连续性问题时。通过将角度回归和边界框回归结合，模型能够更好地处理不同类型的目标检测任务。

实验

下表展示了在使用相位移编码器（PSC）的联合范式下，模型在HRSC数据集上的性能提升情况，特别是通过结合不同的旋转边界框（RBox）损失函数（如GWD、KLD、KFIoU、RotatedIoU）来验证PSC的有效性。

image-20240928134945603

表格结构

列标题

Detectors：列出了不同的目标检测器（如RetinaNet、FCOS、R3Det）。
RBox Loss：指明了用于模型训练的损失函数类型。
Baseline：表示没有使用PSC的模型性能。
Incorporating PSC：表示使用PSC后模型的性能。

关键内容解释

Baseline vs. Incorporating PSC：

每种检测器在使用不同的RBox损失时，Baseline列展示了未使用PSC时的平均精度（AP）表现，而Incorporating PSC列展示了加入PSC后的AP表现。
通过比较这两列，可以清楚地看到PSC的引入对模型性能的影响。

性能提升：

大多数情况下，AP值在加入PSC后都有所提升，说明PSC能够有效增强模型对目标方向的预测能力。
例如，RetinaNet在使用GWD损失时，Baseline为71.55，加入PSC后提升到72.73，增幅为1.18。这种提升在多个检测器和损失函数中均有体现。

不同损失函数的影响：

表格中显示，PSC在不同的RBox损失下表现出不同程度的性能提升，说明结合合适的损失函数可以进一步增强PSC的效果。

最新文章

锂离子电池储能系统数字孪生设计方法

推荐阅读 | 整合按需出行与城市公交网络的战略规划

将因果关系分解为协同、独特和冗余

推荐阅读 | 经典论文解读：X-Y区间与改进的(s, S)库存策略

一种跨域集群对抗的动态弹性评价方法

推荐阅读 | 带飞行助手的旅行商问题：无人机协助的配送优化建模及求解（附代码）

基于 MResNet-LSTM 的滚动轴承故障诊断

空间挠性作动器的可靠性验证试验方法

推荐阅读 | 上门配送成本控制：如何通过激励机制优化成本？

组合加权包络谱:一种用于提取旋转机械特征频率的增强解调框架

推荐阅读| 旋转的秘密：相位移编码器破解目标检测中的边界之谜

基于多保真度深度神经网络的偶然不确定性量化

推荐阅读 | FeatAug-DETR：通过特征增强丰富DETRs的一对多匹配

乘积包络谱优化- Gram：一种用于滚动轴承故障诊断的增强包络分析

基于物理信息残差网络的滚动轴承故障诊断

学术辑览 | 机械轴承推送合集

推荐阅读 | 血液捐献者供应链管理策略：库存响应串联网络模型

学术辑览 | 锂离子电池推送合集

基于混合注意力的多小波系数融合滚动轴承剩余寿命预测方法

推荐阅读 | 疫苗供应链优化建模：综述与未来机遇

ReF-DDPM: 一种基于DDPM的滚动轴承故障诊断数据增强新方法

推荐阅读 | 互补产品供应链中的权利差异与定价智慧

基于物理信息与数据驱动的贝叶斯网络的锂离子电池事故风险分析

推荐阅读 | 不确定条件下旅行者路径选择的K阶均值偏差模型

基于深度隐变量状态空间模型的轴承退化预测

推荐阅读 | 论文的整体结构：文前部分、主文部分和文尾部分

一种全新滚动轴承局部缺陷扩展动态更新和实时映射的数字孪生模型

面向滚动轴承故障智能诊断的数字双驱动局部域自适应网络

无寿命标签下的RUL概率预测：一种融合贝叶斯深度学习和随机过程的方法

推荐阅读 | 一种时频谱幅值调制方法及其在滚动轴承故障诊断中的应用

CBAM增强残差卷积域自适应网络在跨机滚动轴承剩余使用寿命预测中的应用

推荐阅读 | 应用Benders分解方法解决多车生产路由问题

考虑量化的随机退化设备的剩余寿命预测

推荐阅读 | 按需、长期还是混合?共享平台上最优租赁模式的优化模型

锂电池多物理场-退化耦合模型的参数灵敏度分析

推荐阅读 | 联邦学习经典高被引论文《原型对比联邦学习-FedProc》

基于因果路径的层次图卷积注意力网络在复杂机电系统故障检测中的应用

推荐阅读 | 面对服务中断和客户服务要求的多式联运网络整合规划

考虑大规模电池储能热致事故的可再生能源系统可靠性评估

推荐阅读 | 机器学习求解大规模TSP/VRP方法归纳

用于预测和健康管理的类ChatGPT大型基础模型：综述和路线图

推荐阅读 | 训练数据平衡时模型的不公平现象该如何解释？

基于动态贝叶斯网络和数字孪生的水下控制模块可靠性分析

推荐阅读 | 联合选址和可修复库存的电车换电服务模型

用于锂电池参数识别的分类器辅助贝叶斯优化方法

推荐阅读｜大语言模型中的优化问题(LoRA相关算法)

考虑非线性能耗模型的多路电动公交线路调度优化

基于数据驱动与迁移堆叠的锂离子电池SOH估计方法

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉