AAAI2025 | SemStereo: 实现遥感语义分割和立体匹配任务的协同优化

文摘   2024-12-30 10:00   荷兰  

 RS   DL 

论文介绍

题目:SemStereo: Semantic-Constrained Stereo Matching Network for Remote Sensing

会议:39th Annual AAAI Conference on Artificial Intelligence (CCF-A会议)

论文:https://arxiv.org/abs/2412.12685

年份:2024
单位:中科院空天院

AAAI 2025 合集请点击:AAAI 2025

创新点

  • 提出基于语义约束的立体匹配网络,显式建模语义类别与视差disparity的联系。
  • Semantic-Guided Cascade (SGC):通过共享深层特征隐式加强语义信息对立体匹配的指导。
  • Semantic Selective Refinement (SSR):基于语义预测通过残差学习进一步优化视差。
  • Left-Right Semantic Consistency (LRSC):通过跨视图一致性约束明确加强语义和视差的联系。

数据


  • US3D:
    • 包含约2139对Jacksonville卫星立体图像及2153对Omaha图像。
    • 提供语义标签,用于训练、验证和测试。
  • WHU:
    • 高分辨率航空数据集,无语义标签。
    • 用于测试模型的泛化能力。

方法

总体结构

1. Semantic-Guided Cascade (SGC)

  • 利用U型网络提取深层共享特征,同时生成语义分割图和初始视差图。
  • 通过共享深层特征,增强语义信息对立体匹配的隐式指导,避免传统并行结构的弱耦合问题。
  • 使用适配的Fast-ACV网络进行视差计算,确保高效性和准确性。

2. Semantic Selective Refinement (SSR)

  • 基于语义预测优化初始视差图,通过学习残差对视差进行细化。
  • 使用通道注意力机制,根据语义类别调整特征对视差优化的贡献,提升同类像素区域的视差一致性。
  • 进一步通过多尺度特征融合,生成高质量的最终视差图。

3. Left-Right Semantic Consistency (LRSC)

  • 利用视差图将左视图的语义标签映射到右视图,确保语义一致性。
  • 即使在缺乏语义标注的情况下,也能通过预测的伪标签实现自监督的跨视图一致性约束。
  • 该模块不仅提升了语义分割的准确性,还强化了视差图在复杂场景下的鲁棒性。

多任务联合优化

  • 同时优化语义分割和立体匹配任务,通过共享深层特征和引入显式约束,实现性能的互相提升。
  • 通过自适应的多阶段训练和损失函数的加权组合,使模型在多个任务间找到最佳平衡点。

实验和精度


通过语义分割和立体匹配的精度指标进行评估,结果显示所提方法在两个任务上均显著优于现有方法,实现了最先进的性能。

精度对比

可视化对比

更多图表分析可见原文


因配置了AI回复功能,除关键词自动回复外,号内信息主要由AI大模型回复。如需资源、投稿、合作等,请直接联系小助手微信(添加请备注:咨询投稿合作加群,加群需备注姓名/昵称,单位和研究方向)。

公众号欢迎优秀作者投稿!可加入优秀论文作者群:欢迎加入AI遥感优秀论文作者群!


问题及讨论可直接在文章下方留言


  欢迎关注  


分享遥感与深度学习领域的技术、论文、书籍、新鲜事。



欢迎加入遥感与深度学习交流群(点此加入)


遥感与深度学习
聚焦遥感与深度学习,分享相关技术、论文、书籍、资讯,团队来自国内外著名期刊作者及审稿人
 最新文章