ISPRS | SoftFormer: 多层次融合处理多模态遥感数据, 土地利用和土地覆盖分类

文摘 2024-11-12 08:16 荷兰

RS DL

论文介绍

题目：SoftFormer: SAR-optical fusion transformer for urban land use and land cover classification

期刊：ISPRS Journal of Photogrammetry and Remote Sensing

论文：https://www.sciencedirect.com/science/article/pii/S0924271624003502

代码：https://github.com/rl1024/SoftFormer

年份：2024

作者单位：香港大学

创新点

SoftFormer网络：该网络结合CNN和Transformer的优点，通过多层次融合（特征层和决策层）来处理多模态数据。SoftFormer提出了一种“内部自注意力”（ISA）机制，用于提取局部特征，同时保留Transformer的全局语义建模能力。
联合关键学习模块（JKL）：在特征层融合中，该模块通过个体注意力减少特征冗余，并在统一的特征空间中生成互补特征，增强了多模态特征的整合。
多层次融合方法：该方法在特征和决策层次上进行融合，通过结合光学和SAR数据的特性，实现了更高的分类精度和抗干扰能力。

数据

研究区域

选取了中国的三个地区——杭州、武汉和香港（包含元朗和葵涌）作为研究区域。这些地区代表了不同的地理位置和城市化水平，具备多样的地表覆盖类型和复杂的地貌特征。

数据来源

光学数据：杭州和武汉使用Sentinel-2影像，分辨率为10米。香港的葵涌使用了Worldview-3影像，包含8个多光谱波段，分辨率更高。
SAR数据：采用ALOS-2的SAR影像，分辨率为5米，为杭州、武汉和香港提供稳定的空间信息。SAR影像对天气不敏感，可以在多云或降雨天气下获取数据，补充了光学影像的不足。

SAR数据捕获的时间点为2019年8月（杭州、武汉）和2017年（香港），并选择时间接近的光学影像以减少时间不匹配带来的误差。

预处理

SAR影像经过辐射校正、斑点滤波和地形校正，并进行了极化分解处理，增加了SAR数据的分类能力。光学影像经过大气校正后进行分辨率提升（10米分辨率）。

标注信息

杭州和武汉：划分为四类地物，包括植被、土壤、城市不透水面和水体。
香港的元朗和葵涌：根据香港规划署的标准，包含十几类更为细化的土地利用类型，如工业、港口、开放空间、住宅、道路等。元朗数据特意包含了云覆盖区域，用于测试在云干扰条件下多模态数据融合的效果。

结果与精度

总体结构

SoftFormer采用了Transformer架构，并结合了卷积神经网络（CNN）的局部特征提取优势。它通过在特征层和决策层进行多层次融合来实现光学和SAR数据的综合利用，从而提高分类效果。
网络主要分为三个部分：编码器（用于特征提取）、特征融合模块（用于多模态特征融合）和决策融合模块（用于分类结果融合）。

多头内部自注意力机制 multi-head ISA

ISA用于模仿CNN的局部感受野，从图像中提取局部细节。ISA在Transformer的浅层中引入，使模型在早期能够聚焦于局部信息，这对于SAR影像中的纹理和边界提取尤为有效。
传统Transformer会在所有像素之间计算自注意力，而ISA机制仅计算局部区域内的注意力关系，减轻了计算负担，保留了局部特征，同时提升了对于像素间差异的适应性。

多模态特征融合

SoftFormer在特征融合方面采用了联合关键学习模块（JKL），通过这个模块使得光学和SAR特征在统一的语义空间中进行融合。JKL模块的设计可以减少特征冗余，同时在不同模态之间形成互补性特征。
在特征融合中，传统的简单加和或拼接方法常常引入特征冗余，而SoftFormer的JKL模块则让每种模态的特征在共享语义空间中单独学习，以更好地保留每种数据的独特性。

决策层融合

SoftFormer在最后进行决策层的融合，即融合不同模态特征经过单独分类器后的结果，形成最终分类。这种多层次融合可以在特征级别上加强分类结果的精度，同时在决策层融合时提升模型的抗干扰能力。
为了避免单一模态分类器的误差影响最终决策，SoftFormer通过一个线性组合的方式，将来自光学、SAR和融合特征的分类结果综合，形成一个更稳定、抗干扰的最终分类结果。

结果与精度

实验结果表明，SoftFormer方法在分类精度上表现优异，尤其是在包含云覆盖的复杂场景下，相较传统方法表现更加稳定。这种多模态、多层次的融合策略，有效提升了在复杂城市地表的分类效果。

不同数据集上的精度

可视化对比

杭州（上）和武汉（下）不同方法的可视化分类结果

葵青（上）和元朗（下）不同方法的可视化分类结果

更多分析可见原文

因配置了AI回复功能，除关键词自动回复外，号内信息主要由AI大模型回复。如需资源、投稿、合作等，请直接联系小助手微信（添加请备注：咨询、投稿、合作、加群，加群需备注姓名/昵称，单位和研究方向）。

公众号欢迎优秀作者投稿！可加入优秀论文作者群：欢迎加入AI遥感优秀论文作者群！

问题及讨论可直接在文章下方留言

欢迎关注

分享遥感与深度学习领域的技术、论文、书籍、新鲜事。

欢迎加入遥感与深度学习交流群(点此加入)。

http://mp.weixin.qq.com/s?__biz=MzU2NTc2MjU2OQ==&mid=2247490810&idx=1&sn=46af8e90511242b0db47c44cc852656f

遥感与深度学习

聚焦遥感与深度学习，分享相关技术、论文、书籍、资讯，团队来自国内外著名期刊作者及审稿人

ACM MM24 | UrbanCross: 通过跨域适配增强卫星图像-文本检索, 香港科技大学广州分校等团队提出

TGRS | 无需切成小块图像! 金字塔超像素transformer用于高光谱图像分类

NeurIPS24 | M3LEO: 剑桥大学等提出集成干涉SAR和多光谱影像的多模态多标签数据集

TGRS | UBCV2:全球建筑检测和细粒度分类数据集, 光学和SAR影像精准对齐

TIP | 武大团队提出跨模态异常检测模型UniADRS, 用于遥感图像

技术实践 | 如何在YOLO11中训练tif格式4波段遥感图像？

TGRS | U²ConvFormer: 复旦团队提出高光谱图像分类模型, 结合U-Net和Transformer

ISPRS | SoftFormer: 多层次融合处理多模态遥感数据, 土地利用和土地覆盖分类

资讯 | 2024软科世界一流学科排名! 遥感、计算机专业排名

NeurIPS24 | AnyChange, 遥感零样本变化检测！

GSIS综述论文 | 中国遥感卫星, 原来有了这么多应用！对标哨兵和Landsat, 我们有哪些发展？

吉林一号高分辨率遥感数据免费下载！限时24小时！

NeurIPS24 | GeoPlant: 大型植物物种预测数据集, 含长时间序列卫星数据及土壤气候数据, 托管于Kaggle

会议手册 | 2024全国博士生测绘遥感学科学术论坛通知, 于中山大学举办

顶会新方向！全新多模态大模型统一分割框架

看Nature | 全球研究生在学术压力下的心理健康问题: ‘发表或淘汰’文化如何影响新一代学者？

TGRS | 哈工大提出同时处理遥感分类/分割/目标检测的多任务学习框架RSCoTr, 基于Transformer

NeurIPS24 | MMM-RS: 多模态, 多分辨率,多场景的遥感数据集和基准, 可用于跨模态数据生成

NeurIPS24 | OpenSatMap: 细粒度高分辨率卫星数据集, 中科院和腾讯等提出的用于大规模制图的数据集

遥感数据 | FTW全球农田边界数据, 含对应影像数据! 约160万田块边界及7万多个样本

太强了！如何用ChatGPT结合Python处理遥感数据

NeurIPS24 | SolarCube: 马里兰大学等提出高分辨率太阳辐照预测基准数据集, 包含卫星和现场观测数据

TPAMI | 大型城市场景的建筑实例分割和3D重建, 基于航拍图像

TGRS | P2PFormer: 武大等提出遥感建筑轮廓提取新pipeline

遥感竞赛 | 基于无人机航片的玉米异常情况识别, CCF大数据与计算智能大赛

NeurIPS24 | 如何更好地利用地理位置信息来提升模型效果？

NeurIPS24 | FUSU: 香港大学等单位提出多源多时相土地利用变化分割数据集

Python包 | Leafmap: 交互式地理空间分析, 为非GEE用户设计! 含500多个高级地理空间分析工具

论文er们，深度学习+遥感这口饭得趁热吃！

实用工具｜GeoSegment,SAM用于遥感图像分割,网页端操作,下载便捷

RSE | 刚果盆地道路发展监测, 基于深度学习和多源卫星影像

INFUS | STFDiff: 基于扩散模型的遥感图像时空融合

资讯 | 硬刚！被On hold后，eLife期刊正面回应

NeurIPS24 | ETH等提出高分辨率树冠数据集, 实例级标注, 超28万个体树和5.6万树群, 全球+多样化

会议通知 | AI和数字孪生改变城市生活, 英国格拉斯哥大学举办, 可线上免费参加

超强3D人体姿态估计SOTA! 即插即用于各种基于Transformer 3D姿势估计器

遥感数据 | 时间序列农作物分类基准数据集, 跨不同国家和气候区

PNAS | 检测2000多种植物分布! 使用遥感和深度学习监测和预测植物物种分布和快速变化, 结合公民科学数据

NeurIPS24 | 无需复杂地图! 基于城市白模的无人机视觉定位新方法

IJDE | 综述 | 全面回顾多源遥感影像变化检测, 发展历史, 数据, 方法, 未来展望

实用工具｜适用遥感图像的AI自动标注工具,T-Rex Label, 开箱即用, 检测一切!

论文 | HazyDet: 雾天无人机目标检测开源数据基准, 以及深度感知检测器DeCoDet

TPAMI | Changen2, 用于生成多时相遥感图像及变化检测数据的基础模型

深度｜AI教父Hinton与AI教母李飞飞首次公开对谈：我们必须通过，让懂得数据的人和懂得如何使技术有效的人建立联系来搭建这座桥

RSE | 降低对灾后图像的依赖! 遥感建筑损毁评估模型, 受灾前后样本无需相同位置

TPAMI聚焦, SegNet 高效而精准的图像语义分割网络

完整PPT | 谷歌提出用于遥感大模型的Embedding Fields 模型

会议通知 | 第二届大湾区测绘遥感大会（二号通知）

NeurIPS24 | 多无人机协作精确预测车辆等目标移动轨迹, Drones Help Drones

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉