论文赏读 | ECCV24 | 两阶段高光谱遥感图像分类(语义分割) 模型DSTC

文摘科技 2024-07-14 07:02 荷兰

RS DL

论文介绍

题目：Dual-stage Hyperspectral Image Classification Model with Spectral Supertoken

会议：2024 The European Conference on Computer Vision (ECCV)

论文：http://arxiv.org/abs/2407.07307

代码：https://github.com/laprf/DSTC (将发布)

年份：2024

创新点

双阶段光谱supertoken分类器 (DSTC)：DSTC 模型旨在解决单阶段逐像素分类模型的缺点，使用两阶段的过程来分类高光谱图像。
基于光谱导数的像素聚类：该技术将具有相似光谱特征的像素聚类成光谱supertoken，有助于保持区域分类的一致性和精确的边界定义。
基于类别比例的软标签：创新的标签方法根据各类别在每个supertoken中的比例分配权重。该方法有效地管理数据分布不平衡问题并提高分类性能。

数据

1. WHU-OHS 数据集

WHU-OHS数据集是一个大规模高光谱数据集，由Orbita Hyperspectral Satellite (OHS)获取。
图像分辨率：每张图像的分辨率为512 × 512像素。
光谱通道：包含32个光谱通道，覆盖了466-940 nm的光谱范围。
类别数：该数据集包含24种地表覆盖类别，如稻田、干旱农田、林地、灌木丛等。
用途：广泛应用于土地覆盖分类，尤其是大型区域的分类任务。
https://www.sciencedirect.com/science/article/pii/S1569843222002102

2. Indian Pines (IP) 数据集

IP数据集是一个经典的高光谱图像数据集，广泛用于遥感图像分类研究。
图像尺寸：145 × 145像素。
光谱通道：包含200个光谱波段。
空间分辨率：每个像素对应20 µm的空间分辨率。
类别数：包含16个地表覆盖类别，如玉米、草地、森林等。
样本分布：类别样本数量差异较大，从少量到大量不等。

3. Kennedy Space Center (KSC) 数据集

数据集简介：KSC数据集包括从肯尼迪航天中心获取的高光谱图像。
图像尺寸：512 × 614像素。
光谱通道：包含176个光谱波段。
空间分辨率：覆盖400-2500 nm的光谱范围，去除了低信噪比波段。
类别数：最终数据集中包含13个地表覆盖类别。
样本分布：类别分布不均匀，涵盖不同的自然和人工地表覆盖类型。

4. University of Pavia (UP) 数据集

数据集简介：UP数据集由Pavia大学区域的高光谱图像组成，主要用于城市地表覆盖分类。
图像尺寸：610 × 340像素。
光谱通道：包含115个光谱波段，去除噪声后剩余103个波段。
空间分辨率：每个像素对应1.3米的空间分辨率。
类别数：包含9个城市地表覆盖类别，如道路、建筑、植被等。

5. 文中提到补充材料中有在HS-SOD数据集中的实验

HS-SOD：https://ieeexplore.ieee.org/document/8463428

方法

总体结构

阶段1：光谱supertoken生成（Stage 1: Spectral Supertoken Generation）

目标：通过聚类技术将具有相似光谱特征的像素组合在一起，生成光谱supertoken，以减少数据的复杂度并提高分类精度。

1. 空间保留特征编码器（Spatial-preserved Feature Encoder）

目标：从输入的高光谱图像中提取深层语义特征，同时保留空间分辨率。步骤：

使用基于UNet架构的模型进行特征提取。
在下采样阶段，利用预训练的深度网络（如ResNet、PVTv2或Swin Transformer）作为骨干网络，从高光谱图像中提取特征。
在上采样阶段，通过一系列堆叠的卷积层恢复空间分辨率，并扩大特征维度，从而丰富捕获的语义信息。

2. 基于光谱导数的像素聚类（Spectrum-derivative-based Pixel Clustering）

目标：根据光谱相似性将像素聚类成光谱supertoken（Spectral Supertokens）。

步骤：

计算光谱导数特征：包括一阶和二阶光谱导数，分别用于分离在原始光谱中重叠的峰值和揭示复杂的光谱细节。一阶光谱导数帮助分离重叠的峰值，而二阶光谱导数揭示复杂的光谱细节。
像素聚类：选择初始中心点，计算每个像素与这些中心点的关联矩阵，通过迭代更新中心特征，最终形成像素聚类。初始中心点是从深层语义特征中选取的，通过计算每个像素与这些中心点的相似性，进行像素的分组。

3. 语义特征聚合（Semantic Feature Aggregation）

目标：动态聚合每个聚类内的语义特征，形成光谱supertoken。

步骤：对每个聚类内的特征点进行加权求和，聚合成一个supertoken。这种聚合方法考虑了每个特征点与聚类中心的相似性，从而形成代表该聚类的综合特征。

阶段2：supertoken到像素的预测（Stage 2: Token-to-Pixel Prediction）

目标：利用Transformer对光谱supertoken进行分类，并将这些分类结果投射回图像空间，生成最终的分类图。

1. token到像素预测（Token-to-Pixel Prediction）

目标：利用Transformer对光谱supertoken进行分类，并将这些分类结果投射回图像空间，生成最终的分类图。

步骤：

使用Vision Transformer (ViT) 对光谱supertoken进行分类。
通过注意力机制计算supertoken之间的关系，利用Transformer的强大特征表示和全局上下文建模能力，生成token级别的分类结果。
将这些分类结果转换回图像域，生成像素级别的分类图。

2. 基于类别比例的软标签（Class-proportion-based Soft Label）

目标：由于单个supertoken可能包含多种地表覆盖类别，因此提出一种基于类别比例的软标签来进行监督。

步骤：

使用关联矩阵过滤每个中心点下的所有像素标签。
计算每个类别在supertoken中的出现频率，生成软标签。这种方法确保了标签能够反映supertoken内所有类别的比例，从而提高分类精度。

结果和精度

DSTC模型通过有效的光谱supertoken生成和分类方法，在多个高光谱图像数据集上展示了其强大的分类性能和计算效率。实验结果表明，该模型在处理类别不平衡和提高分类精度方面具有显著优势，是一种有效的高光谱图像分类方法。

WHU-OHS 数据集精度

IP, KSC, 和UP 数据集精度

消融实验

欢迎关注CVPR 2024系列

点此进入CVPR2024遥感方向合集

因配置了AI回复功能，除关键词自动回复外，号内信息主要由AI大模型回复。如需资源、投稿、合作等，请直接联系小助手微信（添加请备注：咨询、投稿、合作、加群，加群需备注姓名/昵称，单位和研究方向）。

关于AI回复功能：

公众号新增AI回复功能，已接入大模型，集成查找ArXiv论文、CSDN博文等功能

问题及讨论可直接在文章下方留言

论文赏读 | ECCV24 | MutDet: 基于DETR的预训练框架改进遥感目标检测

深度学习全进阶！95博后新型思路曝光！频登顶刊解决遥感领域多年难题！

实践 | OpenAI发布o1, 编程等能力大幅提升! 遥感AI问题实测对比GPT4o

数据论文 | SARDet-100K: 首个 COCO 级别的大型 SAR 目标检测数据集

综述论文 | RSE | 深度学习用于城市土地利用分类综述, 以及实验评估

CVPR'25遥感视觉或将大杀四方！

遥感工具 | PaddleRS, 百度飞桨的官方遥感深度学习开发工具, 从数据到部署的全流程遥感应用

书籍推荐 | 骆剑承研究员: 遥感智能计算与地理精准应用的思考与探索

资讯 | NASA 新出功能: 在Landsat 上找到你的名字! Your Name in Landsat！

数据论文 | ISPRS | 688个城市1000万张街景综合数据集, 可直接下载

数据整理 | 全球大规模建筑底座数据集汇总

资讯 | 武汉一号卫星数据正式发布！

论文赏读 | TGRS | SSUMamba 用于高光谱遥感图像去噪, 代码已开源

书籍推荐 | 深度学习原理及遥感地学分析

论文赏读 | ISPRS | 农作物分类制图, 使用PlanetScope 影像和SAM模型, 并结合谷歌街景视图数据

论文赏读 | Φsat-2星载AI算法和应用论文, 包含U-Net云检测, YOLOv3-tiny船只检测等

资讯 | CogniSAT-6 AI卫星增强地物探测能力, Live Earth Intelligence 重大进步

欢迎加入AI遥感竞赛交流群！

遥感目标检测新王者！YOLO-World提升速度20倍！

会议通知 | 首届智慧遥感制图国际研讨会 (第二轮通知)，香港大学等单位主办

论文赏读 | TGRS | 全色和多光谱图像融合新方法! 基于像素级集成掩码自编码器

欢迎加入AI遥感竞赛交流群！

重磅！2024年最新国家自然科学基金申报与标书撰写培训

论文赏读 | ECCV24Oral | 点投影到轴, 用于有向框目标检测的点轴表示方法

论文赏读 | KAN 和 U-Net结合用于遥感农田分割, KAN You See It?

声明 | 关于公众号被恶意举报的声明

遥感Workshop| 雄安土地覆盖变化检测及分类制图, 学习免费, 邀请好友送黑神话悟空游戏一份！

三大顶会, 大模型搭建和优化工作！超全总结！（送书）

资讯 | 9月16日起, GEE将限制没有云项目的帐户的配额; 11月13日起, 所有GEE访问都需要云项目

数据论文 | AAAI24 | SkyScript: 斯坦福团队提出的大型遥感视觉-语言数据集, 关注语义多样性

论文赏读 | ISPRS | 基于天问一号影像的火星横向风成脊有向框目标检测

论文赏读 | TGRS | 高分辨率遥感影像去云，基于扩散模型和参考视觉先验

论文赏读 | TGRS | 无人机图像单目深度估计, 结合动态语义感知的精度提升方法

论文赏读 | TPAMI | 解决遥感有向目标检测中的边界不连续问题

综述+数据 | ISPRS | 卫星视频单目标跟踪: 综述及首个定向目标跟踪基准！

会议通知 | 大佬云集! 中国地理学会地理模型与地理信息分析专业委员会2024年学术年会, 可现场注册

欢迎加入遥感与深度学习交流群！

顶会涌现一批多模态大模型+遥感深度学习工作，极具创新！

论文赏读 | PyramidMamba: 即插即用的解码器用于遥感图像语义分割, UNetFormer作者新作

遥感竞赛 | 近期竞赛总结, 含道路提取, 变化检测, 高光谱影像分类, 目标检测追踪, 图像去云等

论文赏读 | ECCV24 | 使用全景-BEV联合检索网络进行跨视角图像地理定位

论文赏读 | TGRS | SAM辅助遥感影像语义分割，使用目标和边界约束

CVPR一作整理的计算机视觉学习路线

资讯 | 2024软科世界大学学术排名发布, 是由哪些指标评出的？附QS/USNews对比

论文赏读 | TIP | TTST: 用于遥感超分辨率重建的可动态选择token的Transformer网络

当遥感技术遇上扩散模型（Diffusion Model），强强联合！

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉