NeurIPS24 | AnyChange, 遥感零样本变化检测！

文摘 2024-11-11 10:01 荷兰

RS DL

论文介绍

题目：Segment Any Change

会议：Conference on Neural Information Processing Systems 2024

论文：http://arxiv.org/abs/2402.01188

年份：2024

单位：斯坦福大学、武汉大学

注：本篇由论文原作者审阅

NeurIPS 2024遥感方向论文合集：NeurIPS024

创新点

Segment Any Change（AnyChange）模型实现了零样本变化检测功能，通过使用SAM（Segment Anything Model）实现无需训练即可跨越未见的变化类型和数据分布进行检测，为变化检测模型设立了新的范式。
模型利用了双时相潜在空间匹配，通过SAM的潜在空间中的语义相似性，独特地将SAM转化为一种变化检测工具，使其能够在不进行训练的情况下对各种数据和场景进行广泛的泛化。
AnyChange 支持带有点查询机制的面向对象的变化检测，允许进行交互式、特定对象的检测，这在现实应用中（如灾害评估）尤其有益。

数据

本文使用的数据已全部收录于：https://github.com/rsdler/Remote-Sensing-Change-Detection-Dataset/

LEVIR-CD：用于建筑物变化检测的二分类数据集，包含前后两个时间点的高分辨率遥感图像，用于识别建筑物增减或结构上的变化。LEVIR-CD数据集常用于测试在城市环境中建筑变化的检测能力，特别是在建筑增建或拆除等场景下的应用。
S2Looking：S2Looking数据集专注于建筑变化检测，但其图像来自卫星的侧视角度拍摄，因此为建筑物变化的检测增添了复杂性。该数据集同样为二分类数据集，包含成对的多时相图像，以检测建筑物在不同时间点的变化。
xView2：xView2数据集是灾后建筑损毁评估的基准数据集，用于识别和评估建筑物在自然灾害（如地震、洪水等）中的损坏情况。该数据集包含受损前后的图像对，通过对建筑物损毁的识别和标注，为灾后救援和评估提供帮助。数据集的标签信息涵盖了建筑物受损的程度，因此xView2数据集在检测建筑物结构变化方面具有挑战性。
SECOND：SECOND是一个多类别的城市变化检测数据集，涵盖了多达36种变化类型，包括建筑、道路、植被等多个地物的变化。相比前几个数据集，SECOND具有更丰富的地物类别和变化类型，为AnyChange模型提供了更复杂的测试场景。由于SECOND数据集的多类别特性，AnyChange模型在该数据集上的表现尤为重要，展示了模型在无监督和零样本检测条件下识别多种地物变化的能力。

方法

1. 双时相潜在空间匹配（Bitemporal Latent Matching）

“双时相潜在空间匹配”方法，这是一个无需训练的适应过程。该方法利用SAM潜在空间中的语义相似性，通过在双时相图像对上匹配潜在特征，检测两时相的语义变化。

具体步骤：

给定时相t和t+1的图像对，首先通过SAM的图像编码器提取每个时相的图像嵌入。
SAM生成多个对象掩膜，并在每个掩膜区域内计算嵌入的平均值作为该区域的潜在表示（称为“掩膜嵌入”）。
在两个时相之间计算掩膜嵌入的相似性，通过余弦相似度评估掩膜在不同时间的语义变化程度，定义为“变化置信度分数”。如果两时相的嵌入角度较大（低相似性），则表明发生了变化。

双向匹配：为了确保变化检测的时序对称性，AnyChange采用了双向匹配，即从t到t+1和从t+1到t的双向匹配来计算变化分数。这种方法可在没有训练的情况下识别出显著变化区域。
筛选变化：最终的变化预测通过对变化置信度分数进行排序和筛选得到，可以采用前k个变化或设定阈值进行过滤。

2. 点查询机制（Point Query Mechanism）

点查询机制赋予AnyChange交互式变化检测能力，使用户可以选择特定对象来实现面向对象的变化检测。用户在一张图像上点击某个对象（如建筑物），模型将聚焦于该对象的变化。
具体操作：

用户点击的点会生成一个对象掩膜（即SAM的点提示功能），并计算该点区域的平均嵌入。
该嵌入作为查询，与所有对象掩膜的嵌入进行匹配，以获得与该类别对象最相关的变化。

多点查询：为了提高变化检测的稳定性，用户可以选择多点查询模式，通过多个相同类别对象的点击点平均嵌入来提升变化检测的精度。这种机制在需要特定目标变化的应用场景（如灾后建筑评估）中尤为有效。

3. 实例级变化检测（Instance-Level Change Detection）

AnyChange不仅支持像素级变化检测，还能够检测实例级的变化，即检测单个对象（如建筑、道路等）的变化区域。这种能力得益于SAM生成的对象掩膜。
在每个时相中，AnyChange通过SAM生成对象掩膜，并在双时相间计算每个对象掩膜的变化分数，这样可以识别对象级别的变化，从而获得具体实例的变化区域。

4. 模型的零样本和无监督模式

零样本变化检测：AnyChange不需要针对变化检测任务进行任何训练，直接基于SAM的潜在空间适应来实现变化检测。这种方式避免了大量标注数据的依赖，扩展了SAM的应用场景。
无监督变化检测：AnyChange在没有监督标签的情况下生成“无类别变化掩膜”，即不依赖特定变化类别，仅检测任何语义上显著的变化。这使其在完全无标注数据的场景中也具有强大的变化检测能力。

实验和结果

为了验证AnyChange的有效性，本文与几种基线方法进行了比较，结果表明，AnyChange在多种数据集上实现了更高的变化检测精度，特别是在像素级和实例级的变化召回率上，显著优于基线方法。

CVA（变化矢量分析）：一种传统的基于像素差异的无监督变化检测方法。
DINOv2+CVA：基于DINOv2视觉模型提取的深度特征的变化矢量分析。
SAM+Mask Match：通过SAM生成的掩膜的几何匹配来检测变化。
SAM+CVA Match：基于SAM潜在空间的特征差异，通过负L2范数计算变化。

精度对比

更多图表分析可见原文

欢迎关注会议论文赏读系列

因配置了AI回复功能，除关键词自动回复外，号内信息主要由AI大模型回复。如需资源、投稿、合作等，请直接联系小助手微信（添加请备注：咨询、投稿、合作、加群，加群需备注姓名/昵称，单位和研究方向）。

公众号欢迎优秀作者投稿！可加入优秀论文作者群：欢迎加入AI遥感优秀论文作者群！

问题及讨论可直接在文章下方留言

ACM MM24 | UrbanCross: 通过跨域适配增强卫星图像-文本检索, 香港科技大学广州分校等团队提出

TGRS | 无需切成小块图像! 金字塔超像素transformer用于高光谱图像分类

NeurIPS24 | M3LEO: 剑桥大学等提出集成干涉SAR和多光谱影像的多模态多标签数据集

TGRS | UBCV2:全球建筑检测和细粒度分类数据集, 光学和SAR影像精准对齐

TIP | 武大团队提出跨模态异常检测模型UniADRS, 用于遥感图像

技术实践 | 如何在YOLO11中训练tif格式4波段遥感图像？

TGRS | U²ConvFormer: 复旦团队提出高光谱图像分类模型, 结合U-Net和Transformer

ISPRS | SoftFormer: 多层次融合处理多模态遥感数据, 土地利用和土地覆盖分类

资讯 | 2024软科世界一流学科排名! 遥感、计算机专业排名

NeurIPS24 | AnyChange, 遥感零样本变化检测！

GSIS综述论文 | 中国遥感卫星, 原来有了这么多应用！对标哨兵和Landsat, 我们有哪些发展？

吉林一号高分辨率遥感数据免费下载！限时24小时！

NeurIPS24 | GeoPlant: 大型植物物种预测数据集, 含长时间序列卫星数据及土壤气候数据, 托管于Kaggle

会议手册 | 2024全国博士生测绘遥感学科学术论坛通知, 于中山大学举办

顶会新方向！全新多模态大模型统一分割框架

看Nature | 全球研究生在学术压力下的心理健康问题: ‘发表或淘汰’文化如何影响新一代学者？

TGRS | 哈工大提出同时处理遥感分类/分割/目标检测的多任务学习框架RSCoTr, 基于Transformer

NeurIPS24 | MMM-RS: 多模态, 多分辨率,多场景的遥感数据集和基准, 可用于跨模态数据生成

NeurIPS24 | OpenSatMap: 细粒度高分辨率卫星数据集, 中科院和腾讯等提出的用于大规模制图的数据集

遥感数据 | FTW全球农田边界数据, 含对应影像数据! 约160万田块边界及7万多个样本

太强了！如何用ChatGPT结合Python处理遥感数据

NeurIPS24 | SolarCube: 马里兰大学等提出高分辨率太阳辐照预测基准数据集, 包含卫星和现场观测数据

TPAMI | 大型城市场景的建筑实例分割和3D重建, 基于航拍图像

TGRS | P2PFormer: 武大等提出遥感建筑轮廓提取新pipeline

遥感竞赛 | 基于无人机航片的玉米异常情况识别, CCF大数据与计算智能大赛

NeurIPS24 | 如何更好地利用地理位置信息来提升模型效果？

NeurIPS24 | FUSU: 香港大学等单位提出多源多时相土地利用变化分割数据集

Python包 | Leafmap: 交互式地理空间分析, 为非GEE用户设计! 含500多个高级地理空间分析工具

论文er们，深度学习+遥感这口饭得趁热吃！

实用工具｜GeoSegment,SAM用于遥感图像分割,网页端操作,下载便捷

RSE | 刚果盆地道路发展监测, 基于深度学习和多源卫星影像

INFUS | STFDiff: 基于扩散模型的遥感图像时空融合

资讯 | 硬刚！被On hold后，eLife期刊正面回应

NeurIPS24 | ETH等提出高分辨率树冠数据集, 实例级标注, 超28万个体树和5.6万树群, 全球+多样化

会议通知 | AI和数字孪生改变城市生活, 英国格拉斯哥大学举办, 可线上免费参加

超强3D人体姿态估计SOTA! 即插即用于各种基于Transformer 3D姿势估计器

遥感数据 | 时间序列农作物分类基准数据集, 跨不同国家和气候区

PNAS | 检测2000多种植物分布! 使用遥感和深度学习监测和预测植物物种分布和快速变化, 结合公民科学数据

NeurIPS24 | 无需复杂地图! 基于城市白模的无人机视觉定位新方法

IJDE | 综述 | 全面回顾多源遥感影像变化检测, 发展历史, 数据, 方法, 未来展望

实用工具｜适用遥感图像的AI自动标注工具,T-Rex Label, 开箱即用, 检测一切!

论文 | HazyDet: 雾天无人机目标检测开源数据基准, 以及深度感知检测器DeCoDet

TPAMI | Changen2, 用于生成多时相遥感图像及变化检测数据的基础模型

深度｜AI教父Hinton与AI教母李飞飞首次公开对谈：我们必须通过，让懂得数据的人和懂得如何使技术有效的人建立联系来搭建这座桥

RSE | 降低对灾后图像的依赖! 遥感建筑损毁评估模型, 受灾前后样本无需相同位置

TPAMI聚焦, SegNet 高效而精准的图像语义分割网络

完整PPT | 谷歌提出用于遥感大模型的Embedding Fields 模型

会议通知 | 第二届大湾区测绘遥感大会（二号通知）

NeurIPS24 | 多无人机协作精确预测车辆等目标移动轨迹, Drones Help Drones

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉