TPAMI | Changen2, 用于生成多时相遥感图像及变化检测数据的基础模型

文摘 2024-10-18 08:02 荷兰

RS DL

论文介绍

题目：Changen2: Multi-Temporal Remote Sensing Generative Change Foundation Model

期刊：IEEE Transactions on Pattern Analysis and Machine Intelligence

论文：https://ieeexplore.ieee.org/document/10713915

代码：https://github.com/Z-Zheng/pytorch-change-models

数据：

https://huggingface.co/datasets/EVER-Z/Changen2-S1-15k
https://huggingface.co/datasets/EVER-Z/Changen2-S9-27k

年份：2024

作者单位：斯坦福大学、河南省科学院、武汉大学

注：本篇经由论文原作者审阅

创新点

生成式变化基础模型：提出了一个名为Changen2的生成式变化基础模型，采用生成概率变化模型(GPCM)框架，能够生成多时相遥感图像和相应的语义和变化标签。与现有的“基础模型”不同，Changen2通过生成变化数据来训练特定任务的基础模型，特别是在变化检测方面具有内在的零样本检测能力和强大的迁移能力。
可扩展的分辨率：Changen2采用分辨率可扩展的扩散Transformer架构，可以在不同的空间和时间尺度上生成高分辨率图像。这一特性使模型在跨尺度数据生成时表现出更好的稳定性和精度。
自监督学习与无监督数据生成：Changen2通过使用自监督学习，能够从未标记的单时相图像中学习。这减少了对大量手动标注数据的需求，并能够利用大规模的地球观测数据。
多样化的变化事件模拟：模型能模拟多种类型的变化事件，如对象的创建、移除以及属性编辑，并能根据需求生成多时相的变化数据。这大大增强了模型的灵活性和通用性。

背景

旨在解决遥感变化检测任务中的两个关键问题：

数据获取与标注的困难：多时相遥感图像的收集、预处理和标注成本高昂，特别是在大规模数据集下。传统方法依赖于手动标注的变化检测数据集，耗时且知识密集。Changen2通过生成合成变化数据，减少了对大规模标注数据的依赖，从而降低了构建变化检测模型所需的成本。
提高模型的泛化能力和零样本检测能力：遥感变化检测模型通常需要在特定任务上进行监督学习，而这种方法的泛化能力有限。Changen2通过生成多样化的合成数据，训练具有零样本变化检测能力的基础模型，使其能够在未见过的数据集和任务上实现良好的性能。这对于应对真实世界中的复杂变化场景（如建筑物变化、土地覆盖变化和灾害评估）尤其重要。

数据

xView2 数据集

用途：用于生成建筑物变化检测的合成数据集（Changen2-S1-15k）。
数据特点：全球分布的卫星图像，包含建筑物的预灾建筑物轮廓标注。该数据集主要用于训练建筑物变化检测模型。

OpenEarthMap 数据集

用途：用于生成语义变化检测数据集（Changen2-S9-27k）。
数据特点：全球分布的卫星图像，包含土地覆盖类型的标注。Changen2通过该数据集生成多达38种变化类型的数据，用于训练和评估土地覆盖变化检测任务。

fMoW（Functional Map of the World）数据集

用途：用于生成无类别限制的变化检测数据集（Changen2-S0-1.2M）。
数据特点：大规模卫星图像数据集，未标注具体变化类型。Changen2通过自监督学习从这些未标注的数据中生成变化事件并进行训练，形成无类别限制的变化检测数据。

Changen2 生成的数据集

Changen2-S1-15k：包含1.5万对图像的建筑物变化检测数据集，具有两类变化类型。
Changen2-S9-27k：包含2.7万对图像的语义变化检测数据集，最多包含38种变化类型。
Changen2-S0-1.2M：无类别限制的变化检测数据集，包含多达120万对图像。

方法

文章提出了一种新型的生成式变化基础模型——Changen2，主要通过生成概率变化模型（GPCM）框架来生成多时相遥感图像及其相应的语义和变化标签。

1. 生成概率变化模型 (GPCM)

GPCM 将复杂的时序变化过程分解为两个更可控的子问题：

变化事件模拟：描述变化事件在语义层面的发生过程，例如对象的创建、移除或属性编辑。
语义变化生成：在图像层面生成与变化事件对应的图像。

2. 变化事件模拟

变化事件是模拟真实世界中对象的变化过程，包括以下三种情况：

对象创建：在语义掩码中创建新的对象，模拟新建筑物或其他地物的出现。
对象移除：从语义掩码中移除已有对象，模拟建筑物或其他地物的消失。
属性编辑：修改对象的属性而不改变其位置，例如将某块区域从裸地变为水体。

为了实现这种变化模拟，文章设计了一种语义过渡矩阵，通过为每类对象定义过渡概率来生成变化事件。

3. 语义变化生成

语义变化生成的任务是根据变化事件生成后续时相的图像。Changen2基于扩散模型（Diffusion Models）来完成此任务。扩散模型的主要特点是：

它可以逐步生成新的图像，从初始图像的语义信息出发，逐步应用变化事件，生成后续时相的图像。
扩散过程通过噪声逐步减少，最终生成清晰的图像。

4. 分辨率可扩展的扩散Transformer（RS-DiT）

Changen2 引入了一个分辨率可扩展的扩散Transformer，能够从低分辨率图像生成高分辨率图像，解决了传统Transformer架构在生成高分辨率图像时的计算复杂性问题。主要改进包括：

移除绝对位置嵌入：绝对位置嵌入限制了输入图像的分辨率，通过移除它，模型能够适应不同分辨率的图像。
局部窗口注意力机制：替代全局自注意力机制，大大降低了计算成本，使得模型在生成高分辨率图像时更加高效。

5. 自监督学习

为了充分利用未标记的数据，Changen2设计了自监督学习方法。该方法通过从未标记的单时相图像中提取对象轮廓，并模拟变化事件生成后续时相的图像。其步骤如下：

提取对象轮廓：利用现有的分割模型（如SAM）从未标记图像中提取对象轮廓，并将其作为条件输入。
模拟变化事件：通过移除部分对象，生成变化后的对象轮廓，进而生成后续时相的图像。
自监督训练：利用生成的前后时相图像对模型进行训练，避免了手动标注的依赖。

6. 时空可扩展性

Changen2具备良好的时空可扩展性，能够生成从低分辨率到高分辨率、从短时序到长时序的图像。它不仅可以生成建筑物变化数据，还可以生成土地覆盖变化等多种变化类型的数据。

7. 引导比率 (Guidance Ratio)

在生成多时相图像时，Changen2还可以调整“引导比率”（λ），用于控制生成图像的时间一致性与多样性：

较大的λ值：生成与前时相图像更加一致的图像，适用于模拟高保真度的场景。
较小的λ值：生成更加多样的后时相图像，适用于需要更丰富的正负样本的场景，如用于训练模型时。

结果和精度

精度对比

可视化

更多结果讨论图表可查看原文

欢迎关注会议论文赏读系列

因配置了AI回复功能，除关键词自动回复外，号内信息主要由AI大模型回复。如需资源、投稿、合作等，请直接联系小助手微信（添加请备注：咨询、投稿、合作、加群，加群需备注姓名/昵称，单位和研究方向）。

公众号欢迎优秀作者投稿！可加入优秀论文作者群：欢迎加入AI遥感优秀论文作者群！

问题及讨论可直接在文章下方留言

ACM MM24 | UrbanCross: 通过跨域适配增强卫星图像-文本检索, 香港科技大学广州分校等团队提出

TGRS | 无需切成小块图像! 金字塔超像素transformer用于高光谱图像分类

NeurIPS24 | M3LEO: 剑桥大学等提出集成干涉SAR和多光谱影像的多模态多标签数据集

TGRS | UBCV2:全球建筑检测和细粒度分类数据集, 光学和SAR影像精准对齐

TIP | 武大团队提出跨模态异常检测模型UniADRS, 用于遥感图像

技术实践 | 如何在YOLO11中训练tif格式4波段遥感图像？

TGRS | U²ConvFormer: 复旦团队提出高光谱图像分类模型, 结合U-Net和Transformer

ISPRS | SoftFormer: 多层次融合处理多模态遥感数据, 土地利用和土地覆盖分类

资讯 | 2024软科世界一流学科排名! 遥感、计算机专业排名

NeurIPS24 | AnyChange, 遥感零样本变化检测！

GSIS综述论文 | 中国遥感卫星, 原来有了这么多应用！对标哨兵和Landsat, 我们有哪些发展？

吉林一号高分辨率遥感数据免费下载！限时24小时！

NeurIPS24 | GeoPlant: 大型植物物种预测数据集, 含长时间序列卫星数据及土壤气候数据, 托管于Kaggle

会议手册 | 2024全国博士生测绘遥感学科学术论坛通知, 于中山大学举办

顶会新方向！全新多模态大模型统一分割框架

看Nature | 全球研究生在学术压力下的心理健康问题: ‘发表或淘汰’文化如何影响新一代学者？

TGRS | 哈工大提出同时处理遥感分类/分割/目标检测的多任务学习框架RSCoTr, 基于Transformer

NeurIPS24 | MMM-RS: 多模态, 多分辨率,多场景的遥感数据集和基准, 可用于跨模态数据生成

NeurIPS24 | OpenSatMap: 细粒度高分辨率卫星数据集, 中科院和腾讯等提出的用于大规模制图的数据集

遥感数据 | FTW全球农田边界数据, 含对应影像数据! 约160万田块边界及7万多个样本

太强了！如何用ChatGPT结合Python处理遥感数据

NeurIPS24 | SolarCube: 马里兰大学等提出高分辨率太阳辐照预测基准数据集, 包含卫星和现场观测数据

TPAMI | 大型城市场景的建筑实例分割和3D重建, 基于航拍图像

TGRS | P2PFormer: 武大等提出遥感建筑轮廓提取新pipeline

遥感竞赛 | 基于无人机航片的玉米异常情况识别, CCF大数据与计算智能大赛

NeurIPS24 | 如何更好地利用地理位置信息来提升模型效果？

NeurIPS24 | FUSU: 香港大学等单位提出多源多时相土地利用变化分割数据集

Python包 | Leafmap: 交互式地理空间分析, 为非GEE用户设计! 含500多个高级地理空间分析工具

论文er们，深度学习+遥感这口饭得趁热吃！

实用工具｜GeoSegment,SAM用于遥感图像分割,网页端操作,下载便捷

RSE | 刚果盆地道路发展监测, 基于深度学习和多源卫星影像

INFUS | STFDiff: 基于扩散模型的遥感图像时空融合

资讯 | 硬刚！被On hold后，eLife期刊正面回应

NeurIPS24 | ETH等提出高分辨率树冠数据集, 实例级标注, 超28万个体树和5.6万树群, 全球+多样化

会议通知 | AI和数字孪生改变城市生活, 英国格拉斯哥大学举办, 可线上免费参加

超强3D人体姿态估计SOTA! 即插即用于各种基于Transformer 3D姿势估计器

遥感数据 | 时间序列农作物分类基准数据集, 跨不同国家和气候区

PNAS | 检测2000多种植物分布! 使用遥感和深度学习监测和预测植物物种分布和快速变化, 结合公民科学数据

NeurIPS24 | 无需复杂地图! 基于城市白模的无人机视觉定位新方法

IJDE | 综述 | 全面回顾多源遥感影像变化检测, 发展历史, 数据, 方法, 未来展望

实用工具｜适用遥感图像的AI自动标注工具,T-Rex Label, 开箱即用, 检测一切!

论文 | HazyDet: 雾天无人机目标检测开源数据基准, 以及深度感知检测器DeCoDet

TPAMI | Changen2, 用于生成多时相遥感图像及变化检测数据的基础模型

深度｜AI教父Hinton与AI教母李飞飞首次公开对谈：我们必须通过，让懂得数据的人和懂得如何使技术有效的人建立联系来搭建这座桥

RSE | 降低对灾后图像的依赖! 遥感建筑损毁评估模型, 受灾前后样本无需相同位置

TPAMI聚焦, SegNet 高效而精准的图像语义分割网络

完整PPT | 谷歌提出用于遥感大模型的Embedding Fields 模型

会议通知 | 第二届大湾区测绘遥感大会（二号通知）

NeurIPS24 | 多无人机协作精确预测车辆等目标移动轨迹, Drones Help Drones

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉