INFUS | STFDiff: 基于扩散模型的遥感图像时空融合

文摘 2024-10-26 00:12 荷兰

RS DL

论文介绍

题目：https://www.sciencedirect.com/science/article/pii/S1566253524002835

期刊：Information Fusion, IF=14.7

论文：https://www.sciencedirect.com/science/article/pii/S1566253524002835

代码：https://github.com/prowDIY/STF

年份：2024

单位：武汉大学，中国地质大学(武汉)

创新点

基于扩散模型：STFDiff 采用了扩散模型进行时空融合，克服了传统深度学习模型（如 GANs）的模式崩溃问题，并增强了稳定性。扩散模型通过迭代去噪的过程，能够捕捉图像的复杂时空关系。
双流Unet (DS-Unet)：提出了一种新的双流Unet作为噪声预测器，利用双流编码器分别提取噪声图像和先验图像的特征，通过差异来增强噪声特征的表示，从而提高去噪精度。
自适应训练：该方法在训练和迁移阶段，分别优化模型参数，以应对不同区域的时空动态变化，提高了模型的适应性。

数据

CIA（Coleambally Irrigation Area）：包含17对Landsat-MODIS影像，时间跨度为2001到2002年。覆盖面积为2193平方公里，影像大小为2040×1720像素。在移除无效像素后，裁剪后的图像大小为1792×1280像素。
LGC（Lower Gwydir Catchment）：包含14对Landsat-MODIS影像，时间跨度为2004到2005年，涵盖了洪水带来的显著地表变化。影像的空间分辨率为2720×3200像素。移除无效像素后的裁剪图像大小为2560×3072像素。
E-SMILE：全球数据集，包含来自多时相的Landsat和MODIS影像，用于评估STF方法的泛化性能。包含6177个影像块，每个影像块的大小为512×512像素。其中，训练集包含5089个块，验证集有638个块，测试集有450个块。

方法0

总体结构

1. 问题定义

STFDiff的目标是融合不同时间和空间分辨率的遥感影像，生成具有高空间分辨率和高时间频率的融合图像。具体来说，它在已知粗分辨率影像（代表时间动态信息）和细分辨率影像（代表空间细节信息）的情况下，预测目标时间点的高分辨率图像。

2. 扩散模型的引入

扩散模型分为两个阶段：扩散过程和去噪过程。

扩散过程：通过在预测时间点的细分辨率影像中加入高斯噪声，生成逐渐退化的影像，直到完全变成高斯噪声。
去噪过程：从完全高斯噪声开始，通过多个迭代步骤去除噪声，最终生成目标时间点的高分辨率图像。噪声的预测通过一个特殊的神经网络——双流Unet（DS-Unet）进行。

3. 双流Unet (DS-Unet)

DS-Unet 是 STFDiff 的核心组件，用于在去噪过程中准确预测和去除噪声。

双流编码器 (DS-Encoders)：包含两个编码器流，分别对噪声影像和先验影像进行特征提取。噪声流用于提取含有噪声的影像特征，而干净流提取来自先验影像的空间细节特征。

特征差异增强：通过对噪声流和干净流特征的差异进行计算，增强噪声特征的表示，从而更准确地预测和去除噪声。
解码器：将增强的噪声特征通过解码器转换，恢复生成最终的细分辨率图像。

4. 训练过程

STFDiff的训练过程包括以下步骤：

生成噪声图像：在已知的细分辨率图像中逐渐加入噪声，生成不同噪声水平的影像。
优化噪声预测器：通过DS-Unet在不同噪声水平下的噪声预测结果，优化其参数。目标是最小化预测噪声和实际加入噪声之间的误差。
条件训练：DS-Unet结合先验影像的条件信息，提高对目标影像细节和时间动态的预测能力。

5. 去噪过程

去噪过程通过多次迭代：

从完全随机的高斯噪声开始，通过DS-Unet的噪声预测逐步消除噪声。
每次迭代都会使用先验影像中的信息作为条件，逐步恢复空间细节和时间动态。
通过使用DDIM（Denoising Diffusion Implicit Model）采样器加速生成过程。

6. 模型微调

为了应对不同区域之间的差异，STFDiff还引入了微调策略，在新区域应用时，调整DS-Unet的干净流参数，以适应不同区域的时间动态变化。这种方法只微调部分参数，保持模型的空间特征一致性，减少了训练时间。

结果与精度

STFDiff有效融合了粗分辨率和细分辨率的影像，在复杂场景中生成高质量的融合影像，显著提升了空间和时间动态的精确度。

精度对比

可视对比

迁移能力

更多图表分析可见原文

欢迎关注会议论文赏读系列

因配置了AI回复功能，除关键词自动回复外，号内信息主要由AI大模型回复。如需资源、投稿、合作等，请直接联系小助手微信（添加请备注：咨询、投稿、合作、加群，加群需备注姓名/昵称，单位和研究方向）。

公众号欢迎优秀作者投稿！可加入优秀论文作者群：欢迎加入AI遥感优秀论文作者群！

问题及讨论可直接在文章下方留言

最新文章

INFUS | STFDiff: 基于扩散模型的遥感图像时空融合

资讯 | 硬刚！被On hold后，eLife期刊正面回应

NeurIPS24 | ETH等提出高分辨率树冠数据集, 实例级标注, 超28万个体树和5.6万树群, 全球+多样化

会议通知 | AI和数字孪生改变城市生活, 英国格拉斯哥大学举办, 可线上免费参加

超强3D人体姿态估计SOTA! 即插即用于各种基于Transformer 3D姿势估计器

遥感数据 | 时间序列农作物分类基准数据集, 跨不同国家和气候区

PNAS | 检测2000多种植物分布! 使用遥感和深度学习监测和预测植物物种分布和快速变化, 结合公民科学数据

NeurIPS24 | 无需复杂地图! 基于城市白模的无人机视觉定位新方法

IJDE | 综述 | 全面回顾多源遥感影像变化检测, 发展历史, 数据, 方法, 未来展望

实用工具｜适用遥感图像的AI自动标注工具,T-Rex Label, 开箱即用, 检测一切!

论文 | HazyDet: 雾天无人机目标检测开源数据基准, 以及深度感知检测器DeCoDet

TPAMI | Changen2, 用于生成多时相遥感图像及变化检测数据的基础模型

深度｜AI教父Hinton与AI教母李飞飞首次公开对谈：我们必须通过，让懂得数据的人和懂得如何使技术有效的人建立联系来搭建这座桥

RSE | 降低对灾后图像的依赖! 遥感建筑损毁评估模型, 受灾前后样本无需相同位置

TPAMI聚焦, SegNet 高效而精准的图像语义分割网络

完整PPT | 谷歌提出用于遥感大模型的Embedding Fields 模型

会议通知 | 第二届大湾区测绘遥感大会（二号通知）

NeurIPS24 | 多无人机协作精确预测车辆等目标移动轨迹, Drones Help Drones

2024遥感顶刊热门idea，多模态遥感影像融合

Python包 | samgeo: 使用SAM分割遥感影像等地理空间数据, 交互处理功能丰富

NeurIPS24 | 清华哈工大等提出轻量级卫星图像压缩新方法: COSMIC

Nature 子刊 | 使用元学习应对跨分辨率的多样化地球观测问题

NeurIPS24 | 大型卫星影像去云数据集, 超400万张图像

TGRS | Easy-Net: 轻量级建筑提取网络, 基于建筑本身特征, 结合CNN和Transformer

NeurIPS24 | 武大季顺平团队提出多模态大模型OMG-LLaVA, 桥接图像级、对象级、像素级理解和推理

在线地图实现SOTA性能，Wayve太强了！

论文 | Hinton等人的 t-SNE 数据可视化方法, 已广泛应用于遥感和深度学习研究

资讯 | 2025年度泰晤士高等教育世界大学排名发布

资讯 | scikit-eo: 用于遥感数据分析的Python包, 含深度学习, 大气校正, 图像融合等功能

资讯+实测 | OpenAI 推出Canvas 界面, 革新写作和编程体验! 实测U-Net和遥感代码

RSE | 结合Transformer和GEE实现Landsat全球陆地气溶胶遥感反演

Web演示 | 通过文本搜索遥感影像中的目标, 基于SkyCLIP模型, 可演示应用

NeurIPS24 | 330亿m²淹没区, 用于洪水制图的多时相卫星数据集Kuro Siwo

论文 | SegEarth-OV: 面向遥感图像的无训练开放词汇分割

CVPRW24 | GeoSynth: 卫星遥感图像生成器, 支持多种控制方式, 方便下载使用

论文 | ECCV24 | 卫星影像元数据自监督学习, 在下游任务提升分类性能

会议通知 | 2024人工智能与遥感学术交叉研讨会三号通知（AIRS-2024）

论文 | NeurIPS24 | SSDiff: 扩散模型用于遥感图像全色锐化Pansharpening

论文 | NeurIPS24 | SynRS3D: 合成遥感数据集, 可用于单目语义分割和高度估计等任务

技术实践 | YOLO11 遥感数据应用全流程, 基于DIOR遥感目标检测数据集

论文赏读 | TGRS | HLMamba: 基于Mamba的高光谱和LiDAR数据联合分类

观点 | 李德仁院士: 黑神话悟空, 测绘遥感人怎么看?

又一篇遥感顶刊！这个idea简直“ 杀疯了 ” ....

论文 | RSE | 跨年度农作物制图更新框架CROPUP, 端到端, 无需现场样本

论文赏读 | TIM | 高光谱和LiDAR 数据融合, 基于进阶光照的框架PID-HLfusion

论文赏读 | TGRS | HI²D²FNet: 高光谱图像与LiDAR数据的融合和分类网络, 基于高光谱本征图像分解引导的模型

论文赏读 | TGRS | 基于阴影掩码驱动的多模态本征图像分解用于高光谱和LiDAR数据融合

审稿人视角下的SCI及核心期刊论文撰写与发表

论文赏读 | ECCV24 | DQ-DETR: 遥感微小目标检测网络

书籍推荐 | 武大李彦胜教授：高分辨率遥感影像场景智能理解

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉