遥感论文 | 多模态时空遥感基础模型应用于农作物制图

文摘 2024-12-09 23:06 美国

论文题目：Towards a Knowledge guided Multimodal Foundation Model for Spatio-Temporal Remote Sensing Applications
论文链接：https://arxiv.org/pdf/2407.19660
发表时间：2024.7.29

摘要

本文提出了一个遥感地球科学应用的基础建模框架，

该框架利用了知识引导原则，即光谱图像捕获了物理驱动因素对环境系统的影响，以及它们之间的关系由系统的特征所决定。
方法称为多模态可变步长预测（MM-VSF），使用多模态数据（光谱图像和天气）作为输入，并使用可变步长预测任务作为其预训练目标。

在评估中展示了使用天气进行卫星图像预测可以作为基础模型的有效预训练任务。

方法

两部分：

架构遵循重量级编码器和轻量级解码器的格式。
将多种模态纳入我们的预训练中，即光谱图像和天气。

Pretraining Task

使用当前的卫星图像，并提供直到特定日子的天气数据，将要求模型预测那个时间点的卫星图像。
期待额外的地理知识注入将在依赖土地生长和变化动态的下游任务中大有帮助，例如作物预测、土地覆盖和土地利用变化

Dataset

数据库由Sentinel影像构成光谱图像部分，以及ERA5陆地分析数据构成气象部分:

光谱图像序列：一系列Sentinel2图像，每个图像有6个波段，形状为128x128。这个序列的长度取决于地点的覆盖范围。
气象数据序列：一系列ERA5陆地数据，有5个波段，形状为1x1，序列长度为365（每天一个）。
年天数序列：序列中每个光谱图像的年天数。这个序列的长度与光谱图像序列相同

Architecture

模型结构：

空间特征提取：使用视觉变换器（ViT）从光谱图像中提取空间特征，处理一系列图像，形成时间序列的空间嵌入。
时间特征提取：由于气象数据分辨率较低，使用时间嵌入方法（如双向LSTM）来处理，实现时间序列的匹配。
时间信息嵌入：将一年中的天数信息通过共享的线性层和tanh激活函数嵌入，为模型提供时间上下文。
多模态嵌入：结合空间嵌入、时间匹配的气象嵌入和一年中的天数嵌入，形成多模态嵌入序列
时间序列分析：使用BERT风格的前向注意力变换器对嵌入序列进行时间序列分析，学习时间关系。
预测解码：利用编码器生成的嵌入序列进行未来图像的预测，使用线性层和激活函数将嵌入从当前时间戳空间转换到未来时间戳空间。

Masking

模型在空间和时间上都采用均匀的掩蔽方法。这种方法与以往的随机掩蔽不同，它确保了：

时空均匀性：每个时间戳的掩蔽补丁数量相同，保证了在时间轴上每个空间位置的掩蔽补丁数量一致。
公平性：确保了所有时间序列的补丁系列长度相同，有助于实现时间组件的一致性。
共享变换器输出一致性：每个时间戳有相同数量的没有被mask的token，确保了共享视觉变换器在每个时间戳上产生相同数量的输出。

图3中的示例展示了这种掩蔽策略，其中4x4网格图像系列的50%掩蔽率下，每个时间戳图像有8个补丁被掩蔽，而特定空间位置沿时间维度有2个补丁可用。

Implementation details

在预训练阶段：

选择输入系列长度为6的图像，并在最终图像之后随机选择一张图像作为预测的最终图像。
使用了50%的时空掩蔽以及8的补丁大小用于视觉变换器。
模型在4个A100 Nvidia GPU上使用Adam优化器和均方误差损失训练至收敛。

实验

Pretraining Task: Forecasting

图4展示了SM-VSF （Single Modality Variable step Forecasting）和MM-VSF（MultiModal Masked Variable step Forecasting），在3个独立示例上的图像比较。每一行对应一个样本，前6张图像对应模型输入系列的卫星部分，气象部分没有在图像中显示，但是与卫星部分一起传递。

Downstream Task: Crop Mapping

将本文方法微调至Crop mapping 。

结论

本文提出了一个新颖的多模态时空基础模型MM-VSF，模型使用卫星和气象数据的多模态输入，以及知识引导的可变步长预测预训练任务。

MM-VSF可以被微调为一个作物映射模型，该模型能够跨年份泛化。
模型在时间上具有灵活性，并且能够适应包括时空遥感数据的地球科学下游任务。
本研究是将知识引导原则纳入预训练任务并采用多模态方法改进嵌入的第一步。

GEE遥感训练营

分享GEE遥感领域实用教程、最新科研成果及资讯，交流、合作等事宜请加V：GeeStudy_2020

最新文章

GEE前沿教程|geemap多线程、网格化数据集极速下载

GEE+ChatGPT实战特训教学

GEE前沿教程|geemap利用Sentinel-2对全球进行实时监测

开源卫星展示杜鲁门号航母近10天航行轨迹

GEE前沿教程|利用geemap进行本地数据交互、数据显示及下载

GeoAI：地理信息与人工智能的交叉融合

深度学习提升全球海洋卫星观测能力

使用卫星数据对全球降水日变化进行聚类

重磅！真心建议各位GEE遥感研究生读一下《Nature》这篇文章

GEE+本地XGboost分类

武汉大学一区TOP发表ChatGPT与GEE地理分析模型知识提取与重用框架

GEE+ChatGPT实战特训教学

未来已来！全国高校截至目前到底已经开始了多少人工智能学院？

武汉大学人工智能学院成立！

导师要我用GEE发顶刊，有啥靠谱的新方向？

HD.073 | 水文数据——全球土壤水数据[Ⅶ: ISMN]

顶刊必备！我写的工具，一键下载遥感影像可用观测

技术实践 | 如何在YOLO11中训练tif格式4波段遥感图像？

Science 子刊速递|利用GEE探索21世纪全球人类与野生动物重叠范围

GEE+ChatGPT实战特训教学

SCS顶刊|基于GEE的全球热岛效应研究

武汉大学|乐鹏教授团队成功获批“龙计划”项目

前沿资讯|龚健雅/张觅等研发28亿参数的多模态-多任务的遥感大模型（珞珈.灵感）

SAM-2全面来袭！可分割任意图像、视频，代码开源！

遥感论文 | 多模态时空遥感基础模型应用于农作物制图

SCI图片高级感|利用IPCC配色方案一键生成！！！！

GEE免费高分辨率遥感数据集（含示例代码）

遥感算法|Transformer深度学习算法填补GRACE水资源卫星空缺序列

GEE前沿教程|基于邻域像元分析进行平滑处理与降噪/异常监测

重磅发布|Hi-GLASS全球长时序高分辨率定量遥感数据集

可视化展示神经网络模型运行过程

GEE前沿教程|全球遥感影像细碎化耕地提取

论文赏读 | ISPRS | 农作物分类制图, 使用PlanetScope 影像和SAM模型, 并结合谷歌街景视图数据

SCI遥感一区TOP，发表顶刊的新方向！

数据 | 全球农田边界数据fiboa介绍, 本地及GEE使用实测, 可转为Shapefile格式

Nature：2019-2020 年澳大利亚特大火灾对生物多样性的影响

这也能发SCI？ GEE多任务输出代码在 EMS期刊发表

HA.221 [陆地碳水循环过程] 北半球高纬度地区空气和地表温度驱动陆地碳、水循环过程差异

Journal of Hydrology|GEE水温时空特征提取研究（附数据+代码）

HD.072 | 水文数据——全球土壤水数据[VI: SMOS]

GEE前沿教程|在 Google Earth Engine 中进行大规模分块处理

LM Studio本地部署大模型，大模型so easy！

北京大学在Nature Food在优化亚洲稻田灌溉模式研究中取得新进展

遥感云平台综合应用优秀案例

ISPRS前沿|1991–2023年青藏高原九千座湖泊全尺度演变的年度精细化制图

CTAmap version 1.2.0版本（更新2009年-2024年初）

Nature正刊|全球热带森林砍伐地区自然再生的潜力

GEE+ChatGPT科研必备|科研论文搞起来！！！

geemap下载LAI年度最大值合成数据

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉