论文赏读 | ISPRS | 农作物分类制图, 使用PlanetScope 影像和SAM模型, 并结合谷歌街景视图数据

文摘科技 2024-09-05 23:33 荷兰

RS DL

论文介绍

题目：CropSight: Towards a large-scale operational framework for object-based crop type ground truth retrieval using street view and PlanetScope satellite imagery

期刊：ISPRS Journal of Photogrammetry and Remote Sensing

论文：https://www.sciencedirect.com/science/article/pii/S0924271624002922

数据/代码：https://github.com/rssiuiuc/CropSight/

年份：2024

作者单位：美国伊利诺大学厄巴纳—香槟分校

创新点

CropSight：研究提出了CropSight框架，结合Google街景视图(GSV)和高分辨率PlanetScope卫星影像，用于大规模的基于对象的作物类型地面实况检索。这是一种从传统的像素级方法转变为更准确的基于对象的作物分类方法。
UncertainFusionNet模型：作者提出了一个名为UncertainFusionNet的贝叶斯卷积神经网络，通过整合不确定性量化进行作物类型分类。这使得系统能够过滤掉低置信度的预测，提升整体分类的可靠性。
Segmentation Anything Model (SAM)：该研究优化了SAM，用于使用卫星影像进行农田边界的划定，与现有的模型（如Mask-RCNN）相比，提供了更精确的农田边界检测。
影像收集方法：框架包括一个系统化的街景视图农业图像收集方法，通过过滤非农业景观并确保相关高质量作物图像的使用。

数据

街景视图和卫星影像：GSV影像用于捕捉详细的路旁农田景观，而PlanetScope卫星影像凭借其3米的空间分辨率和高频率的重访用于农田边界检测。
研究区域：框架在美国四个农业多样化的地区进行测试，覆盖了伊利诺伊州、南部中西部、得克萨斯州和加利福尼亚州，这些地区主要种植玉米、大豆、棉花、杏仁等作物。
地面实况数据：作者构建了一个地面实况数据集（CropGSV），其中包含带地理标签的田间视图图像，并用于作物类型分类。每个研究区域的数据集中包含超过10,000幅田间视图图像。

方法

整体结构

CropSight框架由三个核心部分组成：

大规模田间视图影像收集方法：从Google街景视图(GSV)中系统性地收集作物田间视图影像。
UncertainFusionNet模型：一种结合了不确定性量化的深度学习模型，用于从收集到的田间视图影像中提取高质量的作物类型标签。
SAM模型：通过调整Segmentation Anything Model (SAM)从PlanetScope卫星图像中自动提取每个田间视图影像对应的农田边界。

田间视图影像的收集方法

该部分详细描述了如何通过大规模的操作性方法来收集和筛选街景视图中的田间影像，以确保高效、准确地收集农田相关图像。

GSV影像采集：首先，在目标区域内收集所有可用的GSV全景图像，这些图像通过其元数据（包括经纬度、方向等）映射到具体的地理点。
影像过滤：为了确保收集到的影像主要聚焦在农田，作者设计了多个过滤步骤：

非农业用地过滤：基于全球土地覆盖数据（WorldCover），筛选出与农业用地相关的GSV点，剔除非农用地的图像。
主要道路过滤和路口过滤：排除主要道路和路口处的图像，保证采集的是与农田最近的影像。
非种植季过滤：根据美国农业部(USDA)的作物进展报告（CPRs），过滤掉非种植季节的图像，避免采集到无作物的影像。

视图转换：从全景图像中提取左右两个路旁视图图像，并推测其对应的农田坐标，以便后续的边界划定。
图像分类与增强：使用VGG16模型对这些路旁视图进行进一步筛选，剔除住宅、商业等非农业场景。随后，通过基于边缘检测的缩放方法对影像进行裁剪，专注于作物的关键部分，增强作物特征的可识别性。

UncertainFusionNet模型

UncertainFusionNet模型设计用于从GSV影像中提取作物类型标签，并通过不确定性量化提高预测的可靠性。

特征融合模块：模型由两个主要分支组成：

ResNet-50分支：该分支是一种卷积神经网络，能够有效提取图像的局部特征。通过跳跃连接解决深层神经网络中的梯度消失问题，逐层抽象出复杂的作物特征。
ViT-B16分支：Vision Transformer (ViT)将输入图像分割成小块，使用自注意力机制逐块分析图像，从而提取全局特征。它能够捕获田间视图中的大范围空间关系和上下文信息。
特征融合：通过将这两种不同的特征学习模型的输出进行融合，该模型能够同时处理作物图像的局部和全局特征，从而进行更准确的作物分类。

贝叶斯分类模块：该模块通过MC Dropout方法进行贝叶斯推理，生成概率分布，并通过多次前向传递计算出作物类型的预测不确定性。

不确定性量化：使用熵（entropy）和方差（variance）来衡量模型预测的置信度。通过为每张影像设置不确定性阈值，剔除高不确定性的预测结果。

模型训练与优化：UncertainFusionNet在CropGSV数据集上进行训练，并使用交叉熵损失函数结合不确定性信息来优化模型参数，从而减少错误分类和正确分类之间的重叠，提高分类准确性。

基于SAM模型的农田边界划定

为了从卫星影像中提取农田边界，CropSight框架使用了Segmentation Anything Model (SAM)并对其进行了优化。

SAM模型结构：

图像编码器：基于ViT的架构，用于从PlanetScope卫星图像中提取视觉特征并生成图像嵌入。
提示编码器：用于处理地理标签等提示信息，并将其嵌入向量中，指导边界划分。
蒙版解码器：使用图像嵌入和提示嵌入生成分割结果（即农田边界），并输出IoU置信度分数，评估边界划定的准确性。

SAM优化：为了适应卫星影像中的农田边界划定，研究者使用手工标注的数据集(CropBoundary)对SAM的蒙版解码器进行了微调，冻结了图像编码器和提示编码器部分。优化后的模型能够更精确地划分农田边界。
损失函数：结合Dice损失和置信度损失进行训练，以提高边界划定的精确性。

结果和精度

作物类型识别对比

农田边界分割对比

和CDL的对比

CDL是由美国农业部（USDA）国家农业统计局（NASS）开发的一个大规模作物类型分类产品

CropSight框架生成的作物类型地图

更多分析可见原文

欢迎关注CVPR 2024系列

点此进入CVPR2024遥感方向合集

因配置了AI回复功能，除关键词自动回复外，号内信息主要由AI大模型回复。如需资源、投稿、合作等，请直接联系小助手微信（添加请备注：咨询、投稿、合作、加群，加群需备注姓名/昵称，单位和研究方向）。

关于AI回复功能：

公众号新增AI回复功能，已接入大模型，集成查找ArXiv论文、CSDN博文等功能

问题及讨论可直接在文章下方留言

论文赏读 | ECCV24 | MutDet: 基于DETR的预训练框架改进遥感目标检测

深度学习全进阶！95博后新型思路曝光！频登顶刊解决遥感领域多年难题！

实践 | OpenAI发布o1, 编程等能力大幅提升! 遥感AI问题实测对比GPT4o

数据论文 | SARDet-100K: 首个 COCO 级别的大型 SAR 目标检测数据集

综述论文 | RSE | 深度学习用于城市土地利用分类综述, 以及实验评估

CVPR'25遥感视觉或将大杀四方！

遥感工具 | PaddleRS, 百度飞桨的官方遥感深度学习开发工具, 从数据到部署的全流程遥感应用

书籍推荐 | 骆剑承研究员: 遥感智能计算与地理精准应用的思考与探索

资讯 | NASA 新出功能: 在Landsat 上找到你的名字! Your Name in Landsat！

数据论文 | ISPRS | 688个城市1000万张街景综合数据集, 可直接下载

数据整理 | 全球大规模建筑底座数据集汇总

资讯 | 武汉一号卫星数据正式发布！

论文赏读 | TGRS | SSUMamba 用于高光谱遥感图像去噪, 代码已开源

书籍推荐 | 深度学习原理及遥感地学分析

论文赏读 | ISPRS | 农作物分类制图, 使用PlanetScope 影像和SAM模型, 并结合谷歌街景视图数据

论文赏读 | Φsat-2星载AI算法和应用论文, 包含U-Net云检测, YOLOv3-tiny船只检测等

资讯 | CogniSAT-6 AI卫星增强地物探测能力, Live Earth Intelligence 重大进步

欢迎加入AI遥感竞赛交流群！

遥感目标检测新王者！YOLO-World提升速度20倍！

会议通知 | 首届智慧遥感制图国际研讨会 (第二轮通知)，香港大学等单位主办

论文赏读 | TGRS | 全色和多光谱图像融合新方法! 基于像素级集成掩码自编码器

欢迎加入AI遥感竞赛交流群！

重磅！2024年最新国家自然科学基金申报与标书撰写培训

论文赏读 | ECCV24Oral | 点投影到轴, 用于有向框目标检测的点轴表示方法

论文赏读 | KAN 和 U-Net结合用于遥感农田分割, KAN You See It?

声明 | 关于公众号被恶意举报的声明

遥感Workshop| 雄安土地覆盖变化检测及分类制图, 学习免费, 邀请好友送黑神话悟空游戏一份！

三大顶会, 大模型搭建和优化工作！超全总结！（送书）

资讯 | 9月16日起, GEE将限制没有云项目的帐户的配额; 11月13日起, 所有GEE访问都需要云项目

数据论文 | AAAI24 | SkyScript: 斯坦福团队提出的大型遥感视觉-语言数据集, 关注语义多样性

论文赏读 | ISPRS | 基于天问一号影像的火星横向风成脊有向框目标检测

论文赏读 | TGRS | 高分辨率遥感影像去云，基于扩散模型和参考视觉先验

论文赏读 | TGRS | 无人机图像单目深度估计, 结合动态语义感知的精度提升方法

论文赏读 | TPAMI | 解决遥感有向目标检测中的边界不连续问题

综述+数据 | ISPRS | 卫星视频单目标跟踪: 综述及首个定向目标跟踪基准！

会议通知 | 大佬云集! 中国地理学会地理模型与地理信息分析专业委员会2024年学术年会, 可现场注册

欢迎加入遥感与深度学习交流群！

顶会涌现一批多模态大模型+遥感深度学习工作，极具创新！

论文赏读 | PyramidMamba: 即插即用的解码器用于遥感图像语义分割, UNetFormer作者新作

遥感竞赛 | 近期竞赛总结, 含道路提取, 变化检测, 高光谱影像分类, 目标检测追踪, 图像去云等

论文赏读 | ECCV24 | 使用全景-BEV联合检索网络进行跨视角图像地理定位

论文赏读 | TGRS | SAM辅助遥感影像语义分割，使用目标和边界约束

CVPR一作整理的计算机视觉学习路线

资讯 | 2024软科世界大学学术排名发布, 是由哪些指标评出的？附QS/USNews对比

论文赏读 | TIP | TTST: 用于遥感超分辨率重建的可动态选择token的Transformer网络

当遥感技术遇上扩散模型（Diffusion Model），强强联合！

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉