首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

TGRS | PolyRoad: 北大, 达摩院团队提出道路边界检测的transformer网络

文摘 2024-11-20 09:31 荷兰

RS DL

论文介绍

题目：PolyRoad: Polyline Transformer for Topological Road-Boundary Detection

期刊：IEEE Transactions on Geoscience and Remote Sensing

论文：https://ieeexplore.ieee.org/document/10364754

年份：2024

单位：北京大学，阿里巴巴达摩院

创新点

任务转化：将道路边界检测任务从传统的图增长问题转化为多实例折线检测问题，实现了一种新的检测范式。
模型架构：基于Transformer的PolyRoad模型能够并行检测所有道路边界折线，大幅提高了推理速度。
匹配策略：开发了折线(polyline)匹配代价函数，针对open和closed 折线的顺序进行优化，解决了多折线的二分匹配问题。
多层监督损失：提出点级（顺序感知L1损失）、方向级（方向损失）和像素级（掩膜损失）的监督机制，从不同层次约束折线的几何特性。

数据

Topo-boundary 数据集

数据规模：

共 25,295 张图像（1000 × 1000 像素）。
分为训练集（20,236 张）、验证集（1,770 张）和测试集（3,289 张）。

标注格式：

提供 8 种标注类型，包括折线序列、二值图和实例图。
本文采用折线序列标注，并对每条边界均匀采样 500 个点以标准化表示。

特点：

场景复杂，涵盖直路、弯道和交叉口。
数据量大，适合深度学习模型训练和评估。

方法

任务转化

传统方法将道路边界检测建模为逐点图增长问题，而本文创新性地将其转化为多实例折线检测问题：

道路边界被表示为独立的折线（开口open或闭合closed），可以并行检测。
通过Transformer的全局感受野，更适合检测细长且分布广泛的道路边界。

模型架构

PolyRoad 模型由三个模块组成

(1) 图像特征提取器

采用ResNet-50作为骨干网络，从输入图像中提取多层次特征。
提取的特征通过位置编码加入空间位置信息，为后续折线特征提取做好准备。

(2) 折线特征提取器

使用基于Transformer的编码器-解码器架构：

编码器：通过自注意力机制整合全局上下文信息，捕捉道路边界的长距离特性。
解码器：输入随机初始化的折线查询，利用自注意力机制在查询间交互信息，并通过交叉注意力从图像特征中捕捉上下文。

最终输出折线实例的特征，供后续折线生成模块使用。

(3) 折线生成器

根据折线特征，输出所有道路边界折线的点序列。
结合多任务学习，增加三个辅助任务：

道路分类：判断每个折线是否属于道路边界。
边界框检测：预测道路边界的包围框。
关键点分类：标注折线中的关键点，有助于移除冗余点，提高效率。

折线匹配代价函数

在所有预测折线和真实折线之间进行匹配，针对 open 折线的正反顺序和 closed 折线的多起点方向进行全面考虑。
匹配结果用于指导后续的损失计算，确保模型能够有效学习到折线实例的空间和几何特性。

损失设计

点级监督：使用顺序感知的机制确保折线点的绝对位置精确，解决open和closed折线的排列问题。
方向级监督：通过相邻点的相对位置约束，优化折线的几何形状和平滑性。
像素级监督：将折线转为二值掩膜，通过像素级对齐提高边界的定位精度。

实验与分析

本文提出的PolyRoad模型在像素级和几何级指标上均表现优异，显著优于现有方法。同时，模型具备更快的推理速度，并能在复杂场景中生成平滑且连贯的道路边界预测。

精度对比

可视化对比

更多图表分析可见原文

因配置了AI回复功能，除关键词自动回复外，号内信息主要由AI大模型回复。如需资源、投稿、合作等，请直接联系小助手微信（添加请备注：咨询、投稿、合作、加群，加群需备注姓名/昵称，单位和研究方向）。

公众号欢迎优秀作者投稿！可加入优秀论文作者群：欢迎加入AI遥感优秀论文作者群！

问题及讨论可直接在文章下方留言

相关链接：

RSE | 刚果盆地道路发展监测, 基于深度学习和多源卫星影像

论文赏读 | TGRS | 遮挡感知的道路提取网络OARENet，用于高分辨率遥感影像

论文赏读 | CVPRW24 | SAM用于遥感影像中提取向量化的道路网络

NeurIPS24 | OpenSatMap: 细粒度高分辨率卫星数据集, 中科院和腾讯等提出的用于大规模制图的数据集

遥感竞赛 | 近期竞赛总结, 含道路提取, 变化检测, 高光谱影像分类, 目标检测追踪, 图像去云等

欢迎关注

分享遥感与深度学习领域的技术、论文、书籍、新鲜事。

欢迎加入遥感与深度学习交流群(点此加入)。

http://mp.weixin.qq.com/s?__biz=MzU2NTc2MjU2OQ==&mid=2247491038&idx=1&sn=86634a531fdacb2e490acf3839820d0f

遥感与深度学习

聚焦遥感与深度学习，分享相关技术、论文、书籍、资讯，团队来自国内外著名期刊作者及审稿人

最新文章

TGRS | PolyRoad: 北大, 达摩院团队提出道路边界检测的transformer网络

ACM MM24 | UrbanCross: 通过跨域适配增强卫星图像-文本检索, 香港科技大学广州分校等团队提出

TGRS | 无需切成小块图像! 金字塔超像素transformer用于高光谱图像分类

NeurIPS24 | M3LEO: 剑桥大学等提出集成干涉SAR和多光谱影像的多模态多标签数据集

TGRS | UBCV2:全球建筑检测和细粒度分类数据集, 光学和SAR影像精准对齐

TIP | 武大团队提出跨模态异常检测模型UniADRS, 用于遥感图像

技术实践 | 如何在YOLO11中训练tif格式4波段遥感图像？

TGRS | U²ConvFormer: 复旦团队提出高光谱图像分类模型, 结合U-Net和Transformer

ISPRS | SoftFormer: 多层次融合处理多模态遥感数据, 土地利用和土地覆盖分类

资讯 | 2024软科世界一流学科排名! 遥感、计算机专业排名

NeurIPS24 | AnyChange, 遥感零样本变化检测！

GSIS综述论文 | 中国遥感卫星, 原来有了这么多应用！对标哨兵和Landsat, 我们有哪些发展？

吉林一号高分辨率遥感数据免费下载！限时24小时！

NeurIPS24 | GeoPlant: 大型植物物种预测数据集, 含长时间序列卫星数据及土壤气候数据, 托管于Kaggle

会议手册 | 2024全国博士生测绘遥感学科学术论坛通知, 于中山大学举办

顶会新方向！全新多模态大模型统一分割框架

看Nature | 全球研究生在学术压力下的心理健康问题: ‘发表或淘汰’文化如何影响新一代学者？

TGRS | 哈工大提出同时处理遥感分类/分割/目标检测的多任务学习框架RSCoTr, 基于Transformer

NeurIPS24 | MMM-RS: 多模态, 多分辨率,多场景的遥感数据集和基准, 可用于跨模态数据生成

NeurIPS24 | OpenSatMap: 细粒度高分辨率卫星数据集, 中科院和腾讯等提出的用于大规模制图的数据集

遥感数据 | FTW全球农田边界数据, 含对应影像数据! 约160万田块边界及7万多个样本

太强了！如何用ChatGPT结合Python处理遥感数据

NeurIPS24 | SolarCube: 马里兰大学等提出高分辨率太阳辐照预测基准数据集, 包含卫星和现场观测数据

TPAMI | 大型城市场景的建筑实例分割和3D重建, 基于航拍图像

TGRS | P2PFormer: 武大等提出遥感建筑轮廓提取新pipeline

遥感竞赛 | 基于无人机航片的玉米异常情况识别, CCF大数据与计算智能大赛

NeurIPS24 | 如何更好地利用地理位置信息来提升模型效果？

NeurIPS24 | FUSU: 香港大学等单位提出多源多时相土地利用变化分割数据集

Python包 | Leafmap: 交互式地理空间分析, 为非GEE用户设计! 含500多个高级地理空间分析工具

论文er们，深度学习+遥感这口饭得趁热吃！

实用工具｜GeoSegment,SAM用于遥感图像分割,网页端操作,下载便捷

RSE | 刚果盆地道路发展监测, 基于深度学习和多源卫星影像

INFUS | STFDiff: 基于扩散模型的遥感图像时空融合

资讯 | 硬刚！被On hold后，eLife期刊正面回应

NeurIPS24 | ETH等提出高分辨率树冠数据集, 实例级标注, 超28万个体树和5.6万树群, 全球+多样化

会议通知 | AI和数字孪生改变城市生活, 英国格拉斯哥大学举办, 可线上免费参加

超强3D人体姿态估计SOTA! 即插即用于各种基于Transformer 3D姿势估计器

遥感数据 | 时间序列农作物分类基准数据集, 跨不同国家和气候区

PNAS | 检测2000多种植物分布! 使用遥感和深度学习监测和预测植物物种分布和快速变化, 结合公民科学数据

NeurIPS24 | 无需复杂地图! 基于城市白模的无人机视觉定位新方法

IJDE | 综述 | 全面回顾多源遥感影像变化检测, 发展历史, 数据, 方法, 未来展望

实用工具｜适用遥感图像的AI自动标注工具,T-Rex Label, 开箱即用, 检测一切!

论文 | HazyDet: 雾天无人机目标检测开源数据基准, 以及深度感知检测器DeCoDet

TPAMI | Changen2, 用于生成多时相遥感图像及变化检测数据的基础模型

深度｜AI教父Hinton与AI教母李飞飞首次公开对谈：我们必须通过，让懂得数据的人和懂得如何使技术有效的人建立联系来搭建这座桥

RSE | 降低对灾后图像的依赖! 遥感建筑损毁评估模型, 受灾前后样本无需相同位置

TPAMI聚焦, SegNet 高效而精准的图像语义分割网络

完整PPT | 谷歌提出用于遥感大模型的Embedding Fields 模型

会议通知 | 第二届大湾区测绘遥感大会（二号通知）

NeurIPS24 | 多无人机协作精确预测车辆等目标移动轨迹, Drones Help Drones

分类

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉