之前介绍过谷歌的全球建筑物足迹数据集(谷歌发布并开源18亿个建筑物足迹数据集),微软也同步发布了全球建筑物足迹数据集,2023年发布的最新建筑物足迹数据集还有一部分带了建筑物高度,这是该数据集的一个特色。微软全球建筑物足迹数据集基于2014年至2023年的高分卫星影像数据获取,包括Maxar、Airbus和IGN France的图像,共检测到12.4亿栋建筑和估计了1.74亿建筑物高度,该数据集已开放免费下载和使用,由微软根据开放数据公共数据库许可证(Open Data Commons Open Database License, OdbL)许可,文末有下载链接。
数据集基本情况
微软地图(Microsoft Maps)有一个专门的地图人工智能(Maps AI)团队,该团队把深度学习、计算机视觉和机器学习技术应用于地图绘制,其中一个任务就是生产全球建筑物足迹(见图1)数据集,2022年7月5日在微软的行星计算机(Microsoft's Planetary Computer)平台上发布其第一个完整版本,数据集最近的更新是2023年9月5日。
该最新的全球建筑物足迹数据集包括2014年至2023年间必应地图(Bing Maps)卫星图像中的12亿建筑足迹和1.74亿建筑高度估计,其中包括Maxar、Airbus和IGN France的图像。
图1 通过Bing地图显示全球建筑足迹的示例图(来自微软)▼
该数据集覆盖区域如图2所示,覆盖全球大部分区域,包括南美洲、非洲、欧洲部分区域、亚洲部分区域、美国和澳大利亚等,数据集覆盖范围在逐步扩展。
图2 微软全球建筑足迹覆盖范围图(来自微软)▼
该数据集2023年的更新提供了备受用户欢迎的描述建筑物的一个新的维度——建筑高度,这将使用户可以生成建筑物白膜,图3显示了具有高度估计的全球建筑足迹覆盖范围,包括欧洲部分区域、美国和澳大利亚等。
图3 具有高度估计的全球建筑足迹覆盖范围图(来自微软)▼
数据集的坐标参考系统是EPSG: 4326(WGS84椭球,坐标用经纬度表示);数据集主文件是GeoJSON格式文件,存储建筑物轮廓的多边形角点坐标,供下载的文件打包成ZIP格式。
微软指出该数据集的建筑足迹提取分两个阶段进行:
(1)语义分割(Semantic Segmentation)——使用深度神经网络(DNN)识别卫星/航空图像上的建筑像元(pixel),如图4所示实际上就是通过AI模型自动标记出图像上的建筑物像元。
图4 遥感图像的建筑物语义分割图(来自微软)▼
(2)多边形化(Polygonization)——将检测的建筑像元(栅格)转换为多边形(矢量),这里从栅格转化为矢量(见图5),根据建筑物的特点做了一定的规则化的工作,把有毛刺的边转换为直线。
图5 建筑物轮廓规则矢量化图(来自微软)▼
建筑物的高度测量,微软训练了一个神经网络,使用与高度测量配对的图像来估算建筑物地面上方的高度,然后取建筑多边形内的平均高度,没有高度估算的用-1填充,高度估算以米为单位。
微软对建筑物足迹数据集的评估度量是在每个区域的一组建筑多边形标签上计算的,用了多个指标评估其精度:
(1)建筑物检测结果的精度和召回率评估,见表1不同区域的精度(precision)和召回率(recall)表。可以看出查准率比较高,但是查全率相对较低。
表1 微软全球建筑物足迹数据集不同区域的精度和召回率表(来自微软)▼
(2)建筑物多边形的匹配度度量:交并比和主角旋转误差,见表2不同区域的交并比和主角旋转误差表。交并比(Intersection of Union,IoU):作为衡量指标,用来描述两个框(检测框和真值框)之间的重合度(见图6);主角旋转误差:测量检测多边形和真值多边形的旋转偏差(见图6)。
表2 微软全球建筑物足迹数据集不同区域的交并比和主角旋转误差表(来自微软)▼
图6 交并比和主角旋转误差示意图(来自微软)▼
(3)建筑物检测结果的假阳性率(False positive ratio);根据随机抽样的建筑多边形结果,估计每个区域/国家的假阳性率。
表3 微软全球建筑物足迹数据集不同区域的随机抽样建筑物结果假阳性率表(来自微软)▼
微软认为基于以上评估指标的结果,在绝大多数情况下,建筑物足迹的质量至少与开放街道地图(OpenStreetMap, OSM)中的手动数字化建筑轮廓一样好。但是并不完美,尤其是在人口稠密的城市地区,但在农村地区它提供了很好的召回率(查全率)。
该数据集的介绍和下载地址发布在GitHub上,参考文献2给出了该数据集项目在GitHub上的网址。
查看这些建筑高度的实际情况,可使用Windows地图应用程序(Windows Maps Application)中的三维视图。
也可以通过微软的行星计算机(Microsoft's Planetary Computer)探索数据集。
微软和谷歌似乎就全球的建筑物足迹数据集正在开展竞争,但两个公司的初衷是基本一致的,全球建筑物足迹数据集可以为科学研究、公益和商业应用提供基础数据支撑(例如微软发布基于遥感卫星和人工智能的土耳其建筑损毁评估报告),相信后续有更多区域的建筑物足迹提取结果会发布。中国区域的建筑物足迹预计有7亿个,微软和谷歌暂时还未发布,也许是中国部分区域建筑物密集,从卫星图像中自动提取得到比较好的结果还有相当的挑战性。
感谢阅读,如有任何问题和建议请发私信或联系我(微信号jack299)!欢迎关注并星标“石头人看遥感”,并转发让更多的人看到。您的每一次点赞、转发,都是对我的肯定和支持,谢谢!
参考文献
[1] Bing Maps Global Building Footprints Released. https://blogs.bing.com/maps/2023-06/Bing-Maps-Global-Building-Footprints-released#:~:text=You%20might%20have%20noticed%20that%20Bing%20Maps%20has,France%20imagery%20and%20released%20a%20new%20full%20dataset .
[2] GitHub - microsoft/GlobalMLBuildingFootprints: Worldwide building footprints derived from satellite imagery. https://github.com/microsoft/GlobalMLBuildingFootprints .
(全文完)