建筑物是人类生产和生活的重要空间,城市的主要组成部分。建筑物足迹(Building footprint)也称为建筑物底部轮廓,是建筑物在俯视图中投影到地面的轮廓数据,通过建筑物足迹可以确定单体建筑物的地理位置、边界空间范围和占地面积等信息。建筑物足迹数据在城市规划、保险、防灾减灾和可持续发展等方面有着重要作用。谷歌和微软基于高分辨率卫星图像和深度学习方法相继发布了开源的全球建筑物足迹数据,但缺少东亚区域特别是中国区域的建筑物足迹数据。
以下简要介绍中国区域2.5亿建筑物足迹数据集的基本情况并在文末提供该数据集下载网盘链接(无需科学上网)。
中国区域建筑物足迹数据集基本情况
2024年5月中山大学石茜等在《国际遥感学报》(Journal of Remote Sensing)发表文章《全球建筑物足迹数据的最后一块拼图——基于高分辨率图像绘制2.8亿东亚建筑物》(The Last Puzzle of Global Building Footprints—Mapping 280 Million Buildings in East Asia Based on VHR Images)并开源了东亚区域的建筑物足迹数据,包括中国、日本等5个东亚国家,填补了东亚区域开源建筑物足迹的空白。
中国区域2.5亿建筑物足迹数据集为以上开源数据集的中国部分。该数据集基于2020-2022年0.5米的谷歌卫星图像自动提取,平均总体准确率(Accuracy)为89.6%。“2.8亿东亚建筑物”论文认为该数据集是高质量、全面的东亚地区建筑物数据,并在文中展示了部分成果(见图1和图2)。
图2 不同城市建筑物足迹成果局部细节图-底图为2021年谷歌卫星图像(引自参考资料1)
建筑物足迹数据集精度评估
“2.8亿东亚建筑物”论文对提取的建筑足迹数据进行了全面的评估,包括定量评估、视觉评估和与现有产品的比较。
定量评估选择中国大连、杭州、珠海和上海等城市评估准确性,参考数据为手动标注的建筑物矢量。精度评估结果:准确率(Accuracy)87.6%-93.5%,召回率/查全率(Recall)81.8%-86.8%,精确率/查准率(Precision)80.6%-81.8%,F1分数(F1 Score)81.4-83.6%;准确率是指预测正确的样本数与样本总数的比值,召回率指预测正确的样本与真实正确样本数的比值,精确率指预测为正确的样本中真实正确的比例,F1分数是精确率和召回率的调和平均值。视觉评估见图1和图2,现有产品比较评估可见论文原文。
在论文的精度评估之外,随机挑选了中国区域南北方城市局部区域展示该建筑物数据集的目视效果。图3天津天津站附近区域整体效果不错,图4是近期被淹的岳阳市华容县团洲垸区域,房屋较小,图像质量一般,可以看到有一些房屋足迹未被提取。
总结
“2.8亿东亚建筑物”论文开源的数据集数据量为74.8G,压缩为一个数据文件后21.5G,原数据集需要科学上网下载,下载链接见参考资料1。中国区域数据压缩后17.9G,单个文件数据量太大,对中国区域建筑物足迹数据按7个地理分区分组后压缩(见图5),根据需要下载单个压缩文件或全部。给本号发送消息”2020-2022年中国区域建筑物足迹数据“获取网盘下载链接。
图5 中国区域建筑物足迹数据地理分区压缩包
如“2.8亿东亚建筑物”论文所说,东亚区域建筑物与世界上其他区域建筑物相比有较大差异,东亚区域特有复杂、小型和多样化的建筑,加上训练数据稀缺和质量差,同时该区域谷歌卫星图像质量相对较差,因此东亚地区建筑物的准确提取是一个巨大的挑战。该文生成了高质量、全面的中国区域(还包括其它东亚4国)建筑物数据,填补了中国地区开源建筑物足迹数据的空白,同时数据集还有改进空间。
欢迎分享至朋友圈!
未经授权,禁止转载!
转载与合作请联系下方二维码