【期刊】Computers, Environment and Urban Systems,
【题目】Towards the automated large-scale reconstruction of past road networks from historical maps
【作者】Johannes H. Uhl, Stefan Leyk, Yao-Yi Chiang, Craig A. Knoblock
【DOI】https://doi.org/10.1016/j.compenvurbsys.2022.101794.
摘要
公路或铁路网络等交通基础设施是人类文明的基本组成部分。对于可持续规划和明智决策而言,全面了解公路网等交通基础设施的长期演变至关重要。然而,在 2000 年代以前,覆盖大空间范围的空间明确、多时态道路网络数据非常稀缺,也很少能获得。在此,我们提出了一个框架,通过整合丰富的当代道路网络数据和从历史地图中提取的颜色信息,利用越来越多的扫描和地理参照历史地图系列来重建过去的道路网络。具体来说,我们的方法将当代道路路段作为分析单元,并根据图像处理和聚类技术推断历史地图系列中是否存在历史道路,从而提取历史道路。我们在 30 多万个路段上测试了我们的方法,这些路段代表了美国超过 5 万公里的道路网络,横跨三个研究区域,涵盖了 1890 年至 1950 年间的 42 幅历史地形图。我们通过与其他历史数据集和人工创建的参考数据进行比较,对我们的方法进行了评估,F-1 分数高达 0.95,并表明提取的道路网络统计数据随着时间的推移具有很高的可信度,即遵循一般的增长模式。我们的研究表明,当代地理空间数据与从历史地图系列中提取的信息相结合,为定量分析长期城市化进程和景观变化开辟了新途径,其意义远远超出了遥感和数字制图时代。
关键词:Historical maps;Topographic map processing;Spatial data integration;Road network analysis;Transportation infrastructure;Land development;Urbanization;Historical GiS
一、研究问题
如何从历史地图中重建过去道路网络?
如何整合当代道路网络数据和历史地图信息?
如何评估重建的历史道路网络的准确性?
二、研究意义
道路网络是文明的基石,对可持续规划和决策至关重要。大规模、多时相的道路网络数据在 2000 年代之前稀缺且难以获取。理解道路网络的长期演化对于理解城市发展和景观变化至关重要。
三、研究创新点
提出了一种基于图像处理和聚类技术的历史道路网络重建框架。
利用当代道路段作为分析单元,并提取历史地图中的颜色信息。
通过 ROC 分析评估了重建历史道路网络的准确性。
对重建的历史道路网络进行了时间一致性分析。
图 1.三个研究区域的历史 1:62,500 地形图。由 (a) 1893 年、(b) 1930 年和 (c) 1950 年覆盖大奥尔巴尼(纽约)的六幅地图组成的合成图幅;一张 10 张地图的合成图,分别于 (d) 1895 年和 (e) 1950 年拍摄的加利福尼亚州湾区,以及 (f) 1920 年拍摄的一张覆盖阿拉巴马州莫比尔湾的 4 张地图合成图。地图来源:USGS-HTMC。
图 2.历史地图中用于道路描绘的制图样式。奥尔巴尼(纽约州),(a) 1900 年、(b) 1930 年和 (c) 1950 年;1895 年和 (e) 1950 年的圣克拉拉(加利福尼亚州),以及 1920 年的 (f) 莫比尔(阿拉巴马州)。地图来源:USGS-HTMC。
四、研究方法
1. 数据准备:
当代道路网络数据: 使用来自美国国家交通数据集 (NTD) 的当代道路网络数据,该数据集包含了美国全国范围内的道路网络信息。
历史地形图: 使用来自美国地质调查局历史地形图收藏 (HITMC) 的历史地形图,该收藏包含了 1892 年至 1974 年间美国 50 个州和波多黎各的 15,000 多张地形图。研究人员选择了 42 张地形图,涵盖了 1890 年至 1950 年间美国纽约、加利福尼亚和阿拉巴马州的部分地区。
2. 空间数据处理:
地理配准: 使用 GDAL/VOGR2 软件对每张历史地形图进行扫描和地理配准,以确保其与当代道路网络数据的空间参考系一致。
道路矢量化: 使用 ArcPy 和 GDAL 软件将当代道路网络数据矢量化,并将其投影到每张历史地形图的空间参考系中。
截面采样: 对于每条当代道路段,使用 GDAL 软件生成垂直于道路段轴线的截面采样位置。每个截面采样位置的距离为 25 毫米,截面长度为 100 米。
3. 图像处理和道路重叠指标计算:
颜色信息提取: 使用 GDAL 软件将每张历史地形图转换为 RGB 像素格式,并提取每个截面采样位置的颜色信息。
轴向图像生成: 将每个截面采样位置的颜色信息堆叠成一个二维轴向图像,其中 y 轴对应道路轴线,x 轴对应垂直于道路轴线的方向。
梯度计算: 计算每个轴向图像中水平和垂直方向上的梯度。
道路重叠指标 (ROI) 计算: 计算每个轴向图像中南北方向上水平梯度之和,并计算该和曲线下的面积,作为道路重叠指标 (ROI)。
4. 历史道路提取:
聚类分析: 使用 Python 的 k-means 聚类算法将连续的 ROI 分为两类,分别表示历史道路和更近期的道路。
结果评估: 计算每条道路段在两个聚类中的平均 ROI,并将平均 ROI 较高的聚类识别为历史道路。
5. 验证和交叉比较:
可视化评估: 将每条道路段的 ROI 绘制在地图上,并可视化一组随机抽取的地图片段,以评估 ROI 指标的空间分布和合理性。
ROC 分析: 使用 ROC 曲线分析评估 ROI 指标和提取的历史道路网络与手动创建的参考数据集和基于建筑分布的自动创建的参考数据集之间的相关性。
时间一致性分析: 比较每条道路段在不同历史地图中的 ROI 值,以及提取的历史道路网络随时间推移的长度变化,以评估重建结果的合理性。
图 5.历史道路网络提取的工作流。(a) 具有横截面采样线的当代路网段,(b) 横截面采样位置,(c) 附加到路段特征的道路重叠指标 (ROI),以及 (d) 使用一维聚类分析将 ROI 离散为两类后确定的历史道路。
图 7.这项工作中使用的数据集、数据处理和分析步骤。为提取历史道路网络而执行的步骤显示在左侧,验证和交叉比较显示在右侧。颜色表示输入数据集(灰色)、数据处理步骤(黄色)、中间和输出空间数据集(红色)以及分析步骤(蓝色)。(有关此图例中对颜色引用的解释,读者请参阅本文的 Web 版本。
图 3.道路网络和验证数据。(a) 当代被忽视的热带病路网数据,分为城市(短)和农村(长)路段,显示整个纽约研究区域,以及 (b) 阿姆斯特丹市(纽约);(c)-(e):来自 HISDAC-US 数据集的历史建成区 (BUA),源自 ZTRAX 的建筑施工年份信息,最初来自县级税收和评估数据,分别于 1900 年、1930 年和 1950 年显示纽约研究区,(f),(g) 1900 年和 1950 年加利福尼亚研究区的 BUA,以及 (h) 1920 年阿拉巴马州研究区的 BUA。标记为 “built-up area” 的网格单元格在给定年份至少包含一个 built-up property。(c)-(h) 中的山体阴影源:世界地形基础(Esri、USGS、NOAA)。
五、研究结果
ROI 指标的有效性: 研究结果表明,ROI 指标能够有效地识别历史地图中的道路符号。在密集的城市中心区域,ROI 值较高,并且随着时间的推移而增加。在较稀疏的农村地区,ROI 值较低,并且变化较小。
历史道路网络的合理性: 提取的历史道路网络在地理空间上具有高度的合理性。它们与当代城市中心和城市扩张的轨迹相一致。
ROC 分析结果: 与手动创建的参考数据集相比,提取的历史道路网络的 F-1 分数高达 0.95,表明该方法具有较高的准确性。与基于建筑分布的自动创建的参考数据集相比,ROC 曲线的 AUC 值更高,表明该方法能够更好地区分历史道路和更近期的道路。
时间一致性分析: 提取的历史道路网络随时间推移显示出合理的增长模式。大多数历史道路段在随后的地图中都存在,并且许多新的道路段被检测出来。
图 10.1920 年莫比尔湾(阿拉巴马州)研究区域的道路重叠指标 (ROI) 指标地图,(a) 显示整个研究区域,(b)-(c) 显示莫比尔市,具有不同细节级别,包括基础历史地图。显示的是每个路段的 ROI,指示在创建历史地图的年份是否可能存在道路(浅蓝色、黄色),深蓝色道路可能尚不存在。(有关此图例中对颜色引用的解释,读者请参阅本文的 Web 版本。
图 15.提取了 3 个研究区域和不同年份的历史道路网络。(a) 地图图表级别的 CK 均值聚类,以及 (b) 地图图表级别聚类分析与研究区域级别聚类分析的一致性-不一致地图。
附图 A4. 各研究区域、时间点和聚类策略的 ck-means 聚类得出的各路段剪影得分。
六、研究展望
1将该方法应用于其他历史地图和地区。
2探索更先进的图像处理和聚类技术。
3将重建的历史道路网络与其他历史数据集进行整合。
4利用重建的历史道路网络进行更深入的城市化和景观变化分析。
【声明】
1、以上仅用作学习研究,不作商用。图文若有侵权请联系删除。
2、除摘要外,以上仅为个人阅读后再梳理的结果,若造成理解歧义,请各位客官老爷们点击【阅读原文】,以原文观点为准。