1
摘要
2
研究方法
本研究提出了一个HashGAT-VCA模型来模拟城市不规则形状地块的多类土地利用变化。如图1所示,该模型由四个主要模块组成:(1)信息提取和编码:提取每个地块内每个驱动因素的栅格数据。使用SHA512算法将驱动因素的栅格数据编码为等长向量。(2)图构建和训练:构建地块的图结构。将每个地块视为一个节点,将编码的驱动因素等长向量与土地利用类型等其他特征相结合,形成地块特征。基于地块之间的邻接关系构建边,形成地块的图网络。通过训练图注意力网络(GAT),同时探索地块内的环境驱动效应和地块间的邻域效应。(3) VCA模拟:利用训练后的GAT来计算在环境因素和地块之间相互作用的综合影响下,每个地块的土地利用转换的适宜性。通过结合约束和随机因素,获得了单个地块的土地利用转换概率。使用历史统计数据进行参数调整,经过几次迭代后,通过轮盘选择过程确定每个地块的最终土地使用类型。(4)准确性评估和未来情景预测:经过训练的模型可以模拟历史土地利用变化,从而能够评估其准确性和可靠性。该模型可用于生成各种情景下的未来土地利用空间模式,为政府当局的决策和规划提供便利。
如图2(a)所示,在原始数据集中,地块数据由描述地块位置和形状的矢量多边形组成。一个特定的环境驱动因子数据是一个具有规则形状和大小的空间单元(例如,30m✖30m像素)的连续栅格表面,它代表了驱动因子值在整个研究区域的空间分布。
每个驱动因子的栅格数据首先由地块的矢量多边形裁剪,以生成所有地块的一组栅格面片,每个面片表示驱动因子在特定地块内的空间分布。当栅格单元的质心位于矢量地块的边界内时,它被视为代表地块的一部分(图2(b))。驱动因素的所有栅格斑块都具有不规则的形状和不一致的像素数量,作为其对应的地块。然后,为每个栅格补丁创建一个最小边界矩形(MBR),并应用填充过程以使用特定的NoData值(例如,-1或-9999)填充MBR中的那些外部补丁像素。由此产生的MBR保留了地块形状和大小的信息,以及地块内驱动因素的空间分布(图2(c))。
图2 信息提取和编码过程
(2)图构建和训练
在VCA模型中,某个地块的邻域效应很大程度上取决于相邻地块的选择方法,不同的邻域选择方法导致不同的邻域配置,从而产生不同的邻域效应。通常有两种类型的领域选择方法:基于缓冲区的和基于拓扑的。基于缓冲区的方法可以进一步分为两种方法:基于边缓冲区的方法和基于质心的方法。基于缓冲区的方法包括在地块的质心或边缘周围创建不同大小的缓冲区,如图3(a)(b)所示。与缓冲区相交的周围地块被视为连接到中心地块。由于地块的形状复杂,地块的质心可能不位于地块内部。此外,当地块很大时,缓冲区可能包含在地块内,如图3(c)(d)所示。因此,基于边缘的建模方法在理论上产生了更好的结果。然而,无论使用何种方法,都需要重复实验来确定适当的缓冲距离,以提高模拟精度。
图3 图结构构建
图4 图注意力网络
其中指的是地块i在t时刻发生第𝑘种土地利用变化类型的转换适宜性概率(在本研究为环境因子驱动和邻域地块影响共同作用下的土地利用变化概率)。指的是地块𝑖在𝑡时刻是否被允许发展为城市用地。在本研究中设定了三种特殊的用地类型,其中包括保护区、特殊用地和水体,将其作为限制发展区域。RA是指地块i在t时刻发生第k种土地利用变化类型的随机参数,用来反映城市复杂系统发展过程中的不确定因素和随机效应。
(4)精度评价
3
研究数据
本研究的研究区位于深圳市,深圳市位于中国广东省的南部,处于珠江口东岸,其中常住人口约1252.8万人,总面积1997.47km2(http://www.sz.gov.cn/cn/zjsz/gl/)。深圳市2021年GDP达到了30664.85亿元,在全中国排名第三(http://tjj.sz.gov.cn/)。深圳市是中国的经济、金融和技术创新中心之一,拥有四大支柱产业,包括:文化、创造、高科技、现代物流和金融。为保护和维护城市生态环境,确保城市可持续发展,防止城市建设用地无序扩张,深圳率先探索划定和管理中国生态保护红线。该措施的实施旨在强调城市生态环境的保护和重要性,限制城市建设用地的过度扩张,确保生态系统的健康和稳定。图5的左侧显示了研究区域的情况,而右侧显示了生态控制区的情况。
图5 研究区和生态控制区
图6 深圳市土地利用情况
城市土地利用变化通常受到位置、地形、社会经济活动、几何特征和政策等因素的影响(在本研究中,位置和交通因素包括到市中心的距离、到高速公路的距离、离铁路的距离和离公路的距离。地形因素包括数字高程模型(DEM)和坡度。POI因素包括医院、公交车站、餐馆、娱乐场所、公园、超市、购物中心和工厂。几何特征包括地块的周长和面积。图7显示了所有驱动因素的30m分辨率栅格数据集。POI的强度可以看作是人类经济活动的反映。
图7 驱动因子数据集
4
研究结果
表一 不同模型模拟的FoM结果
本研究将SHAPE(形状指数范围)、PARA(周长面积比范围)、CRICLE(相关外切圆范围)和CONTIG(邻接指数范围)四个景观指数相结合,评估模拟和实际土地利用的景观相似性。表二显示了五个模型在2012年的景观相似性计算结果。与CNN-VCA、LR-VCA、ANN-VCA和RF-VCA相比,HashGAT-VCA模型与实际土地利用的景观相似性最高(0.999),比其他四个模型高出约0.5%-2.5%。
表二 同模型模拟的景观指数结果
为了进一步比较不同模型模拟的土地利用变化,图8显示了2012年五个模型的实际土地利用变化和模拟土地利用变化。此外,图9选择了几个具有代表性的区域来说明实际变化和模拟变化之间的差异。这些区域中经过改造的主要地块是大型地块和一些集群。图10显示了2014年的模拟变化结果和一些细节。详细信息显示,HashGAT-VCA和CNN-VCA模型在模拟过程中都取得了良好的效果,而其他三个模型难以接近真实情况。FoM值也证实了这一点(FoM=0.382)。与CNN-VCA相比,本研究提出的HashGAT-VCA模型的模拟结果更接近地块的实际变化模式。HashGAT-VCA可以有效地识别大地块和某些集群的变化。这是因为,与其他模型相比,在HashGAT-VCA模型中使用图网络可以提取环境驱动的适用性,同时聚合邻域效应,从而获得更好的准确性。
图9 模拟细节展示
图10 2014年模拟和细节展示
为了评估基于哈希的编码的有效性,使用地块内部驱动因素的平均值作为相应节点的特征来构建模型进行比较(即Average-GAT-VCA)。地块内内部驱动因子的平均值也是大多数VCA方法的共同特征。为了评估散列函数选择的影响,使用3个哈希函数(即SHA-512、SHA-256和MD5)构建模型进行比较。此外,还使用图卷积网络(GCN)构建了一个模型进行比较,以评估GAT的有效性。表三显示了所有这些模型的精度。结果表明,使用驱动因子的平均值作为节点(即地块)的特征会导致地块驱动因子的异质性损失,导致结果较差。SHA512的效果最好,说明较长的函数编码可以保留更多的信息。
表三 模型不同算法的结果对比
为了探索深圳市最佳领域配置,分别以拓扑、边缓冲和质心缓冲三种方法构建图结构,结果如表四所示。结果显示,基于拓扑一阶效果最好,一些地块的高阶连接可能会凭借这些大型地块连接到距离它非常远的地方,这也会影响模拟的结果。基于边缓冲的构建方法取得了不错的结果,在缓冲区为50米的时候,效果最好。基于质心缓冲的建模在100m的时候效果最好,在50m的效果较差,这是因为50m的范围较小,可能出现缓冲区还在地块内部的情况,或者地块形状比较特殊,会影响训练效果。
提出的HashGAT-VCA模型可以用于对未来场景预测,使用约束马尔可夫链的方法和历史数据,基于2014年的土地利用数据,通过多次迭代得到2025年和2030年的深圳市土地利用变化,对增加生态保护红线的场景进行实验分析,结果如图11所示。
5
总结
Guan, Q., Li, J., Zhai, Y., Liang, X. & Yao, Y.* (2024) HashGAT-VCA: A vector cellular automata model with hash function and graph attention network for urban land-use change simulation. Landscape and Urban Planning, 250: 105145. DOI: 10.1016/j.landurbplan.2024.105145