最新进展 | HashGAT-VCA:面向城市土地利用变化模拟的哈希函数-图注意力网络矢量元胞自动机模型

文摘   2024-07-16 16:17   湖北  

1


摘要




矢量元胞自动机(VCA)模型擅长于表示不规则形状地块的时空演变过程,已被广泛应用于土地利用变化模拟。然而,目前的研究面临以下问题:(1)大多数VCA模型在计算环境驱动效应时忽略了每个地块内驱动因素的空间异质性;(2)在计算邻域效应时,通常使用相邻地块土地利用类型的简单统计,忽略了相邻地块内驱动因素的影响;(3)挖掘地块之间相互作用的能力往往是有限的。
为了解决上述问题,本研究提出了一个HashGAT-VCA模型用于模拟城市土地利用变化。该模型利用哈希函数将每个不规则形状地块内非均匀分布驱动因子编码为统一长度的向量,并基于地块之间的空间拓扑关系构建地块的图结构。通过使用图注意力网络(GAT),该模型探索了环境驱动效应和地块间相互作用的机制,以计算每个地块的土地利用变化概率。将所提出的HashGAT-VCA模型应用于2009年至2012年中国深圳城市土地利用变化的模拟。
与其他VCA模型相比,HashGAT-VCA具有更高的模拟精度。结果表明,HashGAT-VCA可以有效地捕捉地块内驱动因素的非均匀分布特征以及地块之间的相互作用对土地利用变化的影响。此外,本研究模拟了生态控制策略2025年和2030年的土地利用模式,为城市规划提供决策支持。

2


研究方法




本研究提出了一个HashGAT-VCA模型来模拟城市不规则形状地块的多类土地利用变化。如图1所示,该模型由四个主要模块组成:(1)信息提取和编码:提取每个地块内每个驱动因素的栅格数据。使用SHA512算法将驱动因素的栅格数据编码为等长向量。(2)图构建和训练:构建地块的图结构。将每个地块视为一个节点,将编码的驱动因素等长向量与土地利用类型等其他特征相结合,形成地块特征。基于地块之间的邻接关系构建边,形成地块的图网络。通过训练图注意力网络(GAT),同时探索地块内的环境驱动效应和地块间的邻域效应。(3 VCA模拟:利用训练后的GAT来计算在环境因素和地块之间相互作用的综合影响下,每个地块的土地利用转换的适宜性。通过结合约束和随机因素,获得了单个地块的土地利用转换概率。使用历史统计数据进行参数调整,经过几次迭代后,通过轮盘选择过程确定每个地块的最终土地使用类型。(4)准确性评估和未来情景预测:经过训练的模型可以模拟历史土地利用变化,从而能够评估其准确性和可靠性。该模型可用于生成各种情景下的未来土地利用空间模式,为政府当局的决策和规划提供便利。

研究框架
1)信息提取与编码

如图2a)所示,在原始数据集中,地块数据由描述地块位置和形状的矢量多边形组成。一个特定的环境驱动因子数据是一个具有规则形状和大小的空间单元(例如,30m30m像素)的连续栅格表面,它代表了驱动因子值在整个研究区域的空间分布。

每个驱动因子的栅格数据首先由地块的矢量多边形裁剪,以生成所有地块的一组栅格面片,每个面片表示驱动因子在特定地块内的空间分布。当栅格单元的质心位于矢量地块的边界内时,它被视为代表地块的一部分(图2b))。驱动因素的所有栅格斑块都具有不规则的形状和不一致的像素数量,作为其对应的地块。然后,为每个栅格补丁创建一个最小边界矩形(MBR),并应用填充过程以使用特定的NoData值(例如,-1-9999)填充MBR中的那些外部补丁像素。由此产生的MBR保留了地块形状和大小的信息,以及地块内驱动因素的空间分布(图2c))。

如图所示,图神经网络模型要求所有节点的属性特征的维数是一致的。因此,在HashGAT-VCA模型中,使用哈希函数将各种大小的驱动因子MBR编码为均匀长度的向量。(图2d))。一旦构建了地块图,每个驱动因子向量将作为图中相应节点(即地块)的属性特征的一部分(图2e))。地块的其他属性(如土地使用类型)也将添加到相应节点的属性特征中。

信息提取和编码过程

2)图构建和训练

VCA模型中,某个地块的邻域效应很大程度上取决于相邻地块的选择方法,不同的邻域选择方法导致不同的邻域配置,从而产生不同的邻域效应。通常有两种类型的领域选择方法:基于缓冲区的和基于拓扑的。基于缓冲区的方法可以进一步分为两种方法:基于边缓冲区的方法和基于质心的方法。基于缓冲区的方法包括在地块的质心或边缘周围创建不同大小的缓冲区,如图3a)(b)所示。与缓冲区相交的周围地块被视为连接到中心地块。由于地块的形状复杂,地块的质心可能不位于地块内部。此外,当地块很大时,缓冲区可能包含在地块内,如图3c)(d)所示。因此,基于边缘的建模方法在理论上产生了更好的结果。然而,无论使用何种方法,都需要重复实验来确定适当的缓冲距离,以提高模拟精度。

图结构构建

如果周围地块j对中心地块i的影响显著,则相应的注意力系数eij也会较高,如公式(1)。
其中,指的是中心地块i的输入特征在第l层,指的是周围地块j的输入特征在第l层,F为每个结点的特征长度,当l0时,输入特征矩阵为初始特征矩阵X。通过线性变化实现不同层的特征向量的转变,其中为新的结点特征长度。||为连接符号,将2个结点的特征简单的连接在一起,注意力机制a是一个单层前馈神经网络,通过权重向量进行参数化,使用LeakyReLU线性激活函数得到eij。然后使用softmax函数在结点之间进行注意力的标准化,如公式(2)。下一层的结点特征的表达公式如下公式(3)。

为了稳定注意力学习的过程,GAT提出了多头注意力机制。本研究中的多头注意力使用公式(4)表示,其中||为连接符号,k头的归一化注意力系数,Wk为对应输入线性变换的权重矩阵,输出特征由每个结点的特征组成。

图注意力网络

3)基于GATVCA模拟
在本研究中使用图网络的方法,使得中心地块聚合了周围地块的信息,同时得到了环境驱动效应和邻域土地利用效应,即转换适宜性概率Ph,所以HashGAT-VCA的最终转换概率OP为公式(5)。

其中指的是地块it时刻发生第𝑘种土地利用变化类型的转换适宜性概率(在本研究为环境因子驱动和邻域地块影响共同作用下的土地利用变化概率)。指的是地块𝑖𝑡时刻是否被允许发展为城市用地。在本研究中设定了三种特殊的用地类型,其中包括保护区、特殊用地和水体,将其作为限制发展区域。RA是指地块it时刻发生第k种土地利用变化类型的随机参数,用来反映城市复杂系统发展过程中的不确定因素和随机效应。

4)精度评价

为了定量评估土地利用模拟结果的精度,使用FoM指数来衡量,它主要关注模拟过程中的变化量。具体计算公式如下。

其中,代表了真实发生了用地转变,但模拟结果没有反映这一转变所导致的误差;代表了真实发生了用地转变,并且模拟结果也准确反映了这一转变的土地;代表了真实发生了用地转变,模拟结果也反映了这一转变,但转变类型不符合真实情况所导致的误差;代表了真实没有发生用地转变,但模拟结果却错误地显示了转变的误差。
此外,还使用了一组景观指数来评估实际和模拟土地利用之间的景观模式相似性。Fragstats 4.2计算了几个景观指数(SHAPE的范围、PARA的范围、CIRCLE的范围、CONTIG的范围)。相似性是通过上述景观指数的平均差异来估计的。方程式如下:

其中so代表模拟和真实的土地利用,n为景观数量。

3


研究数据




本研究的研究区位于深圳市,深圳市位于中国广东省的南部,处于珠江口东岸,其中常住人口约1252.8万人,总面积1997.47km2http://www.sz.gov.cn/cn/zjsz/gl/)。深圳市2021GDP达到了30664.85亿元,在全中国排名第三(http://tjj.sz.gov.cn/)。深圳市是中国的经济、金融和技术创新中心之一,拥有四大支柱产业,包括:文化、创造、高科技、现代物流和金融。为保护和维护城市生态环境,确保城市可持续发展,防止城市建设用地无序扩张,深圳率先探索划定和管理中国生态保护红线。该措施的实施旨在强调城市生态环境的保护和重要性,限制城市建设用地的过度扩张,确保生态系统的健康和稳定。图5的左侧显示了研究区域的情况,而右侧显示了生态控制区的情况。

研究区和生态控制区

本研究利用了深圳市国土资源局2009年、2012年和2014年的土地利用数据。土地利用数据分为五类:非城市、公共服务、商业、住宅和工业,如图6所示。

深圳市土地利用情况

城市土地利用变化通常受到位置、地形、社会经济活动、几何特征和政策等因素的影响(在本研究中,位置和交通因素包括到市中心的距离、到高速公路的距离、离铁路的距离和离公路的距离。地形因素包括数字高程模型(DEM)和坡度。POI因素包括医院、公交车站、餐馆、娱乐场所、公园、超市、购物中心和工厂。几何特征包括地块的周长和面积。图7显示了所有驱动因素的30m分辨率栅格数据集。POI的强度可以看作是人类经济活动的反映。

驱动因子数据集


4


研究结果




利用2009年的土地利用数据和驱动因素数据集,构建并训练了HashGAT-VCA模型。使用校准的VCA模型,该研究模拟了2009年至2012年的城市土地利用变化,并评估了模拟结果的准确性。此外,还使用了其他四个VCA模型,即CNN-VCARF-VCAANN-VCALR-VCA进行比较。该研究还讨论了不同类型的哈希函数对结果的影响,证明了SHA-512的有效性。采用不同的图构建方法来构建图网络,并比较了三种模型构建方法的准确性,以及GCNGAT的准确性比较。
精度评估如表一,HashGAT-VCA模型显示了最佳的模拟结果。与CNN-VCA相比,HashGAT-VCA提高了5.81%。在三年的时间里,只有少数地块发生了土地利用变化,因此很难揭示土地利用变化的潜在驱动机制。实验结果表明,HashGAT-VCA能够有效地探索土地利用变化的驱动机制。在实验中的五个模型中,HashGAT-VCA模型表现最好,表明使用HashGAT模型可以更好地提取环境驱动效应和邻域效应。将地块表示为图结构表达空间信息,这有助于分类和预测任务。

表一 不同模型模拟的FoM结果

本研究将SHAPE(形状指数范围)、PARA(周长面积比范围)、CRICLE(相关外切圆范围)和CONTIG(邻接指数范围)四个景观指数相结合,评估模拟和实际土地利用的景观相似性。表二显示了五个模型在2012年的景观相似性计算结果。与CNN-VCALR-VCAANN-VCARF-VCA相比,HashGAT-VCA模型与实际土地利用的景观相似性最高(0.999),比其他四个模型高出约0.5%-2.5%

表二 同模型模拟的景观指数结果

为了进一步比较不同模型模拟的土地利用变化,图8显示了2012年五个模型的实际土地利用变化和模拟土地利用变化。此外,图9选择了几个具有代表性的区域来说明实际变化和模拟变化之间的差异。这些区域中经过改造的主要地块是大型地块和一些集群。图10显示了2014年的模拟变化结果和一些细节。详细信息显示,HashGAT-VCACNN-VCA模型在模拟过程中都取得了良好的效果,而其他三个模型难以接近真实情况。FoM值也证实了这一点(FoM=0.382)。与CNN-VCA相比,本研究提出的HashGAT-VCA模型的模拟结果更接近地块的实际变化模式。HashGAT-VCA可以有效地识别大地块和某些集群的变化。这是因为,与其他模型相比,在HashGAT-VCA模型中使用图网络可以提取环境驱动的适用性,同时聚合邻域效应,从而获得更好的准确性。

实际和模拟土地利用情况

模拟细节展示

10 2014年模拟和细节展示

为了评估基于哈希的编码的有效性,使用地块内部驱动因素的平均值作为相应节点的特征来构建模型进行比较(即Average-GAT-VCA)。地块内内部驱动因子的平均值也是大多数VCA方法的共同特征。为了评估散列函数选择的影响,使用3个哈希函数(即SHA-512SHA-256MD5)构建模型进行比较。此外,还使用图卷积网络(GCN)构建了一个模型进行比较,以评估GAT的有效性。表显示了所有这些模型的精度。结果表明,使用驱动因子的平均值作为节点(即地块)的特征会导致地块驱动因子的异质性损失,导致结果较差。SHA512的效果最好,说明较长的函数编码可以保留更多的信息。

表三 模型不同算法的结果对比

为了探索深圳市最佳领域配置,分别以拓扑、边缓冲和质心缓冲三种方法构建图结构,结果如表四所示。结果显示,基于拓扑一阶效果最好,一些地块的高阶连接可能会凭借这些大型地块连接到距离它非常远的地方,这也会影响模拟的结果。基于边缓冲的构建方法取得了不错的结果,在缓冲区为50米的时候,效果最好。基于质心缓冲的建模在100m的时候效果最好,在50m的效果较差,这是因为50m的范围较小,可能出现缓冲区还在地块内部的情况,或者地块形状比较特殊,会影响训练效果。

表四 不同领域配置的模拟结果

提出的HashGAT-VCA模型可以用于对未来场景预测,使用约束马尔可夫链的方法和历史数据,基于2014年的土地利用数据,通过多次迭代得到2025年和2030年的深圳市土地利用变化,对增加生态保护红线的场景进行实验分析,结果如图11所示。

11 未来场景预测

5


总结




为了将地块内驱动因素的空间异质性纳入环境驱动效应评价,更好地捕捉土地利用变化的邻域效应,提出了一种耦合哈希函数和图注意力网络的VCAHashGAT-VCA)。哈希函数(即SHA-512)用于将形状和大小不规则的地块内的驱动因子值编码为等长向量,这些向量与地块的其他特征(例如,土地利用类型)集成以形成地块的特征向量。构建地块图结构来表示地块之间的空间拓扑关系。GAT用于同时提取各地块及其相邻地块内驱动因素的影响,以及地块之间的相互关系,从而评估地块的土地利用变化适宜性。
将所提出的HashGAT-VCA模型应用于2009-2012年深圳市城市土地利用变化的模拟。结果表明,与其他VCA模型(CNN-VCARF-VCAANN-VCALR-VCA)相比,HashGAT-VCA模型的模拟精度最高,比CNN-VCA模型提高了5.834%HashGAT-VCA模型模拟的土地利用细节与实际发生情况基本一致,特别是在发生真实转化的地块上,就形态特征而言,它们中的许多是相同的。与CNN-VCA模型相比,HashGAT-VCA模型对变化的地块表现出更高的敏感性,有效地捕获了哪些地块发生了变化以及发生了变化的类型。结果表明,基于GAT的方法能够高效提取各地块邻域内驱动因素的高级特征,有利于城市土地利用变化模式的准确识别,提高模拟精度。

参考文献

Guan, Q., Li, J., Zhai, Y., Liang, X. & Yao, Y.* (2024) HashGAT-VCA: A vector cellular automata model with hash function and graph attention network for urban land-use change simulationLandscape and Urban Planning, 250: 105145. DOI: 10.1016/j.landurbplan.2024.105145




你可能感兴趣


论文 | Temporal-VCA:耦合时序数据和矢量元胞自动机模拟城市土地利用变化
论文 | 土地覆盖变化矢量元胞自动机模型的适用性及敏感性分析
论文 | 基于矢量元胞自动机的特大城市精细尺度经济空间分布演变预测研究
论文 | CarbonVCA:地籍地块尺度下的城市碳排放与“碳达峰”预测框架
教学 | 矢量地块级模拟和分析软件集(UrbanVCA和VecLI)学习视频
软件 | CoCA v1.1.0:基于元胞自动机模型的“土地-人口-经济”空间协同模拟平台



UrbanComp位置智能和城市感知
中国地质大学(武汉)地理与信息工程学院姚尧老师课题组,UrbanComp@HPSCIL的科研发布公众号。研究方向为地理位置智能、时空数据挖掘和可计算城市科学。团队主页:https://www.urbancomp.net。
 最新文章