局部解释空间异质性模型

文摘   科学   2024-01-02 07:22   澳大利亚  

北京师范大学李洋博士与慕尼黑工业大学罗鹏博士合作开发局部解释空间分层异质性模型。合作者包括澳大利亚科廷大学宋泳泽博士。

摘要:

识别地理变量的空间决定因素有助于我们更好地理解世界。然而,鉴于复杂的地理表面和复杂的相互作用,一个响应变量必然受到多个解释变量的交互作用的影响。空间异质性模型等方法已被证明能够定量揭示这种交互作用。然而,仍然存在一个问题:每个解释变量对交互作用的贡献是多少?在本研究中,我们通过引入博弈论的思想,对此前开发的识别地理交互作用的地理最优分区模型(GOZH)进行了拓展。得到的SPD指标可以有效反映单变量在地理变量交互中的贡献,且具备对称性与可加性。

论文引用:

Li, Yang#, Peng Luo#, Yongze Song, Liqiang Zhang, Ying Qu, and Zhengyang Hou. "A locally explained heterogeneity model for examining wetland disparity." International Journal of Digital Earth 16, no. 2 (2023): 4533-4552.


1  模型介绍

空间分层异质性模型(spatial stratified heterogeneity model),例如地理探测器,是检测地理空间中的非线性关系和交互作用的有用工具。它通常用于探测影响某一现象的地理因素,并分析这些因素之间的关系。

它的基本假设是:如果某个自变量对某个因变量有重要影响,那么自变量和因变量的空间分布应该具有相似性。地理分异既可以用分类算法来表达,例如环境遥感分类;也可以根据经验确定,例如胡焕庸线。地理探测器擅长分析类型量,而对于顺序量、比值量或间隔量,只要进行适当的离散化,也可以利用地理探测器对其进行统计分析。

 

图1 不同SSH模型对比

在经典的SSH模型中(图1),通常根据等距、分位数或几何分割进行空间离散化,该过程中没有进行任何优化。该方法的结果受到确定空间离散化规则的影响。因此,相应的PD无法完全解释解释变量和响应变量之间的空间关联。研究表明,在使用经典SSH模型时存在PD显著低估的情况(Song et al., 2020; Luo et al.,2022)。目前已经开发了几种模型来计算OPD以解决上述问题,如OPGD和GOZH模型(图1c)。通过优化空间离散化过程,相应的OPD可以显著改善该方法,以充分揭示空间关联。

然而,尽管OPD可以准确估计多个解释变量对响应变量的影响,我们仍然需要确定每个解释变量的贡献。例如,我们可能发现温度和降水共同解释湿地面积变化的50%,仍有必要确定温度对此相互作用的贡献。在计算多个解释变量之间的相互作用时,目前的SSH模型存在一个黑盒。

在本研究中,我们的目标是打开这个黑盒,确定单一变量对OPD的贡献(图2d)。我们提出了LESH模型,通过结合SHAP和SSH模型。改进后的OPD,称为Shapley决定因素的强度(SPD),可以充分解释每个变量的贡献,而不管考虑多少个变量或相互作用过程有多复杂。

在SSH模型中,PD值用来表示解释变量与响应变量在空间上的关联程度。该值被计算为由一个或多个解释变量确定的地理区域内因变量的方差与整个研究区域因变量方差之比。PD值的计算如下:

其中,SSW是由解释变量确定的地理区域内湿地密度的平方和,SST是整个研究区域湿地密度的总平方和,N_z和σ_z分别是地理区域z(z = 1,..., h)内湿地密度的数量和标准偏差,N和σ分别是整个研究区域湿地密度的数量和标准偏差。PD值的范围从0到1,其中较高的PD值表示响应变量和解释变量之间的空间关联性较强。

最优PD值(OPD)是由地理最优区域异质性(GOZH)模型(Luo el al.,2022)提出的。在GOZH中,OPD由Ω值表示,计算如下:

其中,〖SSW〗_(X,D)表示由解释变量X和分层变量D确定的区域内的平方和。Ω值能够确定由多个解释变量确定的最优地理区域,并展示这些解释变量的最大PD。

接下来,我们分解OPD,得到每个变量对其的贡献。我们引入Shapley value来实现这一步骤。Shapley值是一种合作博弈论中的概念,用于衡量合作参与者对某个合作游戏的收益贡献度。它是一种用于分配合作游戏中的总收益给各个参与者的方法,以便公平地衡量每个参与者的贡献。在本研究中,我们使用shapley value的思想来计算每个解释变量对OPD的贡献,我们把计算得到的值记作shapley power of determinants (SPD)。该值具体的计算方法如下:

假设解释变量包括$X_1$,$X_2$,……$X_m$, 共计$|M|$个变量(其中$|M|$表示$M$集合中的变量个数)。$S= \left\{ X_1, X_2, ...X_s \right\}$ $(s<=m)$是$M$中的一个子集。我们的方法可以以“公平”的方式将OPD值分配给每个变量。对于变量i,SPD可由下式计算:

其中,SPD_{x_j}表示变量{x_j}的SPD值。S\in M\setminus\{x_j\}表示集合S属于M的一个子集,但S不包含变量{x_j},而\nu(S)是用于在|S|个变量的相互作用下计算OPD的函数。这个公式可以理解为:SPD_{x_j}是包含变量{x_j}和不包含变量x_j的所有子集的函数\nu(S)之间差异的加权平均。值得注意的是,空集也是这个集合的一部分。在任何子集的组合中,变量x_j的贡献可以通过\nu(S\cup\{x_j\})-\nu(S) 计算。然后,对于每个变量,可以在所有排列中计算这个贡献的平均值。

 图2 LESH的计算流程。(a-c)为计算OPD的过程,(a,b,d,e)为计算SPD的过程。


2  Case study

我们以2000年至2019年青藏高原地区的湿地数据为例,探索与湿地面积时空分布相关的地理变量。青藏高原湿地的空间分布具有中部多,四周少的特点。在时间上,湿地面积的变化可分为两个时期,2000年至2014年,该地区的湿地面积变化不大,为波动期,2015年至2019年,青藏高原地区湿地出现大面积增加,为快速增长期。我们分别分析了两个时期,湿地面积与高程、坡度、温度、降水、NDVI、EVI、蒸发、径流、融雪等变量之间的空间联系。其中,2000年至2014年的湿地数据表征了湿地的空间分布与地理变量的关联,2015至2019年的湿地数据,代表了湿地的时空变化与地理变量之间的关系。

我们使用LESH模型计算了两个变量的交互情况,并且计算了每个变量的贡献。图3展示了两个变量的OPD值,以及两个变量分别的贡献。地形变量与其他变量之间的相互作用对湿地分布的解释力最强(图3),环境和气候变量对湿地分布的解释力次之。在时间格局上,地形变量(如高程、坡度)在2015-2019年期间所占的比例显著低于2000-2014年,而温度变量所占比例显著增加。该结果表明,新增湿地的分布与地形变量之间没有显著的相关性,而与温度相关性较大。

图3. 双变量交互及其贡献比例。

我们还分析了对湿地时空分布解释力度最大的变量组合。图4a表明,坡度、高程、径流、降水四个变量的交互对2000年至2014年的湿地时空分布的解释力的最大,OPD值为0.77,坡度贡献了0.77中的0.41,高程贡献了0.25,径流贡献了0.06,降水贡献了0.04。图4b表明,坡度、高程、EVI、温度、NDVI五个变量的交互对2015年至2019年的湿地时空分布的解释力的最大,OPD值为0.75,坡度贡献了0.75中的0.33,高程贡献了0.29,EVI贡献了0.09,温度和NDVI贡献了0.07。

图4. SPD值(局部解释能力)。


3  结论

识别影响湿地变化的因素对于理解气候变化与湿地保护和管理的关系至关重要。湿地分布与多个变量相关,并且这些变量之间的相互作用是复杂的。在本研究中,我们旨在探索与青藏高原湿地时空变化相关的因素的可解释和定量分析。通过将Shapley value与空间分层异质性模型相结合,我们提出了一个局部解释的分层异质性(LESH)模型,很好地揭示了多个变量相互作用对湿地时空变化的影响。结果显示,地形变量是与青藏高原湿地空间分布最相关的变量,气候变量是2015年至2019年期间青藏高原湿地面积增加最相关的因素。此外,多个变量之间的相互作用强烈影响青藏高原湿地。其中,当其他地理变量与蒸发变量相互作用时,其对湿地分布的解释能力显著增强。对湿地分布决定因素的了解可以帮助我们理解湿地的演变以及气候变化对湿地变化的影响。


Reference:

Song, Y., Wang, J.F., Ge, Y., et al., 2020. An optimal parameters-based geographical detector model enhances geographic characteristics of explanatory variables for spatial heterogeneity analysis: cases with different types of spatial data. GIScience & Remote Sensing. 57(5): 593-610.

Luo, P., Song, Y., Huang, X., Ma, H., et al., 2022. Identifying determinants of spatio-temporal disparities in soil moisture of the Northern Hemisphere using a geographically optimal zones-based heterogeneity model. ISPRS Journal of Photogrammetry and Remote Sensing. 185, 111-128.

扎克
GIS地理空间分析。网址:https://yongzesong.com/cn/
 最新文章