《IJGIS》发文提出一种“异质的空间自相关模型”HSA Model 解决空间自相关性的异质性问题

文摘 2024-11-22 21:18 安徽

澳大利亚科廷大学张泽华博士、美国佛罗里达州立大学李子奇、科廷大学宋泳泽在国际一区期刊 International Journal of Geographical Information Science (IJGIS) 发表论文 “On ignoring the heterogeneity in spatial autocorrelation: consequences and solutions” 《论空间自相关性的异质性》。论文提出了“异质的空间自相关模型” Heterogeneous Spatial Autocorrelation (HSA) Model 解决空间自相关性的异质性问题。

张泽华：https://sites.google.com/view/zehua-zhang/home

李子奇：https://sites.google.com/view/ziqi-li/home

宋泳泽：https://yongzesong.com/

文章提出在空间自回归过程（spatial autoregressive process）中空间自相关性存在的异质性，并提出 ”异质的空间自相关模型” 经过蒙塔卡罗模拟，应用在交通地理的案例中。本文对先前的空间自回归模型做出了异质性假设的补充，可替代传统空间滞后模型进行应用。各个地理单元具有统计显著的不同的自相关强度，可以为空间规划提供更多信息。

摘要

空间自回归（SAR）模型通常用于显式地考虑地理现象背后的空间依赖性。然而，传统的SAR模型是使用单一SAR系数进行设定的，这意味着假定空间依赖性在空间上是恒定的。这一假设过于简化了真实空间自回归过程在强度上存在变异的情况，忽略异质性自相关的后果尚需讨论。本研究通过扩展空间滞后模型（SLM），提出了一种异质性空间自相关模型。新模型包括变点检测，用于识别空间自相关强度变化的模式，使用SAR系数矩阵来表示异质性空间自相关，并通过最大似然估计确定多个SAR系数。蒙特卡洛模拟显示，所提出的方法在建模具有异质性自相关模式的SAR过程时效果显著，而传统SLM在未考虑异质性自相关结构时会导致回归系数的不确定性膨胀。我们进一步将新方法应用于澳大利亚大珀斯地区交通事故的实证分析。异质性空间自相关模型将模型的均方根误差（RMSE）减少了42%（相比传统SLM）。从模拟和实证研究的结果表明，SAR过程及相关应用中应考虑空间自相关强度的空间变异性。

Spatial autoregressive (SAR) models are often used to explicitly account for the spatial dependence underlying geographic phenomena. However, traditional SAR models are specified using a single SAR coefficient, assuming constant spatial dependence over space. This assumption oversimplifies the situation where the true spatial autoregressive process varies in strength; the consequences of ignoring heterogeneous autocorrelation remain to be discussed. This study proposes a heterogeneous spatial autocorrelation model by extending the spatial lag model (SLM). The new model includes change point detection for identifying patterns of spatially varying autocorrelation strengths, a SAR coefficient matrix for representing heterogeneous spatial autocorrelation, and maximum likelihood estimation for determining multiple SAR coefficients. Monte Carlo simulations demonstrate that the proposed method is effective in modeling SAR processes with heterogeneous autocorrelation patterns, while traditional SLM inflates uncertainties in the regression coefficients when a heterogeneous autocorrelation structure is not accounted for. We further applied the new method to an empirical analysis of traffic crashes in the Greater Perth Area, Australia. The heterogeneous spatial autocorrelation model reduces model RMSE by 42% (compared with traditional SLM). Results from both simulation and empirical studies indicate that spatially varying autocorrelation strengths should be considered for SAR processes and relevant applications.

引言

空间依赖性是指空间上观测值之间的相互依赖现象，其程度通常通过空间自相关来衡量（Anselin 1988, 2010）。空间自回归（SAR）模型常用于明确考虑空间依赖性，其模型中的空间影响潜藏于地理现象之下（Fischer and Wang 2011）。SAR模型类别包括一系列修正后的模型规范，如空间滞后模型（SLM）、空间误差模型（SEM）和空间Durbin模型，这些模型带有地理邻近性的额外空间滞后效应（Fotheringham 2009, Anselin et al. 2010）。SAR模型中的空间滞后效应通过SAR系数矩阵、定义位置间空间连接性的空间权重矩阵，以及空间变量值的矩阵乘积来表示（Anselin and Griffith 1988, Anselin and Rey 2010）。SAR模型的发展在空间计量经济学中具有重要意义（Baltagi et al. 2007, Arbia and Baltagi 2009），其应用领域扩展到需要解读地理信息的各种研究领域。这些领域包括但不限于交通规划（Rhee et al. 2016）、城市分析（Gao et al. 2020）、社会科学（Lambert et al. 2010）和环境建模（Yin et al. 2018）。

传统的SAR模型假设空间自相关的强度和方向在地理空间内是均质的，因为它们使用单一的SAR系数值进行估计（Harris 2019）。然而，这一假设忽略了空间自相关强度的变异性，在这种情况下，应估计多个自回归系数以反映这种复杂性并避免潜在的模型误设。近年来，在这方面取得了一些进展，研究者们尝试使用地理加权回归（GWR）重新估计空间自相关强度及其空间变异性（Brunsdon et al. 1998, Geniaux and Martinetti 2018）。

空间自相关的非平稳性通常可以通过两类空间过程建模，包括基于二阶方差的模型和SAR模型。尽管对空间建模中非平稳性空间自相关效应的讨论已有广泛探索，但主要是通过二阶方差方法（Fouedjio 2016）。在这些克里金模型中，空间依赖结构或空间自相关的理解通常通过半变异函数或空间协方差来表示（Goovaerts 1997）。空间自相关的非平稳性反映了二阶方差效应的特征，需要仔细考虑以避免误识别一阶趋势效应（Schabenberger and Gotway 2005）。在较大或复杂的研究域中，空间依赖结构可能仅在局部区域内保持平稳性，而从全球视角来看则表现出非平稳性（Sampson et al. 2001）。为了更准确地建模非平稳性空间依赖性，提出了一系列技术，包括分割（Stein et al. 1988）、移动窗口（Haas 1990）、基于核的模型（Fuentes 2001, Harris et al. 2010）、基函数（Holland et al. 1999）和卷积方法（Higdon 1998, Higdon et al. 1999, Paciorek and Schervish 2006）等（Lindgren et al. 2011）。

然而，非平稳性空间依赖性在SAR模型或基于空间权重矩阵的指标中的影响仍未得到充分研究。LISA或SAR模型中的空间滞后项所反映的空间自相关变异性，受地理邻近值的强烈影响（Anselin 1988, 1995）。对每个地理单元的空间自相关强度尚未得到充分考虑。因此，有必要进一步研究在SAR框架内全面理解和建模这些效应。

在SAR过程中，空间自相关的非平稳性最初通过空间变异的自回归模型进行探索和量化，其中SAR系数使用地理加权方法重新估计（Brunsdon et al. 1998）。尽管对模型假设的讨论以及分析空间自相关强度变异性必要性的探讨较少，空间变异的自回归模型证明了地理加权方法在量化SAR系数变异性方面的可行性。随着对SAR过程的进一步探索，一种涉及非平稳性空间自相关强度的新型空间数据生成过程，即混合GWR-SAR被提出（Geniaux and Martinetti 2018）。然而，关于忽略异质性空间自相关的后果的最终结论，尚未清晰地提出以证明考虑SAR过程中的非平稳性空间自相关强度的必要性。此外，MGWR-SAR如何通过空间自相关强度的变异性来提供信息性决策建议，或讨论其与地理邻近性或特征交互的关联性，也未在研究中呈现。在最新使用地理加权方法的SAR模型研究中（Mei and Chen 2022），仍然存在忽略异质性空间自相关及其空间决策潜力的知识空白。

表1总结了两类空间过程的空间依赖性的表示方法，以及反映非平稳性空间依赖性的相应技术。基于二阶方差的空间模型在非平稳性空间依赖性方面的研究进展相对成熟，而SAR模型目前主要依赖地理加权方法来展示非平稳性空间自相关强度。先前基于地理加权的SAR过程假设空间自相关的连续变异性。相反，我们通过残差分析解决了异质性空间自相关的问题。我们的异质性空间自相关模型是Anselin（1988）提出的传统SAR模型的扩展，并假设空间自相关强度的变异性可以被分层或分类。

本研究旨在探讨异质性空间自相关强度的影响，并通过模拟研究和交通地理的实证空间分析来开发捕捉这一空间非平稳性特征的方法。在本研究中，我们设计了一系列蒙特卡洛模拟，以展示（1）在传统空间滞后模型（SLM）中忽略异质性空间自相关的后果，以及（2）我们提出的方法捕捉异质性自相关模式的能力。随后，我们将新方法应用于澳大利亚大珀斯地区交通事故的实证分析。本文的结构安排如下：第2部分介绍我们开发的处理异质性空间自相关模式的方法。第3部分通过一系列蒙特卡洛模拟展示忽略异质性空间自相关在传统SLM中的后果以及我们模型的能力。第4部分展示我们调整后的SLM在交通事故研究中的应用结果，接着第5部分和第6部分分别进行讨论和总结。

模型介绍

异质的空间自相关模型Heterogeneous Spatial Autocorrelation Model以空间滞后模型（spatial lag model）为例，并对其进行拓展。该模型主要由两部分计算构成：（1）通过分析spatial lag model的残差来识别异质的空间自相关的空间结构；（2）将空间自回归系数转换成空间自回归系数矩阵，结合（1）种识别的空间结构来表达异质性，然后通过最大似然估计来得到变量的回归系数，以及每个分区下的空间自回归系数（自相关强弱）。

具体来说，对于（1）：如果一个具有异质性的空间自回归过程用传统空间滞后模型来模拟，原本的空间自相关强的地理单元会残留更大的误差（可以理解为：数据生成过程中从周围吸收了更多空间效应），通过这一特性，分析Y变量和残差的关系，用稳健地理探测器的变化点检测就可以对全局进行分类。

（2）原本空间滞后模型的空间自回归系数其实可以等价转换成一个对角矩阵（每个对角元都是rho，其余元素等于0）的表达，结合变化点检测的分类的信息，就可以根据不同分类区域对应的拆开空间自回归系数的对角矩阵（比如分类1就得到一个“子对角矩阵”，只有分类1对应的对角元有取值，或有效的spatial lag value，其余元素等于0 ），最后用最大似然估计得到系数（本文用R语言nlminb方法）。这个方法会消耗额外的自由度来估计空间自相关系数，所以，建议分类数量少（分类数量可以根据需要自己定义），保证统计显著性。

结论

在各个研究领域中，假设空间自相关均质性的SAR模型仍然广泛用于SAR过程的建模。然而，当空间自相关强度存在变异时，传统SAR模型在估计自变量的beta值和SAR系数时会存在不可靠性或不确定性。本研究对异质性空间自相关对传统SAR模型的影响进行了初步调查，并提出了通过残差分析提取代表空间自相关强度变异的地理结构的策略，同时提出了一个带有广义SAR系数矩阵的调整版SLM，用于重新估计SAR过程。

蒙特卡洛模拟研究表明，调整后的SLM在识别出异质性空间自相关模式后，能够精确地重新估计SAR过程。我们的方法在识别具有施加和接收溢出效应变异的地理结构方面表现出特别的鲁棒性。与传统SLM相比，在交通地理的实际案例研究中，我们的调整版SLM具有更好的拟合度。然而，调整版SLM的表现很大程度上依赖于对异质性空间自相关模式的识别。因此，未来的研究工作需要寻找更好的方法来识别空间自相关强度的变异，尤其是在面对更复杂的情境时，这些方法应能适用于更多SAR系数显著不同的群体。

SAR models with a homogeneous assumption of spatial autocorrelation remain prevalent in the modeling of SAR processes in various research fields. However, traditional SAR models estimate the beta values of independent variables and SAR coefficients with unreliability or uncertainty when there are variations in the strength of spatial autocorrelation. This study conducted a pilot investigation of the impact of heterogeneous spatial autocorrelation on traditional SAR models and proposed strategies to extract geographical structures representing the variation in spatial autocorrelation strength through residual analysis, together with an adjusted SLM with a generalized SAR coefficient matrix to re-estimate the SAR processes.

A Monte Carlo simulation study showed that the adjusted SLM can precisely re-estimate SAR processes after the identification of heterogeneous spatial autocorrelation patterns. Our methods are particularly robust in recognizing geographical structures with variations in imposing and receiving spillover effects. Our adjusted SLM also has a better goodness of fit than the traditional SLM, given a real-world case study on transport geography. The performance of our adjusted SLM relies largely on the identification of heterogeneous spatial autocorrelation patterns. Thus, future research efforts are required to find better approaches to identify the variation in spatial autocorrelation strength with suitability for more complicated cases where more groups of SAR coefficients are significantly different.

重要图表

欢迎交流

http://mp.weixin.qq.com/s?__biz=MzIyMTE1MzMwOA==&mid=2247498777&idx=3&sn=0612288d76aec2b0d5e4f712cf406dde

GISer last

GISer last 公众号主要以分享互联网数据资源为主。也分享过GIS、FME等技术教程方法。我个人对于大数据资源、可视化制作、地图制图等方面有很大兴趣，也会分享个人的一些应用和教程。

最新文章

陈明星｜流空间视角下中国城市体系空间结构

地理流：城市功能量化的新视角

佳文推荐 | 地理流的空间模式：概念与分类

裴韬研究员：构建地理流空间分析的理论

【文献学习】SSH+GSHAP+GWR：顾及空间分层异质性的可解释空间插值方法

【论文学习】GTWR+MGWR：城市景观格局对生境质量的时空驱动机制研究

【论文精选】时空异质性+SBM模型+四象限模型，新型城镇化如何提升中国绿色发展效率？

成果速递|使用机器学习和街景图像评估绿色空间暴露对心理压力感知的非线性影响

福大遥感所新增1篇ESI前1%高引论文

【论文学习】MGWR + XGBoost + SHAP：建筑环境视角下共享单车与地铁连接的空间异质性与非线性研究

论文解读 |【KDD 2024】基于动态参数共享多智能体强化学习的城市时空资源调度优化

香港大学地理系-环境遥感/生态模拟方向招聘博士后和博士

【机器学习】Sustainable Cities and Society：应用多种机器学习模型识别城市活力因素并考察其空间依赖性

城市多灾种地质灾害综合评价——利用可解释机器学习模型的新方法

Ecological Indicators│基于可解释机器学习和Sentinel-2影像的内陆干旱-东部沿海土壤盐渍化反演模型

地理类SSCI期刊（Q1&Q2）最新资讯（截至2024年11月13日）

《IJGIS》：解锁空间过程的新视角：可视化分析助力地理模型解释

《IJGIS》发文提出一种“异质的空间自相关模型”HSA Model 解决空间自相关性的异质性问题

《IJGIS》：一种新颖的混合分层聚合算法（HeLP）

Annals of AAG|王劲峰研究员发表地理探测器相关最新研究：空间分层异构数据的统计建模

论文推送 | 《基于深度强化学习的便利店地理空间位置优化分析》被ACM SIGSPATIAL2024成功接收并应邀做报告发言

【阅读分享】空间数据分析：模型、方法与技术

成果速递丨硕士毕业生李万隆以第一作者在《地理学报》发文：京津冀和长三角城市群建设用地分配研究

南京内城日夜间单身、青年、高低消费及有车群体的空间分布格局——基于手机用户画像数据与地理位置信息

“广义对称”视角下上海夜间经济集聚中心识别方法与空间分异机理

理论研究 | 成渝城市群生态用地演变特征及影响因素研究

基于TD-GNNWR的武汉市房价因子空间非平稳性研究

陈小亮等：基于机器学习方法的一线城市房价影响因素研究

【文章导读】北京市住宅租金影响因素空间分异研究

基于多尺度地理加权回归模型的城市住宅价格影响因素空间异质性——以桂林市主城区为例

中国市域数字经济创新空间格局演化及其驱动机制（沈体雁等）

【文章导读】城市创新空间的集聚特征及影响因素研究——以南京主城为例

邹炀等丨城市群空间结构与城市创新能力——基于中国十大国家级城市群的经验证据

【规划师论坛】大城市经济适用型养老设施配置模式研究——以武汉市主城区为例

研究成果 | 机构养老服务设施空间多目标优化研究：以上海市为例

经典回顾 |【研究篇】广州天河区老年服务设施配置公平绩效及空间优化研究

研究趋势 | 基于POI数据的15分钟生活圈空间测度评价研究——以长春市朝阳区为例

继续，2020年村庄/社区七普数据，这是目前为止我搜集到的最优质的公开的七普数据了。

【文献速递】中国初级医疗机构空间可及性和不平等性研究

20分钟掌握基于dpethmap的空间句法快速分析

中国PM2.5暴露的多尺度时空变化趋势及差异

中国华东地区PM2.5浓度时空变化及与景观格局关联研究

全球高空污染物（GHAP）PM2.5 浓度（2017-2022）

王开泳，冯润东：行政区划调整对政区位势的影响与定量化测度

【政区地理】清代县级行政区划调整的时空变动与演化机理

【地理科学】多维尺度重构视角下“双城合并”的过程与机制——以济南莱芜行政区划调整为例

文献研读 | 区域增长 | 中国行政区划调整对城市扩张的时空影响

北部湾城市群洪涝灾害韧性时空演变及影响因素分析

国家生态保护修复公报

【转载】ggmapcn | 一款绘制中国标准地图的R包

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉