空间计量小白教程 | 空间概念、权重矩阵、空间计量模型、软件操作等

科技   教育   2024-06-04 11:45   北京  

关注SPSSAU

据分析 简单一点

论文问卷 快人一步

空间计量模型

SPSSAU出品 · 必属精品 · 建议收藏

↓↓↓↓↓↓↓↓

当我们谈论地理学中的回归问题时,我们其实是在尝试理解一个地理现象(比如房价、疾病发病率等)是如何与其他因素(比如收入、教育水平等)相关的。但是,由于我们是在地理空间中讨论这些问题,所以地理位置本身也成为了一个重要的因素。这就是空间计量要研究的内容。

SPSSAU 


一、空间概念


1

空间计量


通常情况下,我们研究X对于Y的影响作用关系,可以使用OLS回归,并且OLS回归时默认认为数据之间具有独立性(即行与行之间具有完整的独立性并不互相影响)。

但当前有的数据并非如此,比如各省GDP之间具有影响作用关系,北京的GDP可以拉动天津的GDP提升,即如果研究的样本是31个省,那么此31个省(样本)之间本身就具有相互影响关系,即样本之间不独立,而且样本之间具有‘空间性’,此则空间计量研究的内容

空间计量是在普通计量基础上加入‘空间性’,此‘空间性’是通过‘空间权重矩阵’进行体现,其表示样本之间的相关关系情况,比如31个省市之间是否具有相邻关系,也或者31个省市之间的物理距离或者经济距离情况等。


2

空间权重矩阵


“空间权重矩阵”类似如下图:

(图1)

比如上图中的空间权重矩阵,其表示中国31个省市之间空间关系,此关系为两两省份之间是否具有相邻性,数字1表示具有相邻关系数字0表示没有。比如北京和天津相邻因而为1,也比如上海和浙江相邻为1。当然里面的数字也可以为小数,小数时很可能就是表示两两间的比如物理距离或者经济距离等。


  • 空间矩阵的特点

①对称性:其一定满足M(i, j)=M(j, i)这一特点,该特点很明显,北京和天津相邻,那么天津和北京也相邻;
②主对角线为0:主对角线表示自己与自己的关系,永远为数字0;
③n*n阶矩阵:比如31个省那就是31*31矩阵,只是第1行为省的名称而已;
④标准化处理:通常需要对空间权重矩阵进行量纲化处理,正常情况下会使用‘按行标准化’处理这一方式。

  • 空间权重矩阵的获取:
许多学术网站和论坛会分享关于空间权重矩阵的研究方法和数据集资源,如全国地级市、区县的空间权重矩阵数据等,用户可自行上网查找。若没有,可以使用SPSSAU【空间权重矩阵构造】,点击查看下方帮助手册:
空间权重矩阵构造帮助手册

二、七大空间计量模型


考虑模型中不同变量的空间滞后性,科学研究中常用的空间计量模型可分为以下七种:空间OLS模型、空间滞后SLM模型、空间误差SEM模型、空间滞后误差SAC模型、空间杜宾SDM模型、空间杜宾误差SDEM模型、自变量空间滞后SLM模型


七种空间计量模型其数学公式及简要说明如下:


(图2)

常用的七种空间计量模型已经知道了,那么我们在研究时,应该如何判断使用哪一种空间计量模型呢?


二、空间计量模型选择


LM检验就是用于判断选择最优空间计量模型的检验方法。空间模型时包括比较关键的四个检验——LM检验和稳健LM检验,并且分别分为LM误差检验和LM滞后检验。


1

LM检验


LM检验用于判断选择最优的空间计量模型,其检验流程图如下:


(图3)

流程图解读:进行空间OLS回归时输出4个LM检验,首先针对LM-error(LM误差检验)和LM-lag(LM滞后检验)进行分析,如果二者均不显著,则应该使用OLS回归即可,如果仅LM-error显著则使用空间误差模型,如果仅LM-lag显著则使用空间滞后模型,如果二者均显著,则需要进一步查看Robust LM检验。大家可结合上面检验流程图进一步判断应该选择空间滞后模型或空间误差模型等。


2

SPSSAU输出LM检验


SPSSAU进行空间OLS回归输出LM检验结果如下:

图4)

根据LM检验选择空间计量模型针对四个LM检验进行分析,首先分析LM-error检验和LM-lag,从上表可知:LM-error检验和LM-lag检验均呈现出显著性,此时需要进一步分析Robust LM-error检验和Robust LM-lag检验,但这二者并没有呈现出显著性;此时可考虑退回LM检验并且结合卡方值大小进行判断,如下:由于LM-error检验对应的卡方值(4.246)< LM-lag检验对应的卡方值(6.595),建议最终使用空间滞后模型,同时也可考虑使用空间滞后误差模型(一般空间模型SAC)。

四、空间计量分析步骤


空间计量分析需要准备分析数据和空间权重矩阵,首先进行空间OLS回归,得到LM检验结果,根据LM检验选择合适的空间计量模型,然后再进行分析。不同的空间计量模型考虑不同变量的空间滞后性,SPSSAU将自动根据模型公式构建滞后变量进行分析。


1

数据准备及软件操作


在使用空间计量相关的方法时,其均需要 ‘分析数据’ 和 ‘空间权重矩阵’ 两份数据,均需要上传到SPSSAU中,并且对 ‘分析数据’ 进行分析时,下拉选择对应的‘空间权重矩阵’ ,软件操作上分为以下3个步骤。

step1:上传‘空间权重矩阵’文档
此处需要注意:上传的数据需要为n*n阶格式,而且第1行为空间点的名称(比如31省市的名称)。类似下图格式:

(图5)
step2:上传‘分析数据’文档
此处需要注意:比如31省市数据,‘空间权重矩阵’ 有着该31个空间点的顺序比如北京-》天津-》河北-》山西-》…,那么‘分析数据’ 的31行数据也需要按此顺序才可以。

step3:针对‘分析数据’进行分析,并且选择‘空间权重矩阵’文档
此处需要注意:进行某空间研究方法时需要下拉选择‘空间权重矩阵’,选择后,SPSSAU会自动判断其是否为‘空间权重矩阵’格式,软件操作如图:

(图6)


2

SPSSAU分析结果


根据上文图4空间OLS模型LM检验汇总可知,应该本案例应该选择空间滞后SLM模型:y = βk * x + ρ * Wy + µ,即考虑因变量Y的空间滞后性,构建因变量空间滞后变量Wy(这一步SPSSAU将自动完成),Wy的实际意义为其他相邻地区的因变量综合值,其作为X纳入到回归模型中,分析意义为当前因变量除了受到自变量X的影响作用外,还受到其它相邻地区因变量的作用关系

在SPSSAU【空间计量】模块,选择“空间滞后SLM”,再次进行分析:

(图7)

  • SPSSAU输出结果:

共输出6个表格,分别是模型基本参数等、空间滞后SLM模型分析结果、空间滞后SLM模型相关检验汇总、信息准则指标结果、空间效应分析和空间滞后SLM模型分析结果-简化格式表格,如下所述(不同空间计量模型输出结果略有不同):

(图8)

由于篇幅限制,在这里不对输出结果进行一一展示说明,感兴趣的同学可以直接使用SPSSAU进行空间计量分析,每一个分析结果下方均提供智能分析与分析建议,可以帮助用户解读分析结果如下图:


(图9


(图10

用户也可以点击查看下方SPSSAU帮助手册进行空间计量模型的学习:

空间OLS回归帮助手册

空间滞后SLM模型帮助手册

空间误差SEM模型
空间滞后误差SAC模型
空间杜宾SDM模型
空间杜宾误差SDEM模型
自变量空间滞后SLM



五、空间面板模型


上面介绍的空间计量七大模型都是针对截面数据的,当数据为面板数据时则稍有不同,面板数据进行空间计量分析时,有以下三个注意点:

  • ①数据格式的整理:包括空间权重矩阵的数据格式和面板数据的数据格式(此处需要为平衡面板数据),以及空间权重矩阵与面板数据的ID匹配;

  • ②面板模型的选择:是固定效应还是随机效应,应该使用Hausman检验进行检验并且得出结论,多数情况下可直接使用面板固定模型即可;

  • ③空间计量模型的选择:应该是面板滞后模型还是面板误差模型,此处SPSSAU默认提供LM检验得出结果。关于LM检验的判断逻辑如下图所示:


(图11

SPSSAU空间面板模型操作如下图:


(图12

完整版分析可以点击下方文字查看空间面板模型帮助手册:

空间面板模型帮助手册






以上就是今天的全部内容啦~

若您想看其他干货内容

请在评论区告诉SPSSAU







数据分析救命神器

让你的数据处理

非常简单!


点击下方  跳转至SPSSAU官方账号





SPSSAU

数据科学分析平台

www.spssau.com



SPSSAU
SPSSAU官网: https://spssau.com
 最新文章