什么是数据的中心化处理?一定要进行中心化处理吗?(附SPSS具体步骤)

教育   2025-02-03 20:30   黑龙江  

转自SPSS学堂

作者:王梓欣 香港理工大学应用心理学硕士




在上一篇推文《运用分层回归探究调节效应》中,我们介绍了当自变量x和调节变量m其中有一个变量是定量变量时,我们就可以利用分层回归来检验调节作用。

那么当全部变量是定量变量时,需要对数据进行中心化处理后方可录入变量,分析调节作用。那么——

什么是数据的中心化处理?
一定要进行中心化处理吗?
如何进行中心化处理?
本次,我们将利用摘自《多元线性回归观点》(Multiple Linear Regression Viewpoints)的《调节效应:中心化,方差膨胀因子,以及解读》(Interaction effects: centering, variance inflation factor, and interpretation issues)一文,回答上述三个问题。让我们一起来揭开数据中心化的神秘面纱吧!
1

什么是数据中心化处理?


 数据中心化是指将每一个分数减去它的平均数,得到中心化后的数据(centered score)。一般来说,研究调节作用需要输入的预测变量有交互项(XZ)以及各个变量(X和Z)。然而由于交互项直接来自于变量的乘积,预测变量的协方差(covariance)会变得很大。Robinson和Schumacker指出,数据中心化是保证正确解释交互作用的重要步骤。

2


一定要中心化处理吗?

变量全部是定量变量时,数据中心化是一个必不可少的过程。原因是未中心化数据使得多重共线性(multicolinearity)增大,会导致一些变量对于回归模型的贡献减少甚至消失。换言之,由于预测变量之间互相覆盖交错,我们很难判断预测变量(X,Z以及XZ)对于因变量(Y)究竟有多大的影响。

Robinson和Schumacker利用方差膨胀因子(variance inflation factor, VIF)这一指标,直观地向我们展示了中心化和未中心化的数据在多重共线性上的差异。

【注:方差膨胀因子(variance inflation factor):指解释变量之间存在多重共线性时的方差与不存在多重共线性时的方差之比,是容忍度的倒数。VIF越大,共线性越严重。一般来说,当0<VIF<10,不存在多重共线性;当10≤VIF<100,存在较强的多重共线性;当VIF≥100,存在严重多重共线性】
如表1显示,作者分别用未中心化的回归模型(uncentered regression model)和中心化的回归模型(centered regression model)分析了学术希望(Academic Hope)和种族对平均成绩预测作用(Ethnicity Predicting Grade Point Average)之间的交互作用,发现未中心化数据的方差膨胀因子(VIF=39.198)明显高于中心化后的数据(VIF=1.653)

由此可知,对于定量变量的交互作用分析,数据中心化不可或缺。

3


如何进行数据中心化处理?


由前文知,分数减去平均数可得中心化后的数据,但是当我们拥有多个变量时,操作起来就显得有些繁琐。今天我们向大家分享一个简单快捷的方法:利用spss中的语法编辑器(Syntax Editor)进行数据中心化处理。以下是详细步骤:

01

原始数据:“年龄”,“兴趣”,“疾病症状”三个变量



02


打开语法编辑器:文件>新建>语法



03


编辑:粘贴文本于编辑器>全选文本>运行(如图)




COMPUTE group=1.
EXECUTE.

AGGREGATE
  /OUTFILE=* MODE=ADDVARIABLES
  /BREAK=group
  /兴趣_mean=MEAN(兴趣)

COMPUTE c兴趣=兴趣 - 兴趣_mean.
VARIABLE LABELS  c兴趣 '兴趣(centered)'.
EXECUTE.  


【注:可将 兴趣 替换为其他任意变量,并进行中心化处理】

04


中心化后的数据




 红框内数据,我们只需要保留最后一列“c兴趣”。“group”以及“兴趣_mean”不会在后续分析中用到,删除即可。

另外,如果需要重新对该变量进行中心化处理,请将红框内的三列数据清除后再次运行语法(见步骤3) 

本次分享就到这里,后续我们还会推出定量变量交互作用的实例解析,请多多关注之后的内容~ 

Reference:
Robinson, C., & Schumacker, R. E. (2009). Interaction effects: centering, variance inflation factor, and interpretation issues. Multiple Linear Regression Viewpoints, 35(1), 6-11.

量化研究方法
以量化之思想认识世界,体会量化之美。
 最新文章