正态分布检验是进行连续型数据比如T检验、方差分析、相关分析以及线性回归等比较分析的前提,均要求数据服从正态分布或近似分布。数据正态分析主要有非参数检验法、偏度和峰度判断法、图形法三种检验方法。下面开始实操:
1.非参数检验法实操步骤:
进行正态性检验是一种非参数检验方法,其原假设是“样本所来自的总体与正态分布无显著性差异”,只有当P>0.05时才能够接受原假设,从而认为数据符合正态分布的特征。一般常见的正态性检验包括柯尔莫戈洛夫-斯米诺夫检验(K-S检验)和夏皮-威尔克检验(S-W检验),其中K-S检验适用于大样本量数据(SPSS规定样本量>5000),而S-W检验适用于小样本量数据(SPSS规定样本量<5000)。当正态性检验结果的P<0.05时,通常认为数据不符合正态分布。
实操步骤:
第一步
第二步
第三步
最后就可以出结果了
2.偏度和峰度判断法
峰度(K)是用于判定数据分布的陡缓程度;偏度(S)主要用于判定数据的对称性,整体数据偏左还是偏右。当k≈0,S≈0时,说明数据是服从正态分布的。实际上,数据很难能满足S≈0,K≈0,因此,可采用K系数与S系数来检验,检验公式如下:
偏度系数和峰度系数的绝对值满足小于1.96的正态分布条件,就可以认为样本数据符合正态分布。
操作步骤:
第一步
第二步
3.图形法
图形法主要通过直方图、Q-Q图、P-P图来判断数据的正态分布情况:
(1)直方图
样本数据呈现正态分布的直方图形状一般为“倒钟型”,即数据样本量呈现“中间多、两边少、左右对称”的特征,如上图所示,训练自觉性的样本量呈现形状并不能很好的贴合正态分布曲线,故认为训练自觉性的正态直方图并不能反映其数据分布的正态性;
操作步骤:
第一步
第二步
最后就可以出结果了
(2)正态Q-Q图
Q-Q图反映了变量的实际分布与理论正态分布的符合程度,可以用来考察数据是否服从某种分布类型。若数据服从正态分布,则数据点应与理论直线基本重合。如图所示,训练自觉性一部分位点偏离了直线,说明该连续数据并不能很好地服从正态分布。
操作步骤:
(3)P-P图
P-P图反映了变量的实际累积概率与理论累积概率的符合程度,可以用来考察数据是否服从某种分布类型。如图5.8所示,训练自觉性一部分位点偏离了直线,说明该连续数据并不能很好地服从正态分布。
操作步骤:
点个关注吧