在SPSS中如何判断是否存在多重线性回归方差不齐?
学术
科学
2024-10-10 07:32
陕西
数据小兵介绍:统计学/数据分析博主,主要从事统计学方法、统计软件、科研数据分析问题咨询、答疑指导、课程开发,最新合著出版畅销图书《SPSSAU科研数据分析方法与应用》。我的线性回归满足等方差要求吗?怎么看回归残差是不是异方差呢?线性回归有诸多假设条件,对于残差来说,要求符合正态性、等方差性、无自相关,因此残差诊断分析成为线性回归中必不可少一个环节。利用残差散点图来判断检验以上残差问题是常用,直观,而且简单有效的方法。具体来说,残差图是指以某种残差为纵坐标,以其他适宜的变量为横坐标的散点图,所以残差图、残差散点图都是一个概念。这里横坐标有多种选择,最常见的选择是:1.因变量的拟合值;2. 某自变量的观察值等。那怎么看残差图呢?能看出什么吗?我的经验是,利用反证法、倒推的方法来看。咱们先明确一下完全满足线性回归假设条件的情况下,残差图应该什么样子的,把这个特征作为标准,然后自己做残差图出来,只要发现它的分布特征和标准特征有偏离有不同,那么就可以粗暴认为残差诊断存在问题。一般统计教材关于线性拟合完美残差图的描述大概是这样子的:好,这些特征就是金标准了,我们可以简单粗暴的,把与此金标准有较大偏差的残差图,都认为是或多或少存在问题的即可。上面两个图形中,只有第一个(a)图为等方差分布特征,其他均有不同程度的异方差问题。
以当前薪金为Y,起始薪金为X,拟合简单线性回归模型。虽然我一直说SPSS是最好的统计软件,但我看到左侧的可用变量框里面有DEPENDNT、ZPRED、ZRESID、DRESID、ADJPRED等7个变量时还是有点懵,软件给的越多,越是会给使用者造成更多的困扰,7个变量可用于残差图,我到底选择哪两个作为横轴和纵轴呢?我建议使用(标准化残差)ZRESID为Y轴,(标准化预测值)ZPRED为X轴制作标准化残差图。或者保存标准化残差变量,然后与自变量X构成残差图。我在软件输出的原始图基础上描了两个红箭头,总体来看残差点的分布并不是随机均匀分散的,疏密对比明显,而且总体上呈现出一个【大喇叭】的形状,且有部分点在正负3外,这显然与【金标准】图形特征是有明显区别的。所以简单粗糙地认为本次线性回归拟合并未完全满足使用条件,存在异方差和其他拟合不足的问题。
小结:残差散点图法是辅助型的,观察型的,在宽松的研判前提下可以开心使用。
《SPSS统计教程》全套视频最新调价:原价319,现只需要139元。特别提示:取消一对一答疑啦,有问题读者群提问解决。具体看下面这个调价通知: