残差的定义
残差(Residual)就是指观测值与其相应拟合值之间的差(见图1,图2)。残差(或误差)由ei确定 。最适合的直线即是残差平方和最小的那条线。残差有如下特征:1)平均值等于0;2)正态分布的;3)应随机分布。
图1 图2
残差图的作用
残差图用于检查模型的拟合优度,确认模型的适合性。
残差图的使用时机
在使用方差分析(ANOVA)、回归分析(Regression)、试验设计(DOE)的时候,都要用到此分析。
残差图的解读
残差值在回归和方差等分析过程中特别有用,因为残差值表示模型能在多大程度上解释观测数据中的变异。它是检查回归及方差分析模型“优劣”的诊断工具。Minitab 提供的残差图有“单独示图”选项,也有“四合一”图形的选项。“四合一”的参见图3,由4部分图形构成:
残差的正态概率图。此图用于残差的正态性检验。如果残差呈正态分布,则此图中的点一般应该形成一条直线。如果图中的点不能形成一条直线,则正态性假设可能不成立。一般数据点占据了对角线,则数据是正态分布的;也可以采用“粗铅检测”做直观判定。在此图中的正态性产生怀疑,则需要对残差数据进行正态性检验(见图4)。
图4
残差与拟合值。此图应显示残差在0两侧的随机模式。此图横轴代表预测值,纵轴代表残差值。因此此图上的点应该分布在一条水平的带子中。若图中有明显的“喇叭口”或弯曲的形状,则表示残差的标准差不是常数,而是随着预测值而变化。这就提示原来的模型假设可能有问题。如果某个点远离大多数点,则该点可能是异常值。残差图中也不应该有任何可识别的模式。
残差的直方图。一种显示残差的一般特征(包括典型值、展开和形状)的研究性工具。一侧的长尾可能表示偏斜分布。如果有一个或两个条形与其他条形距离较远,这些点有可能是异常值。残差应服从正态分布,此图同正态概率图功能类似,均可以对其进行正态性检验。
残差与数据顺序。这是一个所有残差以收集数据的顺序排列的图,可以用于找出非随机误差,特别是与时间相关的效应。此图横轴代表观测值顺序,纵轴代表对应的残差值。这些残差值应在横轴(即残差为0)上下随机波动,不应有任何上升、下降、摆动、跳跃等趋势。若有某种趋势存在,则说明数据观测过程中受到某个未知因素的影响,则应该找出此因素并加以控制。此图有助于检查残差彼此不相关这一假设。
因此,通过以上图3,图4残差图及正态检验判读,可以得出残差模型是“不适配”的结论。图5输出的残差四合一图是正常的情形。
图5
残差异常形态及改进
残差的存在的形态可能指出所选择的模型不适配。如果形态较明显,单变量线性模型可能不是所具有的数据的最佳拟合,或者说,还有其它的关键“ X”。
异常形态举例:
-曲线(起点低,逐渐上升,然后下降);
-随数据收集的时间变化;
图6
-不等变差(一般情况下,值越大,变差越大);
图7
-一个或两个极端值。
图8
改进不良拟合(模型不适配)的方法
针对回归模型出现的特征,可参考下表图9,经过相关工具评估验证后,并采取推荐的解决方案去优化改进。
图9
如果确定模型不满足上面所列标准,就应该:进行检查以确定数据输入是否正确或数据太少等,特别是观测值是否标识为异常。如果残差适度的偏离正态性,不需要过多的关注。尽管如此,我们总是习惯去检查残差,因为它能让我们更好的了解数据。
言质有锂知识星球本周更新动态:
知识星球-质量云第15季精选代表性干货资料共计10份,包含质量、六西格玛、管理体系以及国内外知名企业质量管理课件等资料,干货多多。本期内容具体详细清单如下:
知识星球-新质能源智库第82季共上传了包含质量、六西格玛、管理体系、锂电及材料、储能、固态电池、钠电、行业研究报告以及国内外知名企业质量管理课件等共计12份资料,干货多多。本期内容具体详细清单如下:
欢迎大家搜索查阅及学习。我们会不定期上传及分享更多的、前瞻性的质量及新能源领域专业资讯及资料(注:不少是可编辑性文档)。同时,我们也会参考依据大家及众多粉丝朋友的需求,会重点分享热点及大家普遍关心的内容。所有成功加入星球会员的朋友可以申请加入专属微信群(注: 锂电群或非锂电群质量群,二选一)。让我们在知识星球相聚,一起学习加油并共同成长!
言质有锂,您身边的学习好帮手!若公众号免费的、海量资讯还满足不了爱学习及上进的你,那么可以考虑并关注以下知识星球。知识星球-新质能源智库已收集了质量管理的及新能源(含锂电池及材料、钠离子电池、固态电池、光伏电池、储能电池及系统、新能源行业分析及研究报告、以及各类材料和电池标准等)等干货资料1400+。相关内容还在持续更新中;专业质量领域知识星球-质量云也正式起航了,资料信息持续更新中,已收集了质量类的干货资料(含国内外先进及系统化的质量理论、方法和工具、管理体系、六西格玛、标杆企业及优秀企业案例等)150+。欢迎大家的加入!
往期精彩内容推荐
一文搞懂最新六大工具(APQP、FMEA、MSA、SPC、PPAP、CP)。附思维导图!
干货|六西格玛工具之回归分析(基于Minitab操作案例讲解)。赶紧get!
干货|残差(Residual)在方差分析(ANOVA)、回归(Regression)分析及实验设计(DOE)中的判读及异常对策
质量管理五大核心工具(APQP/FMEA/MSA/SPC/PPAP))的应用
六西格玛工具之直方图理论及Minitab案例分析详解。赶紧get!!
计数型MSA-Kappa技术的应用(Minitab案例分析详解),请收藏!
干货|六西格方法和工具在项目D(定义)阶段实施中的运用。请收藏!
六西格改善方法论和工具在项目实施中的运用案例分享-测量(M )阶段
六西格改善方法论和工具在项目实施中的运用案例分享-分析(A )阶段
六西格改善方法论和工具在项目实施中的运用案例分享-改善(I )阶段