它表明自变量和因变量之间的显著关系
它表明多个自变量对一个因变量的影响强度
要点:
自变量与因变量之间必须有线性关系
多元回归存在多重共线性,自相关性和异方差性
线性回归对异常值非常敏感。它会严重影响回归线,最终影响预测值
要点:
它广泛的用于分类问题。
逻辑回归不要求自变量和因变量是线性关系。它可以处理各种类型的关系,因为它对预测的相对风险指数OR使用了一个非线性的log转换。
如果因变量的值是定序变量,则称它为序逻辑回归
如果因变量是多类的话,则称它为多元逻辑回归
重点: 虽然会有一个诱导可以拟合一个高次多项式并得到较低的错误,但这可能会导致过拟合。你需要经常画出关系图来查看拟合情况,并且专注于保证拟合合理,既没有过拟合又没有欠拟合。
标准逐步回归法做两件事情。即增加和删除每个步骤所需的预测。
向前选择法从模型中最显著的预测开始,然后为每一步添加变量。
向后剔除法与模型的所有预测同时开始,然后在每一步消除最小显着性的变量。
要点: 除常数项以外,这种回归的假设与最小二乘回归类似;它收缩了相关系数的值,但没有达到零,这表明它没有特征选择功能,这是一个正则化方法,并且使用的是L2正则化。
要点:
除常数项以外,这种回归的假设与最小二乘回归类似
它收缩系数接近零(等于零),确实有助于特征选择
这是一个正则化方法,使用的是L1正则化
要点:
在高度相关变量的情况下,它会产生群体效应
选择变量的数目没有限制
它可以承受双重收缩
扫描/识别下方二维码后
回复【1102】即可领取
17张统计学高清思维导图
爱数据精选统计学学习资料大全