实例背景
假设一家公司的市场部希望研究广告支出(自变量)对产品销售量(因变量)的影响。他们收集了过去10个月的数据,如下表所示:
月份 | 广告支出(千元) | 销售量(千件) |
---|---|---|
1 | 2 | 4 |
2 | 3 | 5 |
3 | 4 | 6 |
4 | 5 | 7 |
5 | 6 | 9 |
6 | 7 | 10 |
7 | 8 | 12 |
8 | 9 | 13 |
9 | 10 | 15 |
10 | 11 | 16 |
步骤一:建立回归模型
首先,我们建立一个简单的线性回归模型:
使用最小二乘法估计回归系数
计算回归系数
计算必要的统计量
计算回归系数
和β 1 β 0
步骤二:回归系数的t检验
我们要检验广告支出
1. 设定假设
原假设
H 0: (广告支出对销售量没有显著影响)β 1 = 0 备择假设
:H 1 (广告支出对销售量有显著影响)β 1 ≠ 0
2. 计算标准误S E ( β 1 )
首先,计算残差平方和(SSE):
月份 | 残差 | 残差平方 | |||
---|---|---|---|---|---|
1 | 2 | 4 | -0.8 + 1.63*2 = 2.46 | 4 - 2.46 = 1.54 | 2.3716 |
2 | 3 | 5 | -0.8 + 1.63*3 = 3.09 | 5 - 3.09 = 1.91 | 3.6481 |
3 | 4 | 6 | -0.8 + 1.63*4 = 4.12 | 6 - 4.12 = 1.88 | 3.5344 |
4 | 5 | 7 | -0.8 + 1.63*5 = 5.15 | 7 - 5.15 = 1.85 | 3.4225 |
5 | 6 | 9 | -0.8 + 1.63*6 = 6.18 | 9 - 6.18 = 2.82 | 7.9524 |
6 | 7 | 10 | -0.8 + 1.63*7 = 7.21 | 10 - 7.21 = 2.79 | 7.7841 |
7 | 8 | 12 | -0.8 + 1.63*8 = 8.24 | 12 - 8.24 = 3.76 | 14.1376 |
8 | 9 | 13 | -0.8 + 1.63*9 = 9.27 | 13 - 9.27 = 3.73 | 13.9129 |
9 | 10 | 15 | -0.8 + 1.63*10 = 10.3 | 15 - 10.3 = 4.7 | 22.09 |
10 | 11 | 16 | -0.8 + 1.63*11 = 11.33 | 16 - 11.33 = 4.67 | 21.8089 |
总和 | 94.9084 |
接下来,计算标准误:
3. 计算t统计量
4. 确定临界值或计算p值
自由度
查t分布表,双侧检验,显著性水平
5. 做出决策
由于
结论:广告支出对销售量有显著的正向影响。
步骤三:整体回归模型的F检验
我们还需要检验整个回归模型是否显著,即所有自变量(在本例中只有一个自变量)是否共同对因变量有显著影响。
1. 设定假设
原假设
:H 0 =0(模型无解释力)β 1 备择假设
:H 1 (模型有解释力)β 1 ≠ 0
2. 计算F统计量
在简单线性回归中,F统计量与t统计量的平方相等:
3. 确定临界值或计算p值
4. 做出决策
由于
结论:整体回归模型显著,说明广告支出对销售量具有显著的解释力。
总结
通过以上步骤,我们可以得出以下结论:
回归系数的t检验表明广告支出对销售量有显著的正向影响。
整体回归模型的F检验进一步验证了模型的显著性,说明广告支出是影响销售量的重要因素