直线回归方程的例子

健康   2024-10-02 16:00   印度尼西亚  

实例背景

假设一家公司的市场部希望研究广告支出(自变量)对产品销售量(因变量)的影响。他们收集了过去10个月的数据,如下表所示:

月份广告支出(千元)XXX销售量(千件)YYY
124
235
346
457
569
6710
7812
8913
91015
101116

步骤一:建立回归模型

首先,我们建立一个简单的线性回归模型:

Y=β0+β1X+ϵ 

使用最小二乘法估计回归系数β0β1

计算回归系数

  1. 计算必要的统计量

n=10

X=2+3+4+5+6+7+8+9+10+11=65

Y=4+5+6+7+9+10+12+13+15+16=97

XY=(2×4)+(3×5)+(4×6)+(5×7)+(6×9)+(7×10)+(8×12)+(9×13)+(10×15)+(11×16)=2×4+3×5++11×16=2×4+3×5+4×6+5×7+6×9+7×10+8×12+9×13+10×15+11×16=8+15+24+35+54+70+96+117+150+176=765

X2=22+32+42+52+62+72+82+92+102+112=4+9+16+25+36+49+64+81+100+121=505

  1. 计算回归系数β 和β0

步骤二:回归系数的t检验

我们要检验广告支出X对销售量Y的影响是否显著,即检验β1是否显著不同于0。

1. 设定假设

  • 原假设H0β1=0(广告支出对销售量没有显著影响)

  • 备择假设H1β10(广告支出对销售量有显著影响)

2. 计算标准误SE(β1)

首先,计算残差平方和(SSE):

月份XXXYYYY^=0.8+1.63X残差YY^残差平方
124-0.8 + 1.63*2 = 2.464 - 2.46 = 1.542.3716
235-0.8 + 1.63*3 = 3.095 - 3.09 = 1.913.6481
346-0.8 + 1.63*4 = 4.126 - 4.12 = 1.883.5344
457-0.8 + 1.63*5 = 5.157 - 5.15 = 1.853.4225
569-0.8 + 1.63*6 = 6.189 - 6.18 = 2.827.9524
6710-0.8 + 1.63*7 = 7.2110 - 7.21 = 2.797.7841
7812-0.8 + 1.63*8 = 8.2412 - 8.24 = 3.7614.1376
8913-0.8 + 1.63*9 = 9.2713 - 9.27 = 3.7313.9129
91015-0.8 + 1.63*10 = 10.315 - 10.3 = 4.722.09
101116-0.8 + 1.63*11 = 11.3316 - 11.33 = 4.6721.8089
总和



94.9084

SSE=94.9084

接下来,计算标准误:

3. 计算t统计量

4. 确定临界值或计算p值

自由度df=n2=8

查t分布表,双侧检验,显著性水平α=0.05,临界值约为t0.025,82.306

5. 做出决策

由于t=4.30>2.306,拒绝原假设H0。

结论:广告支出对销售量有显著的正向影响。

步骤三:整体回归模型的F检验

我们还需要检验整个回归模型是否显著,即所有自变量(在本例中只有一个自变量)是否共同对因变量有显著影响。

1. 设定假设

  • 原假设H0β1=0(模型无解释力)

  • 备择假设H1β10(模型有解释力)

2. 计算F统计量

在简单线性回归中,F统计量与t统计量的平方相等:

3. 确定临界值或计算p值

4. 做出决策

由于F=18.49>5.32,拒绝原假设H0

结论:整体回归模型显著,说明广告支出对销售量具有显著的解释力。

总结

通过以上步骤,我们可以得出以下结论:

  1. 回归系数的t检验表明广告支出对销售量有显著的正向影响。

  2. 整体回归模型的F检验进一步验证了模型的显著性,说明广告支出是影响销售量的重要因素

急危重症规培
急诊医学及重症医学专业住院医师规范化培训管理平台,主旨是让学员在住培期间达到住培要求,提高专业知识素质,提升岗位胜任力。
 最新文章