简单线性回归模型(Simple Linear Regression)是一种统计方法,用于研究两个连续变量之间的线性关系。具体来说,它通过拟合一条直线来描述一个自变量(独立变量)如何预测一个因变量(依赖变量)。模型的基本形式为:
Y:因变量
X:自变量
模型假设
简单线性回归模型建立在以下几个基本假设之上:
线性关系:自变量与因变量之间存在线性关系。
误差项独立性:误差项之间相互独立。
同方差性:误差项的方差恒定。
正态分布:误差项服从正态分布。
自变量无多重共线性(在简单线性回归中仅涉及一个自变量,此假设自动满足)。
举例说明
例子1:房屋面积与价格的关系
背景:房地产开发商希望了解房屋的面积(平方米)如何影响房屋的售价(万元)。
模型设定:
自变量
:房屋面积(平方米)X 因变量 Y:房屋售价(万元)
假设数据:
房屋面积(X) | 售价(Y) |
---|---|
50 | 150 |
60 | 180 |
70 | 210 |
80 | 240 |
90 | 270 |
回归分析:
通过简单线性回归分析,可能得到以下回归方程:
解释:
截距
:当房屋面积为0平方米时,预计售价为30万元(实际意义可能需要结合具体情况解读)。β 0 = 30 斜率
:房屋面积每增加1平方米,售价预计增加3万元。β 1 = 3
应用:如果一个新的房屋面积为75平方米,预计售价为:
例子2:广告支出与销售额的关系
背景:一家企业希望评估在电视广告上的支出如何影响其产品的销售额。
模型设定:
自变量
:电视广告支出(万元)X 因变量
:产品月销售额(万元)Y
假设数据:
广告支出(X) | 销售额(Y) |
---|---|
10 | 100 |
15 | 150 |
20 | 200 |
25 | 250 |
30 | 300 |
回归分析:
通过简单线性回归分析,可能得到以下回归方程:
解释:
截距
:当广告支出为0万元时,预计销售额为50万元。β 0 = 50 斜率
:广告支出每增加1万元,销售额预计增加8万元。β 1 = 8
应用:如果企业计划在下个月投入20万元进行电视广告,预计销售额为: