韦恩图与FWL定理
直播课件回顾| 韦恩图&FWL定理+ R2优势分析专题
一、引言
在计量经济学中,Frisch-Waugh定理(也称为Frisch-Waugh-Lovell定理,简称FWL定理)是一个重要的工具,用于在多元线性回归模型中单独分析一个自变量(称为关注变量)对因变量的影响,同时控制其他自变量(称为控制变量)的干扰。
二、FWL定理的基本思想
FWL定理的基本思想是通过一系列的回归分析步骤,将关注变量的影响从其他控制变量的影响中分离出来,从而得到关注变量对因变量的净效应。
假设我们有一个因变量 ( Y ) 和两个自变量 ( X_1 )(关注变量)与 ( X_2 )(控制变量),在实际应用中,我们希望单独分析 ( X_1 ) 对 ( Y ) 的影响,而不受 ( X_2 ) 的干扰。
我们可以使用韦恩图来表示这些变量之间的关系:
reg Y X2
predict eY, res
eY= A + B
R2= C + D
reg X1 X2
predict eX1, res
eX1 = E + B
R2 = F + C
reg eY eX1
系数为B
FWL 定理表明执行OLS 回归得到的β1与采用如下 Partial 回归得到的结果是等价的。
步骤:
计算残差矩阵
对 ( X_1 ) 中的每个解释变量分别对 ( X_2 ) 进行回归,得到残差矩阵 ( E_1 )。
对 ( y ) 对 ( X_2 ) 进行回归,得到残差向量 ( e_2 )。
利用残差进行回归分析
使用残差向量 ( e_2 ) 对残差矩阵 ( E_1 ) 进行回归,得到参数估计 ( \tilde{\beta}_1 )。
或者方法2:
首先,对 Y 和X1 进行回归分析,得到 Y 关于 ( X_1 ) 的残差ey 用 X1 对X2 执行OLS回归,得到残差向量eX1 。 用 ey 对 eX1 执行 OLS 回归,得到系数向量β1
三、Stata操作案例
假设我们想要研究汽车价格(price
)与汽车重量weight和mpg之间的关系,同时控制rep78,一个分类变量)可能产生的影响。
我们首先设定一个多元回归模型:
. sysuse "auto.dta", clear
(1978 Automobile Data)
. regress price weight rep78 mpg
Source | SS df MS Number of obs = 69
-------------+---------------------------------- F(3, 65) = 12.44
Model | 210350667 3 70116888.9 Prob > F = 0.0000
Residual | 366446292 65 5637635.26 R-squared = 0.3647
-------------+---------------------------------- Adj R-squared = 0.3354
Total | 576796959 68 8482308.22 Root MSE = 2374.4
------------------------------------------------------------------------------
price | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
weight | 2.111488 .6190081 3.41 0.001 .875243 3.347732
rep78 | 820.8123 320.8986 2.56 0.013 179.9335 1461.691
mpg | -52.21724 83.73955 -0.62 0.535 -219.4567 115.0222
_cons | -1939.871 3622.351 -0.54 0.594 -9174.206 5294.465
------------------------------------------------------------------------------
.
根据FWL定理,我们可以分步估计这个模型:
步骤1:对价格对weight回归,同时控制rep78
regress price weight rep78
步骤2:regress mpg weight rep78,并获取残差
regress mpg weight rep78
predict residuals_mpg, residuals
步骤3:使用步骤1得到的残差(residuals
)对步骤2得到的残差(residuals_mpg
)回归
regress residuals_mpg residuals
结果为:
结果解释
步骤1 给出了 weight
和rep78
对price
的影响,同时控制了其他变量。步骤2 计算了 mpg
在控制weight
和rep78
之后的残差,这些残差代表了mpg
对price
的净影响。步骤3 的回归系数给出了 mpg
对price
的影响,这是在已经考虑了weight
和rep78
影响之后的估计结果。
FWL定理的结论
FWL定理的结论是,通过上述分步回归得到的mpg
的系数估计值与直接进行多元回归得到的mpg
的系数估计值是一致的。这意味着我们可以将一个复杂的多元回归分解为几个简单的回归步骤,而不会改变某些变量的估计系数。
Frisch-Waugh定理通过两个步骤的回归分析,有效地将关注变量的影响从其他控制变量的影响中分离出来,使得我们可以更准确地估计关注变量对因变量的净效应。这一方法在计量经济学中具有广泛的应用,特别是在处理复杂模型和面板数据时尤为重要。
FWL定理的直观理解
1. 部分回归的视角
FWL定理的一个关键应用是“部分回归图”。它帮助我们直观理解在剔除了其他变量的影响之后,目标变量之间的关系。Stata命令如avplot
、avciplot
等均用于此类部分回归的可视化展示。
部分回归的核心思想是将目标自变量和因变量分别与其他控制变量之间的关系剔除,得到的残差再进行回归。通过这种方式,可以直观理解目标自变量对因变量的“净效应”。
2. 通过残差解释回归系数
FWL定理的另一个重要应用是在解释回归系数时,通过残差来进行理解。在多元回归中,每一个回归系数的含义是:在控制其他自变量的影响之后,目标自变量对因变量的边际影响。这种理解是通过残差回归的方式来实现的。
FWL定理的进阶应用
1. 高维固定效应模型
FWL定理在处理高维固定效应模型时非常有用。在涉及时间和个体维度的面板数据中,经常需要控制双向固定效应,这时FWL定理可以帮助我们高效地估计模型。比如在Stata中,使用reghdfe
命令可以通过FWL定理来吸收多维固定效应。
2. 与工具变量和正则化的结合
FWL定理也广泛应用于带有工具变量的回归和正则化模型中。例如在ivreg2
命令中,经常使用partial()
选项,这实际上是通过FWL定理剔除某些变量的影响后再进行回归。在LASSO等正则化方法中,也使用FWL定理来处理高维特征空间的估计。
实操与应用
1. Stata实操
在Stata中,FWL定理的应用涉及多种命令。例如:
reghdfe
:用于高维固定效应模型的回归。avplot
:用于部分回归图的绘制。ivreg2
:带有工具变量的回归,通过partial()
选项实现变量剔除。
在Stata中,可以通过以下步骤来实现FWL定理的估计:
对因变量和部分自变量进行回归,得到残差。 对目标自变量和部分自变量进行回归,得到残差。 使用这些残差进行回归,得到与原多元回归一致的结果。
2. 应用场景
固定效应模型:当研究个体效应(如企业、国家)或时间效应(如年度、季度)时,FWL定理帮助剔除这些固定效应,进而更好地估计其他自变量的影响。 倍分法(DID):在倍分法中,FWL定理常用于处理双向固定效应,确保政策冲击的影响被正确识别和估计。