Stata:基于IV的因果中介分析-ivmediate

文摘   教育   2024-09-08 22:04   山西  

👇 连享会 · 推文导航 | www.lianxh.cn

🍓 课程推荐:2024 空间计量专题
主讲老师:范巧 (兰州大学)
课程时间:2024 年 10 月 2-4 日 (三天)
课程咨询:王老师 18903405450(微信)

 课程特色 · 2024空间计量

👉  一、从“零基础”到“高水平”的课程设计

  • 兼顾基础知识、主流模型与前沿模型
  • 既考虑软件安装、程序编写以及空间权重矩阵设计等 基础知识 讲授,更强调时空面板地理加权回归模型、贝叶斯空间计量模型、矩阵指数模型、空间计量交互模型与空间面板似不相关回归模型等 前沿模型 的传授。

👉  二、“保姆级”的空间计量代码

  • 编写与校准所有模型的MATLAB代码,简化实操环节
  • 模型的估计与检验等 仅按照提供的Excel数据版式 搜集与整理原始数据,即可一次性出结果并作图

👉   三、“最多上新” 的内容体系

  • 新增 矩阵指数模型、短面板空间似不相关模型、空间计量交互模型、贝叶斯空间计量模型等
  • 新增 前沿应用案例,包括空间计量与索洛余值法、随机前沿分析与数据包络分析等的互嵌研究,阐释基于空间计量的产业空间结构优化评价方法。
  • 新增 Dagum空间基尼系数、核密度估计、空间马尔科夫链与空间收敛性等内容,阐释现实研究中对空间收敛性的应用“谬误”。

作者:关欣 (南开大学)
邮箱:gx0222@126.com

编者按:本文主要摘译自下文,特此感谢!
Source:Dippel C, Ferrara A, Heblich S. Causal mediation analysis in instrumental-variables regressions[J]. The Stata Journal, 2020, 20(3): 613-626. -PDF-

温馨提示: 文中链接在微信中无法生效。请点击底部「阅读原文」。或直接长按/扫描如下二维码,直达原文:


目录

  • 1. 简介

  • 2. 理论背景

  • 3. 估计过程

  • 4. Stata 实操

    • 4.1 模拟案例

    • 4.2 应用实例

  • 5. 参考文献

  • 6. 相关推文



1. 简介

在传统的中介效应分析框架下,假设处理变量 和中介变量 是外生的。如果处理变量 和中介变量 是内生的,那么是否能够以及如何进行中介效应分析呢?

Becker 和 Woessmann (2009) 在研究宗教对经济增长的促进时,认为宗教通过促进阅读提高了识字率,进而实现了人力资本积累,促进了经济增长。不过跨地区宗教传播和地区识字率可能不是随机的,因此需要对宗教通过提高识字率间接影响经济增⻓进行因果中介分析。

针对上述问题,Dippel 和 Ferrara (2020) 提出了 ivmediate 命令。该命令可使用一个工具变量同时进行因果效应和中介效应分析。本文的目的正是介绍基于 IV 的因果中介分析命令 ivmediate

2. 理论背景

传统中介分析中假设 的分配具有随机性,其分析框架为:


为了确定间接效应解释了总效应 (TE) 的哪一部分,必须进行中介分析,将 的 总效应 (TE) 分解为通过 产生的间接效应和不通过 产生的直接效应。其中,总效应 (TE) 为 ,间接效应为

注:方框表示可观测变量,圆圈表示不可观测变量,箭头表示因果关系,虚线表示相关关系。

上图为变量关系路径图。模型 1、2 为标准的 IV 模型,模型 1 估计 的因果影响,模型 2 估计 的因果影响。其中 是内生的,引入外生变量 。模型 3 是具有工具变量 的因果中介模型。方程 意味着 通过 间接和直接导致 。因此,在 的回归中,有两个潜在的内生变量,但只有一种工具变量 解决其内生性。

模型 3 中的因果关系可以写为:



上述可表示为 ,即:



观测变量 的协方差矩阵



表示未观测到的误差项 的协方差矩阵,因为 是一个工具变量,这意味着 在统计上独立于 。因此,



Dippel 等 (2020) 提出,其识别假设为 的回归中是内生的,但内生性不能来自共同影响 的混淆因素,只能来自共同影响 的混淆因素。形式上,识别假设为 中的 ,同时允许

3. 估计过程

标准的 2SLS 估计如下,其中 代表 在第一阶段的估计值。

  • 第一阶段:
  • 第二阶段:

根据 Dippel 等 (2020) 提出的识别假设 ,产生了一个新的排除限制,允许在以 为条件时将 作为 的工具变量。这意味着 是 2SLS 回归估计量的期望值,其中 为条件变量, 是工具变量, 是内生变量, 是因变量。即 可以被以下 2SLS 模型估计:

  • 第一阶段:
  • 第二阶段:

其中 是第一阶段 的估计值。

ivmediate 估计时,其通过报告一阶段相应 F 统计量来提供弱工具变量识别测试。若需要稳健标准误,则输出结果显示 Kleibergen 和 Paap (2006) 的 F 统计量。为了校正 F 统计量,可使用 Kleibergen 和 Schaffer (2007) 的 ranktest 命令。

关于弱工具变量识别,以往的做法是要求第一阶段 F 统计量至少大于 10。下面两图展示了通过模拟在不同 F 统计值下总效应、间接效应和直接效应的系数值。其中直接效应和间接效应的真实值为 1,总效应真实值为 2。

在标准情况下,当第一阶段 F 统计值接近 10 时,估计结果趋近于真实值。

在基于 IV 的中介因果分析中,当第一阶段 F 统计值接近 30 时,估计结果才趋近于真实值。因此,基于 IV 的中介因果分析中需要一个相对更好的工具变量。

4. Stata 实操

net install st0611_1.pkg, replace  // 命令安装
net get st0611_1.pkg, replace // 数据获取
* 命令语法
ivmediate depvar [indepvars] [if] [in], mediator(varname) treatment(varname) instrument(varname) [options]

4.1 模拟案例

服从标准正态分布,且 对于任何 ,所以 不独立于 。同理, 不独立于

意味着 。然而, 之间存在线性关系,即 。因此,在 的条件下 之间的相关性为 。所以,在 的条件下, 不独立于

设置真实参数 。当错误的假定 是外生的,通过OLS 估计:


真实参数为 1 ,但 OLS 估计量的范围可能为 0 到 2,具体取决于误差相关性。因为 越大, 越大,随着 的增加, 的 OLS 估计值越偏离真实值。相比之下, 的 OLS 估计收敛到真实值 1。

* set seed for replicability
set seed 12345
* weights for the mediation error
global omega = 0.5
* model parameters
global betaYT = 1
global betaYM = 1
global betaMT = 1
capture program drop ivmedsym
program ivmedsym
clear
set obs 1000
* generate error terms as described in the article
generate e_t = rnormal(0,1)
generate e_y = rnormal(0,1)
generate e_m = sqrt($omega)*e_t + sqrt(1-$omega)*e_y
* generate variables according to (1)-(4) in section 2
generate z = rnormal(0,1)
generate t = z + e_t
generate m = t*$betaMT + e_m
generate y = t*$betaYT + m*$betaYM + e_y
* naive OLS
regress y t
scalar bols = _b[t]
* ivmediate regression
ivmediate y, mediator(m) treatment(t) instrument(z)
scalar te = _b["total effect"]
scalar de = _b["direct effect"]
scalar ie = _b["indirect effect"]
end
simulate b_ols = bols b_total = te b_direct = de b_indirect = ie, reps(200): ivmedsym
. sum

Variable | Obs Mean Std. dev. Min Max
-------------+---------------------------------------------------------
b_ols | 200 2.355732 .0404492 2.25768 2.454119
b_total | 200 2.003096 .0561753 1.859572 2.117501
b_direct | 200 1.004551 .0867107 .8003523 1.274698
b_indirect | 200 .9985453 .0556392 .8147842 1.141245

上述模拟过程显示了 ivmediate 如何得到真实的 TE,并将其分解为直接效应和间接效应。

4.2 应用实例

在本部分,我们使用 Becker 和 Woessmann (2009) 的数据。他们研究了新教对普鲁⼠经济增长的影响,其中被解释变量为 1877 年人均所得税 (inctax),解释变量为新教徒比例 (f_prot),中介变量为识字人口比例 (f_rw)。由于新交的传播主要在 Wittenberg 周围开展,将工具变量定义为到 Wittenberg 的距离 (kmwitt)。

. use ipehd_qje2009_master
. global controls "f_jew f_fem f_young f_pruss hhsize pop gpop f_miss"
. ivmediate inctax $controls, mediator(f_rw) treatment(f_prot) instrument(kmwitt)

Linear IV Mediation Analysis
----------------------------
Outcome: inctaxpc Number of obs = 426
Treatment: f_prot
Mediator: f_rw
---------------------------------------------------------------------------------
inctaxpc | Coefficient Std. err. z P>|z| [95% conf. interval]
----------------+----------------------------------------------------------------
total effect | 0.835 0.272 3.07 0.002 0.301 1.369
direct effect | 0.083 0.083 1.00 0.316 -0.079 0.244
indirect effect | 0.752 0.291 2.58 0.010 0.181 1.323
---------------------------------------------------------------------------------
Mediator f_rw explains 90.09% of the total effect.
F-statistic for excluded instruments in
- first stage one (T on Z): 48.394
- first stage two (M on Z|T): 65.274
Excluded instruments: kmwittenberg
---------------------------------------------------------------------------------

结果显示,新教影响经济增长的总效应为 0.835,其中直接效应仅为 0.083,间接效应为 0.752,这说明新教传播所带来的识字率的上升解释了 90% 的总效应。

5. 参考文献

  • Dippel C, Ferrara A, Heblich S. Causal mediation analysis in instrumental-variables regressions[J]. The Stata Journal, 2020, 20(3): 613-626. -PDF-
  • Dippel C, Gold R, Heblich S, et al. Mediation analysis in IV settings with a single instrument[R]. Mimeo, 2020. -PDF-
  • Becker S O, Woessmann L. Was Weber wrong? A human capital theory of Protestant economic history[J]. The quarterly journal of economics, 2009, 124(2): 531-596. -PDF-

6. 相关推文

Note:产生如下推文列表的 Stata 命令为:
lianxh 中介 工具, m
安装最新版 lianxh 命令:
ssc install lianxh, replace

  • 专题:IV-GMM
    • 工具变量法:IV估计的信与不信
    • Stata:工具变量的秩检验-bootrantest
    • Stata:无需工具变量的IV估计-kinkyreg-
    • Stata:当工具变量小于内生变量时,该如何估计?-mmeiv
    • Lasso一下:再多的控制变量和工具变量我也不怕-T217
    • IV在哪里?奇思妙想的工具变量
    • twostepweakiv:弱工具变量有多弱?
    • 多个(弱)工具变量如何应对-IV-mivreg?
    • IV:工具变量不满足外生性怎么办?
    • IV-工具变量法:第一阶段系数符号确定时的小样本无偏估计
    • IV:可以用内生变量的滞后项做工具变量吗?
    • Stata: 工具变量法 (IV) 也不难呀!
    • IV-估计:工具变量不外生时也可以用!
  • 专题:内生性-因果推断
    • Stata:内生变量与工具变量非线性关系处理-discretize
    • 工具变量-IV:排他性约束及经典文献解读
  • 专题:交乘项-调节
    • medsem-中介效应:基于结构方程模型SEM的中介效应分析-T331
    • Stata:因果中介分析大比拼-T323
    • med4way:中介效应和交互效应分析
    • Stata:调节中介效应检验.md
    • Stata+R:一文读懂中介效应

🍓 课程推荐:2024 空间计量专题
主讲老师:范巧 (兰州大学)
课程时间:2024 年 10 月 2-4 日 (三天)
课程咨询:王老师 18903405450(微信)

New! Stata 搜索神器:lianxh 和 songbl  GIF 动图介绍
搜: 推文、数据分享、期刊论文、重现代码 ……
👉 安装:
  . ssc install lianxh
  . ssc install songbl
👉  使用:
  . lianxh DID 倍分法
  . songbl all

🍏 关于我们

  • 连享会 ( www.lianxh.cn,推文列表) 由中山大学连玉君老师团队创办,定期分享实证分析经验。
  • 直通车: 👉【百度一下: 连享会】即可直达连享会主页。亦可进一步添加 「知乎」,「b 站」,「面板数据」,「公开课」 等关键词细化搜索。

连享会
连玉君老师团队分享,主页:lianxh.cn。白话计量,代码实操;学术路上,与君同行。
 最新文章