Stata:IV估计新方法-ivreg2m

文摘   教育   2024-11-15 22:01   山西  

👇 连享会 · 推文导航 | www.lianxh.cn

🍓 课程推荐:2024 机器学习与因果推断专题
主讲老师:司继春 (上海对外经贸大学) ;张宏亮(浙江大学)
课程时间:2024 年 11 月 9-10 日 ;16-17日
课程咨询:王老师 18903405450(微信)

课程特色 · 2024机器学习与因果推断

  • 懂原理、会应用。本次课程邀请了两位老师合作讲授,目的在于最大限度地实现理论与应用的有机结合。为期四天的课程,分成两个部分:第一部分讲解常用的机器学习算法和适用条件,以及文本分析和大语言模型;第二部分通过精讲 4-6 篇发表于 Top 期刊的论文,帮助大家理解各类机器学习算法的应用场景,以及它们与传统因果推断方法的巧妙结合。
  • 以 Top 期刊论文为范例。目前多数人的困惑是不清楚如何将传统因果推断方法与机器学习结合起来。事实上,即便是 MIT 和 Harvard 的大牛们也都在「摸着石头过河」。为此,通过论文精讲和复现来学习这部分内容或许是目前最有效的方式了。张宏亮老师此前在浙江大学按照这一模式教授了「因果推断和机器学习」课程,效果甚佳:学生们能够逐渐建立起研究设计的理念,并在构造识别策略时适当地嵌入机器学习方法。

作者:董洁妙 (暨南大学)
邮箱:graceveio@163.com

温馨提示: 文中链接在微信中无法生效。请点击底部「阅读原文」。或直接长按/扫描如下二维码,直达原文:


目录

  • 1. 背景简介

  • 2. 命令介绍

  • 3. Stata 实操

  • 4. 结语

  • 5. 参考资料

  • 6. 相关推文



1. 背景简介

当某些观测值处理组划分的结果不是随机缺失,或者这些结果普遍存在错误测量时,对局部平均处理效果 (LATE) 的估计结果是有偏的。

具体地,Calvi 等 (2021) 在探讨印度妇女对家庭资源的控制权与家庭健康之间的因果关系时,使用妇女对家庭资源的控制程度作为 Treatment,并利用 1976 年至 2005 年间印度几个州颁布的《印度教继承法》修正案 (这一法案的颁布意味着赋予妇女继承其出生家庭财产的权利,改善了她们的外部选择) 构建工具变量并进行 IV 估计。

但是事实上,妇女对家庭资源的控制程度是不能被直接观测得到的,为了识别这一因果关系,作者提出使用结构模型进行估计。因此,Treatment 能否被准确识别将变得非常重要,错误识别将会导致 LATE 的估计结果出现较大的偏误。为了解决这些问题,Calvi 等 (2021) 提出了一种新的估计方法 (Mismeasurement Robust LATE,MR-LATE) 来修正 LATE 估计结果。

  • 首先,将 Treatment 拆分为 Ta (Ta=1 表示获得处理的状态,Ta=0 表示未获得处理的状态) 和 Tb (Tb=1 表示处理数据缺失或处理数据存在偏误的状态,Tb=0 表示未获得处理的状态) 两组二元处理变量,对应构建双方程的结构模型;
  • 接着,通过非线性似不相关回归 (SUR) 估计 Ta 的系数,捕捉修正后的 LATE,估计 Tb 的系数,用于隔绝遗漏变量或误差所造成的影响。

在新方法下,当处理组的识别指标包含缺失值时,MR-LATE 可以识别并一致地估计 LATE。当处理组的划分出现错误时,MR-LATE 可以减少传统 LATE 的估计偏差。为了推广这一估计方法的使用,Calvi 等 (2021) 编写了 MR-LATE 的估计命令 ivreg2m。本文的目的是介绍 ivreg2m 命令的使用方法。

在正式介绍之前,本文先对 ivreg2m 命令的使用补充以下几个重要事项:

  • 第一,ivreg2m 不仅可以分别估计处理组的识别指标缺失和识别错误条件下的 LATE,还可以估计同时存在上述问题条件下的 LATE。
  • 第二,ivreg2m 是在现有的 xtivreg2ivreg2 的框架上建立的,所以一切关于 xtivreg2ivreg2 的拓展指令几乎都可以在 ivreg2m 中使用。
  • 第三,ivreg2mivreg2 之间存在三个主要区别。首先,在运行该命令之前,用户必须生成一个离散的处理变量,并至少包含以下三个赋值:是否位于处理组,是否位于控制组,是否为缺失、误测或者其他未知的状态。其次,在估计过程中,可以同时设定一个或多个工具变量,但工具变量也必须满足二元或离散 (整数) 值的变量设定。最后,该命令只支持 VCE 的单向聚类。
  • 第四,ivreg2ranktest 软件包必须从 SSC 中安装。同时,不应使用 ivreg2 的早期版本。

2. 命令介绍

命令安装:

ssc install ivreg2m, replace

命令语法:

ivreg2m depvar [varlist] (treatment=varlist_iv) [weight] [if exp] [in range] [, ta(string) tb(string) options]
  • depvar:指定回归的被解释变量;
  • treatment:指定回归中存在错误的原始处理变量的名称;
  • ta(string):定义处理组中处理变量 Ta 的数字值,默认为 ta(1)
  • tb(string):定义控制组中处理变量 Ta 的数字值,默认为 tb(-1)

3. Stata 实操

为了更好地理解 MR-LATE 在实际分析中的应用,Calvi 等 (2021) 使用是否加入美国退休金 401k 计划对个人净固定资产的影响进行举例。401k 计划是指美国 1978 年《国内税收法》新增的第 401 条 k 项条款的规定,具体指代一种由雇员、雇主共同缴费建立起来的完全基金式的养老保险制度。

但是,在美国养老保险制度的选择并不唯一。美国还推出了个人退休金账户计划 (以下简称 IRA计划) 作为备选。那么,在分析个是否加入 401k 计划对个人净固定资产的影响时,难免会面临着遗漏 IRA 计划所造成 LATE 的偏误。这种情况,可以通过 ivreg2m 命令估计 MR-LATE 进行解决:

第一,调用数据进行回归分析。

. ssc install bcuse, replace
. bcuse 401ksubs, clear

第二,生成一个处理变量 (离散型),至少包含三个不同的取值。

. generate treat = (p401k & pira)
. replace treat = -1 if (p401k==0 & pira==0)

第三,使用 ivreg2m 命令进行估计,解释变量包括错误分类的 Treatment 变量,以及一个二元的工具变量。

. ivreg2m nettfa (treat = e401k), ta(1) tb(-1) 

MR-LATE point and interval estimate:
(1) treat_a - treat_b = 0
------------------------------------------------------------------------------
nettfa | Coefficient Std. err. z P>|z| [95% conf. interval]
-------------+----------------------------------------------------------------
(1) | 72.666 2.613 27.81 0.000 67.545 77.788
------------------------------------------------------------------------------

第四,在第三步基础上加入控制变量和采用 Robust 标准误的回归结果。

. ivreg2m nettfa (treat = e401k) inc, robust ta(1) tb(-1)

MR-LATE point and interval estimate:
(1) treat_a - treat_b = 0
------------------------------------------------------------------------------
nettfa | Coefficient Std. err. z P>|z| [95% conf. interval]
-------------+----------------------------------------------------------------
(1) | 58.839 3.154 18.66 0.000 52.657 65.021
------------------------------------------------------------------------------

第五,在第四步基础上加入多项工具变量以及 cluster-robust 标准误的回归结果。

. ivreg2m nettfa (treat = e401k pira) inc, cluster(age) ta(1) tb(-1)

MR-LATE point and interval estimate:
(1) treat_a - treat_b = 0
------------------------------------------------------------------------------
nettfa | Coefficient Std. err. z P>|z| [95% conf. interval]
-------------+----------------------------------------------------------------
(1) | 58.104 3.386 17.16 0.000 51.467 64.741
------------------------------------------------------------------------------

4. 结语

相信大家在阅读本推文后,对如何使用 ivreg2m 命令估计修正后的 LATE (即 MR-LATE) 有了更深入的理解。不过,它也存在一些不足,比如只能够考虑单一偏误冲击所造成的影响。未来,几个可能性的优化方向包括:

  • 允许估计两个以上的冲击偏误下的 MR-LATE;
  • 对于多个工具变量的处理,可以根据每个工具平均 MR-LATEs,或者对错误分类概率施加同质性。

5. 参考资料

  • Baum, C., M. Schaffer, and S. Stillman. 2007. ivreg2: Stata module for extended instrumental variables/2SLS and GMM and AC/HAC, LIML and k-class regression. -Link-
  • Schaffer, M. 2020. XTIVREG2: Stata module to perform extended IV/2SLS, GMM and AC/HAC, LIML and k-class regression for panel data models. -Link-
  • Calvi, R., A. Lewbel, and D. Tommasi. 2021. LATE With Missing or Mismeasured Treatment. Journal of Business & Economic Statistics, forthcoming. -PDF-
  • Imbens, G. W., and J. D. Angrist. 1994. Identification and Estimation of Local Average Treatment Effects. Econometrica 62(2): 467-475. -PDF-
  • Tommasi, D., and L. Zhang. 2022. Identifying Program Benefits When Participation Is Misreported. IZA Discussion Paper 13430. -PDF-

6. 相关推文

Note:产生如下推文列表的 Stata 命令为:
lianxh 工具变量, m
安装最新版 lianxh 命令:
ssc install lianxh, replace

  • 专题:论文写作
    • Stata论文复现:份额移动法工具变量(Shift-Share IV)
  • 专题:Stata命令
    • Stata新命令-pdslasso:众多控制变量和工具变量如何挑选?
  • 专题:IV-GMM
    • 工具变量:Shock-IV中预处理平衡的必要性
    • 工具变量:顶刊中的Shock-IV整理
    • 工具变量法:IV估计的信与不信
    • Stata:工具变量的秩检验-bootrantest
    • Stata:无需工具变量的IV估计-kinkyreg-
    • Stata:当工具变量小于内生变量时,该如何估计?-mmeiv
    • Lasso一下:再多的控制变量和工具变量我也不怕-T217
    • IV在哪里?奇思妙想的工具变量
    • twostepweakiv:弱工具变量有多弱?
    • 多个(弱)工具变量如何应对-IV-mivreg?
    • IV:工具变量不满足外生性怎么办?
    • IV-工具变量法:第一阶段系数符号确定时的小样本无偏估计
    • IV:可以用内生变量的滞后项做工具变量吗?
    • Stata: 工具变量法 (IV) 也不难呀!
    • IV-估计:工具变量不外生时也可以用!
  • 专题:内生性-因果推断
    • Stata:内生变量与工具变量非线性关系处理-discretize
    • 工具变量-IV:排他性约束及经典文献解读

🍓 课程推荐:2024 机器学习与因果推断专题
主讲老师:司继春 (上海对外经贸大学) ;张宏亮(浙江大学)
课程时间:2024 年 11 月 9-10 日 ;16-17日
课程咨询:王老师 18903405450(微信)

尊敬的老师 / 亲爱的同学们:

连享会致力于不断优化和丰富课程内容,以确保每位学员都能获得最有价值的学习体验。为了更精准地满足您的学习需求,我们诚挚地邀请您参与到我们的课程规划中来。请您在下面的问卷中,分享您 感兴趣的学习主题或您希望深入了解的知识领域 。您的每一条建议都是我们宝贵的资源,将直接影响到我们课程的改进和创新。我们期待您的反馈,因为您的参与和支持是我们不断前进的动力。感谢您抽出宝贵时间,与我们共同塑造更加精彩的学习旅程!https://www.wjx.cn/vm/YgPfdsJ.aspx# 再次感谢大家宝贵的意见!

New! Stata 搜索神器:lianxhsongbl  GIF 动图介绍
搜: 推文、数据分享、期刊论文、重现代码 ……
👉 安装:
. ssc install lianxh
. ssc install songbl
👉  使用:
. lianxh DID 倍分法
. songbl all

🍏 关于我们

  • 连享会 ( www.lianxh.cn,推文列表) 由中山大学连玉君老师团队创办,定期分享实证分析经验。
  • 直通车: 👉【百度一下: 连享会】即可直达连享会主页。亦可进一步添加 「知乎」,「b 站」,「面板数据」,「公开课」 等关键词细化搜索。


连享会
连玉君老师团队分享,主页:lianxh.cn。白话计量,代码实操;学术路上,与君同行。
 最新文章