Stata：IV估计新方法-ivreg2m

文摘教育 2024-11-15 22:01 山西

👇 连享会 · 推文导航 | www.lianxh.cn

🍎 Stata：Stata基础 | Stata绘图 | Stata程序 | Stata新命令
📘 论文：数据处理 | 结果输出 | 论文写作 | 数据分享
💹 计量：回归分析 | 交乘项-调节 | IV-GMM | 时间序列 | 面板数据 | 空间计量 | Probit-Logit | 分位数回归
⛳ 专题：SFA-DEA | 生存分析 | 爬虫 | 机器学习 | 文本分析
🔃 因果：DID | RDD | 因果推断 | 合成控制法 | PSM-Matching
🔨 工具：工具软件 | Markdown | Python-R-Stata
🎧 课程：最新专题 | 计量专题 | 关于连享会

🍓 课程推荐：2024 机器学习与因果推断专题
主讲老师：司继春 (上海对外经贸大学) ；张宏亮（浙江大学）
课程时间：2024 年 11 月 9-10 日；16-17日
课程咨询：王老师 18903405450（微信）

课程特色 · 2024机器学习与因果推断：

懂原理、会应用。本次课程邀请了两位老师合作讲授，目的在于最大限度地实现理论与应用的有机结合。为期四天的课程，分成两个部分：第一部分讲解常用的机器学习算法和适用条件，以及文本分析和大语言模型；第二部分通过精讲 4-6 篇发表于 Top 期刊的论文，帮助大家理解各类机器学习算法的应用场景，以及它们与传统因果推断方法的巧妙结合。
以 Top 期刊论文为范例。目前多数人的困惑是不清楚如何将传统因果推断方法与机器学习结合起来。事实上，即便是 MIT 和 Harvard 的大牛们也都在「摸着石头过河」。为此，通过论文精讲和复现来学习这部分内容或许是目前最有效的方式了。张宏亮老师此前在浙江大学按照这一模式教授了「因果推断和机器学习」课程，效果甚佳：学生们能够逐渐建立起研究设计的理念，并在构造识别策略时适当地嵌入机器学习方法。

作者：董洁妙 (暨南大学)
邮箱：graceveio@163.com

温馨提示： 文中链接在微信中无法生效。请点击底部「阅读原文」。或直接长按/扫描如下二维码，直达原文：

1. 背景简介
2. 命令介绍
3. Stata 实操
4. 结语
5. 参考资料
6. 相关推文

1. 背景简介

当某些观测值处理组划分的结果不是随机缺失，或者这些结果普遍存在错误测量时，对局部平均处理效果 (LATE) 的估计结果是有偏的。

具体地，Calvi 等 (2021) 在探讨印度妇女对家庭资源的控制权与家庭健康之间的因果关系时，使用妇女对家庭资源的控制程度作为 Treatment，并利用 1976 年至 2005 年间印度几个州颁布的《印度教继承法》修正案 (这一法案的颁布意味着赋予妇女继承其出生家庭财产的权利，改善了她们的外部选择) 构建工具变量并进行 IV 估计。

但是事实上，妇女对家庭资源的控制程度是不能被直接观测得到的，为了识别这一因果关系，作者提出使用结构模型进行估计。因此，Treatment 能否被准确识别将变得非常重要，错误识别将会导致 LATE 的估计结果出现较大的偏误。为了解决这些问题，Calvi 等 (2021) 提出了一种新的估计方法 (Mismeasurement Robust LATE，MR-LATE) 来修正 LATE 估计结果。

首先，将 Treatment 拆分为 Ta (Ta=1 表示获得处理的状态，Ta=0 表示未获得处理的状态) 和 Tb (Tb=1 表示处理数据缺失或处理数据存在偏误的状态，Tb=0 表示未获得处理的状态) 两组二元处理变量，对应构建双方程的结构模型；
接着，通过非线性似不相关回归 (SUR) 估计 Ta 的系数，捕捉修正后的 LATE，估计 Tb 的系数，用于隔绝遗漏变量或误差所造成的影响。

在新方法下，当处理组的识别指标包含缺失值时，MR-LATE 可以识别并一致地估计 LATE。当处理组的划分出现错误时，MR-LATE 可以减少传统 LATE 的估计偏差。为了推广这一估计方法的使用，Calvi 等 (2021) 编写了 MR-LATE 的估计命令 ivreg2m。本文的目的是介绍 ivreg2m 命令的使用方法。

在正式介绍之前，本文先对 ivreg2m 命令的使用补充以下几个重要事项：

第一，ivreg2m 不仅可以分别估计处理组的识别指标缺失和识别错误条件下的 LATE，还可以估计同时存在上述问题条件下的 LATE。
第二，ivreg2m 是在现有的 xtivreg2 和 ivreg2 的框架上建立的，所以一切关于 xtivreg2 和 ivreg2 的拓展指令几乎都可以在 ivreg2m 中使用。
第三，ivreg2m 和 ivreg2 之间存在三个主要区别。首先，在运行该命令之前，用户必须生成一个离散的处理变量，并至少包含以下三个赋值：是否位于处理组，是否位于控制组，是否为缺失、误测或者其他未知的状态。其次，在估计过程中，可以同时设定一个或多个工具变量，但工具变量也必须满足二元或离散 (整数) 值的变量设定。最后，该命令只支持 VCE 的单向聚类。
第四，ivreg2 和 ranktest 软件包必须从 SSC 中安装。同时，不应使用 ivreg2 的早期版本。

2. 命令介绍

命令安装：

ssc install ivreg2m, replace

命令语法：

ivreg2m depvar [varlist] (treatment=varlist_iv) [weight] [if exp] [in range] [, ta(string) tb(string) options]

depvar：指定回归的被解释变量；
treatment：指定回归中存在错误的原始处理变量的名称；
ta(string)：定义处理组中处理变量 Ta 的数字值，默认为 ta(1)；
tb(string)：定义控制组中处理变量 Ta 的数字值，默认为 tb(-1)。

3. Stata 实操

为了更好地理解 MR-LATE 在实际分析中的应用，Calvi 等 (2021) 使用是否加入美国退休金 401k 计划对个人净固定资产的影响进行举例。401k 计划是指美国 1978 年《国内税收法》新增的第 401 条 k 项条款的规定，具体指代一种由雇员、雇主共同缴费建立起来的完全基金式的养老保险制度。

但是，在美国养老保险制度的选择并不唯一。美国还推出了个人退休金账户计划 (以下简称 IRA计划) 作为备选。那么，在分析个是否加入 401k 计划对个人净固定资产的影响时，难免会面临着遗漏 IRA 计划所造成 LATE 的偏误。这种情况，可以通过 ivreg2m 命令估计 MR-LATE 进行解决：

第一，调用数据进行回归分析。

. ssc install bcuse, replace
. bcuse 401ksubs, clear

第二，生成一个处理变量 (离散型)，至少包含三个不同的取值。

. generate treat = (p401k & pira)
. replace treat = -1 if (p401k==0 & pira==0)

第三，使用 ivreg2m 命令进行估计，解释变量包括错误分类的 Treatment 变量，以及一个二元的工具变量。

. ivreg2m nettfa (treat = e401k), ta(1) tb(-1) 

MR-LATE point and interval estimate: 
(1)  treat_a - treat_b = 0
------------------------------------------------------------------------------
      nettfa | Coefficient  Std. err.      z    P>|z|     [95% conf. interval]
-------------+----------------------------------------------------------------
         (1) |     72.666      2.613    27.81   0.000       67.545      77.788
------------------------------------------------------------------------------

第四，在第三步基础上加入控制变量和采用 Robust 标准误的回归结果。

. ivreg2m nettfa (treat = e401k) inc, robust ta(1) tb(-1)

MR-LATE point and interval estimate: 
(1)  treat_a - treat_b = 0
------------------------------------------------------------------------------
      nettfa | Coefficient  Std. err.      z    P>|z|     [95% conf. interval]
-------------+----------------------------------------------------------------
         (1) |     58.839      3.154    18.66   0.000       52.657      65.021
------------------------------------------------------------------------------

第五，在第四步基础上加入多项工具变量以及 cluster-robust 标准误的回归结果。

. ivreg2m nettfa (treat = e401k pira) inc, cluster(age) ta(1) tb(-1)

MR-LATE point and interval estimate: 
(1)  treat_a - treat_b = 0
------------------------------------------------------------------------------
      nettfa | Coefficient  Std. err.      z    P>|z|     [95% conf. interval]
-------------+----------------------------------------------------------------
         (1) |     58.104      3.386    17.16   0.000       51.467      64.741
------------------------------------------------------------------------------

4. 结语

相信大家在阅读本推文后，对如何使用 ivreg2m 命令估计修正后的 LATE (即 MR-LATE) 有了更深入的理解。不过，它也存在一些不足，比如只能够考虑单一偏误冲击所造成的影响。未来，几个可能性的优化方向包括：

允许估计两个以上的冲击偏误下的 MR-LATE；
对于多个工具变量的处理，可以根据每个工具平均 MR-LATEs，或者对错误分类概率施加同质性。

5. 参考资料

Baum, C., M. Schaffer, and S. Stillman. 2007. ivreg2: Stata module for extended instrumental variables/2SLS and GMM and AC/HAC, LIML and k-class regression. -Link-
Schaffer, M. 2020. XTIVREG2: Stata module to perform extended IV/2SLS, GMM and AC/HAC, LIML and k-class regression for panel data models. -Link-
Calvi, R., A. Lewbel, and D. Tommasi. 2021. LATE With Missing or Mismeasured Treatment. Journal of Business & Economic Statistics, forthcoming. -PDF-
Imbens, G. W., and J. D. Angrist. 1994. Identification and Estimation of Local Average Treatment Effects. Econometrica 62(2): 467-475. -PDF-
Tommasi, D., and L. Zhang. 2022. Identifying Program Benefits When Participation Is Misreported. IZA Discussion Paper 13430. -PDF-

6. 相关推文

Note：产生如下推文列表的 Stata 命令为：
lianxh 工具变量, m
安装最新版 lianxh 命令：
ssc install lianxh, replace

专题：论文写作

Stata论文复现：份额移动法工具变量(Shift-Share IV)

专题：Stata命令

Stata新命令-pdslasso：众多控制变量和工具变量如何挑选？

专题：IV-GMM

工具变量：Shock-IV中预处理平衡的必要性
工具变量：顶刊中的Shock-IV整理
工具变量法：IV估计的信与不信
Stata：工具变量的秩检验-bootrantest
Stata：无需工具变量的IV估计-kinkyreg-
Stata：当工具变量小于内生变量时，该如何估计？-mmeiv
Lasso一下：再多的控制变量和工具变量我也不怕-T217
IV在哪里？奇思妙想的工具变量
twostepweakiv：弱工具变量有多弱？
多个(弱)工具变量如何应对-IV-mivreg？
IV：工具变量不满足外生性怎么办？
IV-工具变量法：第一阶段系数符号确定时的小样本无偏估计
IV：可以用内生变量的滞后项做工具变量吗？
Stata: 工具变量法 (IV) 也不难呀！
IV-估计：工具变量不外生时也可以用！

专题：内生性-因果推断

Stata：内生变量与工具变量非线性关系处理-discretize
工具变量-IV：排他性约束及经典文献解读

🍓 课程推荐：2024 机器学习与因果推断专题
主讲老师：司继春 (上海对外经贸大学) ；张宏亮（浙江大学）
课程时间：2024 年 11 月 9-10 日；16-17日
课程咨询：王老师 18903405450（微信）

尊敬的老师 / 亲爱的同学们：

连享会致力于不断优化和丰富课程内容，以确保每位学员都能获得最有价值的学习体验。为了更精准地满足您的学习需求，我们诚挚地邀请您参与到我们的课程规划中来。请您在下面的问卷中，分享您 感兴趣的学习主题或您希望深入了解的知识领域 。您的每一条建议都是我们宝贵的资源，将直接影响到我们课程的改进和创新。我们期待您的反馈，因为您的参与和支持是我们不断前进的动力。感谢您抽出宝贵时间，与我们共同塑造更加精彩的学习旅程！https://www.wjx.cn/vm/YgPfdsJ.aspx# 再次感谢大家宝贵的意见！

New！ Stata 搜索神器：lianxh 和 songbl GIF 动图介绍
搜：推文、数据分享、期刊论文、重现代码 ……
👉 安装：
. ssc install lianxh
. ssc install songbl
👉 使用：
. lianxh DID 倍分法
. songbl all

🍏 关于我们

连享会 ( www.lianxh.cn，推文列表) 由中山大学连玉君老师团队创办，定期分享实证分析经验。
直通车： 👉【百度一下：连享会】即可直达连享会主页。亦可进一步添加「知乎」,「b 站」,「面板数据」,「公开课」等关键词细化搜索。

http://mp.weixin.qq.com/s?__biz=Mzk0MDI1NTgyOQ==&mid=2247581588&idx=1&sn=cff5aa8318bdf5ca57d5cf8a5d8ed35e

连享会

连玉君老师团队分享，主页：lianxh.cn。白话计量，代码实操；学术路上，与君同行。

最新文章

vgets：VAR模型设定和筛选-T240

CCC-GARCH：常值条件相关系数模型

TVP-VAR：时变参数向量自回归模型

调节效应是否需要考虑对控制变量交乘？

medsem-中介效应：基于结构方程模型SEM的中介效应分析

Stata：因果中介分析大比拼-T323

Stata：合成控制法介绍-synth2

严格外生性假设检验方法与应用

IV-面板内生性：严格外生性如何检验？

RDD断点回归：多个断点多个分配变量如何处理

Stata+R：一文读懂精确断点回归-RDD

RDD：离散变量可以作为断点回归的分配变量吗？

Stata：一行代码绘制平行趋势图-eventdd

Stata：事件研究法的稳健有效估计量-did_imputation

DID最新进展：异质性处理条件下的双向固定效应DID估计量 (TWFEDD)

Stata：IV估计新方法-ivreg2m

Stata：无需工具变量的IV估计-kinkyreg-

ivreghdfe-高维固定效应IV估计：错误信息处理-817 lines skipped

异质性分析！异质性分析！

FE！FE！面板固定效应模型：你用对了吗

Stata绘图：面板数据可视化-panelview

Stata：系数稳定性分析 - psacalc

Stata：堆叠回归及组间差异联合检验

控制变量越多越好吗？

Stata：输出LaTeX表格

Stata结果输出：用esttab命令绘制LaTeX表格

Stata：定制论文中表1-table1

Stata：R-squared有用吗？

Stata小白编程：暂元及macrolists命令

Stata：投资组合有效边界

Stata：通过数据框进行数据横向合并-framerge

Stata绘图：一套高效绘图命令-plottabs

Stata绘图：COVID-19数据可视化-山脊图

Stata：手动计算置信区间

Stata数据处理：缺失值类型及应对方法

Stata数据处理：缺失值填充-autofill-carryforward

明天开课！连享会：机器学习与因果推断

交乘项困惑：交互模型中的控制变量如何选择？

Stata：一文读懂事件研究法Event Study

Stata：事件研究法的编程实现

用因子模型克服遗漏变量偏误：论文复现和解读

距离开课仅余1天！机器学习与因果推断

连玉君Stata33讲：面板数据模型简介-FE和RE有何区别？

Stata-Python交互：如何安装Python宏包

从 Stata 到 R：如何使用 tag() 和 if_else() 标记分组中的首个观测

Stata错误信息-stacktrace not available：安装路径中不要包含中文字符和空格

聊聊Stata中的profile文件-第二季

Stata2R：那些 R 中的 _N 和 _n 替代技巧

距离开课仅余3天！机器学习与因果推断

Stata：自己动手做组间系数差异检验-bootstrap-bdiff

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉