👇 连享会 · 推文导航 | www.lianxh.cn
🍎 Stata:Stata基础 | Stata绘图 | Stata程序 | Stata新命令 📘 论文:数据处理 | 结果输出 | 论文写作 | 数据分享 💹 计量:回归分析 | 交乘项-调节 | IV-GMM | 时间序列 | 面板数据 | 空间计量 | Probit-Logit | 分位数回归 ⛳ 专题:SFA-DEA | 生存分析 | 爬虫 | 机器学习 | 文本分析 🔃 因果:DID | RDD | 因果推断 | 合成控制法 | PSM-Matching 🔨 工具:工具软件 | Markdown | Python-R-Stata 🎧 课程:最新专题 | 计量专题 | 关于连享会
🍓 课程推荐:2024 机器学习与因果推断专题
主讲老师:司继春 (上海对外经贸大学) ;张宏亮(浙江大学)
课程时间:2024 年 11 月 9-10 日 ;16-17日
课程咨询:王老师 18903405450(微信)
课程特色 · 2024机器学习与因果推断:
懂原理、会应用。本次课程邀请了两位老师合作讲授,目的在于最大限度地实现理论与应用的有机结合。为期四天的课程,分成两个部分:第一部分讲解常用的机器学习算法和适用条件,以及文本分析和大语言模型;第二部分通过精讲 4-6 篇发表于 Top 期刊的论文,帮助大家理解各类机器学习算法的应用场景,以及它们与传统因果推断方法的巧妙结合。 以 Top 期刊论文为范例。目前多数人的困惑是不清楚如何将传统因果推断方法与机器学习结合起来。事实上,即便是 MIT 和 Harvard 的大牛们也都在「摸着石头过河」。为此,通过论文精讲和复现来学习这部分内容或许是目前最有效的方式了。张宏亮老师此前在浙江大学按照这一模式教授了「因果推断和机器学习」课程,效果甚佳:学生们能够逐渐建立起研究设计的理念,并在构造识别策略时适当地嵌入机器学习方法。
作者:杜静玄 (雪城大学)
邮箱:jdu115@syr.edu
编者按:本文主要摘译自下文,特此致谢!
Source:de Chaisemartin C, D'Haultfœuille X. Two-Way Fixed Effects and Differences-in-Differences with Heterogeneous Treatment Effects: A Survey[J]. Available at SSRN, 2021. -PDF-
目录
1. 简介
2. 异质性处理情况下的 TWFE 回归
2.1 TWFE 回归无法识别处理效应的凸组合
2.2 问题原因:被禁止的比较
2.3 TWFE 回归其他系数的分解结果
3. 异质性处理效应下其他稳健估计量
3.1 排除动态效应的估计量
3.2 允许动态效应的估计量
4. 总结与展望
5. 参考文献
6. 相关推文
温馨提示: 文中链接在微信中无法生效。请点击底部「阅读原文」。或直接长按/扫描如下二维码,直达原文:
1. 简介
双向固定效应 (TWFE) 是评估处理效应的流行方法之一,研究者长期以来都将 TWFE 看做 DID 的等价估计量。在传统设定中:
并且依赖于平行趋势假定:。在满足该假定的前提下,DID 对平均处理效应 (ATE) 的估计是无偏的。
最近的研究表明,要想获得 ATE 的无偏估计,除以上假设外,TWFE 估计量必须还满足另外一个条件:处理效应不论在组间还是不同时期都为常数。这一假设通常不易满足,比如最低工资对于雇佣的影响在不同国家、不同教育程度的工人中都不一样。
有很多学者已提出了对异质性处理情况下的 TWFE 估计量进行诊断或修正的方法,本文对这些文献进行了回顾和梳理,并简要介绍了相关的 Stata 命令。
2. 异质性处理情况下的 TWFE 回归
2.1 TWFE 回归无法识别处理效应的凸组合
观测可被分为 组和 个时间段, 为 的系数,则在平行趋势假设下,无处理 的潜在因果为:
若处理为哑变量,则 ,若为离散或连续变量,则 , 是总和为 1 的权重,它们与下式成正比且符号相同:
是 的观测值个数, 是组 在所有期间的平均处理, 是 期所有组的平均处理, 是所有组在所有时期的平均处理。
式 (2) 和 (3) 存在两个重要问题。首先,式 (3) 表明 对 不成比例,因而 对于所有被处理的 的平均处理效应来说是有偏的,除非:(1) 只有两种处理;(2) 各组可以转移但不可以移除处理;(3) 处理时点都是一样的。在该情况下,可证明 为常数。同时,若假设该式与 无关,则 也是 ATT 的无偏估计量。
其次,更令人担心的是,(3) 式表明一些权重 很可能为负数—— 很可能不满足 “无符号反向” 的假定。在处理多于两种的情形下,更可能发生的情况是一些权重为负数。Stata 中的 twowayfeweights
命令可以计算 (2) 式中的权重,具体使用可见之前的系列推文。
2.2 问题原因:被禁止的比较
Goodman-Bacon (2021) 证明,当仅有两种处理且在交错设计的情况下:
其中, 为比较组 与组 从 到 的结果, 是和为 1 的非负权重,当且仅当 在 与 之间改变处理状态,而 不变时为正。(2) 式中的负权重来源于对转换组以及一直处理组的比较。Borusyak 和 Jaravel (2017) 介绍了一个简单的例子,包含两组和三期,组 在时期 2 就被处理,而组 直到时期 3 才被处理。此时 (4) 式变为:
与 (1) 式中的 DID 估计量类似,且在平行趋势假定下,它也是 组在第二期处理效应的无偏估计量:
则比较了组 在第 2 期到第 3 期之间转换与组 在这期间 (一直被处理) 的结果。由于,
且中间两项在平行趋势的假定下取消了。根据 (5)-(7) 式,可得:
式 (8) 的右侧是三个 TE 的加权平均,其中 的权重为负。若 ,则该负权重会消失。bacondecomp
命令可以计算 (4) 中的 和相应的权重。
2.3 TWFE 回归其他系数的分解结果
在两种处理的交错设计中,Sun 和 Abraham (2020) 用事件分析研究了 TWFE 回归:
其中, 是组 被处理的第一期,当 , 可用来估计 处理期的累积效应,而当 , 是用来检验平行趋势的安慰剂系数。在平行趋势假设下,他们证明:
一个重要的启示是,在异质性处理效果的情况下, 不能用来检验平行趋势。命令 eventstudyweights
可以用来计算这一回归的权重。
3. 异质性处理效应下其他稳健估计量
3.1 排除动态效应的估计量
在这种情况下,组的状态仅取决于其现期处理而非过去的处理。Chaisemartin 和 d'Haultfoeuille (2020b) 提出 估计量,其对两种 处理如下:
移入组:比较 和 期从未处理到处理的组别,以及在两期均未处理的组别的结果; 移出组:比较在两期均接受处理与从处理到未处理的组别的结果。 估计量依赖于 和 的平行趋势假设,并可用移动组 (switchers) 和不变组在移动组变化之前的结果趋势来进行安慰剂检验。
此外,这一估计量也容易拓展到多个处理的情况,其相应的 Stata 命令为 did_multiplegt
。
3.2 允许动态效应的估计量
在该情况下,组 的结果与其过去接受的处理相关。 是一个数为 的 0 向量,则对于所有 ,平行趋势假设变为:
这里简单回顾一下 Callaway 和 Sant’Anna (2020)、Sun 和 Abraham (2020)、以及 Borusyak 等 (2021) 提出的三种估计量。
Callaway 和 Sant’Anna (2020) 估计量:在交错设计中,组可以被加总到在同一期接受处理的族群。Callaway 和 Sant’Anna (2020) 将他们感兴趣的参数定义为 ,即从 期开始接受处理的组在第 期的平均处理效应。他们提出了一个比较处理组与从未处理组在两期之间结果变化的无偏估计量:
他们还提出了估计量来估计更高层面的处理效应,以尚未处理组替代从未处理组作为控制组的估计量 (在缺乏从未处理组的情况下很有用),以及基于条件平行趋势假设——即要求不同组别的相同的时间不变变量服从一样的变化趋势。他们的一系列估计量可以通过 Stata 命令 csdid
实现。
Sun 和 Abraham (2020) 估计量:他们的估计量与前者类似,但与前者相比,还可以使用晚处理组作为控制组。在操作上,他们允许用简单的线性回归进行估计,而 Callaway 和 Sant'Anna (2020) 则使用自助法。在 Stata 中,可使用 eventstudyinteract
命令。
Borusyak 等 (2021) 估计量:他们提出了在一定假设下比前两种更有效的估计量。该估计量可以通过 TWFE 回归获得,同时控制时间、组别以及每个每个被处理的 单元的固定效应。在高斯-马尔科夫定理下,该估计量是最有效的,而在满足平行趋势假设下,则实际上等于最小方差的 。有这些估计量, 可以通过对所有在时期 和 接受处理的组 加权平均得到。
相比于其他估计量,他们提出的估计量是方差最小的,可以通过 Stata 命令 did_imputation
得到。
如何选择不同的估计量:在考虑选择哪种估计量时,需要注意以下两点:首先,Borusyak 等 (2021) 估计量的有效性仅在高斯——马尔科夫定理下满足,而这一定理要求从未处理组的潜在结果 不论在组间还是不同时间段都是独立的。在序列相关的情况下,这一定理就不再满足。
更为严重的是,在平行趋势假设不满足的情况下,Borusyak 等 (2021) 估计量甚至会比之前两种估计量产生更大偏误。Callaway 和 Sant’Anna (2020) 以及 Sun 和 Abraham (2020) 都用 期的结果作为基准结果,而 Borusyak 等 (2021) 则使用 到 期的平均结果作为基准,这在使其更准确的同时,也承担了更大的风险:Roth (2021) 证明,在满足单调性的不同趋势假设下,利用先前时期的结果会增加 DID 的偏误。因此在选择合适估计量时需要明确数据满足哪些假设。
Chaisemartin 和 d'Haultfoeuille (2020a) 提出了在异质性和动态处理效应下仍然稳健的估计量,且在处理不止两种或研究并非交错时依然适用。这里仅简单描述两种处理但并非交错的情况。此时,在 时刻未被处理的组仍可根据他们第一次被处理的日期加总到相同的群内,则对于所有 、 使得 ,Chaisemartin 和 d'Haultfoeuille (2020a) 令 代表群 中组的个数,且定义下式为 群的平均效应:
该效应是基于组在 到 之间的处理轨迹 定义的,在式 (11) 的平行趋势假设下, 可以通过计算组 在 到 的结果变化的 DID 估计量获得。在交错设计中, 是在 阶段均被处理的累积效应。
此时最多有 个处理轨迹,而在非交错的设计中会有 种情况,若分别估计所有轨迹的效应,会产生不准确的估计。他们证明 可被加总到整体层面用于比较处理的成本收益,而该成本收益比率等于从 到 组 的加权平均。他们的估计量可以通过 Stata 命令 did_multiplegt
获得。
4. 总结与展望
该文回顾了当 回归不能估计处理效应的凸组合时的各种情况,并介绍了基于异质性处理效应下的多种 估计量。然而,非交错设计的连续性处理例如降雨量、关税等等,依然未得到足够深入的研究。
5. 参考文献
Abadie, A. (2005), Semiparametric difference-in-differences estimators, Review of Economic Studies 72(1), 1–19. -PDF- Athey, S. and Imbens, G. W. (2021), Design-based analysis in difference-in-differences settings with staggered adoption, Journal of Econometrics forthcoming. -PDF- Bilinski, A. and Hatfield, L. A. (2018), Nothing to see here? non-inferiority approaches to parallel trends and other model assumptions. arXiv preprint arXiv:1805.03273. -PDF- Borusyak, K. and Jaravel, X. (2017), Revisiting event study designs. Working Paper. -PDF- Callaway, B., Goodman-Bacon, A. and Sant’Anna, P. H. (2021), Difference-in-differences with a continuous treatment. arXiv preprint arXiv:2107.02637. -PDF- Callaway, B. and Sant’Anna, P. H. (2020),Difference-in-differences with multiple time periods, Journal of Econometrics forthcoming. -PDF- de Chaisemartin, C. and D’Haultfoeuille, X. (2018), Fuzzy differences-in-differences, The Review of Economic Studies 85(2), 999–1028. -PDF- de Chaisemartin, C. and D’Haultfoeuille, X. (2020a), Difference-in-differences estimators of intertemporal treatment effects. arXiv preprint arXiv:2007.04267. -PDF- de Chaisemartin, C. and D’Haultfoeuille, X. (2020b), Two-way fixed effects estimators with heterogeneous treatment effects, American Economic Review 110(9), 2964–2996. -PDF- de Chaisemartin, C. and D’Haultfoeuille, X. (2020c), Two-way fixed effects regressions with several treatments. arXiv preprint arXiv:2012.10077.20 -PDF- Wooldridge, J. (2021), Two-way fixed effects, the two-way mundlak regression, and differencein-differences estimators, Available at SSRN 3906345 . -PDF-
6. 相关推文
Note:产生如下推文列表的 Stata 命令为:
lianxh did, m
安装最新版lianxh
命令:
ssc install lianxh, replace
专题:倍分法DID Stata:空间双重差分模型(Spatial DID)-xsmle Stata:平行趋势不满足?主成分DID来帮你!- pcdid 倍分法:交错DID与Stata操作 Stata倍分法新趋势:did2s-两阶段双重差分模型 Stata倍分法:全国一刀切的DID Stata-DID:不同处理时点不同持久期的倍分法(flexpaneldid) DID陷阱解析-L111 DIDM:多期多个体倍分法-did_multiplegt 面板PSM+DID如何做匹配? 倍分法:DID是否需要随机分组? DID:仅有几个实验组样本的倍分法 (双重差分) 考虑溢出效应的倍分法:spillover-robust DID tfdiff:多期DID的估计及图示 倍分法DID:一组参考文献 Stata:双重差分的固定效应模型-(DID) 倍分法(DID)的标准误:不能忽略空间相关性 多期DID之安慰剂检验、平行趋势检验 DID边际分析:让政策评价结果更加丰满 Big Bad Banks:多期 DID 经典论文介绍 多期DID:平行趋势检验图示 Stata:多期倍分法 (DID) 详解及其图示 倍分法DID详解 (二):多时点 DID (渐进DID) 倍分法DID详解 (一):传统 DID 倍分法DID详解 (三):多时点 DID (渐进DID) 的进一步分析
🍓 课程推荐:2024 机器学习与因果推断专题
主讲老师:司继春 (上海对外经贸大学) ;张宏亮(浙江大学)
课程时间:2024 年 11 月 9-10 日 ;16-17日
课程咨询:王老师 18903405450(微信)
尊敬的老师 / 亲爱的同学们:
连享会致力于不断优化和丰富课程内容,以确保每位学员都能获得最有价值的学习体验。为了更精准地满足您的学习需求,我们诚挚地邀请您参与到我们的课程规划中来。请您在下面的问卷中,分享您 感兴趣的学习主题或您希望深入了解的知识领域 。您的每一条建议都是我们宝贵的资源,将直接影响到我们课程的改进和创新。我们期待您的反馈,因为您的参与和支持是我们不断前进的动力。感谢您抽出宝贵时间,与我们共同塑造更加精彩的学习旅程!https://www.wjx.cn/vm/YgPfdsJ.aspx# 再次感谢大家宝贵的意见!
New! Stata 搜索神器:
lianxh
和songbl
GIF 动图介绍
搜: 推文、数据分享、期刊论文、重现代码 ……
👉 安装:
. ssc install lianxh
. ssc install songbl
👉 使用:
. lianxh DID 倍分法
. songbl all
🍏 关于我们
连享会 ( www.lianxh.cn,推文列表) 由中山大学连玉君老师团队创办,定期分享实证分析经验。 直通车: 👉【百度一下: 连享会】即可直达连享会主页。亦可进一步添加 「知乎」,「b 站」,「面板数据」,「公开课」 等关键词细化搜索。