有启发! 将DID双重差分的最新进展整合到模型设定偏差的统一框架中进行解读

学术   2024-11-15 16:40   中国香港  

凡是搞计量经济的,都关注这个号了

邮箱:econometrics666@126.com

所有计量经济圈方法论丛的code程序, 宏微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.

接着“近年来这些关于双重差分法DID的新研究是否改变了学术界的研究方向?”,今天要看的这篇文章极具启发性,作者将DID(双重差分)的最新进展整合到模型设定偏差的统一框架中进行解读,使得理解变得清晰明了。此外,文章还引用了众多实证研究案例,进一步阐释了相关观点。

林梦芸,徐阳, 郭汝飞,易君健,2024,在模型误设的统一框架下理解双重差分方法的最新发展,北京大学中国经济研究中心讨论稿系列.

比如,针对DID第三类模型误设:协变量误用的情况,本文先给出了容易理解的背景和例子,之后再进行具体计量逻辑上的解释。
在我国“试点先行,逐步推广”的政策探索中,试点地区的选择通常与地理位置、社会经济发展水平等因素密切相关。例如,在Gruber et al. (2023) 评估“新农合”健康效果的案例中,优先开展试点的地区往往财政实力较强。即使未实施“新农合”,这些财政实力较强的地区也可能通过增加医疗卫生投入,更好地改善居民的健康状况。也就是说,由于处理组的分配并非随机,处理组与控制组之间的特征差异可能会影响未处理时潜在结果的变化趋势,从而导致平行趋势假设(假设1)不成立。现有文献中常见的做法是直接在TWFE 回归模型中加入控制变量,例如各地区的医疗卫生财政支出,即运用TWFE 回归的推广3。然而,如果控制变量直接受到处理变量的影响,或控制变量对结果变量的影响随时间发生变化,TWFE 回归的推广3 就存在模型误设,无法估计出ATT 的合理近似。
以各类环保政策的环保效果评估为例。通常来说,优先进入试点名单的城市通常碳排放较高,同时经济较为发达,拥有更多资源和能力投资环保基础设施。因此,即使未被纳入试点名单,这些城市的空气污染水平也可能因经济转型和技术进步而显著下降。鉴于此,研究者往往在TWFE回归中加入城市特征变量,如产业结构和经济发展水平等。然而,这两种情况都会导致TWFE 回归模型的误设,从而影响处理效应的估计。原因在于:第一,环保政策可能加速试点城市的产业结构转型,这使得产业结构是“坏控制变量(Bad Control)”,不能在回归中直接控制。第二,经济发展水平对空气污染的影响可能随时间变化,呈现“倒U 型”的环境库兹涅茨曲线,不适用于控制变量具有常系数的模型。协变量的模型误设问题在实证研究中普遍存在,尤其是在中国经济近几十年高速发展与结构转型的现实背景之下(张征宇、林丽花、曹思力和周亚虹,2024)。因此,从模型误设的统一框架出发理解加入协变量的TWFE 回归,对于中国经济研究具有重要的现实意义。

概览一下该文:

以Angrist 为代表的经验主义范式主导了最近三十年的经济学实证研究,但近年来屡受质疑。争议的焦点之一在于双重固定效应回归模型的误用。Angrist (1998) 最初基于条件独立假设,发现“无伤大雅(Mostly Harmless)”的常系数回归模型可以近似估计出异质性处理效应的平均值。Angrist & Pischke (2009, 2014) 则将“无伤大雅”思路运用于平行趋势假设下的双重差分方法,扩展了原本用于实施2 × 2 经典双重差分的双重固定效应回归模型,提炼出该模型三个维度的推广,促进了该模型的广泛使用。本文发现,Angrist & Pischke 的三个推广都可能带来严重的模型误设。在平行趋势假设下,常系数双重固定效应回归无法估计出异质性处理效应的凸组合,即不同个体或组的处理效应的加权平均(权重非负且和为1);此时,忽略处理效应的异质性不再是“无伤大雅”的,这是Angrist 经验主义范式的根本问题。本文以模型误设的统一框架理解双重差分方法的最新发展,提倡研究者基于具体问题的现实背景与经济理论来设定经验分析模型,深化了中国经济实证研究的方法论基础。

该文主要内容:

随着Angrist & Pischke (2009, 2014) 两本计量经济学教材在我国的传播,中国经济学研究逐渐疏于理论构建,转向以回归分析为主要研究手段的经验主义范式。Angrist & Pischke (2009) 在其书中开篇指出,经验主义范式的核心思路是“无伤大雅”(Mostly Harmless),即通过简单易行的回归模型得到平均处理效应的近似估计。该思路源于Angrist (1998) 的论证:在条件独立假设下,常系数回归模型可以近似估计出异质性处理效应的平均值。¹ 据此,Angrist (1998) 认为在模型设定上可以忽略处理效应的异质性。

Angrist & Pischke (2009) 则在条件独立假设的适用范围之外,将“无伤大雅”思路运用于平行趋势假设下的双重差分(Difference-in-differences,下文简称DID)方法。他们通过总结已有文献,发现双重固定效应回归(Two-way Fixed-effect Regression,下文简称TWFE 回归)不限于2 × 2 经典DID 的情形,提炼出常系数TWFE 回归的三类推广。回归方法的便利性,让TWFE回归的三类推广在中国经济学研究中得到广泛应用。

本文发现,TWFE 回归的三类推广都可能带来严重的模型误设。在这三类推广情形下,仅依赖平行趋势假设,常系数TWFE 回归无法估计出异质性处理效应的凸组合,即不同个体或组的处理效应的加权平均(权重非负且和为1);此时,常系数回归模型不再是“无伤大雅”的。不假思索地使用回归模型,而不探明研究问题的现实背景和回归模型设定背后的经济学理论,将阻碍对中国经济发展规律的深入研究。

实际上,以Angrist & Pischke (2009, 2014) 为代表的计量教材,仅在2 × 2 经典DID 的情形下证明TWFE 回归可以识别出有清晰定义的因果效应。在2 × 2 的经典数据结构下,DID 方法依赖未受处理潜在结果变量的平行趋势假设:个体𝑖 未受处理潜在结果()的期望值是组别固定效应(𝜶𝒈)和时间固定效应(𝝀𝒕)的线性组合,即此时,TWFE 回归模型(1)是潜在结果变量的饱和模型(Saturated Model):

其中𝑌𝑖,𝑔,𝑡 为观测到的结果变量,𝐷𝑔,𝑡 为处理状态的二元变量,𝜖𝑖,𝑔,𝑡 为误差项,𝐸[𝜖𝑖,𝑔,𝑡] = 0。在2 × 2 经典DID 的情形下,TWFE 回归模型(1)不存在模型误设,是正确设定的饱和模型,其系数𝛽 可以识别出受处理个体的平均处理效应(Average Treatment Effect on the Treated, 下文简称ATT),即

Angrist & Pischke (2009) 通过总结已有的经验研究,发现TWFE 回归的应用早已不限于2×2经典DID 的情形。作为一项“经验研究者指南”(An Empiricist’s Companion),他们提炼出TWFE 回归在三个维度的推广,极大地推动了TWFE 回归的广泛应用。

• 推广1:二元交错处理变量。此时,各组在不同时间点接受处理。例如,有些地区较早开始实施政策,而有些地区则较晚开始实施政策。

• 推广2:非二元处理变量。此时,模型(1) 中的𝐷𝑔,𝑡 不再是一个是否接受处理的二元变量,而是一个多值离散型变量或连续型变量。例如,𝐷𝑔,𝑡 可代表政策实施的强度。

• 推广3:额外的协变量。例如,在回归中控制同时期的其他政策变动。

然而,这三类推广都没有经过严格的理论证明。研究者在应用这三类推广时,仍然依赖2 × 2 经典DID 的平行趋势假设,并将回归系数𝛽 阐释为某类平均处理效应。笔者发现,三类推广都存在模型误设:仅依靠未受处理潜在结果变量的平行趋势假设,无法用回归系数𝛽 识别出异质性处理效应的凸组合。因此,在TWFE 回归的三类推广中,“无伤大雅”的思路失效了。

尽管未经严格证明,TWFE 回归的三类推广因其极高的灵活性和便利性,在中国经济研究中得到了广泛应用。笔者逐篇阅读了2019–2021 年间发表于五本中国经济研究旗舰期刊的论文,发现有473 篇着重运用TWFE 回归,占发文总量的22%。图1按具体应用情形将这473 篇文章分为四类。其中,100 篇文章近似于2 × 2 经典DID 情形,仅占TWFE 回归应用的21% 左右。三类推广主导了TWFE 回归的应用:109 篇文章属于推广1 二元交错处理变量的情形,145 篇文章属于推广2 非二元处理变量的情形,而几乎所有文章都涉及推广3 中添加额外协变量的情形。运用TWFE 回归模型研究中国经济问题,急需严谨的理论基础。

本文构建了模型误设的统一框架,为TWFE 回归的三类推广情形提供了理论基础。具体而言,笔者将多种常系数回归模型对应到可以刻画异质性处理效应的饱和模型,得出常系数是异质性处理效应的线性组合(表1)。然而,在TWFE 回归的推广情形下,仅依赖未受处理潜在结果的平行趋势,常系数不再是异质性处理效应的凸组合,组合的权重可能为负,从而无法得到“无伤大雅”的近似估计。究其根源,常系数TWFE 回归的推广情形不再以未受处理组为唯一控制组,不能仅仅基于未受处理潜在结果的平行趋势就作出因果推断,这就是模型误设的根源所在。对误设的TWFE 回归模型进行估计,会出现各类“禁止的对比”,从而产生“负权重”问题,最终可能使估计结果出现严重偏误(如de Chaisemartin & D’Haultfoeuille, 2020, 2023, 2024a;Goodman-Bacon, 2021;Lin and Zhang, 2022;Borusyak et al., 2023;Caetano and Callaway,2023)

基于模型误设的统一框架,笔者为TWFE 回归和广义DID 方法的应用提供了全面的研究指南、操作手册以及教学课件,深化了中国经济研究的方法基础。现有文献很好地总结了DID 方法的理论发展,但尚无一个统一的理论框架来理解TWFE 回归在广义DID 方法中的适用性、局限性和应用范围。¹² 在统一框架下,本文进一步做出两点贡献。第一,已有研究指南聚焦于二元交错处理变量,即推广1 的情形。本文进一步研究了推广2 非二元处理变量的情形,提炼出基于工具变量法的TWFE 回归模型改进思路。第二,本文还讨论了添加额外协变量所需的基本假设,明确了推广3 的应用条件。模型误设的统一框架,可以引导研究者深入了解研究问题的现实背景,以经济理论指导实证模型设定,从而深化对中国经济发展规律的探索。本文的其余部分安排如下。第2 节追溯了“无伤大雅”思路的缘起与推广。第3–5 节分别论述了TWFE 回归三类推广下模型误设的具体形式,如何引入“禁止的对比”并导致“负权重”问题,以及可能的模型改进方法。第6 节是总结性评述。

*建议阅读全文查看。

*群友可前往社群下下载全文PDF。
关于多期DID或交叠DID: 1.DID相关前沿问题“政策交错执行+堆叠DID+事件研究”, 附完整slides,2.交错(渐进)DID中, 用TWFE估计处理效应的问题, 及Bacon分解识别估计偏误,3.典范! 这篇AER在一图表里用了所有DID最新进展方法, 审稿人直接服了!4.最新Sun和Abraham(2020)和TWFE估计多期或交错DID并绘图展示结果!详细解读code!5.多期DID或渐进DID或交叠DID, 最新Stata执行命令整理如下供大家学习,6.多期DID前沿方法大讨论, e.g., 进入-退出型DID, 异质性和动态性处理效应DID, 基期选择问题等,7.交叠DID中平行趋势检验, 事件研究图绘制, 安慰剂检验的保姆级程序指南!8.欣慰! 营养午餐计划终于登上TOP5! 交叠DID+异质性稳健DID!9.用事件研究法开展政策评估的过程, 手把手教学文章!10.从双重差分法到事件研究法, 双重差分滥用与需要注意的问题,11.系统梳理DID最新进展: 从多期DID的潜在问题到当前主流解决方法和代码! 12.标准DID中的平行趋势检验,动态效应, 安慰剂检验, 预期效应教程,13.DID从经典到前沿方法的保姆级教程, 释放最完整数据和代码!

关于因果推断书籍:1.一本最新因果推断书籍, 包括了机器学习因果推断方法, 学习主流和前沿方法,2.社会经济政策的评估计量经济学, 提供书籍和数据和程序文件,3.诺奖得主Angrist的因果推断课程文献读物单子再次更新了, 还提供了其他三门课程,4.全面且前沿的因果推断课程, 提供视频, 课件, 书籍和经典文献,5.从网页上直接复制代码的因果推断书籍出现了, 学会主流方法成效极快,6.推荐书籍"用R软件做应用因果分析", 有需要的学者可以自行下载!7.哪本因果推断书籍最好?我们给你整理好了这个书单!8.“不一样”的因果推断书籍, 很多观点让我们能恍然大悟, 涵盖了不少其他书里没有的因果推断方法!9.搞懂因果推断中内生性问题解决方法必读的书籍和文献已搜集好!10.一位“诗人”教授写了本因果推断书籍, 现在可以直接下载PDF参看!11.使用R软件学习计量经济学方法三本书籍推荐,12.机器学习与Econometrics的书籍推荐, 值得拥有的经典,13.史上最全的因果识别经典前沿书籍, 仅此一份,14.用R语言做Econometrics的书籍推荐, 值得拥有的经典,15.Stata学习的书籍和材料大放送, 以火力全开的势头,16.USA经管商博士最狂热崇拜的计量书籍震撼出炉,17.推荐使用Python语言做因果推断前沿方法的书籍,18.一些比较常见的因果推断书籍25本汇总, 很多可以直接下载PDF,19.推荐一本专攻处理效应分析的书籍, 包括主流政策评估计量方法

下面这些短链接文章属于合集,可以收藏起来阅读,不然以后都找不到了。

7年,计量经济圈近2000篇不重类计量文章,

可直接在公众号菜单栏搜索任何计量相关问题,

Econometrics Circle




数据系列空间矩阵 | 工企数据 | PM2.5 | 市场化指数 | CO2数据 |  夜间灯光 官员方言  | 微观数据 | 内部数据
计量系列匹配方法 | 内生性 | 工具变量 | DID | 面板数据 | 常用TOOL | 中介调节 | 时间序列 | RDD断点 | 合成控制 | 200篇合辑 | 因果识别 | 社会网络 | 空间DID
数据处理Stata | R | Python | 缺失值 | CHIP/ CHNS/CHARLS/CFPS/CGSS等 |
干货系列能源环境 | 效率研究 | 空间计量 | 国际经贸 | 计量软件 | 商科研究 | 机器学习 | SSCI | CSSCI | SSCI查询 | 名家经验
计量经济圈组织了一个计量社群,有如下特征:热情互助最多前沿趋势最多、社科资料最多、社科数据最多、科研牛人最多、海外名校最多。因此,建议积极进取和有强烈研习激情的中青年学者到社群交流探讨,始终坚信优秀通过感染优秀而互相成就彼此。

计量经济圈
凡是搞计量经济的,都关注这个号了。
 最新文章