Jonathan Roth教授回信了, 平行趋势敏感性检验有考究, 不要被带偏了!

学术   2025-01-01 10:48   美国  


凡是搞计量经济的,都关注这个号了
箱:econometrics666@126.com
所有计量经济圈方法论丛的code程序, 宏微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.

围绕这平行趋势敏感性分析设置错了吧? 包括国内所谓顶刊,出现了很多争议。之后,社群群友专门就此事问询了HonestDID作者Jonathan Roth教授。

为咱们群友这种纯粹的学问交流和讨论点赞;同时,祝愿所有中青年学者2025年更上一层楼。
关于Jonathan Roth,参看:1.最强DID资源: 免费DID课程, 综述性论文, 实现Packages,2.TOP5最新: 不接受log(y+1)或arcsinh(y)转换, 绝不接受!3.Roth的一个Note激起千层浪, 最新DID软件包连夜作出回应和修改,4.这哥们又对事件研究图鞭笞!直言无法用传统的解释最新DID事件研究图,5.AER: Insights对传统方法做平行趋势检验的质疑!谨慎开展政策前趋势检验!6.对数化转换的末日, 今天将被学者永远记住!7.2篇TOP5: 当前平行趋势检验方法有问题,新的平行趋势检验方法已经出现,8.最新: 2024版异质性稳健DID最全指南! 更新太快脑袋跟不上看这里!

群友向Jonathan Roth教授问询的问题如下:

首先,非常感谢你对因果推断方法发展所做出的卓越贡献!你在RES上发表的论文“A More Credible Approach to Parallel Trends”以及提出的“Honest DiD”方法,在中国学术界引起了广泛关注,并被广泛应用于金融与经济学的各类研究之中。

然而,关于“Honest DiD”方法中参数M的选择,学界存在一定的分歧。例如,一些研究者参考了Bias和Sarsons(2020)在QJE上发表的论文“Flexible Wages, Bargaining, and the Gender Gap”的附录部分,该部分引用了你的一篇早期工作论文,并建议将M设置在基准回归中感兴趣系数的标准误差范围内(0到1倍之间)。

然而,其他研究者则参考了你在RES上发表的论文及GitHub上的相关材料,在“使用相对幅度限制的敏感性分析”部分中,你将M设置在0.5到2之间,与系数的标准误差无关。此外,在“使用平滑性限制的敏感性分析”部分中,你将M设置在0到0.05之间,同样未与系数的标准误差挂钩。

这些不同的建议导致研究者在选择M时产生了一些困惑。具体而言,我想请教以下问题:

  1. 在实际应用“Honest DiD”方法时,为了确保敏感性分析的稳健性,如何根据研究背景或数据特征确定适当的M取值范围?
  2. 在相对幅度限制和平滑性限制两种方法下,M的最大值是否需要有所不同?如果需要,研究者应如何根据研究问题调整M的范围?
非常感谢你抽出宝贵时间阅读我的邮件,期待你的宝贵反馈!
Jonathan Roth的回复如下:
关于第一个问题,你可以参考下面的讨论(详情见下方附录A),专注于相对幅度限制下M的选择。我的总体看法是,在考虑“合理”的M值时,必须依赖经济学知识。你需要根据具体的经济背景,评估哪些情况可能导致违反平行趋势的假设。
关于第二个问题,确实,不同的限制条件赋予了M不同的意义,实际上,它们的度量单位也各不相同。在相对幅度限制的情况下,M是以处理前平行趋势的最大偏差百分比来度量的。而在平滑性限制的情况下,M衡量的是偏离线性的程度,其单位与结果变量保持一致。因此,根据不同的限制条件,M的选择自然会有所差异。
附录A:
我的观点是,在评估M时,需要结合经济背景进行深入思考:
我们需要关注哪些随时间变化的混杂因素可能导致违反平行趋势?这些混杂因素在处理前和处理后的影响幅度如何进行比较?
举个例子,假设我们担心不同的宏观经济因素对处理组和对照组的影响。如果我们的政策处理发生在经济大衰退之前,可能会担心不同的宏观经济效应在政策处理后阶段变得更为显著,因此可能需要选择M>1。
相反,如果经济大衰退发生在政策处理之前,而处理后阶段相对平稳,那么我们可能认为处理后阶段的偏差会小得多,这可能促使我们选择M<1。

在评估参数 M 时,需要结合经济背景来判断可能影响平行趋势的混杂因素。如果处理发生在重大经济事件(如经济大衰退)之前,处理后阶段的影响可能更显著,因此 M 应更大(如 M>1)。反之,如果重大经济事件发生在处理之前,而处理后阶段相对平稳,处理后的偏差可能较小, MMM 应更小(如 M<1)。

类似的逻辑同样适用于对同时发生的政策变化的担忧。例如,我们需要考虑在政策实施前后是否有其他政策被通过,以及这些政策的影响幅度如何进行比较。
我撰写关于事前趋势论文的部分动机是希望为研究者提供工具,将经济学因素重新纳入分析框架之中。
人们往往只关注统计学问题,比如事前趋势是否显著,但这实际上忽略了许多关键因素。如果不结合经济学背景,我们无法判断这个检验是否能够对有意义的替代假设产生足够的统计功效。

我开发Honest DiD方法的初衷是为研究者提供一种工具,帮助他们更深入地探讨可能的偏差幅度,将计量经济学与我们对经济学的理解相结合。希望上述讨论能够为如何实现这一目标提供一些启发。

关于多期DID或交叠DID: 1.DID相关前沿问题“政策交错执行+堆叠DID+事件研究”, 附完整slides,2.交错(渐进)DID中, 用TWFE估计处理效应的问题, 及Bacon分解识别估计偏误,3.典范! 这篇AER在一图表里用了所有DID最新进展方法, 审稿人直接服了!4.最新Sun和Abraham(2020)和TWFE估计多期或交错DID并绘图展示结果!详细解读code!5.多期DID或渐进DID或交叠DID, 最新Stata执行命令整理如下供大家学习,6.多期DID前沿方法大讨论, e.g., 进入-退出型DID, 异质性和动态性处理效应DID, 基期选择问题等,7.交叠DID中平行趋势检验, 事件研究图绘制, 安慰剂检验的保姆级程序指南!8.欣慰! 营养午餐计划终于登上TOP5! 交叠DID+异质性稳健DID!9.用事件研究法开展政策评估的过程, 手把手教学文章!10.从双重差分法到事件研究法, 双重差分滥用与需要注意的问题,11.系统梳理DID最新进展: 从多期DID的潜在问题到当前主流解决方法和代码! 12.标准DID中的平行趋势检验,动态效应, 安慰剂检验, 预期效应教程,13.DID从经典到前沿方法的保姆级教程, 释放最完整数据和代码!
下面这些短链接文章属于合集,可以收藏起来阅读,不然以后都找不到了。

7年,计量经济圈近2000篇不重类计量文章,

可直接在公众号菜单栏搜索任何计量相关问题,

Econometrics Circle




数据系列空间矩阵 | 工企数据 | PM2.5 | 市场化指数 | CO2数据 |  夜间灯光 官员方言  | 微观数据 | 内部数据
计量系列匹配方法 | 内生性 | 工具变量 | DID | 面板数据 | 常用TOOL | 中介调节 | 时间序列 | RDD断点 | 合成控制 | 200篇合辑 | 因果识别 | 社会网络 | 空间DID
数据处理Stata | R | Python | 缺失值 | CHIP/ CHNS/CHARLS/CFPS/CGSS等 |
干货系列能源环境 | 效率研究 | 空间计量 | 国际经贸 | 计量软件 | 商科研究 | 机器学习 | SSCI | CSSCI | SSCI查询 | 名家经验
计量经济圈组织了一个计量社群,有如下特征:热情互助最多前沿趋势最多、社科资料最多、社科数据最多、科研牛人最多、海外名校最多。因此,建议积极进取和有强烈研习激情的中青年学者到社群交流探讨,始终坚信优秀通过感染优秀而互相成就彼此。


计量经济圈
凡是搞计量经济的,都关注这个号了。
 最新文章