这TOP5竟引起国内做DID学者的恐慌, 担心以后不能做DID了, 讨论可能的影响及应对.

学术   2025-01-24 00:02   中国香港  

凡是搞计量经济的,都关注这个号了

邮箱:econometrics666@126.com

所有计量经济圈方法论丛的code程序, 宏微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.

在这篇JPE这JPE是XX关于政治经济研究最有意义的一篇, 过去40年中国政策实验的政治经济学!发出来后,不少学者评论认为,这可能会切断DID(双重差分法)的研究路径,从而引发了国内中青年学者对我国政策实验评估的恐慌。

那首先看看,这篇文章到底研究了什么问题?有得到了什么发现呢?

用更简洁的话语总结就是
第一,试验地点并不是随机选择的,而是因为当地的经济、社会条件等比较特殊,才被挑选出来进行试验。
第二,在试验过程中,情况和平时有所不同。地方官员会投入更多资源,更加努力地推动政策实施,这会让政策看起来效果特别好,但实际上可能并没有那么显著。
第三,在评估试验结果时,中央政府可能未能充分考虑试验地点的特殊性以及试验过程中的某些非典型情况,从而可能会高估政策的实际效果。这使得在将政策推广到全国时,其效果往往不如预期。

那是不是该文一出来后,DID用来评估我国这种先试点后铺开的政策就会被蒙上阴影呢?甚至说没办法使用DID开展我国大部分政策评估了?
其实,“Policy Experimentation in China: The Political Economy of Policy Learning“ 并没有对双重差分法(DID)的使用“蒙上阴影”,而是从政策实验的特征和政治经济学角度对DID方法的应用提出了重要的警示和反思。
下面就根据文章主要研究发现,看看对DID使用可能产生影响的几个关键点及应对措施:

1. 样本选择偏差或者说非代表性样本选择对DID的影响

文章指出,中国的政策实验存在显著的正向样本选择偏差,即实验组往往选择经济条件较好的地区。这与DID方法的理想假设(实验组和对照组在干预前是可比的)相违背。
影响:如果在使用DID时不考虑这种样本选择偏差,可能会高估政策效果。例如,实验组的经济增长可能部分是因为其本身较好的经济基础,而不是完全由政策干预导致。

应对措施:研究者需要谨慎检查平行趋势假设,并通过倾向得分匹配(PSM)、合成控制法(SCM)或其他统计方法调整样本选择偏差,确保实验组和对照组在干预前具有可比性。

参看:1.DID双重差分中是否应该讨论政策试验组选取的非随机性?2.虽已有2篇, 但这篇"限购与假离婚"相同话题仍然能登更TOP刊! 异质性DID, Heckman, 政策选择性处理!3.AER又现黑手党: 匹配的双重差分, NNM和PSM用得好, 机制分析和稳健性检验的典范, 内容是真过瘾

2. 政策实验过程中的战略行为(Strategic Effort and Resource Allocation)

文章发现,地方政府官员在政策实验期间会投入更多资源以确保实验成功,这种努力在政策全面推广时难以复制。
影响:DID方法假设干预效果是稳定的,但这种战略行为可能导致实验期间的政策效果被夸大。如果在DID分析中不考虑这种动态变化,可能会得出误导性的结论。

应对措施:研究者在设计DID模型时,应考虑政策实施过程中可能存在的动态变化,例如地方政府的战略行为。可以通过引入额外的控制变量或使用三重差分(DDD)等方法来捕捉这些异质性。

参看:一些使用三重差分DDD的中文文章, 剔除其他干扰因素后获得政策的净效应!

3. 外生冲击与中央政府对实验结果的解读

文章指出,中央政府在评估政策实验结果时,未能完全排除与政策无关的外部冲击(如土地财政收入的意外增长或官员更替带来的激励变化)。
影响:DID方法要求清晰区分干预效果和其他外生因素的影响。如果在DID分析中未能排除这些无关因素,可能会导致对政策效果的误判。
应对措施:研究者需要排除外生冲击的影响,确保DID分析仅捕捉到政策本身的因果效应。这可能需要引入额外的控制变量或使用工具变量方法。

4. 政策效果的外推性(External Validity)

文章发现,政策在实验期间的效果往往比在全国推广时的效果更大,这意味着政策效果在推广过程中可能会缩减。
影响:DID通常假设政策效果在实验组和对照组之间是稳定的。如果政策效果在推广过程中发生变化,DID估计的政策效果可能无法准确反映政策在全国范围内的实际效果。

应对措施:研究者需要考虑政策效果的异质性,并通过分样本分析或其他方法来捕捉这种异质性。此外,应谨慎评估政策推广的外推性,确保实验阶段的效果能够推广到条件截然不同的地区。

参看: 工具变量对因果效应的识别和外推, 大牛的顶级评述!

此外,文章中的一些研究方法中对DID的应用与肯定,为更合理地使用DID提供了参考和启示。例如,在研究地方财政支出在政策实验期间的变化时,作者使用了三重差分策略(DDD),通过将政策实验区域与非实验区域、实验前后以及不同政策领域进行对比,有效控制了其他因素的干扰,从而更准确地识别政策实验对地方财政支出的因果效应。

启示:在合适的研究设计下,基于差分的方法(包括DID)能够为政策效果评估提供有力的工具。然而,研究者需要更加关注样本的代表性、政策实施中的动态变化以及外生冲击的影响。

总结一下:

这篇文章并未否定DID方法的有效性,而是提醒研究者在使用DID时需要特别注意以下问题:

1.检查实验组和对照组在干预前的平行趋势假设;

2.控制政策实验中的动态变化和地方官员的策略性行为;

3.剔除外部冲击对实验结果的干扰;

4.评估政策效果的异质性及其全国推广的可扩展性。

通过更精细的研究设计和稳健性检验,DID仍然可以作为评估政策效果的有力工具,为政策学习和因果推断提供可靠依据。
*欢迎到计量社群交流讨论前沿计量知识。
关于多期DID或交叠DID: 1.DID相关前沿问题“政策交错执行+堆叠DID+事件研究”, 附完整slides,2.交错(渐进)DID中, 用TWFE估计处理效应的问题, 及Bacon分解识别估计偏误,3.典范! 这篇AER在一图表里用了所有DID最新进展方法, 审稿人直接服了!4.最新Sun和Abraham(2020)和TWFE估计多期或交错DID并绘图展示结果!详细解读code!5.多期DID或渐进DID或交叠DID, 最新Stata执行命令整理如下供大家学习,6.多期DID前沿方法大讨论, e.g., 进入-退出型DID, 异质性和动态性处理效应DID, 基期选择问题等,7.交叠DID中平行趋势检验, 事件研究图绘制, 安慰剂检验的保姆级程序指南!8.欣慰! 营养午餐计划终于登上TOP5! 交叠DID+异质性稳健DID!9.用事件研究法开展政策评估的过程, 手把手教学文章!10.从双重差分法到事件研究法, 双重差分滥用与需要注意的问题,11.系统梳理DID最新进展: 从多期DID的潜在问题到当前主流解决方法和代码! 12.标准DID中的平行趋势检验,动态效应, 安慰剂检验, 预期效应教程,13.DID从经典到前沿方法的保姆级教程, 释放最完整数据和代码!

8年,计量经济圈近2500篇不重类计量文章,

可直接在公众号菜单栏搜索任何计量相关问题,

Econometrics Circle




数据系列空间矩阵 | 工企数据 | PM2.5 | 市场化指数 | CO2数据 |  夜间灯光 官员方言  | 微观数据 | 内部数据
计量系列匹配方法 | 内生性 | 工具变量 | DID | 面板数据 | 常用TOOL | 中介调节 | 时间序列 | RDD断点 | 合成控制 | 200篇合辑 | 因果识别 | 社会网络 | 空间DID
数据处理Stata | R | Python | 缺失值 | CHIP/ CHNS/CHARLS/CFPS/CGSS等 |
干货系列能源环境 | 效率研究 | 空间计量 | 国际经贸 | 计量软件 | 商科研究 | 机器学习 | SSCI | CSSCI | SSCI查询 | 名家经验
计量经济圈组织了一个计量社群,有如下特征:热情互助最多前沿趋势最多、社科资料最多、社科数据最多、科研牛人最多、海外名校最多。因此,建议积极进取和有强烈研习激情的中青年学者到社群交流探讨,始终坚信优秀是通过感染优秀而互相成就彼此的。

计量经济圈
凡是搞计量经济的,都关注这个号了。
 最新文章