CIMERS的因果推断最新进展+量化宏观,视频课程全新回归!
👉面板数据模型(DID等)最新进展及其stata应用,点击查看
👉DSGE第一课与Dynare编程,点击查看
成为CIMERS内部学员,你可以获得
⭐ 高质量课程,详细课件,可复用代码及数据
⭐ 许老师详尽答疑服务,知无不言,学无止境
⭐ 高质量的交流社群(主要为硕博以及高校教师)
⭐ 许老师增值讲座,文献解读,模型讲解
⭐ 未来课程内部学员折扣
⭐⭐诚邀您加入CIMERS,许老师正在寻找好的合作者,一起作出高质量研究⭐⭐
报名任意课程即可成为CIMERS内部学员
咨询购买请联系
联系人:吴峰宇老师
联系电话:184 7751 1575
联系邮箱:cimers_dsge@econmod.cn
其它事项:可开具培训、技术服务、咨询等类型的增值税普票
更多课程信息,扫描下方二维码咨询:
特别提醒:非诚勿扰!
恳请各位老师同学动动发顶刊的小手,点个赞和在看,让更多人看到我们的研究,您的支持是CIMERS最大的动力!
Ban, K. and D. Kédagni (2023). Robust Difference-in-Differences Models. https://arxiv.org/abs/2211.06710
Ban, K. and D. Kédagni (2024). rdid and rdidstag: Stata commands for robust difference-in-differences. https://arxiv.org/abs/2410.05212
DID依赖于平行趋势假设,但是我们都知道平行趋势假设是无法用现实数据来证实的,也是不可检验的。所以最近几年,DID理论的最大进展之一,就是许多学者提出了一些平行趋势的敏感性检验(RR,2023,Roth et al.,2023)。Ban, K. and D. Kédagni (2023,2024)提出了一种不满足平行趋势假设的稳健DID置信区间的方法。
首先,这个方法遵循Heckman et al.(1998)将DID的平行趋势理解为选择/混淆因子偏误。其次,Ban and Kedagni(2023,2024)方法的识别假设为处理后的选择偏误是处理前所有可能偏误的凸集。
具体的技术细节可以参见原文。下列用Cai(2016,The Impact of Insurance Provision on Household Production and FinancialDecisions. American Economic Journal: Economic Policy)作为例子来看看稳健DID区间的用法。Cai(2016)用来自于中国农村信用合作社的家庭面板数据研究了保险供给对烟草种植的影响。主要的回归方程为:
其中,i,r,t分别为家庭,区域和年份。Y是结果变量,area_tob表示烟草种植面积,tobshare表示烟草种植面积占总的农业面积。X是协变量。是ATT估计系数。
下图展示了种植面积在处理前每一期的选择偏误:
从上图可以看出,处理组和控制组的烟草种植面积在处理前有正向的偏误,而且每一期的偏误并没有明显的变化模式。
上述两个表展示了用线性或二次型结果方程得到的稳健DID估计量区间。前四列分别是GDID的估计界限和对应95%置信区间。第五列是双重稳健估计量,第六列是标准OLS估计量,第七列是构建的选择偏误集,最后一列是Cai(2016)的结果。从结果里看出,稳健区间及其对应的95%置信区间并没有显著的异于其它的回归结果。因此,保险供给对烟草种植有正向的影响。而且稳健DID区间包含了Cai(2016)的原始结果,除了二次型函数下的结果。这些发现都说明Cai(2016)的原始结果较为稳健。
上图展示了事件研究类型的DID稳健区间结果。红色和蓝色的虚线分别表示处理后每一期处理效应的上下界,灰色的区域表示对应的95%置信区间。从这些结果可以看出,保险供给对烟草种植面积的初始效应较小,但是效应随着时间不断变大。
下面,用Ban and Kedagni(2023,2024)提供的模拟数据来看看stata命令:
****************************************
* 稳健DID置信区间
* 许文立,xuweny87@hotmail.com
****************************************
* 加载数据
use "/Users/xuwenli/Library/CloudStorage/OneDrive-个人/DSGE建模及软件编程/教学大纲与讲稿/应用计量经济学讲稿/应用计量经济学讲稿与code/rdid/sim_rdid.dta", clear
*模拟数据中并没有处理变量,所以先创建处理变量和个体与时间变量,主要来自于Ban的帮助,在此致谢。
gen pos_D = pos*D
gen ind = mod(_n - 1, 100) + 1
gen t_100 = t + 100
* TWFE
reghdfe Y pos*D,ab(ind t_100) cluster(ind)
其中,Y是结果变量,D是个体虚拟变量,pos是时间虚拟变量。ind是个体指标,t_100是时间变量。我们可以看到,TWFE的结果为15.78。
我们来看看,TWFE事件研究图:
* event study
reghdfe Y D##ib100.t_100,ab(ind t_100) cluster(ind) noconstant
g coef = .
g se = .
forvalues i = 98(1)102 {
replace coef = _b[1.D#`i'.t_100] if t_100 == `i'
replace se = _se[1.D#`i'.t_100] if t_100 == `i'
}
* Make confidence intervals
g ci_top = coef+1.96*se
g ci_bottom = coef - 1.96*se
* Limit ourselves to one observation per quarter
keep t_100 coef se ci_*
duplicates drop
* Create connected scatterplot of coefficients
* with CIs included with rcap
* and a line at 0 from function
twoway (sc coef t_100, connect(line)) ///
(rcap ci_top ci_bottom t_100) ///
(function y = 0, range(98 102)), xtitle("Time") ///
legend(order(1 "点估计量" 2 "95%置信区间") pos(6) cols(3))
从上图可以看出,处理前处理组和控制组存在显著差异,平行趋势不满足。下面,用DID稳健区间:
* 安装rdid
* net install github, from("https://haghish.github.io/github/")
* github install KyunghoonBan/rdid
* 稳健DID置信区间
use "/Users/xuwenli/Library/CloudStorage/OneDrive-个人/DSGE建模及软件编程/教学大纲与讲稿/应用计量经济学讲稿/应用计量经济学讲稿与code/rdid/sim_rdid.dta", clear
rdid Y, treat(D) post(pos) info(t) fig(sim_rdid)
上图展示了,处理前每一期的选择偏误,即处理组和控制组结果的差异。下面是DID的稳健区间和对应的三种类型95%置信区间:
这些结果均表明,即使平行趋势不满足,处理效应仍然显著为正。而且TWFE的ATT在稳健区间内。我们还可以画出处理后每一期的稳健区间和对应的置信区间:
rdid_dy Y, treat(D) post(pos) info(t) t(t) fig(sim_rdid_dy)
注:(1)相关讲稿、Slides和stata do文件在许文立老师的github及其主页上公布。
(2)CIMERS学员/付费会员注意后续线上讲座通知。
(3)更多计量和stata内容,请参见经验分析方法及Stata命令汇总
72、【应用计量系列72】断点回归(2):丝滑世界里找“跳跃”
73、【应用计量系列73】交叠DID估计量 :stata包csdid升级版
74、【应用计量系列74】控制组群固定效应还是个体固定效应?
75、【应用计量系列75】合成控制法的新推断框架和stata应用
76、【应用计量系列76】平行趋势的秘密(一):平行趋势假设的类型
77、【应用计量系列77】平行趋势的秘密(二):明知不可为而为之
79、【应用计量系列79】平行趋势的秘密(三):如何给平行趋势假设提供经验证据?
81、【应用计量系列81】平行趋势的秘密(四):如何给平行趋势假设提供经验证据?
82、【应用计量系列82】因果推断中的纠偏机器学习方法(DDML)
85、【应用计量系列85】DID最新文献:共同相关效应DID(CCE-DID)
86、【应用计量系列86】新DID的Stata包升级版csdid2
92、【应用计量系列92】事件研究对平行趋势假设检验的效力及stata操作
94、【应用计量系列94】因果效应推断概述课后作业:随机实验分析
95、【应用计量系列95】匹配估计量(1):小小的匹配从来没有伤害过任何人
97、【应用计量系列97】匹配估计量(2):条件独立性假设、敏感性检验及stata操作
99、【应用计量系统99】匹配估计量(3):精确匹配与共同支持假设
100、【应用计量系列100】最新的交错处理效应估计量:随机交错处理下,更有效率的估计量及其stata操作
101、【应用计量系列101】Stata 18新功能(1):异质性处理效应
102、【应用计量系列102】stata 18新功能(2):培根分解
103、【应用计量系列103】一文读懂线性回归的标准误与stata应用
【应用计量系列100】随机交错处理下,更有效率的估计量及其stata操作(Update)
105、【应用计量系列105】DID Handbook(持续更新)
106、【应用计量系列106】标准误太大,系数不显著?也许弄错了标准误的来源
107、【应用计量系列107】动态合成双重差分及stata操作
108、【应用计量系列108】异质性处理效应稳健估计量:dCDH估计量
109、【应用计量系列109】合成双重差分(SDID)估计量的使用要求
118、【应用计量系列118】《双重差分法的最新理论进展与经验研究新趋势》附录B
119、【应用计量系列119】DID的平行趋势,真的理解,并会用了吗?兼论平行趋势敏感性检验及其stata应用
121、【应用计量系列121】工具变量的强弱检验与stata应用
122、【应用计量系列122】最新异质性处理效应估计量:局部投影法DID的stata命令与例子
123、【应用计量系列123】进入退出DID的稳健估计量和stata例子
124、【应用计量系列124】DID:面板数据与重复截面数据
126、【应用计量系列126】新DID的事件研究图,理解对了吗?
127、【应用计量系列 127】新 DID 的事件研究图,理解对了呀?(续)
128、【应用计量系列 128】一图知因果:因果推断方法选择流程图
129、【应用计量系列129】堆叠DID(stacked DID)及其应用
131、【应用计量系列131】不平行的DD,平行的DDD与stata应用
132、【应用计量经济系列 132】stata 中固定效应模型的命令注意事项
133、【应用计量系列 133】不要这么用异质性处理效应稳健估计量
135、【应用计量系列 135】DID 的平行趋势支持证据的安慰剂检验
137、【应用计量系列137】连续DID的异质性处理效应与stata操作(升级版)
138、【应用计量系列138】推荐多看看Jeff老爷子的东西
140、【应用计量系列 140】Sant' Anna: DID Check List
141、【应用计量系列141】DID的稳健性检验:不可观测的混淆因子-SIV(理论篇)
142、【应用计量系列142】Bartik IV/SSIV到底要怎么应用?
145、【应用计量系列145】Sant' Anna的DID规定动作(1):处理模式图
146、【应用计量系列146】Sant' Anna的DID规定动作(2):每类处理中处理个体数
147、【应用计量系列147】Sant' Anna的DID规定动作(3):画出每个处理类别的平均结果时序图
148、【应用计量系列148】Sant' Anna的DID规定动作(4-1):写好制度背景---处理配置机制
149、【应用计量系列149】Sant' Anna的DID规定动作(4-2):处理配置机制~一场星际会议的讨论
150、【应用计量系列150】Sant' Anna的DID规定动作(4-3):处理配置机制—Ashenfelter's Dip
151、【应用计量系列151】Sant' Anna的DID规定动作(4-4):处理配置机制——基于可观测协变量的处理
152、【应用计量系列152】Sant' Anna的DID规定动作(4-5):处理配置机制——是什么时候平行趋势不成立
153、【应用计量系列153】最新理论与命令:前向型DID(Forward DID)及其stata应用
155、【应用计量系列155】因果推断的效力分析(Power Analysis)及stata代码
157、【应用计量系列157】弱工具变量的AR检验与stata命令
157a、【应用计量系列157a】如何控制协变量?
159、【应用计量系列159】Stata 18最新版本(StataNow)的培根分解