最新DID教材讲义(部分操作翻译稿)--Clément de Chaisemartin Xavier D’Haultfoeuille
以下是该教材讲义第五章翻译稿,主要涉及最新数据代码的案例应用
第五章:处理时机的变化:二元和交错设计
在本章中,我们假设处理是二元的和交错的,意味着组可以在不同的时间点开始接受处理,并且一旦开始就不能退出处理。
章节案例研究:单方面离婚法对离婚率的影响。在1968年至1988年间,美国有29个州采用了单方面离婚法(UDL),允许一方在未经另一方同意的情况下终止婚姻。Wolfers (2006) 在Friedberg (1998) 的基础上,使用1956年至1988年的美国州级年度面板数据(以及哥伦比亚特区,以下简称为州)来估计这些法律对离婚率的影响。UDL处理满足设计2:处理是二元的,各州在不同日期采纳UDL,并且从未废除这些法律。在这里,Fg表示州g采纳UDL的年份。
本章使用的数据集。您需要使用wolfers_didtextbook数据集,其中包含以下变量:
state:州标识符; year:年份标识符; cohort:州g采纳处理的年份(我们的符号中的Fg,只是对于从未接受治疗的州,它等于零而不是T + 1); early_late_never:变量,对于采纳年份低于中位数的州等于1,对于采纳年份高于中位数的州等于2,对于从未采纳者等于3; udl:变量,如果州g在年份t有UDL,则等于1,否则为0; exposurelength:变量,对于接受治疗的(g, t)单元,等于州g在年份t拥有UDL的年数,对于未接受治疗的(g, t)单元,等于0; rel_time1到rel_time15:指标,如果t = Fg − 1 + ℓ,即如果组g在年份t接受了ℓ年的治疗,则等于一,对于ℓ ∈ {1, ..., 15}; rel_time16:指标,如果t ≥ Fg − 1 + 16,即如果组g在年份t至少接受了16年的治疗,则等于一; rel_timeminus1到rel_timeminus8:指标,如果t = Fg − 1 + ℓ对于ℓ ∈ {−1, ..., −8},即如果组g将在年份t之后的ℓ + 1年接受治疗,则等于一; rel_timeminus9:指标,如果t ≤ Fg − 1 − 9,即如果组g将在至少9 + 1年后的年份t接受治疗,则等于一; div_rate:州g和年份t每1000人的离婚数; stpop:州g在年份t的人口; stpop1968:州g在1968年的人口,即各州开始采纳UDL之前的最后一年; controlgroup:变量,对于从未接受治疗的组等于一。
该数据样式为:
静态双向固定效应估计
用于计算TWFE回归中权重的Stata和R命令。twowayfeweights --Stata(见de Chaisemartin,D’Haultfœuille和Deeb,2019)和R(见Zhang和de Chaisemartin,2021)命令。
Stata命令的基本语法是:
twowayfeweights outcome groupid timeid treatment, type(feTR)
为了提示性地检验测试,用户可以使用test_random_weights(varlist)选项,输入可能与处理效果相关的变量到varlist中。然后,命令将计算权重和这些变量之间的相关性,并检验这些相关性是否显著。
应用于Wolfers (2006)。
使用wolfers_didtextbook数据集,对离婚率进行静态TWFE回归,包括州和年份固定效应以及UDL治疗,并按州的人口加权,并且在州级别聚类标准误差。根据这个回归,UDL对离婚有影响吗?
命令为:
reg div_rate udl i.state i.year [w=stpop], vce(cluster state)
. reg div_rate udl i.state i.year [w=stpop], vce(cluster state)
(analytic weights assumed)
(sum of wgt is 6,658,497,317)
Linear regression Number of obs = 1,631
F(32, 50) = .
Prob > F = .
R-squared = 0.9305
Root MSE = .52417
(Std. Err. adjusted for 51 clusters in state)
------------------------------------------------------------------------------
| Robust
div_rate | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
udl | -.0548378 .1507695 -0.36 0.718 -.3576673 .2479917
|
state |
AL | -.957982 .0537405 -17.83 0.000 -1.065923 -.850041
AR | -.7235609 .1417785 -5.10 0.000 -1.008331 -.4387903
AZ | .2234563 .0573855 3.89 0.000 .1081941 .3387184
CA | -1.524975 .04699 -32.45 0.000 -1.619358 -1.430593
CO | -1.137702 .0503639 -22.59 0.000 -1.238861 -1.036543
CT | -3.465987 .062545 -55.42 0.000 -3.591612 -3.340362
DC | -2.616086 .1332946 -19.63 0.000 -2.883816 -2.348356
DE | -2.79409 .1418699 -19.69 0.000 -3.079044 -2.509136
FL | -.2496779 .0491142 -5.08 0.000 -.3483267 -.1510291
GA | -1.729803 .0608782 -28.41 0.000 -1.85208 -1.607525
HI | -2.53744 .0598642 -42.39 0.000 -2.657681 -2.4172
IA | -3.262608 .0506504 -64.41 0.000 -3.364342 -3.160873
ID | -.7997232 .0519723 -15.39 0.000 -.9041125 -.6953338
IL | -2.730575 .1406541 -19.41 0.000 -3.013087 -2.448063
IN | -1.119231 .0622649 -17.98 0.000 -1.244294 -.9941686
KS | -2.074143 .0461431 -44.95 0.000 -2.166824 -1.981462
KY | -2.573664 .0535675 -48.05 0.000 -2.681257 -2.46607
LA | -3.734082 .1693628 -22.05 0.000 -4.074257 -3.393907
MA | -3.866094 .0718059 -53.84 0.000 -4.01032 -3.721867
MD | -3.289396 .1421184 -23.15 0.000 -3.574849 -3.003943
ME | -2.209831 .0627771 -35.20 0.000 -2.335923 -2.08374
MI | -2.587495 .0583103 -44.37 0.000 -2.704615 -2.470376
MN | -3.584948 .0672556 -53.30 0.000 -3.720035 -3.449861
MO | -2.001269 .1395395 -14.34 0.000 -2.281543 -1.720996
MS | -2.213488 .140255 -15.78 0.000 -2.495198 -1.931777
MT | -1.589156 .0717841 -22.14 0.000 -1.733338 -1.444973
NC | -2.827673 .1443534 -19.59 0.000 -3.117615 -2.53773
ND | -3.936348 .0553715 -71.09 0.000 -4.047565 -3.825131
NE | -3.242635 .0590386 -54.92 0.000 -3.361218 -3.124053
NH | -2.291367 .0511484 -44.80 0.000 -2.394101 -2.188632
NJ | -3.932532 .1399646 -28.10 0.000 -4.213659 -3.651405
NM | -.5574284 .0598374 -9.32 0.000 -.6776153 -.4372415
NV | 12.258 .0565328 216.83 0.000 12.14445 12.37155
NY | -4.080891 .1392867 -29.30 0.000 -4.360656 -3.801125
OH | -2.256193 .1384943 -16.29 0.000 -2.534367 -1.978019
OK | .4040454 .0114473 35.30 0.000 .3810528 .4270381
OR | -1.127264 .060412 -18.66 0.000 -1.248605 -1.005923
PA | -3.821491 .1377694 -27.74 0.000 -4.098209 -3.544773
RI | -3.727862 .0776247 -48.02 0.000 -3.883775 -3.571948
SC | -3.427384 .1430379 -23.96 0.000 -3.714684 -3.140084
SD | -3.61649 .1190136 -30.39 0.000 -3.855536 -3.377444
TN | -1.401869 .1419067 -9.88 0.000 -1.686897 -1.116841
TX | -1.035182 .0645522 -16.04 0.000 -1.164839 -.9055249
UT | -2.137737 .147725 -14.47 0.000 -2.434451 -1.841022
VA | -2.995136 .1428779 -20.96 0.000 -3.282115 -2.708157
VT | -3.15136 .1425384 -22.11 0.000 -3.437657 -2.865063
WA | -.8105635 .060674 -13.36 0.000 -.9324307 -.6886962
WI | -3.758213 .1399266 -26.86 0.000 -4.039264 -3.477162
WV | -2.517203 .1404119 -17.93 0.000 -2.799229 -2.235177
WY | -.1178572 .0780831 -1.51 0.137 -.2746918 .0389774
|
year |
1957 | -.0140657 .0499971 -0.28 0.780 -.1144879 .0863565
1958 | -.1231423 .0574713 -2.14 0.037 -.2385768 -.0077078
1959 | -.0241783 .0613121 -0.39 0.695 -.1473274 .0989707
1960 | -.0471515 .0748389 -0.63 0.532 -.1974697 .1031668
1961 | .0156969 .0801329 0.20 0.845 -.1452548 .1766486
1962 | -.0193246 .0629149 -0.31 0.760 -.1456929 .1070437
1963 | .0271608 .0613027 0.44 0.660 -.0959693 .1502909
1964 | .10049 .0620963 1.62 0.112 -.0242341 .2252141
1965 | .225448 .0869157 2.59 0.012 .0508726 .4000234
1966 | .2910481 .0905592 3.21 0.002 .1091545 .4729417
1967 | .3784252 .0852256 4.44 0.000 .2072446 .5496059
1968 | .6775892 .0879874 7.70 0.000 .5008612 .8543171
1969 | .9141577 .0874436 10.45 0.000 .7385221 1.089793
1970 | 1.231731 .1778515 6.93 0.000 .8745059 1.588956
1971 | 1.458008 .1280385 11.39 0.000 1.200836 1.715181
1972 | 1.777329 .119765 14.84 0.000 1.536773 2.017884
1973 | 2.048509 .1247692 16.42 0.000 1.797902 2.299115
1974 | 2.306993 .1341981 17.19 0.000 2.037448 2.576537
1975 | 2.528251 .1422938 17.77 0.000 2.242445 2.814056
1976 | 2.658944 .1307158 20.34 0.000 2.396393 2.921494
1977 | 2.615144 .1313927 19.90 0.000 2.351234 2.879054
1978 | 2.740831 .1403179 19.53 0.000 2.458994 3.022668
1979 | 2.902573 .1459123 19.89 0.000 2.609499 3.195646
1980 | 2.883325 .1594253 18.09 0.000 2.56311 3.20354
1981 | 2.899586 .1515183 19.14 0.000 2.595253 3.20392
1982 | 2.659391 .1473353 18.05 0.000 2.363459 2.955323
1983 | 2.563873 .1615003 15.88 0.000 2.23949 2.888256
1984 | 2.551759 .1422808 17.93 0.000 2.265979 2.837538
1985 | 2.565447 .1687183 15.21 0.000 2.226566 2.904328
1986 | 2.4652 .1717095 14.36 0.000 2.120311 2.810089
1987 | 2.376336 .1843559 12.89 0.000 2.006046 2.746625
1988 | 2.273579 .19394 11.72 0.000 1.884039 2.663118
|
_cons | 4.67002 .1339488 34.86 0.000 4.400976 4.939064
------------------------------------------------------------------------------
.
UDL治疗的系数很小且不显著,所以根据这个回归,UDL对离婚没有影响。
可以按照de Chaisemartin和D’Haultfœuille(2020)的计算,使用twowayfeweights Stata命令计算这个TWFE回归中βfe的权重。
从SSC存储库安装命令(ssc install twowayfeweights)。
执行以下Stata命令:
twowayfeweights div_rate state year udl, type(feTR) test_random_weights(exposurelength)
weight(stpop)
其中test_random_weights(exposurelength)用于测试权重是否与一个州接触UDL的年数相关,而weight(stpop)表示我们寻求分解的TWFE回归是按stpop加权的。
twowayfeweights div_rate state year udl, type(feTR) test_random_weights(expo
> surelength) weight(stpop)
Under the common trends assumption, beta estimates a weighted sum of 522 ATTs.
>
490 ATTs receive a positive weight, and 32 receive a negative weight.
The sum of the positive weights is equal to 1.0259068.
The sum of the negative weights is equal to -.02590675.
beta is compatible with a DGP where the average of those ATTs is equal to 0,
while their standard deviation is equal to .10959386.
beta is compatible with a DGP where those ATTs all are of a different sign tha
> n beta,
while their standard deviation is equal to .33951557.
Regression of variables possibly correlated with the treatment effect on the w
> eights
B[1,4]
Coef SE t-stat Correlation
exposurele~h -8.2883612 .21360588 -38.802121 -.73253245
.
在平行趋势假设下,假设治疗效果不随时间变化的βfe分解在de Chaisemartin和D’Haultfœuille(2020)的网络附录的定理S2中可以计算,用type(feS)替换type(feTR)。Goodman-Bacon分解不能用来评估βfe是否估计一个凸组合的效果。
在Stevenson和Wolfers(2006)的数据中,Goodman-Bacon(2021)在他的实证应用中使用,如果将样本限制在1956年未总是接受治疗的州和前十年的面板上,de Chaisemartin和D’Haultfœuille(2020)的定理1中的所有权重都是正的,但Goodman-Bacon分解中对DIDs的权重总和,使用一个在两个时期都接受治疗的组作为对照组,等于0.06。除此之外,可以表明,有DIDs比较一个切换者和一个在两个时期都接受治疗的组在Goodman-Bacon分解中是必要但不充分的,以在de Chaisemartin和D’Haultfœuille(2020)的定理1中有负权重。同样,Goodman-Bacon分解中对DIDs的权重总和,使用一个在两个时期都接受治疗的组作为对照组,总是大于de Chaisemartin和D’Haultfœuille(2020)的定理1中的负权重的绝对值。
Goodman-Bacon分解“高估”了de Chaisemartin和D’Haultfœuille(2020)的定理1中的负权重,因为只要有三个不同的处理日期,就没有一种独特的方式将βfe分解为DIDs的加权平均,并且存在其他分解方式,比Goodman-Bacon分解对使用一个在两个时期都接受治疗的组作为对照组的DIDs的权重更少。
用于计算Goodman-Bacon分解中的权重的Stata和R命令bacondecomp。
Stata(见Goodman-Bacon等人,2019)和R(见Flack和Edward,2020)命令
Stata命令bacondecomp 的基本语法是:
bacondecomp outcome treatment, detail
事件研究TWFE估计
*** 4) Event-study TWFE regression
reg div_rate rel_time* i.state i.year [w=stpop], vce(cluster state)
test rel_timeminus1 rel_timeminus2 rel_timeminus3 rel_timeminus4 rel_timeminus5 rel_timeminus6 rel_timeminus7 rel_timeminus8 rel_timeminus9
Decomposing the first estimated effect in the event-study TWFE regression
twowayfeweights div_rate state year rel_time1, type(feTR) test_random_weights(year) weight(stpop) other_treatments(rel_time2-rel_time16) controls(rel_timeminus1-rel_timeminus9)
Sun and Abraham event-study estimators
*ssc install eventstudyinteract
*help eventstudyinteract
replace cohort=. if cohort==0
eventstudyinteract div_rate rel_time* [aweight=stpop], ///
absorb(i.state i.year) cohort(cohort) control_cohort(controlgroup) ///
vce(cluster state)
Estimators of Callaway and Sant'Anna
*ssc install csdid
*help csdid
replace cohort=0 if cohort==.
timer clear
timer on 1
csdid div_rate [weight=stpop], ivar(state) time(year) gvar(cohort) notyet agg(event)
timer off 1
timer list
Estimators of de Chaisemartin and D'Haultfoeuille
*ssc install did_multiplegt_dyn
*help did_imputation_dyn
timer clear
timer on 1
did_multiplegt_dyn div_rate state year udl, effects(16) placebo(9) weight(stpop) predict_het(stpop1968,1)
timer off 1
timer list
Estimators of Borusyak et. al.
*ssc install did_imputation
*help did_imputation
replace cohort=. if cohort==0
did_imputation div_rate state year cohort [aweight=stpop], horizons(0/15) autosample minn(0) pre(9)
20217--2024年,8年Stata经典课程
新课纲、新升级
AI赋能科研
AI全流程辅助Stata机器学习与因果推断学术应用
含AI大模型基础课+因果推断+双重机器学习(Stata操作)等前沿内容
原理+操作+论文+前沿
超长回放,详询工作人员报名