最新CC_XD DID教材-部分操作章节翻译

学术   2024-11-01 12:46   陕西  

最新DID教材讲义(部分操作翻译稿)--Clément de Chaisemartin Xavier D’Haultfoeuille

以下是该教材讲义第五章翻译稿,主要涉及最新数据代码的案例应用

第五章:处理时机的变化:二元和交错设计

在本章中,我们假设处理是二元的和交错的,意味着组可以在不同的时间点开始接受处理,并且一旦开始就不能退出处理。

章节案例研究:单方面离婚法对离婚率的影响。在1968年至1988年间,美国有29个州采用了单方面离婚法(UDL),允许一方在未经另一方同意的情况下终止婚姻。Wolfers (2006) 在Friedberg (1998) 的基础上,使用1956年至1988年的美国州级年度面板数据(以及哥伦比亚特区,以下简称为州)来估计这些法律对离婚率的影响。UDL处理满足设计2:处理是二元的,各州在不同日期采纳UDL,并且从未废除这些法律。在这里,Fg表示州g采纳UDL的年份。

本章使用的数据集。您需要使用wolfers_didtextbook数据集,其中包含以下变量:

  • state:州标识符;
  • year:年份标识符;
  • cohort:州g采纳处理的年份(我们的符号中的Fg,只是对于从未接受治疗的州,它等于零而不是T + 1);
  • early_late_never:变量,对于采纳年份低于中位数的州等于1,对于采纳年份高于中位数的州等于2,对于从未采纳者等于3;
  • udl:变量,如果州g在年份t有UDL,则等于1,否则为0;
  • exposurelength:变量,对于接受治疗的(g, t)单元,等于州g在年份t拥有UDL的年数,对于未接受治疗的(g, t)单元,等于0;
  • rel_time1到rel_time15:指标,如果t = Fg − 1 + ℓ,即如果组g在年份t接受了ℓ年的治疗,则等于一,对于ℓ ∈ {1, ..., 15};
  • rel_time16:指标,如果t ≥ Fg − 1 + 16,即如果组g在年份t至少接受了16年的治疗,则等于一;
  • rel_timeminus1到rel_timeminus8:指标,如果t = Fg − 1 + ℓ对于ℓ ∈ {−1, ..., −8},即如果组g将在年份t之后的ℓ + 1年接受治疗,则等于一;
  • rel_timeminus9:指标,如果t ≤ Fg − 1 − 9,即如果组g将在至少9 + 1年后的年份t接受治疗,则等于一;
  • div_rate:州g和年份t每1000人的离婚数;
  • stpop:州g在年份t的人口;
  • stpop1968:州g在1968年的人口,即各州开始采纳UDL之前的最后一年;
  • controlgroup:变量,对于从未接受治疗的组等于一。

该数据样式为:

静态双向固定效应估计

用于计算TWFE回归中权重的Stata和R命令。twowayfeweights --Stata(见de Chaisemartin,D’Haultfœuille和Deeb,2019)和R(见Zhang和de Chaisemartin,2021)命令。

Stata命令的基本语法是:

twowayfeweights outcome groupid timeid treatment, type(feTR)

为了提示性地检验测试,用户可以使用test_random_weights(varlist)选项,输入可能与处理效果相关的变量到varlist中。然后,命令将计算权重和这些变量之间的相关性,并检验这些相关性是否显著。

应用于Wolfers (2006)。

使用wolfers_didtextbook数据集,对离婚率进行静态TWFE回归,包括州和年份固定效应以及UDL治疗,并按州的人口加权,并且在州级别聚类标准误差。根据这个回归,UDL对离婚有影响吗?

命令为:

reg div_rate udl i.state i.year [w=stpop], vce(cluster state)
. reg div_rate udl i.state i.year [w=stpop], vce(cluster state)
(analytic weights assumed)
(sum of wgt is 6,658,497,317)

Linear regression                               Number of obs     =      1,631
                                                F(32, 50)         =          .
                                                Prob > F          =          .
                                                R-squared         =     0.9305
                                                Root MSE          =     .52417

                                 (Std. Err. adjusted for 51 clusters in state)
------------------------------------------------------------------------------
             |               Robust
    div_rate |      Coef.   Std. Err.      t    P>|t|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
         udl |  -.0548378   .1507695    -0.36   0.718    -.3576673    .2479917
             |
       state |
         AL  |   -.957982   .0537405   -17.83   0.000    -1.065923    -.850041
         AR  |  -.7235609   .1417785    -5.10   0.000    -1.008331   -.4387903
         AZ  |   .2234563   .0573855     3.89   0.000     .1081941    .3387184
         CA  |  -1.524975     .04699   -32.45   0.000    -1.619358   -1.430593
         CO  |  -1.137702   .0503639   -22.59   0.000    -1.238861   -1.036543
         CT  |  -3.465987    .062545   -55.42   0.000    -3.591612   -3.340362
         DC  |  -2.616086   .1332946   -19.63   0.000    -2.883816   -2.348356
         DE  |   -2.79409   .1418699   -19.69   0.000    -3.079044   -2.509136
         FL  |  -.2496779   .0491142    -5.08   0.000    -.3483267   -.1510291
         GA  |  -1.729803   .0608782   -28.41   0.000     -1.85208   -1.607525
         HI  |   -2.53744   .0598642   -42.39   0.000    -2.657681     -2.4172
         IA  |  -3.262608   .0506504   -64.41   0.000    -3.364342   -3.160873
         ID  |  -.7997232   .0519723   -15.39   0.000    -.9041125   -.6953338
         IL  |  -2.730575   .1406541   -19.41   0.000    -3.013087   -2.448063
         IN  |  -1.119231   .0622649   -17.98   0.000    -1.244294   -.9941686
         KS  |  -2.074143   .0461431   -44.95   0.000    -2.166824   -1.981462
         KY  |  -2.573664   .0535675   -48.05   0.000    -2.681257    -2.46607
         LA  |  -3.734082   .1693628   -22.05   0.000    -4.074257   -3.393907
         MA  |  -3.866094   .0718059   -53.84   0.000     -4.01032   -3.721867
         MD  |  -3.289396   .1421184   -23.15   0.000    -3.574849   -3.003943
         ME  |  -2.209831   .0627771   -35.20   0.000    -2.335923    -2.08374
         MI  |  -2.587495   .0583103   -44.37   0.000    -2.704615   -2.470376
         MN  |  -3.584948   .0672556   -53.30   0.000    -3.720035   -3.449861
         MO  |  -2.001269   .1395395   -14.34   0.000    -2.281543   -1.720996
         MS  |  -2.213488    .140255   -15.78   0.000    -2.495198   -1.931777
         MT  |  -1.589156   .0717841   -22.14   0.000    -1.733338   -1.444973
         NC  |  -2.827673   .1443534   -19.59   0.000    -3.117615    -2.53773
         ND  |  -3.936348   .0553715   -71.09   0.000    -4.047565   -3.825131
         NE  |  -3.242635   .0590386   -54.92   0.000    -3.361218   -3.124053
         NH  |  -2.291367   .0511484   -44.80   0.000    -2.394101   -2.188632
         NJ  |  -3.932532   .1399646   -28.10   0.000    -4.213659   -3.651405
         NM  |  -.5574284   .0598374    -9.32   0.000    -.6776153   -.4372415
         NV  |     12.258   .0565328   216.83   0.000     12.14445    12.37155
         NY  |  -4.080891   .1392867   -29.30   0.000    -4.360656   -3.801125
         OH  |  -2.256193   .1384943   -16.29   0.000    -2.534367   -1.978019
         OK  |   .4040454   .0114473    35.30   0.000     .3810528    .4270381
         OR  |  -1.127264    .060412   -18.66   0.000    -1.248605   -1.005923
         PA  |  -3.821491   .1377694   -27.74   0.000    -4.098209   -3.544773
         RI  |  -3.727862   .0776247   -48.02   0.000    -3.883775   -3.571948
         SC  |  -3.427384   .1430379   -23.96   0.000    -3.714684   -3.140084
         SD  |   -3.61649   .1190136   -30.39   0.000    -3.855536   -3.377444
         TN  |  -1.401869   .1419067    -9.88   0.000    -1.686897   -1.116841
         TX  |  -1.035182   .0645522   -16.04   0.000    -1.164839   -.9055249
         UT  |  -2.137737    .147725   -14.47   0.000    -2.434451   -1.841022
         VA  |  -2.995136   .1428779   -20.96   0.000    -3.282115   -2.708157
         VT  |   -3.15136   .1425384   -22.11   0.000    -3.437657   -2.865063
         WA  |  -.8105635    .060674   -13.36   0.000    -.9324307   -.6886962
         WI  |  -3.758213   .1399266   -26.86   0.000    -4.039264   -3.477162
         WV  |  -2.517203   .1404119   -17.93   0.000    -2.799229   -2.235177
         WY  |  -.1178572   .0780831    -1.51   0.137    -.2746918    .0389774
             |
        year |
       1957  |  -.0140657   .0499971    -0.28   0.780    -.1144879    .0863565
       1958  |  -.1231423   .0574713    -2.14   0.037    -.2385768   -.0077078
       1959  |  -.0241783   .0613121    -0.39   0.695    -.1473274    .0989707
       1960  |  -.0471515   .0748389    -0.63   0.532    -.1974697    .1031668
       1961  |   .0156969   .0801329     0.20   0.845    -.1452548    .1766486
       1962  |  -.0193246   .0629149    -0.31   0.760    -.1456929    .1070437
       1963  |   .0271608   .0613027     0.44   0.660    -.0959693    .1502909
       1964  |     .10049   .0620963     1.62   0.112    -.0242341    .2252141
       1965  |    .225448   .0869157     2.59   0.012     .0508726    .4000234
       1966  |   .2910481   .0905592     3.21   0.002     .1091545    .4729417
       1967  |   .3784252   .0852256     4.44   0.000     .2072446    .5496059
       1968  |   .6775892   .0879874     7.70   0.000     .5008612    .8543171
       1969  |   .9141577   .0874436    10.45   0.000     .7385221    1.089793
       1970  |   1.231731   .1778515     6.93   0.000     .8745059    1.588956
       1971  |   1.458008   .1280385    11.39   0.000     1.200836    1.715181
       1972  |   1.777329    .119765    14.84   0.000     1.536773    2.017884
       1973  |   2.048509   .1247692    16.42   0.000     1.797902    2.299115
       1974  |   2.306993   .1341981    17.19   0.000     2.037448    2.576537
       1975  |   2.528251   .1422938    17.77   0.000     2.242445    2.814056
       1976  |   2.658944   .1307158    20.34   0.000     2.396393    2.921494
       1977  |   2.615144   .1313927    19.90   0.000     2.351234    2.879054
       1978  |   2.740831   .1403179    19.53   0.000     2.458994    3.022668
       1979  |   2.902573   .1459123    19.89   0.000     2.609499    3.195646
       1980  |   2.883325   .1594253    18.09   0.000      2.56311     3.20354
       1981  |   2.899586   .1515183    19.14   0.000     2.595253     3.20392
       1982  |   2.659391   .1473353    18.05   0.000     2.363459    2.955323
       1983  |   2.563873   .1615003    15.88   0.000      2.23949    2.888256
       1984  |   2.551759   .1422808    17.93   0.000     2.265979    2.837538
       1985  |   2.565447   .1687183    15.21   0.000     2.226566    2.904328
       1986  |     2.4652   .1717095    14.36   0.000     2.120311    2.810089
       1987  |   2.376336   .1843559    12.89   0.000     2.006046    2.746625
       1988  |   2.273579     .19394    11.72   0.000     1.884039    2.663118
             |
       _cons |    4.67002   .1339488    34.86   0.000     4.400976    4.939064
------------------------------------------------------------------------------



UDL治疗的系数很小且不显著,所以根据这个回归,UDL对离婚没有影响。

可以按照de Chaisemartin和D’Haultfœuille(2020)的计算,使用twowayfeweights Stata命令计算这个TWFE回归中βfe的权重。

从SSC存储库安装命令(ssc install twowayfeweights)。

执行以下Stata命令:

twowayfeweights div_rate state year udl, type(feTR) test_random_weights(exposurelength)
weight(stpop)
  • 其中test_random_weights(exposurelength)用于测试权重是否与一个州接触UDL的年数相关,而weight(stpop)表示我们寻求分解的TWFE回归是按stpop加权的。
 twowayfeweights div_rate state year udl, type(feTR) test_random_weights(expo
> surelength) weight(stpop)
Under the common trends assumption, beta estimates a weighted sum of 522 ATTs.
>  
490 ATTs receive a positive weight, and 32 receive a negative weight.
The sum of the positive weights is equal to 1.0259068.
The sum of the negative weights is equal to -.02590675.
beta is compatible with a DGP where the average of those ATTs is equal to 0,
while their standard deviation is equal to .10959386.
beta is compatible with a DGP where those ATTs all are of a different sign tha
> n beta,
while their standard deviation is equal to .33951557.

Regression of variables possibly correlated with the treatment effect on the w
> eights

B[1,4]
                     Coef           SE       t-stat  Correlation
exposurele~h   -8.2883612    .21360588   -38.802121   -.73253245



在平行趋势假设下,假设治疗效果不随时间变化的βfe分解在de Chaisemartin和D’Haultfœuille(2020)的网络附录的定理S2中可以计算,用type(feS)替换type(feTR)。Goodman-Bacon分解不能用来评估βfe是否估计一个凸组合的效果。

在Stevenson和Wolfers(2006)的数据中,Goodman-Bacon(2021)在他的实证应用中使用,如果将样本限制在1956年未总是接受治疗的州和前十年的面板上,de Chaisemartin和D’Haultfœuille(2020)的定理1中的所有权重都是正的,但Goodman-Bacon分解中对DIDs的权重总和,使用一个在两个时期都接受治疗的组作为对照组,等于0.06。除此之外,可以表明,有DIDs比较一个切换者和一个在两个时期都接受治疗的组在Goodman-Bacon分解中是必要但不充分的,以在de Chaisemartin和D’Haultfœuille(2020)的定理1中有负权重。同样,Goodman-Bacon分解中对DIDs的权重总和,使用一个在两个时期都接受治疗的组作为对照组,总是大于de Chaisemartin和D’Haultfœuille(2020)的定理1中的负权重的绝对值。

Goodman-Bacon分解“高估”了de Chaisemartin和D’Haultfœuille(2020)的定理1中的负权重,因为只要有三个不同的处理日期,就没有一种独特的方式将βfe分解为DIDs的加权平均,并且存在其他分解方式,比Goodman-Bacon分解对使用一个在两个时期都接受治疗的组作为对照组的DIDs的权重更少。

用于计算Goodman-Bacon分解中的权重的Stata和R命令bacondecomp。

Stata(见Goodman-Bacon等人,2019)和R(见Flack和Edward,2020)命令

Stata命令bacondecomp 的基本语法是:

bacondecomp outcome treatment, detail 

事件研究TWFE估计

*** 4) Event-study TWFE regression
 
reg div_rate rel_time* i.state i.year [w=stpop], vce(cluster state)
test rel_timeminus1 rel_timeminus2 rel_timeminus3 rel_timeminus4 rel_timeminus5 rel_timeminus6 rel_timeminus7 rel_timeminus8 rel_timeminus9

Decomposing the first estimated effect in the event-study TWFE regression

twowayfeweights div_rate state year rel_time1, type(feTR) test_random_weights(year) weight(stpop) other_treatments(rel_time2-rel_time16) controls(rel_timeminus1-rel_timeminus9)

Sun and Abraham event-study estimators

*ssc install eventstudyinteract
*help eventstudyinteract
replace cohort=. if cohort==0
eventstudyinteract div_rate rel_time* [aweight=stpop], ///
 absorb(i.state i.year) cohort(cohort) control_cohort(controlgroup) ///
 vce(cluster state)

Estimators of Callaway and Sant'Anna

*ssc install csdid
*help csdid
replace cohort=0 if cohort==.
timer clear
timer on 1
csdid div_rate [weight=stpop], ivar(state) time(year) gvar(cohort) notyet agg(event)
timer off 1
timer list



Estimators of de Chaisemartin and D'Haultfoeuille
*ssc install did_multiplegt_dyn
*help did_imputation_dyn
timer clear
timer on 1
did_multiplegt_dyn div_rate state year udl, effects(16) placebo(9) weight(stpop) predict_het(stpop1968,1)
timer off 1
timer list

Estimators of Borusyak et. al.

*ssc install did_imputation
*help did_imputation
replace cohort=. if cohort==0
did_imputation div_rate state year cohort [aweight=stpop], horizons(0/15) autosample minn(0) pre(9)



经济学研究中的机器学习与因果推断专题

20217--2024年,8年Stata经典课程


新课纲、新升级

AI赋能科研

AI全流程辅助Stata机器学习与因果推断学术应用

含AI大模型基础课+因果推断+双重机器学习(Stata操作)等前沿内容

原理+操作+论文+前沿

超长回放,详询工作人员报名

数量经济学
见证计量经济学发展,更懂计量更懂你!
 最新文章