Stata+R：合成控制双重差分法（SDID）及安慰剂检验

学术 2024-09-30 23:39 陕西

合成双重差分法

引言

本文利用面板数据提出了一个新的因果效应估计，该估计建立在广泛使用的双重差分和合成控制方法的见解之上。相对于这些方法，研究发现，无论是从理论上还是从经验上来说，这种“系统双重差分方法”估计具有理想的稳健性，并且它在传统估计中通常在实践中使用的环境中表现良好。本文研究了当结果模型的系统部分包括潜在的单位因素与潜在的时间因素相互作用时估计量的渐近行为，并给出了一致性和渐近正态性的条件。

正如Arkhangelsky等人(2019)提出的，该软件包实现了面板数据中平均处理效果的合成双重差分法(SDID)。我们观察结果Y和二元治疗指标W的矩阵，我们认为满足Yij = Lij + τij Wij + εij。在这里，τij是在时间j时，处理对单位i的影响，我们估计处理在时间和地点发生的平均影响:Wij=1的观测值的平均τij。所有治疗单元必须同时开始治疗，因此W为块矩阵:i > N0, j > T0 Wij = 1，否则为0，其中N0为对照单元数，T0为治疗开始前的观察次数。这特别适用于单个处理单元或处理期间的情况。

合成DID操作及Stata应用

sdid—Stata中合成双重差分

继Arkhangelsky等人(2021年)之后，该Stata包实现了综合双重差分估计过程，以及一系列推断和绘图过程。Arkhangelsky等人提供了一个使用R的代码实现，这里附带了一些材料:synthdid。这里我们提供了一个原生的Stata实现，主要是用Mata编写的。这个包扩展了原始R包的功能，允许非常简单地在多个处理阶段交错采用的上下文中进行评估(以及在原始代码的单个采用阶段)。

安装到Stata

ssc install sdid

语法格式

sdid Y S T D, vce(method) seed(#) reps(#) covariates(varlist [, method]) 
graph g1_opt(string) g2_opt(string) unstandardized graph_export([stub] , type)

选项含义：

Y:结果变量(数值)

S:单位变量(数字或字符串)

T:时间变量(数值)

D:处理的虚拟，如果单位被处理，则为1，否则为0(数字)

vce (): bootstrap, jackknife，安慰剂标准误差。

seed():伪随机数的种子定义。

reps(#):重复bootstrap和安慰剂。

covariates(varlist [, method]):用于调整y的协变量。应包含协变量的varlist，并可选用于调整方法的选项。在这种情况下，它可以遵循Arkhangelsky等人提出的方法进行“优化”，在这种情况下，它可以遵循Kranz, 2021 (xsynth在R中)提出的程序。在没有指定方法的情况下，默认使用“优化”。克兰兹已经证明投影法在许多情况下是可取的。在这个实现中，投影的方法通常要快得多。

graph:如果指定了该选项，将显示单位和时间权重以及结果趋势的图形，如Arkhangelsky等人的图1。

g1_opt(string) g2_opt(string):选项，用于修改上述图形的外观。G1为单位权重图，g2为结果趋势图。请求的选项必须遵循Stata的twoway_options的语法。

unstandardized:如果包含了控制，并且指定了“优化”方法，在找到最优权重之前，控制将被标准化为z分数。这避免了控制变量具有高度离散时的优化问题。如果指定了非标准化，则只需输入控件的原始单位。应该谨慎使用这个选项。

graph_export([stub]， type):使用这个选项可以将生成的图形保存到磁盘。每个单位权重和结果趋势将分别保存为weightsYYYY和trendsYYYY, YYYY表示每个治疗采用期。每个治疗采用阶段将生成两个图表。如果指定了该选项，则必须指定type，它指的是一个有效的Stata图形类型(例如"。Eps "， ".pdf"等等)。可选地，可以指定一个存根，在这种情况下，它将被放在导出的图形名称的前面。

案例1

一个基于提案99 (Abadie et al.， 2010)的例子，只有一个采用日期。加载Abadie et al.(2010)数据:


. use "C:\Users\Metrics\Desktop\prop99_example.dta"

使用sdid进行估计，导出权重和趋势图:


. sdid packspercapita state year treated, vce(placebo) seed(1213) graph g1_opt(xtitle("")) g2_

可以使用 eststo and esttab输出结果:

*create a uniform variable to use as a control
gen r=runiform()

*run sdid
eststo sdid_1: sdid packspercapita state year treated, vce(placebo) seed(2022)
eststo sdid_2: sdid packspercapita state year treated, vce(placebo) seed(2022) covariates(r, projected)

*create a table
esttab sdid_1 sdid_2, starlevel ("*" 0.10 "**" 0.05 "***" 0.01) b(%-9.3f) se(%-9.3f)

结果为：

--------------------------------------------
                      (1)             (2)   
             packsperca~a    packsperca~a   
--------------------------------------------
treated           -15.604*        -15.750*  
                  (7.981)         (8.039)   
--------------------------------------------
N                    1209            1209   
--------------------------------------------
Standard errors in parentheses
* p<0.10, ** p<0.05, *** p<0.01

案例2

基于议会性别配额、议会中的女性和孕产妇死亡率的交错采用设计实例(Bhalotra等人，2020年)。数据加载:

use "C:\Users\Metrics\Desktop\quota_example.dta"

运行没有协变量和引导标准误差的估计

sdid womparl country year quota, vce(bootstrap) seed(1213)

以投影的方式使用协变量运行sdid

sdid womparl country year quota, vce(bootstrap) seed(1213) covariates(lngdp, projected)

安慰剂检验代码

安慰剂检验代码为：

//Specify URL
webuse set www.damianclarke.net/stata/

*------------------------------------------------------------------------------*
*ONE TIME ADOPTION
*------------------------------------------------------------------------------*
webuse quota_example.dta, clear

*-----------*
*Bootstrap SE
*-----------*
//Keep only one time adoption units (2002)
#delimit ;
drop if country=="Algeria" | country=="Jordan" | country=="Kenya"     |
        country=="Rwanda"  | country=="Samoa"  | country=="Swaziland" | 
        country=="Tanzania";
#delimit cr

sdid womparl country year quota, vce(bootstrap) seed(1234) graph

*with control
preserve
drop if lngdp==.
sdid womparl country year quota, vce(bootstrap) seed(1234) covariates(lngdp)
sdid womparl country year quota, vce(bootstrap) seed(1234) covariates(lngdp, projected)
restore

*----------*
*Placebo SE
*----------*
sdid womparl country year quota, vce(placebo) seed(1234) 

*with control: it is necessary drop the missing observations in control variable
preserve
drop if lngdp==.
sdid womparl country year quota, vce(placebo) seed(1234) covariates(lngdp)
sdid womparl country year quota, vce(placebo) seed(1234) covariates(lngdp, projected)
restore

*-----------*
*Jackknife SE
*-----------*
sdid womparl country year quota, vce(jackknife)

*with control: it is necessary drop the missing observations in control variable
preserve
drop if lngdp==.
sdid womparl country year quota, vce(jackknife) covariates(lngdp)
sdid womparl country year quota, vce(jackknife) covariates(lngdp, projected)
restore

*------------------------------------------------------------------------------*
*STAGGERED ADOPTION
*------------------------------------------------------------------------------*
webuse quota_example.dta, clear

*-----------*
*Bootstrap SE
*-----------*
sdid womparl country year quota, vce(bootstrap) seed(1234) graph

*with control: it is necessary drop the missing observations in control variable
preserve
drop if lngdp==.
sdid womparl country year quota, vce(bootstrap) seed(1234) covariates(lngdp)
sdid womparl country year quota, vce(bootstrap) seed(1234) covariates(lngdp, projected)
restore

*----------*
*Placebo SE
*----------*
sdid womparl country year quota, vce(placebo) seed(1234)

*with control: it is necessary drop the missing observations in control variable
preserve
drop if lngdp==.
sdid womparl country year quota, vce(placebo) seed(1234) covariates(lngdp)
sdid womparl country year quota, vce(placebo) seed(1234) covariates(lngdp, projected)
restore

*-----------*
*Jackknife SE
*-----------*
//Keep only treatment periods with more than 2 treated units (2002-2003)
//This is required for jackknife standard error
#delimit ;
drop if country=="Algeria"   | country=="Kenya"    | country=="Samoa"  | 
        country=="Swaziland" | country=="Tanzania";
#delimit cr

sdid womparl country year quota, vce(jackknife)

*with control: it is necessary drop the missing observations in control variable
preserve
drop if lngdp==.
sdid womparl country year quota, vce(jackknife) covariates(lngdp)
sdid womparl country year quota, vce(jackknife) covariates(lngdp, projected)
restore

R软件安装

当前的开发版本可以使用devtools从源代码安装。


devtools: install_github(“synth-inference / synthdid”)

R语言版本：Example

library(synthdid)

# Estimate the effect of California Proposition 99 on cigarette consumption
data('california_prop99')
setup = panel.matrices(california_prop99)
tau.hat = synthdid_estimate(setup$Y, setup$N0, setup$T0)
se = sqrt(vcov(tau.hat, method='placebo'))
sprintf('point estimate: %1.2f', tau.hat)
sprintf('95%% CI (%1.2f, %1.2f)', tau.hat - 1.96 * se, tau.hat + 1.96 * se)
plot(tau.hat)

References

Dmitry Arkhangelsky, Susan Athey, David A. Hirshberg, Guido W. Imbens, and Stefan Wager. Synthetic Difference in Differences, 2019.‘’

阅读原文：

synthdid: Synthetic difference in differences

数量经济学

见证计量经济学发展，更懂计量更懂你！

断点回归方法，来自《经济研究》、《经济学（季刊）》等的操作规范（附代码复刻）

2025年Stata寒假班--AI赋能机器学习与因果推断前沿

韦恩图与FWL定理

2025年Stata初高级寒假班--AI赋能+原理+操作+论文+前沿应用

Stata+R：交叠DID命令清单

DDML主页--双重机器学习入门必备手册

Marp 和 Markdown 快速制作幻灯片

AI赋能科研：2025Stata机器学习与因果推断前沿

《中国工业经济》2024年第11期目录和主要命令集合

合成控制法进展：机器学习中随机森林+SCM！分位数控制法

AI+Stata：2025机器学习与因果推断前沿专题

2025新目标，掌握Hansen 教授提到的最先进的估计方法

Stata+R：异质性DID稳健估计量命令清单

Lasso机器学习&工具变量VS 伍德里奇经典案例--工具变量操作

2025年Stata初高级寒假班--AI赋能+原理+操作+论文+前沿应用

内生性问题：方法、进展与Stata实现（附命令+示例+论文）

Stata：一文读懂help、findit、search、ssc、net、hsearch的具体应用

AI赋能科研：Stata学术研究中的智能应用

Stata：一文搞懂熵权法

Stata：多期DID动态处理效应稳健估计-DIDm估计量—did_multiplegt（附4篇论文应用）

2025Stata寒假班--双重机器学习&因果推断前沿应用

2025Stata寒假班，赠送AI+Stata学术应用阅读讲义

交叠DID操作指南--培根分解、事件研究和安慰剂检验代码+操作手册

htmltab2stata：将 html 表格加载到 Stata 中

Stata18.0因果中介分析新进展（Stata大会）+软件实现+论文推荐

推荐2篇《数量经济技术经济研究》上含Bartik 工具变量法论文（附代码复现)

因果推断经验研究-中介效应论文方法/应用+8大命令资源推荐

DDML：双重机器学习（Stata中Python相关设置）

Stata：Lasso必备速查手册

论文应用+事件研究的平行趋势可信性检验及stata操作：pretrends

2024年第1期--第12期《数量经济技术经济研究》命令、方法汇总

推荐8篇应用 honestdid 进行DID平行趋势/置信区间敏感性检验论文

复现AER大运河_交叠DID及合成控制法应用

机器学习基本术语及其与计量经济学的区别与联系

Stata+R：合成控制双重差分法（SDID）及安慰剂检验

机器学习基本原理笔记

15篇安慰剂检验permute命令应用论文汇总--《中国工业经济》+《数量经济技术经济研究》

AI赋能科研&Stata机器学习与因果推断前沿

24篇bdiff组间系数差异检验等方法论文-《数量经济技术经济研究》+《中国工业经济》

5天30小时进阶AI辅助的机器学习与因果推断前沿方法（双重机器学习+交叠DID+SCM+SDID+HCW+RDD+PSM等前沿）

【精彩回顾】往期Stata初高级专题课--板书截图

一次性搞定DID、SCM、SDID结果输出

户口价值文章提出的断点检验新方法--rdbalance命令操作结果复刻

5篇双重机器学习DDML论文《数量经济技术经济研究》+《中国工业经济》论文推荐

ChatGPT辅助Stata：合成控制法synth操作

2024新的平行趋势检验方法，推荐这8篇最新应用论文

SSC外部命令操作与JDE期刊_户口价值文章 VS 《数量经济技术经济研究》上7月27日论文_研究房价与家庭消费

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉