久违的研究探索栏目正式回归啦!我们此前分享过PSM的原理及其操作,而PSM与DID都可以研究政策的处置效应,但论侧重点,PSM倾向得分匹配能解决样本选择偏误的问题,而DID则侧重于解决内生性问题,让我们举个例子:
案例背景:A省在 2014 年通过了新教育政策,该教育政策实之后,居民受教育年数有所增加,我们想研究新教育政策对一个人的工资水平的影响。
当我们建立回归模型:
Yi :因变量,每小时的工资
Xi :自变量,受教育的年数
Ui :其他非观测因素
我们会发现——受教育的年数不仅和教育政策有关,还和其他的因素有关!这就是出现内生性问题。
参考书目:邱嘉平. 因果推断实用计量方法[M]. 上海财经大学出版社, 2020.
1. 含义及特点:在社会科学研究中,双重差分法DID是用来估计政策干预和事件处置效应的一个常用方法,也是因果机制分析的重要方法。这些政策或事件的特点是,它们并不在同一时间影响所有个体,或者对个体的影响并不相同。
2. 基本原理:基于一个反事实的框架来评估政策发生和不发生这两种情况下被观测因素y的变化。如果一个外生的政策冲击将样本分为两组一受政策干预的实验组和未受政策干预的控制组,且在政策冲击前,实验组和控制组的y没有显著差异,那么我们就可以将控制组在政策发生前后y的变化看作实验组未受政策冲击时的状况 (反事实的结果)。
通过比较实验组y的变化(D1)以及控制组y的变化(D2),我们就可以得到政策冲击的实际效果(DD=D1-D2)。
让我们再举个例子:A省在2014年通过了新税法,B省没有通过,A省和B省其他条件相似,我们要研究的是新税法对企业业绩影响效果如何?当我们运用DID,其基本思路如下:
✔️ 处置组(A省的企业)在2014年前后的平均业绩变化包含了新税法和其他因素的影响;
✔️ 控制组(B省的企业)在2014年前后的平均业绩变化只包含了其他因素的影响。
当其他因素对处置组和控制组的影响一样时,我们可以通过二者相减来估计新税法对业绩的处置效应。
那么在这个例子中,第一重差分其实就是处理组和对照组之间的差分,即它们的横向组间差距,这个差分,我们在政策实施前做一次差,在实施后再做一次差,那么第二重差分就是我们使用政策实施后的差值减去实施前的差值,即纵向组内差距,而通过第二重差分,我们就知道处理行为的效果,这两重差分的顺序是可以变换的,我们会得到相同的结果。
但是大家有没有想到,刚刚介绍的两种差分法有一个说不通的地方,也就是两组个体差异这个值如果随着时间对两组数据产生的影响不同、或者加入了一些新的变量来影响,那么我们测算到的行为处理效果也是不准的,所以我们要引入两个假设,从我们刚刚了解到的两个方向出发,也就是横向和纵向方面:
方法1:从横向差异来理解(平行趋势假设):
✔️ 第一重差分:
处置A组在事件发生的2014年前后的差异
= CA1-CA0
=实施新税法造成的差异 (处置效应) + 其它因素造成的处置组在2014年前后的差异
控制B组在事件发生的2014年前后的差异
= CB1-CB0
=其它因素造成的控制组在2014年前后的差异
✔️ 第二重差分:
处置A组在事件发生的2014年前后的差异—控制组在事件发生的2014年前后的差异
=[CA1-CA0]- [CB1-CB0]
=实施新税法造成的差异 (处置效应) +其它因素造成的处置组在2014年前后的差异-其它因素造成的控制组在2014前后的差异)
=0,当平行趋势假设成立
=实施新税法造成的差异 (处置效应)
可见通过双重差分法能够正确估计实施新税法造成的平均业绩差异,需要的条件是:其它因素造成的处置组在2014年前后的差异 =其它因素造成的控制组在2014前后的差异
这个条件称为平行趋势假设(Parallel Trend Assumption)。
这个假设的意思是其它因素对处置组和控制组在2014前后平均业绩变化的影响是相同的。这意味着在不存在税收法改变的情况下,控制组和处置组的平均业绩随时间变化的趋势是平行。
方法2:从纵向差异理解(差异不变假设)
第一重差分:
处置组和控制组在事件发生的2014年后的差异
=CA1-CB1
=实施新税法造成的差异 (处效应置) + 其它因素造成的处置组和控组制在2014年后的差异
处置组和控制组在事件发生的2014年前的差异
=CA0-CB0
=其它因素造成的处置组和控组制在2014年前的差异
第二重差分:
处置A组和控制B组在事件发生的2014年后的差异-处置组和控制组在事件发生的2014年前的差异
=[ CA1-CB1]- [CA0-CB0]
=实施新税法造成的差异 (处置效应) +其它因素造成的处置组和控组制在2014年后的差异-其它因素造成的处置组和控组制在2014年=0,当差异不变假设成立
=实施新税法造成的差异 (处置效应)
可见,如果我们希望能够通过双重差分正确地估计事件造成的差异,即事件的处置效应,所需的条件是:
其它因素造成的处置组和控组制在2014年后的差异=其它因素造成的处置组和控组制在2014年前的差异
这个条件称为差异不变假设(Bias Stability Assumption)。
这个假设的意思是指其它因素造成处置组和控制组的差异在2014前后是相同的。这意味着在不存在税收法改变的情况下,控制组和处置组在2014年前后的差异是相同。
平行趋势假设和差异不变假设是一致的,平行趋势假设成立意味着,在税法未发生改动的情况下,处置组和控制组的的平均业绩的时间趋势是平行,因此两组的平均业绩差异保持不变的。
同样是因为数据本身存在一些个体差异性,即存在内生性的问题,它们不止会受到我们所研究的处理行为的影响,同时也会收到其他因素的影响,所以我们要设置一组控制变量,这个时候我们就需要去构建回归模型。
以上列出的两个回归模型的形式都是一样的,上面的一般书本上的写法,为了方便记忆、理解我们可以记第二种形式,我们可以直观看出来这个式子一般有5个项,就我们刚刚提到的例子:“2014年税法政策通过与否对A、B省企业业绩的影响情况”里面,Yit是指A省的一个企业y在时间t的平均业绩,在等式右侧有一个截距项β0,然后有一个T自变量,它是时间变量,是一个0、1变量,在处理行为发生之前的就取0,发生之后的就取1;还有一个D变量,是处理组变量,当它不是处理组成员则D值取0,还有一个交互项D×T,对应系数为β3,只有当这个对象是处理组成员且在事件发生之后才取1,其他时候都取0,这个交互项是我们处理行为的效果,所以我们主要关注的是这个交互项。
那么为什么这个β3是处理行为的效果呢?这里大家可以自行带入不同的情况然后按照刚刚演示的差分方法进行带入,就会发现第二重差分后减出来的结果就是β3。
单双重差分法的区别及其优缺点:
1. 单重差分是对原始时间序列数据进行一次差分,即对当前时刻的数值减去上一个时刻的数值,得到新的时间序列数据。这种方法可以用来消除时间序列数据中的趋势性和季节性,使得数据更加平稳。
2. 双重差分则是对单重差分后的数据再进行一次差分,即对单重差分得到的时间序列数据再进行一次差分运算。这种方法通常用于处理非平稳的时间序列数据,可以进一步消除数据中的趋势性和季节性,并减少一些内生性因素,使得数据更加平稳。
区别在于差分的次数和对数据的处理程度,双重差分相对于单重差分来说更加彻底和全面,可以更好地消除时间序列数据中的趋势性和季节性。
文字|麦谷丰 申红朵
排版|孔昊瑜
初审|陈敏欣
复审|陈梓昊