引入
久违的研究探索栏目正式回归啦!前文提到,双重差分法是政策效应评估方法中的一大利器,本期则将结合实例讲解其应用及具体操作,并附上相关的操作代码和解释,主要分为基准回归与平行趋势检验两步骤。我们以《数量经济技术经济研究》的一篇论文为例,复现双重差分DID的数据分析和实操过程。以下的分析模型均为论文的内容,分析软件为STATA。
参考文献
喻旭兰,周颖.绿色信贷政策与高污染企业绿色转型:基于减排和发展的视角[J].数量经济技术经济研究. 2023, 40(07): 179-200.
一、基准回归
构
建
模
型
首先我们构建双重差分模型:
其中:
Yftci为被解释变量,表示污染排放强度指标与全要素生产率;
GCPit为核心解释变量(双重差分项),即根据绿色信贷政策实施后银行机构贷款授信的实际变动情况,将样本划分为仅包含高污染企业的处理组和包含非高污染企业的控制组;
X’ft为一系列企业层面的控制变量;
Trendft为时间趋势项,用来吸收被解释变量可能存在但尚未被控制变量和固定效应所完全覆盖的增减趋势;
∅ftci为企业、年份、城市和行业固定效应,分别用以吸收个体、时间、地区和行业层面不可观测的典型特征对相同组别范围中企业的同质性冲击;
εftci为随机扰动项。
代
码
复
现
此处着重介绍双重差分项的构建及基准回归结果的复现及解释。
核心解释变量
GCPti=Treati×Postt,
其中:
Treati是处理组虚拟变量,高污染企业取1,非高污染企业取0;
Postt是绿色信贷政策实施前后的虚拟变量,2007年以前年度取0,2007年以后年度取1,2007年当年取0.420。
反映到代码上即为“构建双重差分项”以下的部分;然后将一系列企业层面的控制变量和企业、年份、城市、行业固定效应储存到“ctrlist”、“regopt”两个变量中,就被解释变量展开基准回归。
回归结果与文章一致,双重差分项系数显著为负,表明绿色信贷政策实施以后,相对于非高污染企业,高污染企业减排成效提升,同时全要素生产率受到抑制。
二、平行趋势检验
构
建
模
型
我们继续构建模型:
双重差分模型的一个关键假设是平行趋势假说,就参考文章而言,即要求高污染企业和非高污染企业之间污染排放强度和全要素生产率的差异在绿色信贷政策实施前不随时间推移而发生显著变化。
其中:
Dk是时间虚拟变量,当样本所属年份为k年时取1,否则取0;
其余字母符号的解释同基准回归模型。
同时为避免出现多重共线性,参考文章将基准期设定为2006年。
代
码
复
现
此处着重分析平行趋势图的意义及绘制代码复现。
通过软件绘制的平行趋势图分别表示了以Polint(污染排放强度)和TFP_op(全要素生产率)作为上述模型被解释变量时,系数αk的大小和显著性。
观察可知,在2007年以前,交互项系数αk均不显著地异于0,这说明在政策实施以前,高污染企业与非高污染企业之间污染排放强度和全要素生产率的差异不随时间变化,从而平行趋势假说得到验证。
同时,对于2007年以后的交互项系数,其估计值逐年减小,且在样本期的末年均出现显著异于0的情况,这说明绿色信贷政策实施后,相对于非高污染企业,高污染企业环境表现改善更明显而全要素生产率下降更剧烈,且政策对两者的影响效应逐年增强。这也意味着,至少在政策实施后的六年以内,高污染企业环境表现持续改善而全要素生产率持续受到抑制。
End
文字 | 李施宣 张 宇
排版 | 方玮晴
初审 | 陈敏欣
复审 | 陈梓昊