断点回归方法,来自《经济研究》、《经济学(季刊)》等的操作规范(附代码复刻)

学术   2024-12-22 21:52   陕西  

24篇《管理世界》、《经济研究》、《经济学(季刊)》、《数量经济技术经济研究》、《 中国工业经济》等应用断点回归方法的论文


经济学研究中的机器学习与因果推断专题


对《管理世界》、《经济研究》、《数量经济技术经济研究》、《 中国工业经济》等论文进行统计,以关键词“断点回归”搜索,找到如下应用断点回归法的论文。

以《经济学》(季刊)上退休与健康+孟母三迁2篇文章来学习断点回归操作全流程

最新推荐_2023年第6期《数量经济技术经济研究》上时间断点及DID等方法主题文章

《数量经济技术经济研究》2023年第6期主要计量方法命集合(合成DID、强度DID、断点等)JDE顶

级期刊_断点文章与《数量经济技术经济研究》上7月27日论文_研究房价与家庭消费

《数量经济技术经济研究》2023年第9期上事件研究、合成DID、断点文章推荐

推荐2篇经典必读《数量经济技术经济研究》+《中国工业经济》上断点回归方法论文

《中国工业经济》上断点回归操作全流程论文推荐

推荐一篇《中国工业经济》上断点回归操作全流程论文


序号篇名作者年/期
管理世界


1“退休—医疗服务波动”之谜的形成机理与破解路径——基于制度联系视角的理论及实证分析于新亮;胡秋阳;申宇鹏;2023年10月
2公司业绩聚集现象研究——基于中国A股上市公司股权激励计划的断点回归分析甄红线;王玺;史永东;2021年6月
3空气污染对企业生产率的影响——来自中国工业企业的证据李卫兵;张凯霞;2019年10月
4混合所有制企业的股权结构与创新行为——基于自然实验与断点回归的实证检验陈林;万攀兵;许莹盈;2019年10月
5企业避税、债务融资与债务融资来源——基于所得税征管体制改革的断点回归分析刘行;赵健宇;叶康涛;2017年10月
经济研究


1退休与城镇家庭消费:基于断点回归设计的经验证据邹红;喻开志;2015年1月
2脱贫农户返贫风险防范政策研究贾男;王赫;2022年10月
3常态化精准扶贫政策的完善:反福利依赖的视角黄薇;曹杨;2022年4月
4个人信息披露决策:强制收集与挤入效应何佳;高彧;孟涓涓;王曾;2022年5月
5精准扶贫政策效果评估——基于贫困人口微观追踪数据李芳华;张阳阳;郑新业;2020年8月
6义务教育法与中国城镇教育回报率:基于断点回归设计刘生龙;周绍杰;胡鞍钢;2016年2月
7“社会养老”能否替代“家庭养老”?——来自中国新型农村社会养老保险的证据张川川;陈斌开;2014年11月
8价格差异、市场分割与边界效应——基于长三角15个城市的实证研究黄新飞;陈珊珊;李腾;2014年12月
9贫困家庭高中阶段教育选择:基于行为经济学的视角李芳华;肖寒;2022年12月
10晋升激励与工业用地出让价格——基于断点回归方法的研究田文佳;余靖雯;龚六堂;2019年10月
数量经济技术经济研究


1房价升值预期、财富幻觉与家庭消费——基于《国六条》的证据王岳龙;蔡玉龙;唐宇晨;2023年9月
2中国新农保制度的实践与问题分析秦聪;郭婧;2021年5月
3数字化转型是否降低企业研发操纵?董松柯;刘希章;李娜2023年4月
中国工业经济


1养老金对缓解农村居民医疗负担的作用——为何补贴收入的效果好于补贴医保马超;李植乐;孙转兰;唐润宇2021年第04期
经济学季刊


1城市内的“孟母”:子女随迁如何影响母亲就业决策和性别收入差距?梁文泉;钟瑞婷2023年第05期
2公共托幼服务对生育意愿的影响——基于断点回归的经验证据陈梅;张梦皙;石智雷2023年第06期
3未预期的环境污染:税收征管的跨部门溢出效应研究罗宇;张明昂;林高怡2024年第01期
4延迟退休意愿、医疗服务利用与健康收益朱铭来;申宇鹏;康琢2024年第01期
5读书何以改变命运?——基于精英教育长期回报的考察李逸飞;刘海琦;李静2024年第09期


《中国工业经济》上断点回归操作全流程论文推荐


论文题目:养老金对缓解农村居民医疗负担的作用

背景:

本文利用只有满60周岁才能领取新农保养老金这个非连续性制度设计 , 采用断点回归设计 (Regression Discontinuity Design,RDD) 来检验新农保对医疗负担的影响。

1、断点回归操作步骤:判断精确断点还是模糊断点

尽管政策规定年满60岁的参保农村居民可以领取养老金, 但是由于 各地政策差异等原因,有些年满60岁的参保者未必能领取到养老金, 也有 少部分60岁以下的参保者领到了养老金。这说明新农保并没有使个体领 取养老金的概率在断点处发生 0 到 1 的变化,仅仅发生了一个小于 1 的跳跃,因此符合模糊断点的设定(Fuzzy Regression Design,FRD)。

2、图示法:查看年龄与获得新农保养老金概率的图

命令:rdplot


****图2
rdplot nrps_get agesd, binselect(es) ci(95) nbins(15) ///
   graph_options(ytitle(获得养老金的概率) ///
                 xtitle(标准化年龄) ///
                 graphregion(color(white)))///

结果为:

表明在此制度设计下,个体获得养老金的概率在60岁左右出现一个明显的断点(如图所示,明显跳跃)。上图反映了驱动变量年龄与是否获得养老金之间的关系

3、图展示新农保对医疗负担的缓解作用

分别展示驱动变量年龄与家庭自负—收入比的关系,以及年龄与灾难性医疗支出的关系,

结果如下图所示:

可以看到在断点附近家庭自负—收入比++++灾难性医疗支出有明显向下跳跃。初步说明新农保带来的正向收入冲击,可以在一定程度上减少家庭医疗负担。

4、研究断点处理效应

分别选择因变量为家庭自负—收入比++++灾难性医疗支出,得到断点回归处理效应

结果如下图:

代码如下:


****表2 panelA
rdrobust f_burden agesd , fuzzy(nrps_get)  bwselect(msesum) ///
   covs(Edu Marry_Status body_pain hypertension chro_disease_num  GH_poor_2 memory_sr_poor  ADL_IADL Y2_CESD_score insured) ///
   vce(cluster householdID)  
****表2 panelB   
rdrobust cata_medi agesd , fuzzy(nrps_get)  bwselect(msesum) ///
   covs(Edu Marry_Status body_pain hypertension chro_disease_num  GH_poor_2 memory_sr_poor  ADL_IADL Y2_CESD_score insured) ///
   vce(cluster householdID)

原文结果为:

5、断点回归结果的稳健性检验

5.1 断点回归设计的连续性检验

检验各前定变量在断点处是否连续,将因变量换做前定变量。

此部分也是使用rdrobust命令

Stata: 不可不知的4种断点回归 (RDD) 中的平滑性检验方法

5.2 驱动变量内生分组检验

观测驱动变量的分布情况,以检验年龄是否被人操控。

5.3 汇报不同带宽

由于断点回归在操作上有不同选择,一般同时汇报如下各种情形,然后以保证结果的稳健性:分别汇报使用不同带宽的结果(比如最优带宽及其二分之一0.5或者两倍带宽)

在rd命令里面可以进行带宽选择,在rdrobust命令里面可以汇报不同带宽,详见

RDD: 断点回归命令rdrobust(附rdbwselect、rdplot)及Stata实现

5.4 伪断点分析

在远离 60 岁的其他年龄处做“伪断点”,选择偏离60岁的其他作为“伪断点”进行回归,回归结果均不显著。说明 60 岁附近自负-收入比和灾难性医疗支出的下降确实是新农保的作用。


6.1.断点回归操作动作建议

在进行断点回归(RD)设计时,一般有如下步骤:

1、参考变量分布连续性检验/检验内生分组

  • 这里检验内生分组,即主要检验配置变量,其实就是RD中个体是否将自行进入断点两侧,决定是否进入实验的,并是否存在某种跳跃性的变化。如果存在内生分组,个体将自行进入实验,导致在断点两侧的分布不均匀,这样分组变量x的密度函数f(x)在x=c处不连续,出现左右极限不相等的情况。

  • McCrary(2008)提出了一种核密度函数的检验方法(命令是DCdensity,介绍见下述操作),将参考变量划分成不同的区间并计算各区间中的个体数量,如果个体能够操纵参考变量,我们将能观测到断点左右个体数量有较大差别,比如很多个体通过操纵到了断点的右侧,那么,在断点右侧的区间中个体数量可能将大大超过断点左侧区间中个体的数量,利用带宽选择和曲线拟合方法, 可以检验在断点处c是否存在跳跃 。

2、检查为精确断点回归还是模糊断点回归分析

  • 检验处理变量是否完全由“某连续变量是否超过某一断点”所决定,如果个体被处理的概率从0跳跃为1,即为精确断点回归,如果个体被处理的概率从 a跳跃为 b,0<a<b<1,则为模糊断点回归。

3、图形分析

  • 画出结果变量与参考变量之间的关系图,如果是模糊断点,再画出原因变量与参考变量的关系图,呈现结果变量和原因变量在断点处行为,为断点回归设计提供理论支撑。

4、检验结果对不同带宽、不同多项式次数的稳健性

  • 设置不同带宽,通过选择最优带宽,再检验并选择相对应的模型。stata断点回归命令有相关的操作选项。另外还有图形选择(在最优带宽处画线),可以考虑加协变量进行选择。

5、检验其他影响结果变量的因素(协变量),在断点处是否存在跳跃

  • 检验协变量在断点处是否存在跳跃,若是存在跳跃,说明该协变量的条件密度函数在断点处不是连续的,需要剔除。若将存在跳跃的协变量剔除。则需要重新选择最优带宽再重新进行断点回归分析。

6.2、显著性检验

模型估计完成后,可以进行下列模型设定检验,以判断估计结果的稳健性

  • (1)协变量连续性检验,也称为伪结果检验( pseudo outcome)。以协变量 作为伪结果,利用与前面相同的方法,检验相应的RDD估计量是否显著,如果 显著说明这些协变量不符合连续性假设,上文的RDD估计量可能存在问题。

  • (2)参考变量分布连续性检验,如果参考变量分布连续,意味着在断点处个体没有精确操纵参考变量的能力,局部随机化假设成立,从而保证断点附近左右样本能够代表断点处的总体。(此处与检验内生分组一致)

  • (3)伪断点检验( pseudo cutoff point)。在参考变量的其他位置,比如断点 左右两侧中点位置作为伪断点,利用同样的方法估计RDD估计量,我们知道在 伪断点干预效应为零,如果发现伪断点的RDD估计量不为零,则说明我们的RDD设计可能有问题,可能混杂了其他未观测因素的影响,得到的因果效应可能是由其他未观测混杂的跳跃造成的,而不完全是干预的影响

  • (4)带宽选择的敏感性检验。选择不同的带宽对RDD估计量进行重新估 计,检验估计结果是否有较大的变量,如果差异较大,尤其是影响方向有变化说明RDD设计可能有问题。

上述显著性检验其实在前面进行分析时候已经部分有所提及需要进行检验的。

再推荐一篇《数量经济技术经济研究》上含断点回归方法论文

来源:数字化转型是否降低企业研发操纵?,《数量经济技术经济研究》2023年第04期

本文主要考察企业数字化转型对研发操纵行为的影响

1、麦克拉瑞检验-DCdensity

该文图1与图2就是用到了DCdensity命令绘制,原文图为:

原文附件代码命令为:

拓展知识:

McCrary(2008)可以通过非官方命令DCdensity来实现,其中DC表示Discontinuity,可以来检验分组变量的密度函数在断点处是否连续。依此判断,是否存在内生分组问题。

该命令的下载地址为:https://eml.berkeley.edu/~jmccrary/DCdensity/

然后将该命令的DCdensity.ado下载安装或者复制到C:\ado\plus,Mac系统的需要自己sysdir查询外部命令安装路径,自行复制下载。命令语法格式为:

DCdensity assign_var,breakpoint(#) generate(Xj Yj r0 fhat se_fhat) graphname(filename) 

其中

  • assign_var 为分组变量
  • 必选项breakpoint(#)用来指定断点位置,
  • generate(Xj Yj r0 fhat se_fhat)用来指定输出变量名
  • graphname用来命名指定密度函数图。

2、断点图形分析

该文图5用到了cmogram命令绘制,原文图为:

这个可以结合Stata命令模板*断点回归分析设计给讲到的命令


3、协变量连续性

原文表6 报告了协变量在断点附近连续性的检验结果。

在这里主要使用rdrobust命令,rdrobust可以参考RDD: 断点回归命令rdrobust(附rdbwselect、rdplot)及Stata实现

在这里只需要将变量换成全部所有的协变量即可进行相关检验,代码如下:

4、断点分析

文章表7+表8进行的断点回归分析仍然主要使用rdrobust命令,同时选择不同带宽以及Conventional、Bias-corrected与 Robust 等不同的断点估计方法。

rdrobust可以参考RDD: 断点回归命令rdrobust(附rdbwselect、rdplot)及Stata实现

数量经济学
见证计量经济学发展,更懂计量更懂你!
 最新文章