随机干预试验方法,你了解多少?

职场   2024-11-02 20:16   中国  




点击蓝字关注我们

质量开讲,让质量有温度




来源:当代教育实践与教学研究
作者:杨云帆,北方民族大学经济学院
本文转载自公众号计量经济学


内容提要:计量经济学是经济学专业的一门重要专业基础课, 对培养学生批判思维能力, 定量分析能力起到重要作用。计量经济学中的随机干预试验方法可以有效帮助学生建立因果关系框架, 在实践中辨明变量的影响。同时, 随机干预试验方法的应用前景也在不断扩展。
关键词:计量经济学;随机干预试验方法;分析能力


Part1引言

计量经济学是利用经济理论和统计学技术分析经济数据的一门科学。该学科强调对经济数据所反映的变量间因果关系的建模。例如, 在教育经济学中, 研究提供奖学金能否提高学生的学习成绩;在健康经济学中, 研究烟草税可以在多大程度上减少吸烟。这些问题的回答都基于变量因果关系的定量分析。
计量经济学专家发现心理学和医学等众多领域经常应用的随机干预试验方法是理解因果关系的一项有效途径。例如, 某种新药被批准上市销售之前通常需要做临床试验, 即随机选择一些患者服用该药物, 而另一些患者服用无害的替代药品。只有当这种随机干预试验能提供有力的证据表明药物是安全有效的, 才能最终批准该药物上市。
著名计量经济学家Stock和Waston认为, 有三个理由支持应该在计量经济学课程中学习随机干预试验方法。第一, 理想化随机干预试验的概念提供了在实际中判断因果效应估计的标准。第二, 随机干预试验的结果通常很有影响力, 因此了解实际试验的局限和优点十分必要。第三, 试验经济学中得到的教训也适用于一些准试验。
基于以上背景, 本文着重介绍随机干预试验方法在计量经济学中的应用, 包括随机干预试验的基本方法和操作步骤随机干预试验的结果分析, 最后对随机干预试验的优缺点进行讨论

Part2随机干预试验方法概述

随机干预试验的核心问题是找到因果关系, 即找到与未接受政策 (或干预) 时在结果上的差别。影响程度的大小也随时间而改变如下图所示:
随机干预试验示意图
随机干预试验是在控制其他因素不变的情况下分解出哪些影响和变化是由于某项特定因素干预所引起的, 因此要借助于反事实分析。依据在于从统计学意义来讲, 因果关系是可观察到的“事实”与其“反事实”之间的差异。从反事实的框架出发, 因果关系可以表示为:
在这里Τ是指因果关系;π指所有调查对象在干预组中的比例; (1-π) 表示所有调查对象在对照组的比例;w是一个虚拟变量, 其中1代表个体在干预组,而0代表对照组;Y1和Y0分别指代干预组和对照组的成员在因变量上的取值;E则是取期望值的意思。上述公式中, E (Y1|w=1) 或E (Y0|w=0) 是可观测到的事实, 而E (Y1|w=0) 和E (Y0|w=1) 则是反事实。因果关系T就表示为干预组中的个体其“事实”与“反事实”之间的差异即E (Y1|w=1) -E (Y0|w=1) 与对照组中的个体其“事实”与“反事实”之间的差异。随机干预试验中一直存在一个问题是我们永远也不可能观测反事实是什么。因为在某项特定的研究中, 某一群人只可能在干预组或对照组, 而不能同时在两组中出现。这被称为“因果推论的基本问题” (Holland) 。为了做出因果推论, 我们希望能够满足以下条件, 这在统计学上称为“非混淆假设” (unconfoundedness assumption) :
如果满足非混淆假设, 因果推论公式就简化为:
如果公式右边的两项均能观测到, 我们就能做出因果性结论。能否做出因果推论主要取决于非混淆假设是否满足。随机化是统计学中常用的办法,由于干预个体是通过随机方式分配到干预组和对照组中的, w本身就和最后的干预结果Y1或Y0没有关系了。换句话说, 无论w=0还是w=1, E (Y1) 或E (Y0) 的值都是固定的, E (Y1|w=0) =E (Y1|w=1) 且E (Y0|w=0) =E (Y0|w=1)。但是我们通常做不到完美的随机化, 能做的是尽可能控制混淆变量, 保证这些变量一旦被控制起来, w就能够近似地和Y1或Y0保持独立。换句话说, 我们希望做到:
实践中, 为了得到上述介绍的干预组人群和对照组人群在干预后的区别,研究人员需要通过随机干预试验“三步曲”完成数据收集, 展开干预, 进行影响评估。“三步曲”的基本步骤包括:基线调查、干预试验和评估调查(张林秀, 2013) 。
基线调查:在项目干预之前将项目参与者的基本状况了解清楚, 核心信息是收集主要结果变量以及可能影响结果变量的控制变量的信息。
干预试验:将研究人群按照随机分配原则分成干预组和对照组, 并要在干预的过程中进行监控以保证项目能够正确实施。比如在项目执行中, 有些参与者中途会退出, 但是要保证最后退出的参与者和剩余的参与者在基本状况上没有差异。
评估调查:等到干预完成预期已经出现影响后, 评估调查就可以开始了, 评估调查只要重复基线调查时所调查的所有内容就可以了。评估调查最经常遇到的情况是参与者退出, 这时候就需要严格比对参与基线调查的人群, 完整地识别出共同参与基线和评估调查的人员。

Part3随机干预试验的结果分析

在调查工作完成之后, 根据收集得到的数据, 便可以对随机干预试验结果进行分析。利用基线和评估两期数据、干预和对照组分类, 比较两期数据的差即可。利用试验设计的干预组和对照组基线和评估两期面板数据,初步模型设计如下:
上式中:Δyi为评估期的结果变量与基期结果变量的差;结果变量y是我们所要考察的变量;ΔTreati代表是否提供干预的虚拟变量, 缺省的是对照组;εi是随机干扰项;β1的估计量代表相比于对照组群体, 干预的影响效应。(7)式中可进一步加入其他控制变量, 此时的回归模型是:
(8) 式中Y为ΔXi的系数变量, 对于那些基期和评估期不发生改变的控制变量, 两期之间的差值为0, 因此不包含在式 (8) 中的ΔXi中。如果干预是严格的和有效的按照规定来实施, 同时没有被其他因素影响, 那么计量模型估算的影响大小β1就是我们希望得到的干预的效果。

Part4讨论

虽然随机干预试验理论上的优越性被称为影响评估的“黄金准则”, 但是仍然面临诸多挑战。例如, 参与试验的人群会影响他们的行为 (霍桑效应) ;中间退出的参与者的退出原因可能与干预本身相关, 这就会造成OLS估计有偏。
另外, 以人为主体的试验成本非常昂贵, 因此这类项目通常样本不大。而样本较小就可能带来样本代表性的问题。做试验目的就是想推广干预的效果, 但是若在一个国家发现一项政策有效并不一定能在另一个国家有同样的效果时, 试验带来的优势将不复存在。试验研究还经常被批评存在有伦理问题。比如发现当地小孩存在贫血, 而干预是补充铁元素的改善贫血计划, 对照组小孩因为在试验中不能得到铁元素补充, 因而要实施随机干预试验需经过伦理委员会的严格审查。
虽然仍存在不少问题, 但随机干预试验的研究近年来越来越多地被经济学家采用。原因是即使是像American Economic Review这样的顶级经济学期刊, 很多文章的计量经济结论还是有错误的 (Mc Closkey and Ziliak, 1996) 。但随机干预试验的引入有效回应了部分质疑。例如, 哈佛大学著名经济学家Zvi Griliches曾说, 他不曾看到超过4个变量的分析。随机干预试验的研究能够很好地减少控制变量的数目。正因如此, 在经济领域引入随机干预试验的先锋如MIT的Duflo教授, 因其突出的贡献获得了2010年度的克拉克奖。
随着随机干预试验的应用越来越多, 一些计量经济学教科书也引入这部分内容以介绍给读者 (Stock and Waston, 2007) 。在这学期的计量经济学教学中, 我也特意安排一节课阐述了随机干预试验的基本思想, 提醒学生在应用计量经济学时, 能够不断反思自己所建模型的可信性, 以提高学生对计量经济学的掌握程度。

参考文献

[1]Stock, James H., and Mark W.Watson.Introduction to Econometrics, 2nd ed[M].Boston:Addison Wesley, 2007
[2]Holland, Paul W.Statistics and Causal Inference[J].Journal of the American Statistical Association, 1986
[3]张林秀.随机干预试验——影响评估的前沿方法[J].地理科学进展, 2013
[4]Mccloskey, Deirdre N., and Stephen T.Ziliak.The standard error of regressions[J].Journal of economic literature, 1996

1

END

1


大家都在看:


【领取】超长丰田内部品质体系PPT有料

【热点】汽车工程师的宫斗剧,都是人才

【领取】华为质量管理基础手册,快来领

【领取】尼桑(NISSAN)现场管理手册

【难题】生产又与品控掐起来了,怎么破

【领取】你喜欢的8D报告和案例详解来啦

【领取】弄懂这套精品PPTFMEA可以上天

【领取】新版三体系内审检查表,用得到

【领取】为什么博世牛?看它的SPC教材

【PPT】5Why问题分析法完整版,一起学



关注小编二维码

我是质量开讲滴小编

长按扫码关注

咱们有话,质量群里说

更有N多质量大咖在群里哦


找不到我们?

来来来,打个小星星 

每天同最棒的质量知识面对面!


文章来源

计量经济学

免责声明:本文系网络转载,版权归原作者所有。所转载文章并不代表本公众号赞同其观点和对其真实性负责。如涉及作品版权问题,请及时联系我们,我们将删除内容以保证您的权益!

福 利 社

关注“质量开讲”,您可以回复 1-10 任意数字,或以下关键词,查看质量专题。


工业4.0;CPK;PPK;SPC;统计过程控制;柏拉图;帕累托图;五大工具;APQP;PPAP;改善;改进;提升;变更管理;质量成本;QCM;测量;MSA;QSB;8D;控制图;鱼骨图;ISO;质量管理;质量管理体系;抽样;检验;检测;食品安全;食品饮料;HACCP;QC七大手法;新QC七大手 法;旧QC七大手法;管理制度大全;质量大全;IPQC;制程品管;来料;进料;QA;QC;QFD;FMEA;ERP;PDCA;直通率;质量归零;纠正措施;实验设计;六西格玛;精益生产;精益管理;车间管理;车间现场管理;生产管理;5S;6S;供应链;供应商;SQE;多品种;小批量;JIT;准时制生产方式;无库存生产方式;零库存;可靠性;可 靠性分析;标准;认证;丰田;奥迪;宝马;玛莎拉蒂;audit;奥迪特;宝洁;三星;审核;内审;外审;绩效;汽车;华为;田口方法;零缺陷;QC小组;质量看板;看板管理;德国制造;日本制造;中国制造;美国制造;质量会议;生产流程;质量考核;制造业智能;智能制造;SPC问答;常见SPC问题……


您仅需在质量开讲的主页对话框中输入您感兴趣的关键词例如 Cpk、SPC、六西格玛、精益生产、SQE等等关键词。系统会自动给您回复哦!


盈飞无限国际

全球质量智能解决方案

领导者。 五百强制造

企业首选质量预警定位

析系统。


特别推荐


电话:010-65699909

网址:www.infinityqs.cn


扫描二维码,免费试用全新SPC软件

盈飞无限,服务全球质量改进30年!

别忘记转赞看一条龙哦,保证您不会错过质量开讲任何一条好内容!

分享

点赞

在看


品质人生质量开讲
领先的质量管理技术,热点的质量管理问题,专业的质量管理交流……“质量开讲”,您的掌上质量知识库。
 最新文章