审稿人: 记住这8种情况, X2的存在不会让W作为X1的工具变量违反排除限制条件

学术   2024-08-13 00:02   英国  

凡是搞计量经济的,都关注这个号了

箱:econometrics666@126.com

所有计量经济圈方法论丛的code文件, 微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.

前面,讲了审稿人: 谁说使用了相同的IV就合理? 错就错在使用了相同的工具变量”。
今天,我们继续提出一个问题:
假设论文1将W作为X1的工具变量,用以估计X1对结果变量Y的因果影响;与此同时,论文2提出W同样可以作为另一个变量X2的工具变量(揭示了WX2之间存在联系)。那是不是因为X2途径的存在,使得W作为X1的工具变量可能会违反排除限制条件呢?

*想一想,排除限制条件要求W只会通过X1这一路径影响结果变量Y,而若另一项研究中也用W作为X2的工具变量,而如果X2与结果变量Y存在某种关系,那就意味着W不太适合作为X1的工具变量。

不过,好消息是,在下面8种情况中,X2的存在并不必然会让W作为X1影响Y的工具变量违反排除限制条件。
下面一一展开说说。

如果另一项研究声称,你的工具变量W与另一个变量Xj之间存在因果关系,这可能意味着原有的工具变量估计可能存在问题。例如,研究1提出WX1的工具变量,以排除未观测到的混杂因素(U),从而用于估计其对结果变量(Y)的影响。而研究j则提出用W作为另一个变量Xj的工具变量,此时,研究j可能违反了排除性限制条件,即Xj代表了从WY的另一条路径,而这条路径不通过X1(如图[1]所示)。

其他可能性则在表[1]中展示,表中每一行都展示了与研究1和研究j的工具变量估计相兼容的有向无环图(DAG)。DAG中使用波浪形红色箭头表示在研究1的工具变量估计中,必须不能存在这种方向的因果关系。

尽管另一项研究揭示了从W到Xj的联系,但在特定情况下,Xj的存在并不必然违反作为X1影响Y的工具变量(IV)估计中的排除限制条件。
这可能发生在以下几种情况:
第一,如果起初的claim存在缺陷或不适用于当前情况,我们便有理由质疑WXj的影响,即工具变量W压根不会因果影响Xj(例外情况1)。例如,将盛行风(W)作为工具变量来估计其对15世纪城市化(Y)的影响,与另一项研究中使用W来预测21世纪的污染(X1)的情况是不同的。

第二,如果XjX1的一个组成部分(例外情况2),通常不会违反排除性限制条件。例如,研究1可能采用天然气储量(W)作为污染暴露(X1)对死亡率(Y)影响的工具变量。而研究j则可能使用相同的天然气储量作为二氧化硫暴露(Xj)的工具变量。由于二氧化硫暴露是污染暴露的组成部分,因此使用W作为Xj的工具变量,并不会导致研究1违反排除性限制条件

第三,如果X1是Xj的一个组成部分,并且Xj的其他部分(Q)既不是由W引起的,也不会直接影响Y,那么Xj可能不会造成研究1违反排除性限制条件(例外情况3)。以海拔(W)作为心脏病发作(X1)的工具变量为例,即使海拔对健康(Xj)有影响,只要这种影响完全是通过其对心脏病发作的影响来实现的,就不会对造成研究1违反排除性限制条件。然而,如果海拔还通过影响健康的其他方面(如糖尿病,Q)间接影响健康(Xj),那么这将构成对排除性限制条件的违反。

,如果XjY的一个组成部分(例外情况4),那么除非W通过一条不涉及X1的路径影响Xj,否则这种情况不会违反排除限制条件。例如,研究1可能采用居住地靠近大学(W)作为教育水平(X1)对收入(Y)影响的工具变量。而研究j可能使用相同的居住地因素作为自雇收入(Xj)的工具变量。在这种情况下,即使XjY的组成部分,也不会违反研究1的排除限制条件。

,如果YXj的一个组成部分,这同样可能不会违反排除限制条件(例外情况5)。关键在于假设W不直接影响Xj中除了Y以外的任何部分,或者Xj的另一个子部分Q不会影响Y。以之前的例子为例,研究1使用居住地靠近大学(W)作为教育水平(X1)对自雇收入(Y)影响的工具变量。而研究j可能使用W作为总收入(Xj)的工具变量。只要居住地的接近性不会通过与教育无关的其他收入途径影响自雇收入,研究j就不会造成研究1违反排除限制条件。然而,如果自雇收入受到居住地附近大学工作带来的薪资收入的挤压,那么总收入(Xj)可能通过其薪资收入(Q)的子部分造成对研究1排除限制条件的违反。

Xj可能在X1对Y的影响过程中扮演中介角色(例外情况6)。例如,干旱(W)可能首先导致农业收入(X1)减少,这进一步引发资源竞争(Xj),最终可能触发暴力事件(Y)。在这种情况下,即使研究j使用干旱作为资源竞争(Xj)的工具变量,也不一定会使研究1——使用干旱作为农业收入(X1)的工具变量——变得无效。然而,研究1必须基于一个强有力的假设,即不存在除通过农业收入(X1)之外,从干旱(W)到资源竞争(Xj)的其他因果路径(这一假设在有向无环图DAG中以波浪形红色箭头表示)。

第七,还有可能Xj并不直接影响Y(例外情况7)。假设研究1采用兵役抽签号(W)作为教育(X1)对收入(Y)影响的工具变量,而研究j使用兵役抽签号作为服兵役(Xj)的工具变量。如果服兵役的经历并不对个人的收入产生影响,那么研究j的存在并不会导致“研究1违反排除限制条件”。

Xj可能在WX1的影响过程中充当中介角色(例外情况8)。以干旱(W)为例,它可能导致作物产量(Xj)下降,进而减少农业收入(X1),最终可能引发暴力事件(Y)。如果研究j将干旱作为作物产量的工具变量,这并不会直接导致研究1——使用干旱作为农业收入对暴力影响的工具变量——失去效力。然而,这需要研究1做出一个额外的假设:作物产量(Xj)与暴力(Y)之间不存在除通过农业收入之外的其他直接联系(在有向无环图DAG中用红色波浪线表示)。如果存在其他路径,比如通过饥饿或迁徙,这将构成对排除限制条件的违反,从而使研究1中使用干旱作为农业收入工具变量的方法失效。

如果上述的例外情况都不适用,那么Xj就构成了对排除限制条件的违反,正如图[1]所展示的DAG的右侧部分。
本讨论的重点是确认估计结果是否具有严格的因果识别意义。在实际操作中,排除限制条件的违反程度可能各有不同,这将在因果估计中引入不同程度的偏差。
Reference: Mellon, Jonathan. 2024. “Rain, rain, go away: 194 potential exclusion-restriction violations for studies using weather as an instrumental variable.” American Journal of Political Science。
*可以进一步到社群交流讨论各种计量方法。
工具变量,参看1.内生性问题操作指南, 广为流传的22篇文章,2.看完顶级期刊文章后, 整理了内生性处理小册子,3.如何寻找工具变量?得工具者得实证计量,4.内生性处理的秘密武器-工具变量估,5.工具变量在社会科学因果推断中的应用,6.为你的"工具变量"合理性进行辩护, 此文献可以作为范例,7.没有工具变量、断点和随机冲击,也可以推断归因,8.工具变量与因果推断, 明尼苏达Bellemare关于IV的分析,9.工具变量IV与内生性处理的精细解读,10.我的"工具变量"走丢了,寻找工具变量思路手册,11.面板数据里处理多重高维固定效应的神器, 还可用工具变量处理内生性,12.豪斯曼, 拉姆齐检验,过度拟合,弱工具和过度识别,模型选择和重抽样问题,13.工具变量先锋 Sargan,供参考,14.AEA期刊的IV靠不靠谱?15.计量大焖锅: iv, clorenz, rank, scalar, bys, xtile, newey, nlcom,16.GMM是IV、2SLS、GLS、ML的统领,待我慢慢道来,17.IV和GMM相关估计步骤,内生性、异方差性等检验方法,18.因果推断IV方法经典文献,究竟是制度还是人力资本促进了经济的发展?19.内生变量的交互项如何寻工具变量, 交互项共线咋办,20.面板数据、工具变量选择和HAUSMAN检验的若干问题,21.IV和Matching老矣, “弹性联合似然法”成新趋势,22.IV回归系数比OLS大很多咋回事, 怎么办呢? ,23.不用IV, 基于异方差识别方法解决内生性, 赐一篇文献,24.找不到IV, RD和DID该怎么办? 这有一种备选方法,25.内生转换模型vs内生处理模型vs样本选择模型vs工具变量2SLS,26.内生性, 工具变量与 GMM估计, 程序code附,27.GMM和工具变量在面板数据中的运用,28.关于工具变量的材料包, 标题,模型,内生变量,工具变量,29.必须使用所有外生变量作为工具变量吗?30.工具变量精辟解释, 保证你一辈子都忘不了,31.毛咕噜论文中一些有趣的工具变量!33.前沿: 删失数据分位数工具变量(CQIV)估计, 做删失数据异质性效应分析34.不需要找工具变量, 新方式构建工具变量, 导师再也不用担心内生性问题了!35.关于顶级外刊工具变量的使用最全策略, 不收藏反复读就不要谈IV估计!36.如何通过因果图选择合适的工具变量?一份关于IV的简短百科全书37.前沿: nature刊掀起DAG热, 不掌握就遭淘汰无疑!因果关系研究的图形工具!38.最清晰的内生性问题详解及软件操作方案!实证研究必备工具!39.中国女学者与其日本同行在JPE上发文了!利用独特数据, 地理断点RDD和IV研究中国环境议题!40.双胞胎样本解决遗漏变量和测量误差, LIV解决选择偏差41.内生性处理的秘密武器-工具变量估计42.工具变量IV必读文章20篇, 因果识别就靠他了43.看完顶级期刊文章后, 整理了内生性处理小册子44.“内生性” 到底是什么鬼? New Yorker告诉你,45.Heckman两步法的内生性问题(IV-Heckman),46.最全估计方法,解决遗漏变量偏差,内生性,混淆变量和相关问题47.非线性面板模型中内生性解决方案48.内生性处理方法与进展,49.万能cmp程序, 有了他, 建议把其他程序全删掉!50.你的内生性解决方式out, ERM独领风骚51.面板数据是怎样处理内生性的52.计量分析中的内生性问题综述53.一份改变实证研究的内生性处理思维导图54.Top期刊里不同来源内生性处理方法55.面板数据中heckman方法和程序(xtheckman),56.控制函数法CF, 处理内生性的广义方法57.二值选择模型内生性检验方法58.2SRI还是2SPS, 内生性问题的二阶段CF法实现59.非线性模型及离散内生变量处理利器, 应用计量经济学中的控制函数法!60.最全利用工具变量控制内生性的步骤和代码—在经管研究中的应用,61.如何选择合适的工具变量, 基于既有文献的总结和解释!62.中介效应最新进展: 中介效应中的工具变量法使用方法及其代码!63.弱工具变量的稳健性检验, 附上code和相关说明!64.工具变量对因果效应的识别和外推, 大牛的顶级评述!65.几百年一遇的工具变量让基于OLS的截面数据回归结果发到Top了, 设计巧妙让人叹服!66.一份使用工具变量回归的AER文章清单, 思路惊奇定会让你脑洞大开!67.估计工具变量回归时, 是否必须将所有外生变量用作工具变量?68.引力模型基础上的工具变量如何构建?69.必读, 宗教是如何阻碍经济发展的? 基于DID, IV和各种机制分析的AER量化史分析!70.JPE上利用地理断点RDD和IV研究中国环境议题的do文件release!71.工具变量IV估计免费课程, 文章, 数据和代码全在这里, 不学习可不要后悔!72.天下回归, 无内生性不破, 唯此神文不破, 练就内生性处理的终极大法!73.搞懂因果推断中内生性问题解决方法必读的书籍和文献已搜集好!74.2020年博导圈流传最广的一份“几十种内生性处理方法及其要求和局限”的宝典, 并附上代表性重要文献!75.因变量和内生变量是连续,有序和无序多元变量时, 该如何做工具变量估计?76.你确定找到一个好的工具变量了吗? 这将是一篇最值得你看的文章!77.华人金融学术女神为运用工具变量估计方法做因果推断的学者提供了如下宝贵建议!
下面这些短链接文章属于合集,可以收藏起来阅读,不然以后都找不到了。

7年,计量经济圈近2000篇不重类计量文章,

可直接在公众号菜单栏搜索任何计量相关问题,

Econometrics Circle




数据系列空间矩阵 | 工企数据 | PM2.5 | 市场化指数 | CO2数据 |  夜间灯光 官员方言  | 微观数据 | 内部数据
计量系列匹配方法 | 内生性 | 工具变量 | DID | 面板数据 | 常用TOOL | 中介调节 | 时间序列 | RDD断点 | 合成控制 | 200篇合辑 | 因果识别 | 社会网络 | 空间DID
数据处理Stata | R | Python | 缺失值 | CHIP/ CHNS/CHARLS/CFPS/CGSS等 |
干货系列能源环境 | 效率研究 | 空间计量 | 国际经贸 | 计量软件 | 商科研究 | 机器学习 | SSCI | CSSCI | SSCI查询 | 名家经验
计量经济圈组织了一个计量社群,有如下特征:热情互助最多前沿趋势最多、社科资料最多、社科数据最多、科研牛人最多、海外名校最多。因此,建议积极进取和有强烈研习激情的中青年学者到社群交流探讨,始终坚信优秀是通过感染优秀而互相成就彼此的。

计量经济圈
凡是搞计量经济的,都关注这个号了。
 最新文章