搞管理学的醒醒! 24年最新: 实证研究中控制变量选择全部指南, 再奉上因果图告诉你如何做, 管理必看

学术   2024-12-12 20:14   江苏  


凡是搞计量经济的,都关注这个号了

箱:econometrics666@126.com

所有计量经济圈方法论丛的code程序, 宏微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.

在作者看来,一些管理学研究者应该醒醒了,选择控制变量不能过于随意,而应遵循科学的方法。因此,作者在2024年为管理学研究者提供了以下控制变量选择的指南。当然,不代表经济学者就不应该看,相反应该好好地看,结合着这篇一起看“图灵奖得主Judea Pearl关于控制变量选择问题的文章被社会科学方法顶刊接收!


尽管出现了更多精细的因果识别策略,如工具变量和自然实验,控制变量法仍然是实证研究中的一个常用工具。当随机化不可行时,或者难以获取自然实验时,控制变量法常常被用作替代方案。因此,“非实验设计有时被认为是社会科学研究中唯一可行的方法”。尽管存在更优的因果识别策略,比如,期刊中使用实验、自然实验和工具变量的文章数量正在增加,控制变量法仍然是许多研究者的备选方案。

控制变量的使用不仅限于回归分析,它们同样是匹配策略的核心组成部分,并且在工具变量模型中也能发挥作用。由于控制变量的广泛应用,近年来关于如何选择和报告控制变量的文章不断涌现。这些文章建议,控制变量的选择应当基于理论依据。然而,现有文献对于如何根据理论选择控制变量的指导相对较少,导致控制变量的选择和使用往往缺乏透明度。例如,Narita等(2023)在关于倾向得分匹配的最新指南中强调了选择正确控制变量的重要性,他们简要指出,“研究人员必须根据理论和实证依据识别合适的协变量”,但并未提供具体的操作指导。

Reference: The choice of control variables in empirical management research: How causal diagrams can inform the decision, The leadership quarterly, 2024.

背景知识:1.confounder与collider啥区别? 混淆 vs 对撞,2.三张图秒懂, 混淆, 中介, 调节, 对撞, 暴露, 结果和协变量的复杂关系,3.最全估计方法,解决遗漏变量偏差,内生性,混淆变量和相关问题,4.因果推断专题:1.混淆变量,5.因果推断专题:6.再谈混淆变量,7.控制变量就能影响结果显著性, 所以存在很大操作空间, 调参数是常用手段吗?8.合理使用控制变量的策略与建议, 从研究设计, 数据收集与分析和结果报告三方面下手!9.加入其他控制变量后, 估计系数的符号相反了?10.控制变量选择问题: 如何鉴别好或不好的控制变量?附上14篇相关文章!11.什么时候应该使用回归分析?控制变量意味着什么?12.如何选择正确的因变量(控制变量),让你的计量模型不再肮脏,13.什么是不好的控制变量, 什么又是好的控制变量? 14.控制、调节和中介变量,系说

因果图,也称为有向无环图(DAGs),是解决控制变量选择中缺乏严格性和透明度问题的一个宝贵工具。这种图形化工具直观地展现了因果理论,它搭建起了从理论的叙述性描述到将理论视为由数据估计出的统计关系集合的统计模型之间的桥梁。与代数方法,尤其是参数化的结构方程模型相比,因果图的一个显著优势在于其彻底的非参数化特性,这意味着它不需要对函数形式或分布做出任何假设。这种灵活性使得因果图在构建可能是非线性的回归模型时特别有用。此外,图形化的表达方式有时能帮助我们更直观地理解模型及其隐含的约束条件。尽管关于因果图的技术文献已经存在了相当长的时间,但在商业和管理学研究领域中,许多研究者却常常忽视这些模型。

本文开篇便概述了因果推断的多种策略,并阐释了控制变量和因果图在该领域中的作用和定位。随后,文章提出了一种对控制变量进行分类的方法,旨在协助读者更深入地理解如何通过因果图进行分析,以及如何区分那些有助于因果推断的有效控制变量和可能干扰因果推断的无效控制变量。接着,文章对使用因果图选择控制变量的核心准则——“后门标准”,进行了详细解释。在文章的第三部分,展示了构建因果图的工作流程,并通过重现一项关于CEO形象与公司绩效关系的研究来具体演示这一流程。此外,本文还探讨了敏感性分析的重要性,这一工具在因果图中一些混杂变量无法被观察到时显得尤为重要。

因果推断中控制变量的理论

推断因果关系是一项充满挑战的任务,因为因果关系本身是一个无法直接观测的抽象概念。在实际操作中,通过满足三个条件来间接推断因果关系:1)假设的原因与结果之间存在联系;2)影响具有明确的方向性;3)排除其他可能的竞争性解释。第三个条件可以通过两种方法来实现。在实验和准实验设计中,因果关系要么是由研究者通过随机化手段产生的,要么是自然发生的,并且以可比的方式进行,以排除其他可能的竞争性解释。即便在管理学领域,也可以进行真正的实验,但这些实验往往难以实施,因此许多研究还是依赖于观察性设计。在观察性设计中,通常通过抽样或统计建模来处理竞争性解释。这些设计可以进一步细分为三种方法:条件化、工具变量和确立独占机制。

条件化(conditioning)是一个在研究中广泛运用的概念,它指的是通过分析某个或某些变量来排除其他变量的干扰,确保条件变量保持不变。在研究设计领域,条件化通常被称为控制,而本文中讨论的条件化变量则被称作控制变量。以本文分析的CEO性别对公司盈利能力(以资产回报率ROA衡量)的影响为例,行业可能会产生误导效应(例如,一些资产密集型行业,如采矿或重工业,通常是男性主导的)。在本文对行业进行条件化处理时,通过评估CEO性别对公司盈利能力的影响,排除了虚假相关性,从而模拟出一个假设情境,即所有公司仿佛处于同一行业之中。在实际操作中,条件化可以通过两种方式实现:一是选择样本以保持条件变量不变,例如只针对一个特定行业进行研究;二是通过统计调整,其中匹配和回归是两种常用的统计调整方法。无论采用哪种条件化方法,它们都基于一个假设,即能够识别并收集所有可能的混杂因素数据,但实际情况往往并非如此。因此,还应考虑其他策略,例如在研究CEO性别效应时,处理内生性的模型提供了一个有力的替代方案。因果图在这些模型中可以发挥辅助作用,但这些应用不包含在本文的讨论范围内。

为了有效地实施条件化,需要一组合适的控制变量。控制变量的数量不足或过多都可能导致错误的结论。计量经济学的教科书通常更加关注遗漏变量的问题,以及这种遗漏如何导致估计偏差,而对于包含过多控制变量或控制了不该控制的变量(即过度控制)的问题则讨论较少。例如,Cameron 和 Trivedi(2005)指出,在包含不相关变量的情况下,“可以轻易证明,普通最小二乘法(OLS)是一致的,但会损失效率”。不幸的是,包含不恰当的控制变量可能导致比效率损失更严重的问题,这一点在本文后面的部分将作进一步解释。

在计量经济学的文献中,一个常见的问题是文献往往关注整个模型,并提出类似“单个解释变量与误差项之间的相关性通常会导致所有OLS(普通最小二乘法)估计量出现偏误”的观点。然而,这种观点并不完全准确,因为忽视一个相关变量可能会导致某些估计值出现偏误,但并不会影响所有估计值。此外,这种“全有或全无”的观念可能会让人对统计控制感到绝望,因为似乎添加的控制变量越多,与误差项相关的变量也就越多。幸运的是,即便模型中的某些变量与误差项存在相关性,仍然可以一致地估计出感兴趣的参数。这一点在经济计量学文献中常常被忽视。

因果图与因果推断

有效的因果推断建立在对因果机制的理论假设之上,这些假设不仅解释了数据的生成过程,而且能够被清楚地表达。因果图,作为结构方程模型的非参数化版本,与学界领袖们所熟悉的路径图颇有相似之效。本文将阐述因果图的基本概念,并探讨如何利用它们在回归分析中选择控制变量。

为了深入理解因果图和因果分析,首先需要把握因果识别的概念。在计量经济学中,识别通常指的是能够从两个变量之间辨识出因果关系的机制。因此,因果识别与估计或统计推断有所区别,它着眼于研究设计和数据是否能够支撑因果推断,而非样本规模或数据分析手段。

因果图,如图1所示,由代表原因和结果的圆圈(变量,这里指T、Y和X;Y通常代表结果,T代表潜在的原因,X是协变量)以及表示它们之间因果关系的箭头组成。在因果分析领域,这些圆圈被称为节点,箭头被称为边,这与结构方程模型(SEM)文献中的称呼有所不同,在后者中它们被称为圆圈和箭头。边是有方向性的,箭头指向从父节点到子节点(例如,图1a显示了三个有向边:T→Y、X→Y和X→T)。因果关系因其非对称性而著称,因此因果图通常假定为无环结构,即图中不允许存在回路。这两个特点使得因果图在文献中也被称作有向无环图(DAG)。

在因果图中,路径是指连接任意两个节点的边的序列。这些边不必严格遵循箭头指示的方向。如果边的序列与箭头方向一致,那么这样的路径被称为有向路径。例如,在图1a中,可以看到两条有向路径:T→Y和X→T→Y,以及一条无向路径:T←X→Y。

图1b展示了一个更为复杂的因果图,其中T和Y之间存在三条路径:T→Y、T←X1←X2→Y和T←X1→X3←Y。变量U用带有虚线边框的阴影节点表示,这表明它是一个不可观测的变量,无法从实际数据中直接获得。尽管这些不可观测的变量在大多数分析中不能直接使用,但它们在因果图中的表示对于揭示可能干扰因果关系识别的潜在问题至关重要。

因果图在因果推断中极为有用,因为它们能够帮助我们轻松检验变量间的统计独立性。举例来说,考虑图中三个节点构成的三种基本路径配置:

  1. 链式路径A chain:A→B→C

  2. 分叉路径A fork:A←B→C

  3. 碰撞路径A collider:A→B←C

在链式路径和分叉路径这两种情况下,变量A和C之间存在统计相关性。在链式路径中,A对C具有间接的因果影响;而在分叉路径中,A和C之间的统计相关性源于它们共同的父节点的影响。在这两种情形下,通过对中间变量B进行条件化,可以消除A和C之间的这种依赖关系。也就是说,当保持B不变时,A和C在条件上变得独立(表示为:A⊥C|B,读作“在B的条件下A与C独立”)。在链式路径中,保持B不变阻断了A对C的间接影响机制。例如,如果战略投资仅通过销售额影响公司绩效,那么在销售额相同的所有公司样本中,战略投资与公司绩效将不相关。同样地,在分叉路径中,如果控制了共同的父节点B,那么A和C之间的剩余变异将变得相互独立。以之前提到的例子为例,这种结构可以用来模拟行业(B)作为CEO性别(A)和资产回报率(ROA,C)的共同影响因素。

与之相反,第三种结构,碰撞变量(collider)的行为与其他情况截然不同,这对于理解不当控制变量的影响至关重要。在这种情况下,A和C都是B的父节点,但它们之间没有直接联系,理论上应该是相互独立的。然而,当固定B使其不变时,A和C之间便会产生相关性,因为固定结果会对原因的取值施加限制。一个经典的例子是虚构的大学录取情况。在这个例子中,录取(B)取决于SAT成绩(A)和基于面试的动机评分(C)。在整个群体中,动机和SAT成绩是相互独立的。然而,如果只关注被录取的学生(即条件化于录取),就会发现SAT成绩和动机评分之间存在负相关关系。这是因为在被录取的样本中,如果学生的SAT成绩较低,他们的动机评分必须很高才能获得录取,反之亦然。用因果图的语言来说,我们说条件化于B会“解锁”或“打开”A和C之间的路径,使它们在统计上变得相关,从而导致碰撞偏误。这一点在对因碰撞变量而受到因果影响的变量进行条件化时也同样适用。

一个中介节点能够阻断两个变量之间的路径,使它们在条件化后变得独立,这种特性被称为d-分离("d"代表“方向性”)。这一概念在更复杂的因果图中同样适用。以图1a中的示例模型为例,分叉路径T←X→Y可以通过对X进行条件化来实现阻断。在图1b中,存在三条连接T和Y的路径:(1)T←X1←X2→Y,(2)T←X1→X3←Y,以及(3)T→Y。第一条路径可以通过对X1或X2进行条件化来阻断。第二条路径由于存在碰撞节点X3,原本已被阻断,但如果对X3进行条件化,则会重新打开这条路径。第三条路径是我们关注的有向因果路径:T→Y。

在深入探讨如何利用因果图来选择控制变量之前,先引入一个额外的概念,这将为接下来的讨论提供必要的形式化背景。因果图是潜在结构因果模型(SCM)的一种直观而简洁的表达方式。例如,图1a所展示的,就是以下结构因果模型的直观表示:


遵循统计学和因果图文献中的标准符号表示法,用小写字母来表示随机变量的具体取值,而用大写字母来表示随机变量本身。一个结构因果模型包含四个主要组成部分:

1)内生变量,即由模型内部决定的变量(如X、T和Y,或通常表示为V_i);

2)与每个变量相关联的外生背景因素(如ε1, …, εn);

3)一组函数(如f_1, …, f_n),这些函数以父节点和背景因素为输入,并为每个内生变量分配值;

4)定义在背景因素上的概率分布。

结构因果模型不同于统计模型。它是一种工具,用于表达统计模型(例如结构方程模型、回归分析等)所依赖的因果假设。结构因果模型是纯理论性的,函数f_i的具体形式和背景因素εi的分布不需要具体化;它们只要求对数据中的定性因果关系做出假设。与此相对,统计模型通常需要假设f_i的函数形式和εi的分布形式,最常见的假设是线性形式和多元正态分布。有了这些背景知识,我们现在可以利用因果图来解决控制变量选择的问题。


先不写了。建议阅读全文,里面内容非常丰富。下面展示一个非常有启发性的表,其他内容请查看原文。

*群友可前往社群下下载全文PDF。
控制变量问题,1.什么时候应该使用回归分析?控制变量意味着什么?2.如何选择正确的因变量(控制变量),让你的计量模型不再肮脏,3.调节变量, 中介变量和控制变量啥区别与联系? 4.控制、调节和中介变量,系说,5.核心解释变量A不显著, 但加入变量B后, 为什么A和B都显著了?6.被解释变量比解释变量的层级更高的模型设定合理么?7.审稿: 协变量何时重要? 哪个重要, 有多重要?8.三张图秒懂, 混淆, 中介, 调节, 对撞, 暴露, 结果和协变量的复杂关系,9.因果推断专题:6.再谈混淆变量,10.什么时候需要标准化回归模型中的变量?11.因果推断专题:1.混淆变量,12.虚拟变量回归模型是什么? 政策评估的前件,13.11种与机器学习相关的多元变量分析方法汇总,14.回归中各变量的数值相差过大有事, 又有什么问题?15.哦, 不, 回归符号反了, 我们该怎么办?16.回归系数与预期相反时, 我们能够采取的方法和思路有哪些?17.显著不显著的后背是什么, 非(半)参估计里解决内生性,18.在什么情况下多增加一个自变量后, 回归的R方会变小呢?19.控制变量选择问题: 如何鉴别好或不好的控制变量?附上14篇相关文章!20.如何测度不可观测变量遗漏的严重程度, 建议各位学者看过来!21.如何选择合适的工具变量, 基于既有文献的总结和解释!22.如何选择合适的工具变量, 基于既有文献的总结和解释!23.如何测度不可观测变量遗漏的严重程度, 建议各位学者看过来!24.社会网络计量经济学是什么?测度社会关系网中的同伴效应!25.社会网络分析最新文献和软件学习手册,26.添加一个新变量能使以前不显著的变量变得显著了?27.加入其他控制变量后, 估计系数的符号相反了?28.估计工具变量回归时, 是否必须将所有外生变量用作工具变量?29.实证分析观测数据的10条检查清单, 消除实证分析中许多潜在的虚假结果,30.可以在面板回归分析中使用时间序列解释变量或被解释变量吗?31.收入和年龄等变量是将其转化成有序离散变量还是当成连续变量进行回归呢?32.你确定找到一个好的工具变量了吗? 这将是一篇最值得你看的文章!
下面这些短链接文章属于合集,可以收藏起来阅读,不然以后都找不到了。

7年,计量经济圈近2000篇不重类计量文章,

可直接在公众号菜单栏搜索任何计量相关问题,

Econometrics Circle




数据系列空间矩阵 | 工企数据 | PM2.5 | 市场化指数 | CO2数据 |  夜间灯光 官员方言  | 微观数据 | 内部数据
计量系列匹配方法 | 内生性 | 工具变量 | DID | 面板数据 | 常用TOOL | 中介调节 | 时间序列 | RDD断点 | 合成控制 | 200篇合辑 | 因果识别 | 社会网络 | 空间DID
数据处理Stata | R | Python | 缺失值 | CHIP/ CHNS/CHARLS/CFPS/CGSS等 |
干货系列能源环境 | 效率研究 | 空间计量 | 国际经贸 | 计量软件 | 商科研究 | 机器学习 | SSCI | CSSCI | SSCI查询 | 名家经验
计量经济圈组织了一个计量社群,有如下特征:热情互助最多前沿趋势最多、社科资料最多、社科数据最多、科研牛人最多、海外名校最多。因此,建议积极进取和有强烈研习激情的中青年学者到社群交流探讨,始终坚信优秀是通过感染优秀而互相成就彼此的。

计量经济圈
凡是搞计量经济的,都关注这个号了。
 最新文章