分析方法 | 中介分析(Mediation Analysis)

文摘   2024-12-23 11:00   马来西亚  

中介分析


中介分析(Mediation Analysis)是一种统计分析方法,用于研究某一变量(自变量)通过另一个变量(中介变量)对另一个变量(因变量)产生影响的机制。它试图揭示自变量对因变量的影响是否以及如何通过中介变量间接发生,而不仅仅是直接发生。


简要介绍


当一个结构(称为中介结构)干预其他两个相关结构之间的关系时,中介效应便会发生。更具体地说,当外生结构的变化导致中介结构的变化,而中介结构的变化进一步引起路径模型内生结构的变化时,就可以定义为中介作用。如果这一机制得到理论支持并正确实施,中介分析将成为一种有价值的统计工具。

在中介分析中,直接效应描述的是通过单一箭头将两个结构链接的直接关系。而间接效应则涉及通过一个或多个中介结构连接自变量和因变量的路径。这些路径由多个箭头表示,体现了一系列依赖关系。下图 说明了直接效应与间接效应的关系。

具体而言,间接效应展示了结构 Y1 和 Y3之间的影响是通过中介变量 Y2的路径实现的。路径序列为 Y1→Y2→Y3,其间接效应可以通过路径系数的乘积计算,即 p1⋅p2。最终,直接效应与间接效应的总和被称为总效应,例如,图 中的公式为 p1⋅p2+p3。

通过研究总效应、直接效应和间接效应,可以深入理解结构模型中各变量之间的动态关系,并分析中介变量在其中所起的关键作用。



类  型


中介效应的类型

1. 互补型中介(Complementary Mediation)

定义:间接效应和直接效应都显著且方向一致(例如,均为正或均为负)。

意义:中介变量部分解释了自变量与因变量之间的关系,并增强了总效应。

2. 竞争型中介(Competitive Mediation)

定义:间接效应和直接效应都显著,但方向相反(一个为正,一个为负)。

意义:中介变量的解释部分抵消了直接效应,导致自变量与因变量之间的关系呈现混合效应。

3. 仅间接中介(Indirect-Only Mediation)

定义:间接效应显著,但直接效应不显著。

意义:中介变量完全解释了自变量与因变量之间的关系,即完全中介。


非中介效应的类型

1. 仅直接非中介(Direct-Only Non-Mediation)

定义:直接效应显著,但间接效应不显著。

意义:中介变量在自变量与因变量之间未发挥作用,关系主要通过直接路径发生。

2. 无效非中介(No-Effect Non-Mediation)

定义:直接效应和间接效应均不显著。

意义:自变量与因变量之间不存在关系,无论是否涉及中介变量。


因此,中介分析可能表明中介根本不存在(即仅直接的非中介和无效果的非中介),或者,在中介效应的情况下,中介结构要么解释了部分(即互补和竞争性中介)或两个潜在变量之间观察到的所有关系(即仅间接中介)。


中介分析的基本方法


1. Baron 和 Kenny 法则

Baron 和 Kenny(1986)提出了检验中介效应的经典方法,包括以下步骤:

1. 自变量对因变量有显著的总效应。

2. 自变量对中介变量有显著的影响。

3. 中介变量对因变量有显著的影响(控制自变量的影响后)。

4. 控制中介变量后,自变量对因变量的影响减弱或不再显著(完全中介)。

2. Sobel Test

用于检验间接效应是否显著,但假设样本大且数据正态分布。

3. Bootstrap 方法

Bootstrap 是目前较为推荐的方法,通过反复抽样计算间接效应的置信区间,无需假设数据正态分布,适合小样本研究。


路径模型的估计与统计推断


估计路径模型和统计推断

中介测试涉及拟合两个线性回归方程。这些方程的斜率(系数)称为路径,估计的回归系数是路径系数。

上面的模型中有三个路径系数。路径系数 a 捕获了 x 对 m 的影响(例如,在上面的例子中吸烟对癌症的影响)。这是由第一个方程估计的。路径系数 b 捕获了 m 对 y 的影响(例如,上例中的癌症对死亡率的影响),系数 c' 捕获了 x 在控制 m 后对 y 的直接影响  。通过 m 的路径称为间接途径,通过 M 的中介称为间接效应。通过测试 a 和 b 路径系数的乘积,可以对此路径进行统计推断   。

方程式为:


d1 和 d2 是截距 (常数) 项。为了测试中介,我们估计这两个方程,计算 a*b 乘积,并通过除以其标准误差的估计值将其转换为推论统计量(例如,t 统计量)。Sobel 检验是使用公式执行此操作的一种方法,但它仅在大样本中渐近准确,并且在很大程度上取决于正态性假设。在实践中,它通常过于保守。


中介与调节的区别

调节变量是影响自变量 x与因变量 y之间关系的变量。调节效应通过引入交互项(如 X×Mo)到回归模型中进行检验。交互项的系数表示调节效应的显著性。

调节通常通过绘制交互线图表示。例如,研究表明安慰剂(调节变量)会影响大脑特定区域的活性,从而调节自变量与因变量之间的关系。

调节和中介是概念上不同的,但某些变量可以同时起中介和调节作用。例如,神经发生可能既是锻炼对认知表现的中介变量,也是调节变量(当神经发生水平较高时,锻炼的效果更强)。


多层次中介分析

在传统的单层次中介分析中,自变量 X、中介变量 M 和因变量 Y通常以每个个体为观测单位。然而,当对每个个体进行重复测量时,可以估计每个个体内部的路径 a、b和间接效应 a⋅b,从而消除个体层面的混杂因素并提高统计效能。例如,通过对吸烟对癌症的影响(路径 a)和癌症对死亡率的影响(路径 b)的个体内效应进行估计,可以减少饮食等第三变量的干扰。

多层次模型还允许同时引入个体层面的协变量,从而实现调节中介效应的检验(如饮食是否调节吸烟对癌症的影响)。这一方法能够在控制个体内变量的同时,推广研究结论到更广泛的总体。


关于因果推断的注意事项

中介模型基于线性回归,其方向性假设并不能直接证明因果关系。统计关联可能由模型未包含的潜在变量(潜在混杂变量)或因果方向逆转引起。例如,仅通过观察数据无法确定吸烟是否通过癌症影响死亡率,或者因果路径是否相反。

实验方法能够更好地验证因果关系。当自变量 x 和中介变量 m都是实验操控的结果时,中介模型的因果解释更为可靠。但对于观察数据,仅凭统计关联很难得出因果结论。


因果中介框架(如 Pearl, 2014 提出的方法)提供了条件概率基础上的因果推断,但仍需对因果推断的假设进行严格验证。要想确保因果推断的可靠性,需要对研究变量所在的系统有全面的理解。



https://library.virginia.edu/data/articles/introduction-to-mediation-analysis(里面含R包教程)

mediationR2.pdf

中介分析.pdf


THE END


小琳的读博笔记
海外在读博士分享学习日常与科研工具,陪伴式进行科研分享,与大家共同进步
 最新文章