密集追踪数据处理之贝叶斯多水平中介分析(1-1-1模型)

文摘   2024-12-20 07:48   北京  


PSYCH统计实验室


01 前言

我们都知道横断面数据现在很难去发好文章,甚至发表都变得困难了。相较于动辄好几年的纵向追踪数据,密集追踪数据似乎成为一种新的趋势。密集追踪数据会针对同一个人在一段时间内进行多次采样,以探究变量与变量之间的关系。例如14天的日记法研究,参与者需要在每天早晨完成问卷填写,持续14天。密集追踪数据的优势在于他考虑到了变量的动态变化以及个体差异。相反,他也不需要横断面和纵向研究动辄上千的被试量,一般所需要的被试量和采样点数是反比关系。如果采样的点数越多,那么被试量的需求就相对更小,而如果采样点数较少,那么就需要扩大被试量。

当我们拿到了密集追踪数据后,如何去处理成为了第二个问题。因为相较于横断面数据的处理方法,密集追踪数据的处理难度会变得更高。本期推文主要给大家介绍一种用于密集追踪数据的中介分析方法——多水平中介分析。

我们首先需要了解密集追踪数据的格式类型,具体来说就是有N个个体,每个个体有p个变量,这p个变量都在k个时间点进行了采样,因此对于每个变量(如果不存在缺失的话),每个被试都有k个数据。看清楚了数据模式之后,我们应该就明白了为什么要叫做多水平中介分析了,因为与一般的中介分析不同,密集追踪数据其实是一种嵌套数据格式,即时间点嵌套在个体内。如果我们之间用这批数据进行传统的中介分析是不合适的,因为个体内的每个时间点的数据具有较强的相关性(因为其来源于同一个个体),因此样本之间彼此不独立,传统的回归分析不再合适了,此时需要使用多水平回归分析。而多水平中介分析其实本质上就是多个多水平回归分析。


02 多水平中介分析的介绍


library(bmlm)

library(ggplot2)

data(BLch9)

head(BLch9)

data<-BLch9[1:105,]

data$id<-as.factor(data$id)

ggplot(data,aes(x=fwkstrs,y=fwkdis))+

  geom_point(aes(x=fwkstrs,y=fwkdis,color=id))+

  geom_smooth(aes(x=fwkstrs,y=fwkdis,color=id),method = "lm", se = FALSE)+

  geom_smooth(method = "lm", se = FALSE,color="black")+

theme_classic()

如上图所示,图中的每个id表示每个个体,我们能够看到在每个参与者的个体内变量fwkstrs和fwkdis之间的线性关系斜率和截距均不相同(随机截距随机斜率),但如果我们不去考虑样本点彼此之间的依赖关系,直接去拟合变量fwkstrs和变量fwkdis之间的关系,我们会得到一条直线,如图中黑色线所示。但需要注意的是,每个个体的变量fwkdis的初始水平可能是不相同,而且在每个个体内,fwkstrs和fwkdis之间关系的强弱和方向可能也不相同,这就意味着如果不考虑个体的差异直接去拟合会存在非常大的误差。此时就需要使用多水平回归分析。

在多水平回归分析中,我们可以将变量分解成相互正交的两个水平,其中水平1是个体内水平,也就是时间点水平(左图所示),而第二个水平是个体间水平(右图所示)。而我们今天所要说的多水平中介分析模型就是自变量、中介变量以及因变量均是第一个水平的变量,也叫1-1-1中介模型。当然多水平中介分析有着非常多的模型,例如:1-1-2,1-2-2等等。如果大家感兴趣,欢迎留言,下一期可以考虑出各种类型的多水平中介模型的介绍。

03“1-1-1”中介模型的R语言实现


为了实现1-1-1中介模型,我们可以使用bmlm包,bmlm是一个R包,可以轻松估计多级中介模型。bmlm使用RStan接口连接强大的Stan贝叶斯推理引擎。用户可以使用bmlm提供的方便功能轻松估计、总结和绘制多级中介模型。

#我们首先需要安装bmlm包

install.packages("devtools")

packagedevtools::install_github("mvuorre/bmlm", args = "--preclean")

 

#载入bmlm

library(bmlm)

BLch9 <- isolate(BLch9,              

by = "id", #个体编号            

value = c("fwkstrs", "fwkdis", "freldis"),

which = "within")

#上面这一步的目的是为了对原始变量x,m,y构建个体内和个体间成分。具体来说是为了进行变量分解,其实这种变量分解是通过中心化实现的,为了得到个体内变量,实行基于个体均值的中心化,从而消除个体差异,为了得到个体间变量,实行总体均值的中心化。用户可以通过修改参数which实现这一目的,如果只需要个体内水平(which = "within"),如果需要个体间水平(which = "between),如果都需要(which = "both")。

#拟合1-1-1中介模型并通过MCMC链从后验分布中提取样本量进行中介效应检验

fit <- mlm(d = BLch9,

id = "id",   #个体编号

x = "fwkstrs_cw",  #自变量

m = "fwkdis_cw",   #中介变量    

y = "freldis_cw",    #因变量    

iter = 2000,   #指定了每个MCMC链从后验分布中提取的样本数量。     

cores = 4)#4个MCMC链

mlm_summary(fit)


#这里面的a表示自变量-中介变量的路径系数(a=0.19, 固定效应),而b表示中介变量-因变量的路径系数(b=0.15, 固定效应),cp表示自变量-因变量的直接效应(c=0.10, 固定效应),me表示中介效应,c表示总效应,pme表示中介效应占比。看2.5%和97.5%有没有包含0来判断中介效应是否显著。

#绘制1-1-1的中介效应图

mlm_path_plot(fit, level = .95, text = T,

              xlab = "Work\nstressors",

              mlab = "Work\ndissatisfaction",

              ylab = "Relationship\ndissatisfaction", digits = 2)

#到此为止,我们成功构建了1-1-1的中介模型并通过MCMC抽样检验了中介效应。


其实关于1-1-1中介模型中的中介效应检验目前其实有着很多种方法,例如在水平1层面bootstrap抽样,在水平2层面bootstrap抽样,亦或是水平1和水平2层面一起bootstrap抽样,当然也可以使用贝叶斯方法,如这里使用的MCMC链,具体使用推荐和使用情景可以看Falk今年发表在Behavior research methods上的文章。


参考文献

Bolger, N., & Laurenceau, J.-P. (2013). Intensive longitudinal methods: An introduction to diary and experience sampling research. Guilford Press. Retrieved from http://www.intensivelongitudinal.com/


Enders, C. K., & Tofighi, D. (2007). Centering predictor variables in cross-sectional multilevel models: a new look at an old issue. Psychological methods, 12(2), 121–138. https://doi.org/10.1037/1082-989X.12.2.121


Falk, C. F., Vogel, T. A., Hammami, S., & Miočević, M. (2024). Multilevel mediation analysis in R: A comparison of bootstrap and Bayesian approaches. Behavior research methods, 56(2), 750–764. https://doi.org/10.3758/s13428-023-02079-4


Gabry, J. (2016). Bayesplot: Plotting for bayesian models. Retrieved from https://CRAN.R-project.org/package=bayesplot



PSYCH统计实验室

通知公告

网络分析课程目前开放视频课啦

单次课200元/讲(学生),250元/讲(非学生)

共有四讲内容:

①横断面网络分析简介与基础

②网络分析与因子分析

③交叉滞后网络分析

④时间序列网络分析

购买后开放视频权限14天,可多次申请。

并赠送所有课程相关资料(无PPT)

如果想申请购买,请联系M18812507626


更多资讯

关注我们

文稿:摘星

排版:Little Star

责编:Wink
审核:摘星

本文由“Psych统计自习室”课题组原创,欢迎转发至朋友圈。如需转载请联系后台,征得作者同意后方可转载。


Psych统计自习室
大家好,我们是由来自北京师范大学,西南大学,天津医科大学等高校在读硕士、博士研究生组成的一个科研团队——Psych统计自习室。Psych统计自习室旨在关注心理学、精神病学领域的最前沿的系列研究,并做前沿统计知识的分享。
 最新文章