PSYCH统计实验室
01 前言
我们都知道横断面数据现在很难去发好文章,甚至发表都变得困难了。相较于动辄好几年的纵向追踪数据,密集追踪数据似乎成为一种新的趋势。密集追踪数据会针对同一个人在一段时间内进行多次采样,以探究变量与变量之间的关系。例如14天的日记法研究,参与者需要在每天早晨完成问卷填写,持续14天。密集追踪数据的优势在于他考虑到了变量的动态变化以及个体差异。相反,他也不需要横断面和纵向研究动辄上千的被试量,一般所需要的被试量和采样点数是反比关系。如果采样的点数越多,那么被试量的需求就相对更小,而如果采样点数较少,那么就需要扩大被试量。
当我们拿到了密集追踪数据后,如何去处理成为了第二个问题。因为相较于横断面数据的处理方法,密集追踪数据的处理难度会变得更高。本期推文主要给大家介绍一种用于密集追踪数据的中介分析方法——多水平中介分析。
我们首先需要了解密集追踪数据的格式类型,具体来说就是有N个个体,每个个体有p个变量,这p个变量都在k个时间点进行了采样,因此对于每个变量(如果不存在缺失的话),每个被试都有k个数据。看清楚了数据模式之后,我们应该就明白了为什么要叫做多水平中介分析了,因为与一般的中介分析不同,密集追踪数据其实是一种嵌套数据格式,即时间点嵌套在个体内。如果我们之间用这批数据进行传统的中介分析是不合适的,因为个体内的每个时间点的数据具有较强的相关性(因为其来源于同一个个体),因此样本之间彼此不独立,传统的回归分析不再合适了,此时需要使用多水平回归分析。而多水平中介分析其实本质上就是多个多水平回归分析。
library(bmlm)
library(ggplot2)
data(BLch9)
head(BLch9)
data<-BLch9[1:105,]
data$id<-as.factor(data$id)
ggplot(data,aes(x=fwkstrs,y=fwkdis))+
geom_point(aes(x=fwkstrs,y=fwkdis,color=id))+
geom_smooth(aes(x=fwkstrs,y=fwkdis,color=id),method = "lm", se = FALSE)+
geom_smooth(method = "lm", se = FALSE,color="black")+
theme_classic()
如上图所示,图中的每个id表示每个个体,我们能够看到在每个参与者的个体内变量fwkstrs和fwkdis之间的线性关系斜率和截距均不相同(随机截距随机斜率),但如果我们不去考虑样本点彼此之间的依赖关系,直接去拟合变量fwkstrs和变量fwkdis之间的关系,我们会得到一条直线,如图中黑色线所示。但需要注意的是,每个个体的变量fwkdis的初始水平可能是不相同,而且在每个个体内,fwkstrs和fwkdis之间关系的强弱和方向可能也不相同,这就意味着如果不考虑个体的差异直接去拟合会存在非常大的误差。此时就需要使用多水平回归分析。
在多水平回归分析中,我们可以将变量分解成相互正交的两个水平,其中水平1是个体内水平,也就是时间点水平(左图所示),而第二个水平是个体间水平(右图所示)。而我们今天所要说的多水平中介分析模型就是自变量、中介变量以及因变量均是第一个水平的变量,也叫1-1-1中介模型。当然多水平中介分析有着非常多的模型,例如:1-1-2,1-2-2等等。如果大家感兴趣,欢迎留言,下一期可以考虑出各种类型的多水平中介模型的介绍。
为了实现1-1-1中介模型,我们可以使用bmlm包,bmlm是一个R包,可以轻松估计多级中介模型。bmlm使用RStan接口连接强大的Stan贝叶斯推理引擎。用户可以使用bmlm提供的方便功能轻松估计、总结和绘制多级中介模型。
其实关于1-1-1中介模型中的中介效应检验目前其实有着很多种方法,例如在水平1层面bootstrap抽样,在水平2层面bootstrap抽样,亦或是水平1和水平2层面一起bootstrap抽样,当然也可以使用贝叶斯方法,如这里使用的MCMC链,具体使用推荐和使用情景可以看Falk今年发表在Behavior research methods上的文章。
参考文献
Bolger, N., & Laurenceau, J.-P. (2013). Intensive longitudinal methods: An introduction to diary and experience sampling research. Guilford Press. Retrieved from http://www.intensivelongitudinal.com/
Enders, C. K., & Tofighi, D. (2007). Centering predictor variables in cross-sectional multilevel models: a new look at an old issue. Psychological methods, 12(2), 121–138. https://doi.org/10.1037/1082-989X.12.2.121
Falk, C. F., Vogel, T. A., Hammami, S., & Miočević, M. (2024). Multilevel mediation analysis in R: A comparison of bootstrap and Bayesian approaches. Behavior research methods, 56(2), 750–764. https://doi.org/10.3758/s13428-023-02079-4
Gabry, J. (2016). Bayesplot: Plotting for bayesian models. Retrieved from https://CRAN.R-project.org/package=bayesplot
PSYCH统计实验室
通知公告
网络分析课程目前开放视频课啦
单次课200元/讲(学生),250元/讲(非学生)
共有四讲内容:
①横断面网络分析简介与基础
②网络分析与因子分析
③交叉滞后网络分析
④时间序列网络分析
购买后开放视频权限14天,可多次申请。
并赠送所有课程相关资料(无PPT)
如果想申请购买,请联系M18812507626
更多资讯
关注我们
文稿:摘星
排版:Little Star
责编:Wink
审核:摘星
本文由“Psych统计自习室”课题组原创,欢迎转发至朋友圈。如需转载请联系后台,征得作者同意后方可转载。