1
网络分析(Network Analysis),原本较常见于社会学领域,名为“社会网络分析”(Social Network Analysis),又被称作“结构分析方法”。起初,是由社会学家根据图论等方法发展起来的定量分析方法。近些年来,社会网络分析方法经过心理学科研工作者的调整和引入,在心理学科研领域占据了越来越重要的位置。本文将从心理学科研领域视角介绍该方法,而非社会学领域的视角,因此不会过多讨论社会学视角中的“社会网络”等成分(R示例代码及教学解读视频放在文末)。
在心理学领域中,网络分析来自于对系统型研究的需求。在系统型研究中,单纯对单一的变量进行探究是不够全面而充分的,因此需要将系统内的变量当成一个整体,即一个“网络”去探究其关联(Borsboom et al., 2021)。通常而言,一个网络由不同节点和连接节点的边组成。目前,网络分析在心理学领域主要应用于以下场景(文末会有相关代码和视频对横断面相关性网络的分析和解读进行讲解):
(1)观察变量间如何相关,探索高维数据的结构:如探究测量大五人格的条目(低纬)间是如何相互关联的,以此推测五大人格特质(高维)的潜在联系,由此可以为人格理论的建构提供新的证据或方向;
(2)解释变量间的依赖关系:以网络图的形式直观地观察解释变量间的统计关联,如解释某一心理疾病的各症状之间的关联(本文后续也会以此为例说明),由此可以加深对疾病症状学层面的理解,为心理疾病揭示潜在的干预方法;
(3)进行潜在的因果推断:条件独立的网络结构可以作为媒介去推断潜在的因果关联,如两个变量之间在条件相关*的情况下,如果在网络间相连,则说明这两个变量可能存在一定的因果关联(注意:在横断面的相关性网络中,尽管可以以此进行因果推断,但不能仅凭此判断关联的方向);
(4)在理论层面,网络分析能够很好地容纳心理系统的多变量架构,并提供一套工具来发展描述其动态过程的正式理论。通过这种方式,个体内动态模型可以用于解释个体间差异系统,从而弥合个体内与个体间建模之间的差距(Cronbach, 1957)。由于多变量数据的网络模型可以明确表示系统中各组件之间的成对交互作用,因此它们在数据分析与基于网络科学原理的理论构建之间形成了一座天然的桥梁(Newman, 2010)。在这方面,网络不仅能容纳系统的多变量架构,还提供了一套工具来发展关于其形成和维持的动态过程的形式化理论(Cramer et al., 2010; Dalege et al., 2016)。一个成功的案例是智力的互惠模型(Van Der Maas et al., 2006),该模型基于网络概念解释了智力测验之间的正相关性,并量化了认知网络的结构中发生的动态过程。
*注:条件相关是网络分析最基础的模型估计,即在控制其他变量的值的情况下,分析两个变量间的关联。对多分类变量,可以通过偏相关分析进行估计;而针对二分类变量,可以通过逻辑回归进行估计。其中,最普遍的网络分析应用是观察一些心理变量的相关关系(Borsboom et al., 2021)。值得一提的是,在这一点上,网络分析和潜变量模型有一定的相似之处,即潜变量模型也能用于探究变量之间的内在关系,估计潜在的内部维度。但潜变量的估计在所分析条目存在内容重叠等情况下可能并不是十分有效。以大五人格为例,在潜变量分析中,测量大五人格的条目间通常会同时加载到多个因子上,或显示出残差相关性,这表明潜变量模型并未完全解释条目之间的相关性。在这种情况下,网络分析因为不需要和潜变量模型一样有一个预先假定的特定模型,所以能规避上述问题,并有助于识别导致条目间潜在的其他相关机制(Borsboom et al., 2021)。
2
a) 节点(node):即网络图中的变量,每一个变量代表一个节点(如Figure1中的小圆圈)。对应到心理学中,最常见的节点是不同量表的条目,每一个条目对应一个节点。
b) 边(edge):即网络图中,每两个节点相连的线(如Figure1中的绿线和红线),一般而言,线越粗,颜色越深,代表两个节点(变量)间的相关程度越高。
Figure 1.网络分析示意图
c) 中心性(centrality):中心性分析常用于反映不同结点在网络中的核心程度。一般而言,中心性指标包括:强度(strength),预期影响度(expected influence,EI),中介度(betweenness)和亲近度(closeness)。其中,强度指与某一结点直接相连边的权重的绝对值之和。而预期影响度则是与它直接相连边的权重之和(考虑了边的正负值)。中介度则是指一个节点出现在其他两节点相连最短路径(即途径节点数量最少)的次数。亲近度指一个节点到其他节点距离之和的倒数(Opsahl et al., 2010)。根据既往研究,中介度和亲近度被指出在网络分析中稳定性不足(Epskamp et al., 2018)。因此,不少研究仅报告强度中心度或预期影响度,或是两者联合。
d) 高斯图模型是目前网络分析最基础也最常见的网络模型(Graphical Gaussian Model, GGM),主要对有序分类变量与连续变量进行估计。它是以选取的目标作为节点(纳入的各类变量等),以结点间的偏相关(即控制其他纳入因素后,两结点之间的相关)作为连接节点的边(Borsboom & Cramer, 2013)。在这样的网络中,边的颜色代表症状之间相关性的正负(通常绿色或蓝色的边代表正相关,红色代表负相关,可自由设置颜色),边的粗细代表症状相关性的大小(边越粗,相关性越高)。
e) 网络稳定性:网络稳定性即该网络结构是否稳定,结论是否相对可靠。目前,网络分析作为一种偏相关结果的图像呈现方式,由于缺乏显著性检验,对于网络稳定性的估计,主要的方式为通过无参数重抽样的方式(bootstrap),对原始数据进行多次(一般在1000次及以上)重抽样并重新估计网络结构,以各次估计中的每一条边构造其95%的置信区间,以此检验网络分析的稳定性(Epskamp et al., 2018)。对于节点中心性的稳定性检验,往往采取逐步移除总体样本一定比例数据的做法,在剩余子样本中重新估计网络中各节点的中心性(case-dropping bootstrap),并计算不同比例子样本中心性与原中心性的系数,即correlation stability coefficient(CS-coefficient)。基于前人研究,CS系数应不小于0.25,大于0.50可视作稳定性良好(Epskamp et al., 2018)。
目前,大部分解读方式主要从网络结构和中心性强度等两个方面进行。但值得注意的是,由于不同研究的侧重点有所不同,不同研究者对结果的解读方式也会存在差异,此处笔者将举例进行说明,但在实践过程中,读者可以根据自己的研究目的等进行调整。另外,在文章末尾,笔者附上了代码和相关视频进行教学示例,感兴趣的读者可以在看完这部分后观看视频。
a) 网络结构视角——节点间相关
以Figure 2为例(图来源(Yang et al., 2021),侵删),图中蓝线代表正相关,红线代表负相关。由此,可以得出,除同组症状间的强相关外,跨组症状间(如C1与B5)也存在较强的关联,因此,指示这两个症状在临床上可能伴随出现,在治疗时可以考虑采取协同治疗等治疗方案。类似地,跨组症状E2与B1的负相关较强,在临床治疗时可以考虑注意对存在潜在拮抗症状组的患者的治疗方案选择。
Figure 2. PTSD症状网络分析图(Yang et al., 2021)
b) 中心性强度
以Figure 3为例(图来源(Yang et al., 2021),侵删),该图展示了各个节点的强度中心性结果,该图显示出,E2这一节点(自我毁灭行为症状)在网络结构中具有较强的强度中心性,即该节点和其他所有节点的关联较强,是潜在的“核心节点”。其意义为,在临床治疗中可以优先针对“核心症状”进行治疗,以此间接性减轻其他所有症状,可能这一模式在治疗上更为高效。
Figure 3. PTSD症状网络结构中心性分析图(Yang et al., 2021)
c) 网络稳定性
以Figure 4为例(图来源(Yang et al., 2021),侵删),其中4a展示了网络结构的各边重抽样若干次的结果。其中灰色部分为根据重抽样结果得出的95%置信区间,红线为样本单次统计结果,灰线为重抽样均值结果。两线拟合情况良好,且大都落在置信区间内,表示网络边估计较为稳定。而4b展示了对节点中心性的估计,在逐步剔除样本后,子样本中心性与原中心性的系数始终在0.5以上,指示节点中心性良好,中心性估计效果较为稳定。
Figure 4. PTSD症状网络结构稳定性分析图(Yang et al., 2021)
4
此处以R语言自带的数据“attitude”为例进行网络分析,详细内容见视频,代码如下:
#安装必要的包
library(bootnet)
library(qgraph)
data('attitude')
dataw22<-as.data.frame(attitude[,c(1:7)]) #选择你的待分析数据
###把数据变成矩阵形式
data222.cor<-cor_auto(dataw22,detectOrdinal =FALSE)
###命名节点和变量
names<-c("RA","CO","PR","LE","RS","CR","AD")
longnames <- c("Rating","Complaints","Privileges","Learning","Raises","Critical","Advance")
# ---------------------------------------------------------------------------------------
# ---------- Network---------------------------------------------
# ---------------------------------------------------------------------------------------
### A. Figure 1##
graph_ptsd.g<-qgraph(data222.cor, labels=names, graph="pcor", layout="spring",
vsize=6, cut=0, maximum=.99, sampleSize = nrow(dataw22),
border.width=1.5, border.color="black", minimum=.1,
nodeNames = longnames,legend.cex=.4)
dev.off()
### B. Figure 2
centralityPlot(graph_ptsd.g,include = c('Strength','Closeness','Betweenness',"ExpectedInfluence"))
dev.off()
centralityTable(graph_ptsd.g)#the details of centrality
### 稳健性检验
network1<-estimateNetwork(dataw22, default = "pcor") #连续变量
network1<-estimateNetwork(dataw22, default = "EBICglasso") #顺序变量
boot1 <- bootnet(network1, nBoots = 1000, nCores = 4) # 边估计检验
boot3 <- bootnet(network1, nBoots = 1000, type = "case", nCores = 4) # 中心性估计检验
plot(boot1, labels = F, order = "sample" )
dev.off()
plot(boot3)
dev.off()
corStability(boot3) #输出CS系数
参考文献
Borsboom, D., & Cramer, A. O. J. (2013). Network Analysis: An Integrative Approach to the Structure of Psychopathology. Annual Review of Clinical Psychology, 9(1), 91–121. https://doi.org/10.1146/annurev-clinpsy-050212-185608
Borsboom, D., Deserno, M. K., Rhemtulla, M., Epskamp, S., Fried, E. I., McNally, R. J., Robinaugh, D. J., Perugini, M., Dalege, J., Costantini, G., Isvoranu, A.-M., Wysocki, A. C., van Borkulo, C. D., van Bork, R., & Waldorp, L. J. (2021). Network analysis of multivariate data in psychological science. Nature Reviews Methods Primers, 1(1), 58. https://doi.org/10.1038/s43586-021-00055-w
Cramer, A. O. J., Waldorp, L. J., van der Maas, H. L. J., & Borsboom, D. (2010). Comorbidity: A network perspective. Behavioral and Brain Sciences, 33(2–3), 137–150. https://doi.org/10.1017/S0140525X09991567
Cronbach, L. J. (1957). The two disciplines of scientific psychology. American Psychologist, 12(11), 671–684. https://doi.org/10.1037/h0043943
Dalege, J., Borsboom, D., van Harreveld, F., van den Berg, H., Conner, M., & van der Maas, H. L. J. (2016). Toward a formalized account of attitudes: The Causal Attitude Network (CAN) model. Psychological Review, 123(1), 2–22. https://doi.org/10.1037/a0039802
Epskamp, S., Borsboom, D., & Fried, E. I. (2018). Estimating psychological networks and their accuracy: A tutorial paper. Behavior Research Methods, 50(1). https://doi.org/10.3758/s13428-017-0862-1
Epskamp, S., & Fried, E. I. (2018). A tutorial on regularized partial correlation networks. Psychological Methods, 23(4), 617–634. https://doi.org/10.1037/met0000167
Newman, M. E. J. (2010). Networks: An Introduction. Oxford University Press.
Opsahl, T., Agneessens, F., & Skvoretz, J. (2010). Node centrality in weighted networks: Generalizing degree and shortest paths. Social Networks, 32(3), 245–251. https://doi.org/10.1016/j.socnet.2010.03.006
Van Der Maas, H. L. J., Dolan, C. V., Grasman, R. P. P. P., Wicherts, J. M., Huizenga, H. M., & Raijmakers, M. E. J. (2006). A dynamical model of general intelligence: The positive manifold of intelligence by mutualism. Psychological Review, 113(4), 842–861. https://doi.org/10.1037/0033-295X.113.4.842
Yang, F., Fu, M., Huang, N., Ahmed, F., Shahid, M., Zhang, B., Guo, J., & Lodder, P. (2021). Network analysis of COVID-19-related PTSD symptoms in China: the similarities and differences between the general population and PTSD sub-population. European Journal of Psychotraumatology, 12(1). https://doi.org/10.1080/20008198.2021.1997181