文献解读
共同方法偏差的影响及其研究方法
简介
CMB的危害; CMB的来源及其复杂性; CMB普遍存在的依据; 为什么CMB很难解决(控制CMB的方法); 未来的研究方向; 案例分析。
什么是CMB
Part 1|CMB的危害
贴
士
Tips
本文出现的以下名词:共同方法偏差,共同方法变异(common method variance),方法变异(method variance),方法因子(method factors)等都指向同一概念,即由测量方法导致的系统性测量误差。
方法变异会对潜在变量的信效度产生有偏的估计; 方法变异会导致测量的不同变量之间的关系产生偏差。
贴
士
Tips
关于AVE的计算,可以使用R中的lavaan包做验证性因子分析CFA,然后使用semTools包中的reliability()函数得到。
1.1
1.2
导致Ⅰ类错误(变量间无关联但结果显示有关联)和Ⅱ类错误(变量间有关联但结果显示无关联)的增加; 预测因子所解释的效标变量比例的高估或低估;原理同上; 可能会加强或减弱所测construct与其前因、相关因素以及结果变量之间的关系,并进而影响对该construct的收敛效度、区分效度和效标关联效度的推断。
Part 2|CMB的来源及其复杂性
评分者特征(rater characteristic),常见的有:
Implicit theories内隐理论:个体关于态度、价值观、感知、行为等之间关系的先验信念; Consistency motif 一致性动机;个体在作答测验/问卷中相似题目时试图保持一致性; Social desirability社会称许性:个体在作答时会受到社会规范和期望的影响; Response styles反应风格:个体在作答时会系统性地表现出不同的倾向,常见的有极端or趋中反应风格(即倾向于选择极端or中间选项),或者acquiescence默许反应(倾向于认同的选项)。
题目特征/背景(item characteristic effects/item context effects),常见的有:
Item wording题目措辞:题目不同的措辞可能会影响个体的理解和选择; Item demand characteristics题目需求特征:是指问卷/测验题目以一种特定的方式编写,从而向受访者提供了暗示,指示了他们应该如何作答; Item ambiguity题目歧义:题目表述含糊不清晰,个体难以理解; Common scale formats共同量表格式:题目以相同的格式呈现,如Likert量表; Scale length量表长度:问卷题目过少(提供的信息不足)或者过多(引发疲劳反应)。
测量环境(Measurement context effects),常见的有:
预测变量和效标变量在同一时间点测量; 预测变量和标准变量在同一地点测量; 预测变量和标准变量使用相同的媒介进行测量。
Part 3|CMB普遍存在
Part 4|CMB很难解决(控制方法)
作者认为,由于以下情况的存在,理解研究者通常用来控制CMB的补救措施及其有效性非常重要。
CMB的来源非常多;
使用问卷来测量焦点变量(如预测变量、中介变量、调节变量、效标变量)的研究中,这些来源中有很多都可能存在;
每个来源可能需要不同的处理方法来控制其效果;
不同的construct和测量可能容易受到不同的方法因素的影响;
用于控制某些偏差的程序可能会加剧其他偏差的效果。
4.1
从不同来源获取焦点变量(focal variables)的测量数据【Panel a】;心理学研究中变量的测量通常采用self-report方法(以问卷为主),作者指出可以采用一些客观的指标(如学业成绩,工作绩效等)或来自他人(老师,同事,上级等)的评价数据进行替代; 在焦点变量的测量之间引入(时间/心理/接近性上的)间隔【Panel b】; 保证被试匿名作答以减少评估忧虑【Panel c】; 最小化焦点变量的共同量表特性【Panel d】。
这些补救措施的关键在于识别焦点变量测量之间的共同点,并通过研究设计来移除或最小化这些共同的方法特征(Podsakoff et al., 2003)。此外,作者列举了一些针对常见CMB来源的特定程序性补救措施【详见原文Table 4】。
4.2
首先,控制随机测量误差; 其次,允许进行统计检验,以判断CMB是否存在以及其影响程度; 最后,能够将测量结果的方差分解为构念(construct)方差、方法方差和随机误差方差三个部分。
Harman’s single-factor technique (HSF) Harman单因素检验
Unmeasured latent variable technique (UMLV)未测量的潜变量技术
UMLV可以视为对HSF的改进。在这种方法中,不是用单一的方法因子替代实质性潜在变量,而是将 HSF添加到原始模型中,这个原始模型同时包含了相互关联的实质性因子。换句话说,UMLV 方法保留了原始模型中的实质性潜在变量,并且额外加入了一个方法因子来评估共同方法偏差的影响【见上图Panel c】。为了检验CMB的存在,需要比较两个模型:第一是只包含了实质性因子的模型,第二是加入了UMLV的模型,同理,如果前者拟合更好说明CMB不存在,反之说明CMB存在。
易于实施,且不需要额外的测量; 无需识别具体变量,不需要研究人员识别或测量导致方法效应的具体变量; UMLV技术在题目层面(item level)对方法因素的影响进行建模,而不是在构念层面(construct level); 不需要假设方法因素对每个指标的影响都是相等的。
方法因素的具体来源不确定; 对CMB的检测和控制能力有限; 识别问题:如果测验的construct和题目较少,在模型中添加method factor或导致识别(identification)问题。
Marker variable technique (MV)
仍无法明确确定方法效应的具体来源; 单个标签变量同样无法控制所有潜在的CMB来源,尤其是关系特异性CMB,即不同变量对之间特有的方法偏差; 符合要求的标签变量很难选择。
Directly measured latent variable technique (DMLV)
DMLV技术是一种通过直接测量潜在的方法效应来源来检测和控制共同方法偏差(CMB)的方法。与MV方法相比,DMLV技术更直接地针对方法效应的具体来源。研究人员识别可能存在于研究中的CMB的具体来源,直接测量它(如使用社会称许性量表测量社会称许性),并在分析中对其进行控制。常用的变量包括社会愿望、积极或消极情感、印象管理和反应风格。
DMLV技术直接针对CMB的具体来源进行控制,更具针对性; 更准确的控制,由于直接测量方法效应来源,DMLV技术可能比标记变量技术更准确地控制CMB。
来源识别,准确识别CMB的具体来源可能具有挑战性; 测量误差,直接测量方法效应来源也可能存在测量误差; 模型复杂性:DMLV技术可能涉及更复杂的模型,需要更细致的分析。
Summary
Part 5 未来的研究
5.1
随机呈现每个题目(randomized); 将题目按construct分组(grouped)【以60题版大五人格问卷为例,每个维度12个题目分组呈现】; 测量不同construct的题目进行混合,以固定序列呈现(intermixed)【实践中通常采用此做法】; 题目按construct分组,然后随机呈现各组题目(random blocks)【与b的区别是,b中五个维度的题目是固定顺序,而这里是随机顺序】; 题目按construct分组,各组以固定顺序呈现,但组内题目的呈现随机(static blocks)【在b的基础上,每组内的题目呈现是随机的】。
研究发现:
在测验信度方面,当题目按照维度分组(b, d, e)时,其平均信度高于未分组的呈现方式(a, c); 在结构效度方面,static blocks和random blocks(d和e)高于其他三种方式; 在被试反馈方面,分组情况下(b)被试报告的疲劳和挫败感更少;
他们的其他研究结果建议,题组(blocks)设计是研究人员在项目排序方面的更好选择。需要注意的是,尽管分组或题组设计可以减轻被试的疲劳或挫败感,提高测量工具的心理测量特性,但也可能夸大测验信度和效度的估计。因此,建议在测验工具的开发和验证阶段采用混合(b)或随机化(a)的呈现方式,以提高测量的稳健性。此外,为进一步控制CMB,研究人员可以操纵:题目特征(如改变题目的选项设置),评分者特征(考虑被试的短暂情绪状态),确保测量在时间或物理上的分离(在不同时间/场景下测量)。也可以通过实验在不同的测量中操纵这些因素,为理解CMB提供有价值的见解。
5.2
研究发现CMB会夸大高阶因子职业自我效能与工作满意度之间的关系。为了减轻这种影响,研究者使用了统计和程序上的补救措施。在统计控制方面,控制一个测量的或未测量的潜在方法因子(如social desirability)比控制MV(方法方差)更能有效地减少CMB。在程序控制方面,在不同测量之间设置时间间隔(特别是高阶结构各低层维度之间的时序间隔)比使用不同反应格式的组合更能有效地减少CMB。
5.3
5.4
Gabriel等学者(2019)报告了经验抽样方法(experience sampling methods, EMS)在组织行为和应用心理学领域的快速增长。然而,由于从同一评分来源对预测变量和标准变量的重复测量,这些研究中CMV的潜在影响是一个问题。虽然中心化处理(person-mean centering)是一种常见的补救措施,但它不能控制瞬时情绪状态或题目特征等因素。未来的研究应该调查这些因素对ESM研究结果的影响。
5.5
Part 6 CMB案例分析
本节内容为文章解读的扩展内容,我们使用实测数据展示了两种常见的CMB检验方法的程序示例:假设我们采用问卷分别测量了X/M/Y三个变量,其中X变量为由b1~b20测量,M变量由d1~d25测量,Y由e1~e8测量。数据均由被试自我报告产生。接下来,我们采用HSF检验和UMLV两种方法来检验是否存在CMB。
6.1
(2)把问卷中量表题项数据全部纳入变量框内,其他参数选项全部默认设置;
(3)结果发现,第一个因子提取的方差小于40%,因此不存在严重的CMB。
6.2
Step 1 检验单因子模型
VARIABLE:
NAMES ARE b1-b20 d1-d25 e1-e8;
usevariables = b1-b20 d1-d25 e1-e8;
MODEL:
X by b1-b20; !固定因子负荷法
M by d1-d25;
Y by e1-e8;
Step 2 检验双因子模型
VARIABLE:
NAMES ARE b1-b20 d1-d25 e1-e8;
usevariables = b1-b20 d1-d25 e1-e8;
MODEL:
X by b1-b20;
M by d1-d25;
Y by e1-e8; !同单因子模型
CMV by b1-b20(a)
d1-d25(a)
e1-e8(a);!构建额外的共同变异因子
CMV WITH X M Y@0;
CMV@1;
Step 3 模型比较
END