本篇推文应该是结构方程模型(CB-SEM)入门篇系列的最后一篇推文了,感谢大家支持,帮助小水完成了20天涨粉2W的目标,但同时也觉惶恐,怕有误人子弟之嫌。所以,本公众号,也是小水给自己的定位就是,一位服务者+知识传播者,“力求传播对大家有用的知识”是本公众号的根本宗旨,所以大家如有需求,或者认为本公众号尚且有不妥之处,敬请留言告知,定当改进。
当然我们不能止步于入门,所以接下来,小水会推出结构方程模型的进阶篇,这里有几个可供选项:1.结构方程调节效应篇——;2.结构方程模型fsQCA辅助增强篇——;3.结构方程模型PLS-SEM——;这是三个系列,以目前本公众号的体量只能三选一,特此也在这里征求大家的建议,欢迎大家踊跃投票~
1.调节效应
在更深入的研究中,在结构方程模型中引入调节变量是必要的。调节变量并不像中介变量那样与自变量和因变量之间存在强相关关系,但是却可以直接影响自变量对因变量的作用关系。
假设你在研究学习时间(自变量)对考试成绩(因变量)的影响。一般来说,学习时间越长,考试成绩应该越好,对吧?
调节效应的分析
自变量(X):学习时间(比如每周学习5小时、10小时、15小时)
因变量(Y):考试成绩(比如百分制成绩)
调节变量(M):学习方法(比如传统的死记硬背 vs 高效的主动学习)
假设你发现,学习时间对考试成绩的影响取决于学习方法。
对于那些采用高效的学习方法(比如主动复习、做练习题、理解性学习)的人来说,多花时间学习能显著提高成绩。
但对于那些采用死记硬背的人来说,即使学习时间增加,他们的考试成绩也不会显著提升,因为学习方法不够高效。
没有调节效应:无论采用什么样的学习方法,学习时间越长,考试成绩就越好。
有调节效应:对于那些使用高效学习方法的人,学习时间的增加能大大提高成绩;但对于那些只知道死记硬背的人,学习时间再长,效果也不明显。
总之,调节效应的核心是某个变量(在这个例子中是“学习方法”)改变了另一个变量(学习时间)对因变量(考试成绩)的影响强度或方向。如果调节效应存在,意味着某个条件下(例如高效学习方法),学习时间与成绩的关系才变得显著;而在其他条件下(比如死记硬背),这个关系则较弱或者没有效果。
2.fsQCA(模糊集定性比较分析)
fsQCA(模糊集定性比较分析)是一种定性研究方法,能够揭示变量间的非线性关系及其多样化的组合效应,适用于探索复杂条件下的充分性和必要性关系。与结构方程模型偏重单一路径关系不同,fsQCA更强调因果复杂性与条件组合作用,能够揭示不同情境下的优化路径,是作为结构方程模型的重要补充方法。
举个例子:餐厅如何提升顾客满意度?
服务态度:服务员是否热情、专业?
菜品质量:菜肴的口味和外观。
环境氛围:餐厅的装潢和氛围。
价格合理性:餐厅的价格是否符合顾客的期望?
结果可能是:
条件组合1:良好的服务态度 + 高质量的菜品 → 高顾客满意度。
条件组合2:菜品质量一般 + 良好的环境氛围 → 高顾客满意度。
条件组合3:服务态度良好 + 合理的价格 → 高顾客满意度。
3.偏最小二乘结构方程模型(PLS-SEM)
PLS-SEM(Partial Least Squares Structural Equation Modeling)和CB-SEM(Covariance-based SEM,基于协方差的结构方程模型)是两种常用的结构方程建模方法,各自有不同的优点和适用情境。相较于CN-SEM,PLS-SEM的优点包括以下几个方面:
1. 适用于小样本数据
PLS-SEM:尤其适用于样本量较小的数据。PLS-SEM对样本量的要求较低,不需要像CN-SEM那样有较大的样本容量来确保稳定和可靠的估计。一般情况下,PLS-SEM在小样本量(例如N<200)下也能提供可靠的结果。
CN-SEM:要求较大的样本量来进行有效的估计,通常建议至少有200个样本。小样本量可能会导致不稳定的估计,影响结果的可信度。
2. 适用于复杂模型
PLS-SEM:能够处理更为复杂的模型,包括多层次、多维度、以及具有较多潜变量和观测变量的结构。它对模型的灵活性更高,可以同时处理多重因果关系。
CN-SEM:虽然也能处理复杂模型,但其计算复杂度更高,且在结构较为复杂时可能会出现识别问题或模型拟合不足的情况。
3. 模型拟合要求较低
PLS-SEM:与CN-SEM不同,PLS-SEM不依赖于传统的拟合指标(如卡方检验、拟合优度等),它采用的是基于路径分析的推断方法,这使得它在一些模型拟合较差的情况下,依然能够给出有效的路径系数估计。
CN-SEM:更依赖模型拟合的统计检验,拟合度较差时往往会影响模型的有效性,且需要满足较多的假设条件(例如正态性、线性等)。
4. 适用于非正态分布数据
PLS-SEM:对于数据的分布没有太多要求,即使数据不符合正态分布或包含离群值,PLS-SEM依然能够有效地估计模型参数。它使用的是基于方差的估计方法,对数据的分布假设要求较少。
CN-SEM:对数据的分布有较高要求,特别是需要假定数据符合正态分布,否则可能会影响模型参数估计的准确性。
5. 理论导向较少
PLS-SEM:不需要严格的理论支持,可以在探索性研究阶段使用。研究者可以通过PLS-SEM在数据中探索潜在的关系,这使得PLS-SEM在探索性模型构建和新领域研究中具有更大的灵活性。
CN-SEM:通常在假设明确的理论框架下应用,需要较为强的理论指导才能构建有效的模型。
6. 计算效率
PLS-SEM:计算效率较高,适用于处理较为复杂的大型数据集。由于其基于方差的估计方法,相较于CN-SEM的基于协方差的方法,它对计算资源的需求较少。
CN-SEM:计算复杂度较高,尤其在参数估计、模型拟合和大样本时,计算需求和时间消耗较大。
7. 适应性强
PLS-SEM:适应性较强,能够处理不同类型的数据结构,如反向因果模型、多组分析等,且能够处理一些不常见的建模需求(例如复杂的非线性关系)。
CN-SEM:适应性较差,对于一些数据特征(如非线性关系、缺失数据)处理不如PLS-SEM灵活。
总之,PLS-SEM相对于CB-SEM的优点主要体现在其对小样本、复杂模型和非正态数据的适应性上,以及较低的模型拟合要求和较高的计算效率。因此,PLS-SEM更适合在探索性研究、较为复杂或数据量有限的情况下使用,而CN-SEM通常适用于理论验证和样本量较大、数据符合正态分布的情境。
下面是最重要的环节,快来投票吧:
这三种方法或者扩展方法,你们说了算!
点个关注吧~
入门篇9(带实操)——bootstrap5000中介检验相对传统检验有何优势?
如何水论文系列二(完整版):教您如何快速水高质量论文SSCI/SCI——基于结构方程建模
SEM应用的100种经典理论1