验证性因子分析
验证性因子分析(Confirmatory Factor Analysis, CFA)是一种结构方程建模(SEM)技术,用于验证测量模型的理论假设是否与实际数据相符。CFA通常用来检验量表的构念效度,确定某些观测变量是否能有效地反映潜变量(即不可直接测量的构念,如态度或信念)。
什么是验证性因子分析?
验证性因子分析 (CFA) 是一种统计建模方法,用于评估不同系统测量和评估概念的准确性。通过这种方法,研究人员利用他们的背景知识制定关于如何测量的假设,然后应用 CFA 来测试他们的想法的准确性。研究人员使用结构方程建模软件进行验证性因子分析,因为它需要使用高级数学模型和方程式处理复杂的数据集。CFA 是社会科学(尤其是心理学)中一种流行的研究和数据分析程序,因为它可以解决难以衡量的理论模型和概念,例如情绪和心理症状。在社会科学中,这些测量系统通常是调查问题、评分量表和其他清单。例如,研究人员可以使用 CFA 来确定每个心理健康调查问题对焦虑症症状的显示程度。
验证性因素分析与探索性因素分析
验证性因子分析和探索性因子分析是审查研究数据的两种互补技术。探索性因子分析识别变量之间的可能关系,而验证性因子分析测试这些关系。在某一学科领域拥有丰富背景的研究人员经常使用验证性因子分析,因为他们可以预测数据中可能存在的关系。他们使用探索性因子分析来了解新模式并确定创新趋势。
验证性因子分析的关键术语
1. 观测变量 Observed variable
观察变量是用来衡量概念的因素。观察变量包括您在研究期间记录的数据。调查问卷中的问题通常针对不同的观察变量。例如,假设一位心理健康专家使用调查问卷来评估焦虑症状。其中一个调查问卷问题要求受访者对他们的压力水平进行 1 到 5 的评分。由于受访者的压力水平可能表现出焦虑,并且调查问卷提供了一个可量化的压力测量系统,因此它是一个观察变量。
2. 潜在变量 Latent variable
潜在变量,也称为构造,是不同测量系统评估的共同概念。潜在变量很难直接观察,但可以影响实验中观察到的变量的结果。例如,焦虑的潜在变量可能会影响某人报告的压力水平的结果。焦虑的人可能会将他们的压力评为五级,而没有焦虑的人可能会选择较低的分数。虽然询问压力并不能直接衡量焦虑,但它仍然可以为研究人员提供对压力和焦虑之间关系的洞察。CFA 存在是为了评估潜在变量和观察变量之间间接关系。
3. 因子载荷 Factor loading
因子载荷是一个数字,用于描述观测变量与潜在变量的对应程度。它通常介于 0 和 1 之间,尽管在计算多个变量时,某些数据集可能会产生高于 1 的因子载荷。因子载荷值越高,与潜在变量的相关性就越强。例如,对焦虑这一潜在变量的调查数据分析显示,问题一的因子载荷得分为 0.85,问题二的因子载荷得分为 0.33。由于问题一的因子载荷高于问题二,因此问题一在识别焦虑人群方面可能比问题二更好。
确认分析过程的 6 个步骤
要完成验证性因子分析,必须遵循几个关键步骤。尽管验证性因子分析主要是自动化软件程序,但研究人员必须设置分析、选择变量并解释结果。以下是 CFA 方法的主要步骤:
1. 指定潜在变量
首先确定要分析的概念并建立其理论定义。建立描述潜在变量的基线使您能够评估观察到的变量的准确性。您可以通过列出特征或收集其他数据来定义潜在变量。例如,如果您想使用 CFA 来确定入学调查是否是评估自尊的良好方法,请先定义自尊。您可以使用您的专业知识来确定自尊涉及自信、社交能力、适应性和目标等特征。
2. 确定测量方法
接下来,确定要测试的测量方法以及要包含哪些观察变量。这些变量通常是调查问题。您可以根据要进行的分析类型,从同一项调查中包含多个问题,也可以从不同的调查中选择问题。
3. 收集数据
收集您想要在验证性因素分析中使用的信息。决定是否从您自己的研究中收集初始响应或使用来自其他来源的外部数据。尝试确保大量信息样本以确保准确的分析。一旦您拥有足够的质量信息,就将其输入统计建模软件。
4. 建立一致的参数
使用统计建模软件,建立标准化参数来评估潜在变量和观测变量。确定要使用哪种测量系统作为标准,并允许软件将所有其他值转换为该测量值。例如,如果您要使用 1 到 5 的评分系统,其中 1 表示“不同意”,5 表示“同意”,则您首先需要将所有其他类型的问题转换为该格式。对于要求受访者同意或不同意某个陈述的问题,将 1 分配给“不同意”,将 5 分配给“同意”。这允许软件一致地计算许多数据。
5.计算数据
使用统计建模软件计算数据的因子载荷。按照特定软件界面的提示生成结果。大多数因子分析软件将此信息放在表格中,但有些软件会生成图表和表格来表达相同的信息。
6. 解释
查看因子分析表的因子载荷列,确定每个观察到的变量与潜在变量的关系有多好。确定哪个因子载荷值显示出显著的关系,并以此来指导您的解释。例如,您可以确定因子载荷为 0.75 的任何变量都可用于评估自尊。如果所有调查问题的因子载荷都超过 0.75,您可以得出结论,您的调查是一次很好的整体测量。
AMOS进行验证性因子分析的流程
1. 准备数据
清理数据:检查缺失值和异常值,必要时进行处理(如均值替代、插补)。确保数据适合因子分析,比如连续变量和满足正态分布。
检查样本量:一般建议每个参数估计需要10-20个样本,样本量至少200为宜。
导入数据:在SPSS中输入数据,并保存为 .sav 文件,以便AMOS读取。
2. 打开 AMOS 并导入数据
打开 AMOS。点击 文件 →数据文件,导入准备好的 .sav 数据文件。确保变量名称正确无误。
3. 绘制路径图
绘制潜变量(因子):使用工具栏中的“椭圆”工具绘制不可观察变量(潜变量)。为每个潜变量命名(如“态度”、“行为意图”等)。
添加观测变量(指标):使用工具栏中的“矩形”工具绘制观测变量。将观测变量与潜变量相连,使用“单箭头”工具从潜变量指向观测变量,表示因子负荷。
添加误差项:使用“椭圆”工具为每个观测变量添加误差项。通过单箭头将误差项指向观测变量。
添加协方差关系:对所有潜变量之间添加双箭头(表示协方差关系)。
4. 定义模型
检查模型是否合理:确保所有潜变量有足够的观测变量(建议≥3)。确保每个观测变量只属于一个潜变量(单因子结构)。
设置参数约束:通常需要固定一个因子的某一条路径(因子负荷)为1,作为模型的参考点。
命名参数:为路径和误差项命名,便于结果解释。
5. 运行模型
点击工具栏中的 Calculate Estimates 按钮。检查是否出现错误信息(如协方差未绘制或路径遗漏)。查看结果报告。
6. 评估模型拟合度
AMOS 会生成以下拟合指标,用于评估模型:
卡方 (Chisq):评估观察到的协方差矩阵与预期协方差矩阵之间的差异。值越小、越不显著,表示拟合度越高。
拟合优度指数 (GFI):衡量估计的总体协方差占方差的比例。值越接近 1,表示拟合度越高。
标准化拟合指数 (NFI):将目标模型与空模型的拟合度进行比较。高于 0.90 的值通常表示拟合度可接受。
比较拟合指数 (CFI):通过将目标模型与独立零模型进行比较来评估模型拟合度。高于 0.95 的值表示拟合度极佳。
相对拟合指数 (RFI):调整 NFI 以适应模型复杂度。值越高表示拟合度越好,高于 0.90 的值被认为是可以接受的。
增量拟合指数 (IFI):与 CFI 类似,但考虑了模型复杂性。值高于 0.90 表示拟合度良好。
近似均方根误差 (RMSEA ):估计每个自由度的近似误差量。低于 0.06 的值表示拟合度较高,而高达 0.08 的值则被认为是可以接受的。
标准化均方根残差 (SRMR):表示观察到的相关性与预测相关性之间的平均差异。小于 0.08 的值通常表示模型拟合良好。
信息准则:
AIC(赤池信息准则)和 BIC(贝叶斯信息准则):用于模型比较,值越小越好。
7. 修正模型
检查修改指数(Modification Indices, MI):查看模型中可能的改进建议(如添加路径或协方差关系)。仅在有理论依据的情况下进行修正。
重新运行模型:进行调整后再次运行,观察拟合指标变化。
8. 解读结果
因子负荷:检查路径系数(因子负荷)是否显著(建议值>0.5)。标准化系数可以用于解释构念与指标的强关联。
误差项:检查每个观测变量的误差是否合理。
模型拟合:确认拟合指标是否达到标准。
9. 报告结果
描述测量模型的假设。
汇报拟合指标结果(例如:χ²=100.5, df=80, p=0.05, CFI=0.93, RMSEA=0.06)。
提供标准化因子负荷值,并解释其含义。讨论测量模型的可靠性和效度。
https://datapott.com/how-to-perform-confirmatory-factor-analysis-cfa-in-amos/
https://researchwithfawad.com/index.php/lp-courses/ibm-spss-amos-lecture-series/introduction-to-confirmatory-factor-analysis-cfa/
https://spssanalysis.com/confirmatory-factor-analysis-in-spss-amos/
操作教学网站
factoranalysisamos-211031210107.pdf 教学文件
CFA使用的场景
1. 测量模型验证
CFA的核心用途是验证测量模型,即检验理论中设定的潜变量(因子)是否能被观测变量(指标)准确反映。
问卷设计:检验问卷的因子结构是否符合预期(如单因子或多因子结构)。
量表验证:确认量表是否能准确测量目标构念,例如心理学中的焦虑量表或教育学中的学习动机量表。
2. 构念效度检验
CFA用于评估量表的构念效度,包括以下两种:
收敛效度(Convergent Validity):检查一个潜变量的所有观测指标是否表现出高度相关性。
区分效度(Discriminant Validity):确认不同潜变量之间是否有明确区分。
教育研究:评估学术成就、学习态度等构念的区分性。
组织行为学:检验工作满意度、员工敬业度等不同构念的独立性。
3. 理论模型验证
CFA可以验证基于理论的模型是否适合数据。它通过潜变量和观测变量之间的关系,测试模型是否符合实际。
心理学研究:验证如“自我决定理论”中内部动机和外部动机的因子结构。
健康科学:测试患者健康行为模型的适用性。
4. 跨群组比较
CFA可以用于跨群体或跨文化的量表比较,检验量表在不同群体中的适用性。
教育研究:检验一套量表是否对不同年级或不同性别的学生具有相同的结构。
跨文化研究:确认某一心理量表在不同国家或文化背景中的一致性。
5. 模型改进
CFA用于模型修正和优化,通过分析修改指数(Modification Indices, MI),帮助识别需要调整的路径或关联。
问卷优化:发现哪些题项可能需要调整或移除。
模型优化:为后续结构方程建模(SEM)提供优化后的测量模型。
6. 实证研究中的测量部分
CFA通常是结构方程建模(SEM)中的重要步骤,用于构建和验证潜变量的测量模型。
市场研究:验证消费者态度、购买意图等潜变量模型。
社会科学:分析社会信任、社会资本等潜变量的测量。
7. 测量误差评估
CFA可以单独评估测量误差的影响,帮助研究者理解观测变量中的随机误差和系统误差。
测评工具开发:量化不同指标的测量误差,从而提升工具的可靠性。
行为研究:评估特定测量方式(如线上和线下调查)的系统误差。
8. 验证先前研究的量表结构
研究者可以使用CFA检验已有研究开发的量表或模型是否适合新数据集或新研究场景。
延续性研究:对先前研究的因子结构进行再验证。
应用研究:将心理量表或行为量表应用于新群体。
THE END