顶刊都在用的fsQCA方法基本操作步骤详解

科技 2024-11-29 12:30 四川

✦

•

✦

切入正题，fsQCA方法基本操作如下：

一、条件选择

QCA第一步通常是建立理论上合理的组态模型，根据研究问题选择合适的条件和结果变量，强调基于理论或经验知识确定与研究问题相关的条件变量。条件数量：既要考虑样本数量，也要考虑模型简约性，3～8个为宜。

（1）由于k个条件在理论上存在2k组合，过多的条件数量很容易导致组态个数超过观察案例个数，从而出现案例的“有限多样性”问题，故建议小样本规模（10-40个案例）的研究应将模型限制在7个前因条件之内。

（2）大样本研究避免了有限多样性问题，但条件数量过多可能会使研究结果的解释复杂化。

二、案例选择

1、QCA是案例导向型的方法，最初是专门针对中小样本研究情景开发的，一般应遵循理论抽样原则，根据理论和案例的特点选择样本。

2、在大样本研究中，QCA也可以处理数千个案例，使用大样本研究可以采用传统的随机抽样策略或有目的的抽样方法，从而将研究情景扩展到更大的样本群体中。选择案例时应注意几点：

（1）案例总体的充分同质性，入选案例在整体上应当是相似且可以比较的；

（2）案例总体内的最大异质性，入选案例既要包括 “正面案例”,又要包括 “反面案例”,避免呈现出过度的一致；

（3）案例数量与条件变量数量基本匹配，避免QCA研究中经常出现的有限多样性问题。

举些例子，选了几篇文献看一下别人的变量和案例数量选择：

[1]王英伟.权威应援、资源整合与外压中和：邻避抗争治理中政策工具的选择逻辑——基于（fsQCA）模糊集定性比较分析[J].公共管理学报,2020,17(02):27-39+166.条件变量（7个）：上级政府态度、核心领导动员、部门之间联动、民间政策活动家斡旋、群众抗议程度、社会组织干预、媒体舆论施压结果变量：（具有某一特征的政策工具）强制型工具、渐进型工具、退让型工具案例选择：共选取了30个邻避案例，其中案例资料主要源于政务公开平台、学术论文、媒体报道、民众诉求陈述记录、政府回应文本、微博、微信、贴吧等。

[2]方竹兰,徐腾达.人力资本制度与区域创新绩效——基于模糊集定性比较分析(fsQCA)的研究[J].经济理论与经济管理,2021,41(11):23-34.条件变量（6个）：人力资本培育制度、保障制度、信用制度、组织制度、产权制度、定价制度结果变量：创新绩效案例选择：以我国30个省级行政区为样本

[3]武永超.挂牌督办何以有效?——基于38起安全生产事故的fsQCA研究[J].中国行政管理,2021,(11):100-107.条件变量（6个）：科层压力、规制压力、舆论压力、政府响应、企业响应、公众参与结果变量：督办效果案例选择：基于2010-2020年38起安全生产事故挂牌督办案例，数据来源于中华人民共和国应急管理部、国家安监总局、安全管理网等官方网站。

[4]韩娜娜.中国省级政府网上政务服务能力的生成逻辑及模式——基于31省数据的模糊集定性比较分析[J].公共行政评论,2019,12(04):82-100+191-192.条件变量（5个）：政府组织开放性、自身重视程度、政府财政资源能力、中央政府支持、公众需求压力结果变量：网上政务服务能力案例选择：以中国31个省级行政区域 (不包括中国港澳台地区) 作为研究对象。

三、数据校准

校准是指赋予案例的特定条件集合隶属度的过程，只有将原始案例数据校准为集合隶属分数后，才能进一步进行必要性与充分性的子集关系分析。fsQCA允许将案例数据校准为0.0～1.0的集合隶属分数。

（1）直接校准法（大多用的都是这个方法）基于理论和实践使用三个定性锚点进行结构化校准：完全隶属阈值、完全不隶属阈值、交叉点，然后使用软件的算法进行校准。注意锚点的选择应遵循合理性和透明性的原则，可以参考现存的理论或提供理论依据，或参考外部样本进行经验论证，也可基于样本数据的频率分布选择锚点。常见校准标准：分位数95%，50%，5% ；75%，50%，25%

（2）间接校准法需要在定性评价的基础上对测量结果进行重新标定。首先将案例分为不同隶属级别（假定隶属度），再指定这些不同级别的初步隶属分数（基于理论与实质性知识以定性方式对其进行分类），然后使用定距尺度数据对这些隶属分数进行优化。直接校准法操作说明：“打开数据”——单击“变量”——点击“计算”——命名目标模糊集（字母）——在功能菜单中单击“校准calibrate”——单击旁边向上箭头，出现calibrate(x,n1,n2,n3)，分别编辑，x为变量名称，n1是完全隶属阈值对应的intvar值，n2是交叉点对应的intvar值，n3是完全不隶属阈值对应的intvar值——点击“确定”——点击“案例”，可进行升序或降序。

利用SPSS中的频率 - 统计数据 -百分位数找到三个阈值所对应的原始值：

校准过后，在 fsQCA 中，恰好在0.5隶属度的案例被从分析中删除(Ragin，2008b)。为了克服这个问题，Fiss (2011)建议在隶属度为1以下的前因条件中加入0.001的常数。有些研究会将0.5更改为0.501或0.499。

四、单个条件的必要性分析

在进行标准的QCA的标准分析之前，应检查是否有任何条件对结果来说是必要的。即“必要条件”：该条件总在结果存在时出现，换言之，没有该条件，结果就无法产生。主要是为了评估结果集合和单个条件集合的子集关系。：通常认定必要条件需要达到0.9的一致性分数，并且具有足够的覆盖度。操作说明：在菜单“分析”中点击“必要条件”——在Outcome栏选择结果变量（做两次，非集也要）——在左边Add Condition栏里添加所有的条件变量到右边框里，包括非集——点击“OK”

五、组态分析

（一）构建并完善真值表：设定相关门槛值初步筛选真值表行

1、确定最小案例频数以避免经验上琐碎的组态小样本研究可考虑最小案例频数为1或2，大样本会考虑更高案例频数，但要保留80%左右原始案例数。更高的频数阈值意味着每个组态包含更多的案例，但结果会降低覆盖样本的百分比(即覆盖度)，另一方面，较低的频数阈值增加了样本的覆盖度，但会包含一些琐碎组态。

2、确定一致性门槛值以确保组态的解释力度选择一致性阈值的第一个依据是确定已经获得的一致性中的自然断点，一般一致性设置为0.8，最低标准是0.75。

3、PRI一致性（“不一致性的比例减少”）建议将PRI值保持在0.75以上，以避免“同时子集关系”问题。如何构建真值表？真值表共2k行，每行会显示有每个向量空间角中隶属度大于0.5的案例数量、一致性。操作说明：单击菜单“分析”里的真值表运算算法“Truth Table Algorithm”——选择结果变量添加至Outcome栏，选择条件变量添加至右框——单击“OK”——创建真值表。

如何完善真值表？

1、为案例数设定频数阈值，排完序后，删除低于阈值的所有行；

2、设定一致性阈值，一般是0.8；

3、手动更改结果列，根据设定的一致性阈值，当一致性分数满足或超过一致性阈值时输入值1，否则为0；

4、单击底部的“标准分析”，生成三种解：复杂解、简约解、中间解。在导出中间解之前，会出现一个对话框询问对“每个条件的预期”，可以指定条件是“缺失”、“存在”、“缺失或存在”。

（二）标准分析

单击底部的“标准分析”，生成三种解。在导出中间解之前，会出现一个对话框询问对“每个条件的预期”，可以指定条件是“缺失”、“存在”、“缺失或存在”。

一般情况下，都选择“缺失或存在”，如果某个条件在必要性分析时是必要条件，就选择“存在”，如果是~A是必要条件，就选择A条件是缺失。

1、“解”：一个由大量案例支持的组态组合1.复杂解（不包括逻辑余项，如上图）：基于原始数据，排除了涉及有限简化的反事实案例，不经过任何反事实分析，通常包含更多组态和前因条件。

2、简约解（包括逻辑余项但不对其合理性进行评价，如上图）：经过了简单和困难反事实分析，组态和条件数量最少。简约解包括任何可以促成逻辑上更简单的解的反事实组合。

3、中间解（使用逻辑余项但仅限于那些有合理依据的，如上图）：只考虑了简单的反事实分析，纳入符合理论方向预期和经验证据的逻辑余项。合理有据、复杂度适中的中间解通常是QCA研究中汇报和诠释的首选。中间解有几行，就表示存在几条路径，在每条路径中，哪些条件是该条路径的核心条件，哪些是边缘条件，则需要继续分析，并通过结果表直观展现出来。六、结果解释-制作结果表解释分析结果的一种常用方法是使用中间解来确定导致结果的组态数量和这些组态的包含条件，然后利用简约解的结果来确定对给定组态较为重要的核心条件。

（1）出现在简约解中的条件被称为给定组态的核心条件，表明与所关注的结果之间存在很强的因果关系；

（2）出现在中间解但没有出现在简约解的其余条件称为边缘条件，与结果之间因果关系较弱。

整体一致性为0.841，大于0.8，一致性程度很好；整体覆盖度为0.84，大于0.5，解释力度很高今天就分享到这里，如果有缺漏或错误的地方，还请各位大佬指出，好学小白继续学习，继续完善~

注：以上整理内容来自于杜运周的《QCA设计原理与应用》和《重新设计社会科学研究》，以及各学习平台上的碎片化内容，以及知乎piaopiao等。

✦

•

✦

扫码添加客服微信

http://mp.weixin.qq.com/s?__biz=MzU0MTQyOTI2Mw==&mid=2247582426&idx=2&sn=701f45d92a60c3e1ee3bf25edc64637e

数据皮皮侠

社科数据综合服务中心，立志服务百千万社科学者

最新文章

数字技术应用广度与深度(2001-2023)

最全！经管类国家社科基金立项名单汇总1991-2024（附填写指南）

环境政策DID大全

数字经济大合集2.0版本

这些数据可以发顶刊！

上市公司加班时间数据库（2012-2024）

顶刊都在用的fsQCA方法基本操作步骤详解

司法繁简分流改革城市试点DID（2007-2023）

顶刊复刻！数字金融与企业ESG表现:效应、机制与“漂绿“检验

【高级会员】最新整理！中国城市统计年鉴面板数据库（1993-2021年）

人工智能话题再登UTD！生成式AI将颠覆自由职业？

【永久会员】全国省市县分行业碳排放月度数据（2000-2023）

【高级会员】GSOD全球逐日气象站点数据更新（1929-2023.12.31）Python爬取！24个G处理好！

【高级会员】新三板公司数据库2.0（1990.12-2023.8）

【永久会员】时光穿越：1952-2023年5G企业工商档案大揭秘

SSCI一区TOP，5个月录用，一年发了7篇，我是如何写论文的....

生态文明建设示范区DID（2007-2023）

城市蔓延指数(1992-2023)

绿色信贷贴息政策DID（2007-2023）

还有高手？背后定有高人指点！！！

最新！人工智能话题论文发表在《中国工业经济》！

【高级会员】中国城市空气质量指数（2000-2024）

【高级会员】新三板公司数据库2.0（1990.12-2023.8）

【永久会员】全国环境污染百度指数数据（2011-2023）

【高级会员】全球台风数据（1949-2023年）

炸裂！研究生一作发表《经济研究》！

【高级会员】顶刊收割机！绿色工厂与上市公司匹配数据（2017-2023）

【永久会员】中国汽车能源消耗量（2010-2024年）

【高级会员】地级市产业转型升级：绿色产出、清洁化程度指数——基于400w+工企数据库整理

悄悄告诉你，这个发刊秘诀……

供应链创新试点DID（2007-2023）

【高级会员】政府创新补贴（2007-2023）

【高级会员】中国全球投资数据集（2005-2024）

【永久会员】工业企业与海关匹配数据（2000-2013）

【永久会员】科技统计年鉴面板数据库（2000-2022）

新质生产力再发SSCI！人大教授带你正确理解新质生产力！

生态文明建设示范区DID（2007-2023）

【永久会员】抖音带货数据及排名（2024.3-2024.10）

【高级会员】中国全球投资数据集（2005-2024）

【高级会员】 63w+有小程序注册的企业汇总数据（2024.2）

平平无奇间，我发了5篇SSCI....

新质生产力数据大合集2.0

【顶刊复刻】中国工业经济-数实产业技术融合与企业全要素生产率（2008-2022）

全国各省、地级市数字经济专利（1985-2022）

想问一下怎么获取那些顶刊文献的数据？

又一个绝妙idea：如何用空间计量研判人工智能发展趋势

中国城市经济韧性（2007-2022）

消费者投诉与上市公司匹配数据库（2018-2024.7）

【永久会员】上市公司绿色新闻数据库（2007-2023）

《管理世界》也在用!上市公司绿色治理绩效GGP（2009-2023）

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉