年龄-时期-队列交互模型(APC-I)|Sociological Methods & Research

文摘   2024-12-09 22:45   浙江  

年龄-时期-队列交互模型 ——

针对队列间和队列内生命历程动态的描述与分析

编者按:

年龄-时期-队列模型(Age-Period-Cohort Model,也译为年龄-时期-世代模型)已成为社会科学中一种重要的研究方法,用于研究社会变迁和人类发展。由于模型中线性依赖关系(队列 = 时期 - 年龄)的存在,如何测量这三种效应的净效应一直是一个难题,并引发了大量的讨论。传统 APC 方法及其改进版都依赖于有争议的统计假设来实现模型识别,这些假设往往缺乏可靠的理论依据。由此,该文提出了 APC-I 模型(Age-Period-Cohort-Interaction Model)来解决传统 APC 模型的问题。


APC-I 模型的核心思想是,队列效应可以通过比较不同队列的年龄轨迹来识别。如果不存在队列效应,那么所有队列的年龄轨迹应该是平行的(斜率相同),只是在数值上有所不同。相反,如果存在队列效应,那么不同队列的年龄轨迹将会发生偏离。APC-I 模型通过估计年龄轨迹的斜率如何随队列变化来捕捉这种偏离。这种方法不仅允许研究者测量队列效应的数值,还能揭示队列效应是如何随年龄变化的。


全文框架如下:首先,文章对比了社会科学家实际关注的队列效应和传统 APC 模型中所得出的队列效应(包括线性的和非线性的),并指出两者并不相同。其次,文章介绍了 APC-I 模型,提供其理论和方法论依据,描述其具体方法,并解释如何计算和检验队列间和队列内效应。再次,文章以女性劳动参与率为例,说明如何在实证研究中应用该模型。最后,文章讨论了 APC-I 模型在特定情况下的应用,以及其潜力和局限性。


摘要:
一直以来,社会科学家们都试图测量出年龄、时期和队列影响的“净效应”,而由于 队列 = 时期 - 年龄,这成了一个难以克服的技术困难。本文认为,这种技术困难反映了过往人们想要研究的队列效应和他们在传统 APC 建模方法中定义的队列效应之间的脱节。本文提出了一种新方法,称为年龄-时期-队列交互模型(age-period-cohort-interaction mode,APC-I),它与传统 APC 模型存在质的差异,因为它引入了 Ryder(1965)在理论上关于队列内效应变异可能出现的探讨。APC-I 模型无需有争议的前置假设,其对结果的解释也很直接明确。APC-I 模型量化了由年龄和时期主效应带来的队列间差异,同时还允许对队列内生命历程动态进行假设检验。


文献来源:

Luo, L., & Hodges, J. S. (2022). The age-period-cohort-interaction model for describing and investigating inter-cohort deviations and intra-cohort life-course dynamics. Sociological Methods & Research, 51(3), 1164-1210.


作者简介:

罗丽莹,宾夕法尼亚州立大学社会与人口学系

James S. Hdges,明尼苏达大学公共卫生学院


译者:

席东杰


 罗丽莹    &    James S. Hodges


一、传统 APC 模型存在的问题

社会科学家往往很关注社会现象的变化趋势,希望能够从中挖掘出社会规律。例如,近几十年来,人们的价值观是更趋向自由主义还是保守主义?人口死亡率是否随出生队列更替而下降?回答这类问题需要研究者同时考虑三种时间维度的影响:年龄(研究开展时,研究对象的年龄)、时期(研究开展时的年份)和队列(研究对象的出生年份)。因此,许多社会科学家开始采用年龄-时期-队列模型来探讨社会变迁与人类发展

1、年龄、时期和队列效应的定义

在社会科学研究中,年龄、时期和队列效应通常被定义为三种不同类型的时间维度变化(Ryder,1965)。年龄效应指的是随着个体在生命历程中从成长到衰老而发生的变化。这些变化可能是由生理成熟、累积经验或社会角色转变引起的。例如,认知能力可能随着年龄的增长而下降,保守主义倾向可能随着年龄的增长而增加。时期效应指的是影响所有年龄段的社会重大事件造成的变化。这些事件可能包含战争、经济衰退、技术革新或重大政策转向等等(例如,2008年的经济危机可能导致各年龄段的人产生更悲观的经济预期)。队列效应指的是由于出生在特定历史时期而产生的持久差异。这些差异可能源于共同的成长经历、教育机会或社会化过程(例如,在经济繁荣时期出生的人可能终生保持更高的职业抱负,而在经济萧条时期出生的人可能更加重视经济安全)。

2、传统 APC 模型中的队列效应

传统 APC 模型试图将这三种效应分解为相互独立的主效应。在这种框架下,队列效应被定义为在控制年龄和时期效应后剩余的时间变异效应。在统计学模型中,这可以表示为:

g(E(Yij)) = μ + αi + βj + γk        ①

其中,i、j 分别代表年龄、时期和队列,μ 是截距,α、β  γ 分别是年龄、时期和队列的回归系数。Y为研究所感兴趣的因变量, E(Yij表示第 j 个时间段内第 i 个年龄组的结果 Y 的期望值,g为关系函数。

然而,模型①面临着众所周知的识别问题——三个变量之间存在高度的线性依赖关系,这导致了模型无法识别(详见:Fienberg & Mason,1979;Luo 等,2016;Fosse & Winship,2019)。简言之,模型①的设计矩阵的秩小于满秩,因此参数 α、β 和 γ 有无数个解。为解决这个问题,研究者提出了各种约束或假设,如改变模型设置(如Yang 和 Land于2016年对时期和队列使用随机效应的尝试),操作变量(如Sarma等人于2012年对年龄、时期和队列组使用不等区间宽度的尝试)等等。尽管这些方法在技术上可以实现模型的识别,但它们往往缺乏可靠的理论基础,而且对结果的解释也存在争议。

3、重新思考队列效应

除了线性依赖关系导致的识别困难之外。传统 APC 模型中的技术困难还反映了其对队列效应本质的误解:传统 APC 模型及其改进版忽略了队列随年龄变化过程中的生命历程动态,也就是说,传统 APC 模型假定队列效应在整个生命过程中保持不变(Hobcraft & Menken & Preston,1982)。然而,这种假设并不可靠。

实际上,这种队列内的生命历程动态对于理解时期效应至关重要。例如,2008 年发生的美国经济大衰退可能会通过收入下降和早期就业机会减少等各种社会机制对 1980 年代出生队列的人群健康产生负面影响,但这些负面影响可能要等到这一代人年老时才会显现出来。如果按照传统 APC 模型,只关注不同出生队列之间的平均差异,就可能无法发现这种时间段的滞后效应。

Norman Ryder(1965)在其开创性工作中提出,队列应该被视为社会变迁的载体。根据 Ryder 的观点,队列效应并非独立于年龄和时期效应,而是表现为年龄效应随时间的变化,或者说是时期效应随年龄的变化。具体来说,Ryder 强调了两个关键点:其一,队列差异主要源于不同代际群体在其生命历程的关键阶段所经历的社会历史事件;其二,这些早期经历可能会对个体产生持久影响,从而塑造其后续的生命轨迹。

这意味着,队列效应应该被理解为年龄和时期之间的交互作用,而不是一个独立的主效应。例如,经济大萧条时期出生的人可能在整个生命历程中表现出更保守的经济行为,而这种效应的大小也并非一成不变的,是有可能随着年龄变化而变化的(例如,在退休后更为明显)。基于这一观点,本文提出了 APC-I 模型,将队列效应定义为年龄和时期的交互作用。这种建模方法不仅解决了模型的识别问题,还提供了一个更符合 Ryder 理论的队列效应表达形式。

二、APC-I 模型的提出

1、模型设置

APC-I 模型将队列效应定义为年龄和时期之间的交互作用。形式上,该模型可以表示为:

g(E(Yij)) = μ + αi + βj + αβij(k)        ②

其中g、Yij、μ、αi  βj 的定义与模型①相同,而 αβij(k) 表示第 i 个年龄组和第 j 个时期组之间的交互作用,对应于第 k 个队列的效应。需要注意的是,一个队列的效应包含多个年龄与时期交互项 αβij(k) ,这些交互项位于以年龄为行、时期为列的表格中的同一条对角线上。

模型②与模型①在队列效应的建模方式上存在本质区别:
在模型②中,队列效应被视为年龄与时期交互作用的一种特定形式。在统计学中,两个变量之间的交互作用反映了一个变量的差异效应取决于另一个变量的水平(Scheffé,1999)。在 APC 研究中,这意味着如果时间效应可以归因于队列,那么就应该存在显著的年龄与时期交互作用。而当队列成员身份与结果无关时——即当历史或社会变迁(时期效应)对所有年龄类别的影响一致时——则不存在年龄与时期交互作用。

2、估计与检验

在 APC-I 模型中,队列间的变异可通过每个队列相对于年龄和时期主效应的均值偏差来测量。同一队列在其生命历程中的变异则可以通过检查其与对应的年龄与时期交互项的特定对比来研究。下面将介绍 APC-I 模型的三步检验法,并结合实际案例介绍 APC-I 模型如何测量年龄和时期效应以及队列间的偏差和队列内的动态变化。
第1步:全局队列效应显著性检验

首先,研究者需要确定是否真的存在无法通过年龄和时期效应来解释的队列效应。在拟合了模型之后,对年龄与时期交互作用的变异进行全局检验。值得注意的是,全局检验的结果即使显著,也仅仅表明可能存在某种队列效应——即全局检验显著是队列效应真实存在的必要不充分条件。并且,全局检验结果也并不能具体描述队列效应。

而如果全局检验结果不显著,则说明队列效应并未对因变量的变异有多少影响。在这种情况下,社会事件对不同年龄个体的影响没有差异。此时,无需进行第2步或第3步的检验以进一步探讨队列效应。同时,本文建议对年龄与时期交互作用项进行可视化检验,以便更好地解释年龄和时期主效应。

第2步:局部队列效应显著性检验

在控制了年龄和时期主效应后,特定队列的效应是否显著?可以通过针对与每个队列对应的一组年龄与时期交互作用项的偏差度检验来回答这一问题。此检验用于评估特定队列的效应量是否显著,即该队列的一组年龄与时期交互作用项整体上是否解释了因变量的显著变异。如果局部队列效应量检验为显著(拒绝原假设),则可以认为该队列效应对因变量结果有实质影响。然而,该检验依旧无法澄清各队列效应量的具体大小以及正负——这就需要进行第3步检验。第3.1步和第3.2步通过两个 t 检验进一步刻画队列间差异和队列内生命历程动态。

第3步:队列间效应与队列内生命历程动态检验

第3.1步:队列间效应量检验

对于在第 2 步中显著偏离年龄和时期主效应的各队列,计算该队列中包含的年龄与时期交互作用项的均值,并使用 t 检验来检验该队列效应的均值。这些均值及相关的t检验可用于评估各队列相对于年龄和时期主效应的效应量大小。

第3.2步:队列内生命历程动态检验

对于偏离由年龄和时期主效应定义的模式的各队列,针对其年龄与时期交互作用项进行线性正交多项式对比的 t 检验,以分析该队列成员的平均优势或劣势在其生命历程中是增强、稳定不变还是削弱。
关于三步检验法的四点说明

第1点:在 APC 分析中使用这些检验统计量的想法早有人提出。例如,Clayton和Schifflers(1987)建议使用偏差检验或似然比检验,在仅考虑年龄的模型、年龄-时期模型、年龄-队列模型或完整的 APC 模型之间进行选择。此外,Yang 和 Land(2016)也提出了比较这些模型的方法,但同时主张某些检验结果可以证明使用受约束的方法(如内在估计器)的合理性。然而,本文提出全局队列效应显著性检验的目的既不是为了帮助确定模型选择,也不是验证未知参数上的技术约束。相反,由于本文将队列效应视为年龄与时期的交互作用,模型②中年龄与时期交互作用的全局队列效应显著性检验提供了一个明确的度量方法,并作为队列效应存在的必要条件。

第2点:当存在显著的年龄与时期交互作用时,研究者在解释估计的年龄和时期主效应时应保持谨慎。通常,交互作用有两种类型:定量交互作用,即结果的年龄趋势在所有时期具有相同方向,但不同时期的趋势强度有所不同;定性或交叉交互作用,即结果的年龄趋势方向因时期而异。当存在定性或交叉交互作用时,很难以有意义的方式解释主效应。然而,在定量交互作用的情况下,主效应仍可以被解释为平均趋势(Aiken & West,1991;Jaccard & Turrisi,2003)。在 APC-I 方法中,年龄与时期主效应在定量交互作用下是可解释的。如果存在定性年龄与时期交互作用,建议使用可视化方法来评估每个时期的年龄效应差异的大小。当存在定性年龄与时期交互作用的情况下,一个合理的替代分析策略是比较特定队列的年龄分组轨迹,因为在这种情况下,每个队列随年龄所变化的过程是独特的,并以不同于其他队列的方式受到社会变迁的影响。

第3点:当一个队列在年龄-时期分类表中仅由两个或更少的年龄与时期单元组成其对角线时(通常是最年轻或最年长的队列),研究者在解释该队列效应时应特别谨慎。因为将由如此少的数据点(如两个年龄与时期单元)确定的趋势视为该队列在整个生命历程中一般趋势的代表可能具有误导性。观察到的年龄与时期单元越多,对理解该队列内生命历程变化的估计信息量就越大。

第4点:关于编码方案的选择对年龄与时期交互作用解释的影响。一些 APC 估计方法的单元均值估计和结论可能因编码方案而异(Grotenhuis 等,2016;Luo 等,2016)。但在任何已识别的模型(包括 APC-I 模型)中,不同编码方案的估计结果是等价的,并且所有编码方案的单元均值估计是相同的。换句话说,虽然两组交互作用估计值在数值上必然不同,但这种差异并非源于识别问题,而是反映了这些数量表示意义的变化。例如,在虚拟变量编码下,交互作用表示与特定参考组的方向性差异,而在效果编码下,交互作用表示相对于年龄和时期主效应所表明的单元均值的偏差。在 APC-I 模型中,建议使用效果编码,以便更容易解释,并与交互作用存在时的编码方案推荐保持一致(见 Aiken & West,1991;Jaccard & Turrisi,2003)。


三、美国黑人与白人女性劳动参与率变化(1990-2017)

本节将展示如何使用 APC-I 模型来研究 1990 年至 2017 年间美国黑人和白人女性在劳动参与率(Labor Force Participation Rate,LFP)上的年龄、时期及队列间差异和队列内生命历程变化。

1、研究背景

女性劳动参与率的时间趋势一直是社会科学领域中的重要问题。美国女性的劳动参与率在 1990 年代持续增长,但在进入 2000 年代之后则渐趋停滞,之后甚至开始下降。这种变化引发了种种讨论。例如,学者们将观察到的停滞归因于特定时期的因素,包括劳动力需求(Erceg & Levin,2014)、大衰退的经济冲击(Boushey,2005;Hoffman,2009)、社会福利和残疾保险(Duggan & Imberman,2009)以及性别角色态度(Fortin,2015)。然而,这种现象不太可能是纯粹的时期过程。例如,由于女性通常在50多岁时开始退出劳动力市场,如果女性人口正在老龄化,即50岁或以上女性的比例增加,我们应该预期其劳动参与率会下降。也就是说,最近的趋势可能反映了女性人口年龄结构的变化(Aaronson等,2014)。队列更替过程也可能通过退出劳动力市场的较高劳动参与率的年长群体和进入劳动市场的较低劳动参与率的年轻群体来导致劳动参与率的停滞(Lee,2014)。同时,受教育程度、子女数量、社会态度和价值取向等重要的社会和人口变化更有可能是队列特定的,而非时期特定的过程,因为这些变化主要影响特定年龄段的个体(Goldin,2006;Farré & Vella,2013;Fernández,2013;Balleer Gomez-Salvador & Turunen,2014)。因此,将这些趋势分解为与年龄、时期和队列相关的变化可以帮助阐明时间趋势的性质,并提供关于引起这些时间变化的人口、社会和经济因素的重要线索。

本文尝试回答以下研究问题:

其一,对于每个种族群体(黑人和白人),(a)劳动参与率在多大程度上受到年龄、时期和队列的影响?(b)相比于其年龄和时期,哪些队列的劳动参与率特别高或特别低?(c)劳动参与率的队列差异在每个队列的生命历程中是恒定的、增长的,还是减少的?

其二,对于每个种族群体,教育水平和子女数量的变化以何种方式影响了这些模式?

2、数据来源和分析结果

本文使用 1990-2017 年美国当前人口调查(Current Population Survey,CPS)3月补充数据(由 IPUMS-CPS 发布)。CPS 是由美国人口普查局和劳动统计局每月进行的一项调查。为分析女性劳动参与率的变化,本文分别为每个种族群体拟合了包括年龄和时期主效应及其交互作用的 APC-I 模型。

在进行三步检验后,本文发现,对于黑人女性,劳动参与率的变化主要可以通过年龄和时期趋势来解释,尽管有少数队列偏离这些一般趋势。而白人女性的劳动参与率显示出显著的队列效应,这无法通过年龄和时期主效应来解释。尤其值得注意的是,1950-1964 年出生的白人女性队列比预期更有可能参与劳动力市场,也就是说,这些队列的实际劳动参与率显著高于其所经历的年龄组和时期组所描述的水平。她们高于预期的劳动参与率可能与其年轻时经历的教育扩张和女权运动的持久影响有关。

除了队列间效应以外,本文还发现白人女性在队列内的生命历程中存在显著的累积效应。也就是说,对于 1950-1954 年、1955-1959 年和 1960-1964 年出生队列而言,年轻时高于预期的劳动参与率与其在年长时高于预期的劳动参与率高度相关,而其他队列年轻时低于预期的劳动参与率与年长时低于预期的劳动参与率高度相关。这一发现与最近关于婴儿潮群体在年长时劳动参与率高于预期的文献一致。学者们认为,她们相对较高的劳动参与率可能归因于其较高的教育水平和此前的工作经验(Goldin & Mitchell,2017;Goldin & Katz,2018)。本文的发现表明,即便考虑到受教育水平和子女数量的影响,她们累积的高劳动参与率依然存在。
另一方面,1965-1984 年出生的白人女性平均劳动参与率,从队列间来看,不仅低于其年龄和时期一般趋势,而且从队列内变化来看,在其年长时也更低。这一变异在加入受教育水平和子女数量两个控制变量后依然存在。因此,这些队列的累积劣势对女性劳动参与率持续增长的乐观态度提出了质疑。

1950-1964 年出生的白人女性队列累积的高劳动参与率以及年轻队列累积的低劳动参与率对于理解大衰退对女性劳动参与率的影响提供了重要启示。时期主效应表明,从 2000 年代末到 2010 年代,白人女性的总体劳动参与率并未出现明显下降,这说明,可能存在对大衰退异质性效应的遮掩:1950-1964 年出生的年长世代可能未受到负面经济条件的影响,而大衰退的不利影响对年轻的女性世代则最为明显,并可能在她们年长时更加显著。未来的研究可以在数据可用时解决这一时期效应的异质性问题。


四、结论与讨论

本文探讨了 APC-I 模型对队列效应的重新定义以及其与传统 APC 模型中对队列效应定义的区别。为解决传统 APC 模型对于队列效应定义的缺陷,本文提出了一种新的 APC 模型,即 APC-I 模型,用于研究社会和人口结果中年龄和时期主效应的队列间变异以及队列内生命历程动态变化。本文还利用美国当前人口调查(CPS)数据,展示了如何使用 APC-I 模型描述和解释美国黑人和白人女性劳动参与率的年龄、时期、队列间和队列内变化。

APC-I 模型有三个优点:首先,像任何带有交互作用的双因素 ANOVA 模型一样,该模型是可识别的,因此避免了传统 APC 模型的识别问题,并允许包含额外的协变量;其次,APC-I 模型系数估计的解释是有实际意义且直观简洁的;最后,相比于传统 APC 模型预设了队列效应在生命历程中呈现不变状态,APC-I 模型更改了这一假设,使研究人员能够分析队列内的生命历程变化

由于传统 APC 模型在该领域占据主导地位已有数十年,因此很多读者试图根据传统 APC 模型来解释 APC-I 方法,认为 APC-I 方法忽略了队列间的线性效应,而仅关注模型中定义的非线性效应也就不足为奇。实际上,一些传统 APC 模型的研究者也提出了一些只关注非线性队列效应的方法(O'Brien等,2008;Keyes等,2010;Chauvel & Schröder,2015)。

然而,APC-I 模型在两个重要方面与这些方法不同:
首先,以前的方法都是在传统 APC 模型的独立队列效应假设下开发的,即假设队列效应独立于年龄和时期变化过程发生,并且不考虑时期变化对于不同年龄个体的差异性影响。也就是说,以前的方法并没有质疑传统 APC 模型的独立队列效应假设的有效性,因此在其队列效应的操作化中缺乏理论依据。本文质疑这一值得商榷的假设,并为将队列效应建模为特定形式的年龄与时期交互作用提供了详细的理论和概念论证。其次,尽管在某些情况下基于非线性队列模型的队列效应可能在数值上与 APC-I 模型三步检验法中的第二步中估计的局部队列效应相似,但它们具有不同的意义和解释,在传统 APC 模型中的非线性队列效应不能像在 APC-I 模型三步检验法中的第三步中那样用于调查队列内的生命历程动态。


编译| 席东杰
审核 |  霰雪
终审 |  Krystal
©Sociology理论志

前沿追踪 / 理论方法 / 专家评论
ID: SociologicalReview

点点“在看”给我一朵小黄花

Sociology理论志
搜索“理论志”,发现新学术:六万余读者关注的理论志社会学平台。目前,我们主力追踪国内外社会学、人类学和区域研究新动态。
 最新文章