中国高龄人口死亡率的极值分析

2025-01-17 12:50   北京  
点击“中国保险学会”可以订阅!

本文字数:4429字

阅读时间:10分钟

作者简介:付伟略,现供职于泰康人寿保险有限责任公司,首席财务官兼总精算师兼首席投资官;李海秀、李覃勤、苑兴涵,均供职于泰康人寿保险有限责任公司精算部。

文章来源:《保险理论与实践》2024年第5辑

一、引言

由于我国保险市场发展时间不长,85岁以上高年龄段尚未积累足够的经验数据,在编制保险行业生命表过程中,无法直接计算其死亡率,个别年龄直接采用样本数据计算出的死亡率可信度较低。对此,研究通常基于数据量相对充足的85岁以前年龄段死亡率模型,采用参数外推方法获得85岁以上高龄段死亡率。在经典的高年龄外推模型中,年龄起点和终点通常依赖主观假设。当前保险行业生命表的外推年龄起点一般根据暴露数确定,外推终点即极限年龄从1996年发布的第一套中国人寿保险经验生命表(1990—1993)至今一直维持105岁不变。随着近几十年间死亡率的显著改善和寿命的不断延长,对于承担长寿风险类的产品,生存分布尾部特征的重要性愈加凸显。本文对极限年龄的研究有其现实意义。 


极值理论(Extreme Value Theory,EVT)在统计学中的应用为极限年龄的研究提供了一种解决方法。极值理论可以用于研究随机变量在极大或极小水平上的特征,因此,可将其应用于死亡率曲线尾部特征的研究。Aarssen等(1994)通过对广义帕累托(GP)模型中参数符号的假设检验,基于荷兰人口数据验证了极限年龄的存在。Kathryn等(2006)利用极值理论量化了加拿大和日本的人类寿命分布的上尾部,得到了寿命数据的广义极值和广义帕累托分布。Li等(2008)提出了门限生命表方法(Threshold Life Table),利用极值理论推断生存分布的极限年龄,替代当前主观选择年龄使其死亡率为1关闭生命表的方法。段白鸽和孙佳美等(2012)以及肖鸿民等(2019)分别用极大似然估计法(MLE)和加权最小二乘法(WLS),将门限生命表方法应用于中国人口普查数据,预测了男性、女性和总人口的极限年龄及区间估计。本文采用Li等(2008)提出的门限生命表方法,使用Logistic模型和广义帕累托分布研究我国人口死亡率上尾部的分布特征,探讨极限年龄的存在问题,对极限年龄进行估计,为生命表编制工作提供参考。

二、极值理论模型

(一)模型描述


1. 符号定义


2. 模型分段形式


门限生命表方法假设生存函数的分布为分段形式,即门限年龄前后服从不同的模型分布。门限年龄前的生存函数为经典高年龄外推模型,常见的模型包括Heligman-Polard(HP)、Kannisto、Gompertz、Makeham、Logistic、Weibull等。


对于超过门限年龄N的部分,设剩余寿命的条件变量Y=X-N|X>N,根据Balkema-de Haan-Pickands定理,Y的极限分布为GP分布,其分布函数如下:

EVT中的这一重要结果为门限生命表提供了理论依据,高龄人口死亡率的生存函数可定义为:

其中,B>0,C>0,D>0,>0。从S(x)的构造形式可以看出其在门限年龄N处是连续的,平滑性取决于门限年龄N的选择。


3. 极限年龄的估计


对于高年龄x(x>N),若其生存函数服从GP分布,由式(2)有:


人类寿命的有限上界即极限年龄为 =1时的年龄,从式(3)和式(4)可以看出:



(二)模型参数估计


本文沿用Li等(2008)构造门限生命表时使用的参数估计方法,即极大似然估计法和加权最小二乘法,主要基于中国人口普查死亡率数据对65岁及以上的高龄人口的死亡率进行研究,人口普查数据公布的单年龄死亡率数据的最大年龄为99岁,100岁及以上合并为一组。


1. 极大似然估计法


似然函数表达式如下:

其中


65~99岁可获得单年龄死亡率数据,在似然函数中体现为个体在x岁至x+1岁死亡的概率是S(x)-S(x+1)。100岁的死亡率数据是右截断的,在似然函数中通过个体活过100岁的概率S(100)体现。


2. 加权最小二乘法



以每年的暴露人数作为权重,误差平方和(SSE)的定义如下:

其中



(三) 参数估计步骤


MLE和WLS的参数估计步骤是相同的,仅优化的目标函数不同。



步骤2:对于N=96,95,…,90,重复步骤1。


步骤3:为找出MLE和WLS两种估计方法下的最优估计结果,使用平均相对误差(MRE)作为模型拟合效果的评价指标,MRE最小时的N值,即为最优的门限年龄。在这一最优门限年龄下的模型参数估计值即为最优参数估计值。

三、实证分析

(一)死亡率数据分析


1. 数据质量分析


本文采用《中国人口统计年鉴》最近三次人口普查数据,即2000年、2010年和2020年全国分年龄、分性别的死亡数据。我们从死亡发生率、发生率年龄间增速和男女人口数比值3个维度分析前述数据质量,为模型拟合作准备。


(1)死亡发生率


图1展示了这三次普查数据中65~99岁死亡概率的值。可以看出,近20年死亡率整体呈现改善趋势,女性死亡率低于男性死亡率。但是,超高龄段死亡率存在异常现象:一是死亡率随年龄增加而下降,不符合年龄越大死亡率越高的普遍认知;二是2010年死亡率在特定年龄点上低于2020年,不符合死亡率改善的趋势,可能是数据质量不佳导致的。


(2)死亡率年龄间增速


从死亡率年龄间增速(见图2)来看,80岁以上年龄段死亡率增速呈现较明显的下降趋势。对于此类高龄人口死亡率减速现象,学者们已基本达成共识,对该现象的解释为:一是超高龄人口存在年龄夸大、记录准确性难以考证及死亡率漏报等问题。二是人口死亡数据的异质性。由于单年生命表中超高龄人口规模较小,为保证估计结果的可靠性,通常采用合并多个日历年的数据减少超高龄死亡率估计的统计噪声,这种做法不可避免地导致不同出生队列人口死亡数据的异质性效应。虽然学者们普遍认同高龄人口减速现象,但我国人口普查死亡率超高龄段死亡率增速下降过快,导致部分年龄点死亡率呈下降趋势,特别是男性死亡率下降情况更为明显。


(3)男女人口数比值


从男女人口数的比值来看,因为男性死亡率高于女性死亡率,男性与女性的人口数比值应随年龄增加而下降,但图3显示,超高龄段男性和女性人口数比值存在上升趋势。


对于2020年中国人口普查数据,本文基于单年龄死亡率数据计算出的平均余命高于《2021年我国卫生健康事业发展统计公报》和《中国人口和就业统计年鉴》中公布的平均余命。从中国人口与发展研究中心咨询得知,公报中的预期寿命对普查数据进行了修正,人口普查高龄段确实存在漏报情况。综合考虑以上超高龄死亡率的异常现象,下文对超高龄段的异常死亡率进行修正。


2. 超高龄段死亡率修正


由于2000年、2010年和2020年的男性死亡率和2010年的女性死亡率超高龄段异常相对明显,本文考虑采用高年龄外推模型的拟合结果对其进行修正,2020年和2000年女性数据无明显异常暂不修正。下文尝试HP、Kannisto、Gompertz、Makeham、Logistic和Weibull 6种模型用于死亡率修正,因异常年龄为95岁以上的超高龄段死亡率,为提高拟合效果选取较高年龄的死亡率数据作为拟合数据输入模型,拟合数据起点选取85岁。拟合数据终点进行差异化设置,2020年男性和2010年女性拟合数据终点均为99岁;2010年男性和2000年男性超高龄段死亡率下降显著,部分年龄间死亡率下降幅度超过10%,为避免影响修正后死亡率结果,故对其拟合数据进行适当截断。此外,为提高修正后死亡率曲线的平滑性,在拟合数据终点附近选择拟合偏差最小的点作为修正起点(见表1)。


本文选取MRE作为模型评价指标,Logistic模型在6种模型中拟合效果最好,拟合结果如图4所示。死亡率下降情况较明显的2010年和2000年男性平均修正幅度较大,分别为17%和28%,2020年男性和2010年女性平均修正幅度较小,均不超过10%。


(二)模型估计结果


基于极值理论模型中构造的高龄人口死亡率模型(式2),本文分别采用MLE和WLS两种估计方法,目标函数分别为对数似然函数的负值(-ln)和误差平方和,借助Python中的Minimize函数,通过最小化目标函数求解参数的最优估计值。为两种估计方法设置相同的参数初始值,具体数值参考了段白鸽和孙佳美(2012)中的参数估计结果。


1. 门限年龄前的模型选择


门限年龄前的模型为经典的高年龄外推模型,拟合数据起点为65岁,设定门限年龄的取值范围为90~97岁。本文分别计算各种拟合数据下模型拟合的MRE,结果如图5所示。根据MRE选取拟合效果较优的模型,整体来看,Logistic模型拟合效果均明显优于其他模型。


2. 模型估计结果


本文基于上述修正后的死亡率数据拟合模型,根据MRE选取拟合效果较优的估计方法。整体来看,WLS的拟合效果优于MLE。从图6和图7的模型拟合结果来看,无论是男性还是女性,WLS下的模型拟合效果均较好,且在门限年龄处曲线均较为平滑。对超高龄段异常死亡率进行修正后,各曲线的死亡率均呈上升趋势。


从表2中模型参数结果来看,GP模型参数估计值均为负值,说明均存在极限年龄。男性和女性的极限年龄均随年份增加而上升,符合当前人口死亡率持续改善且人均寿命不断延长的特征。三个年份的女性极限年龄比男性高5~8岁,与女性死亡率低于男性的特征相符。

四、结论

本文基于EVT下的高龄死亡率模型,针对2000年、2010年和2020年三次人口普查数据,对人口的极限年龄进行了研究。研究发现,基于三次人口普查数据,从死亡率水平、死亡率年龄间增速和男女人口数比值来看,超高龄人口死亡率存在异常偏低现象,不符合死亡率随年龄上升和死亡率呈改善趋势的普遍认知。基于修正后的死亡率数据来看,WLS方法下模型拟合效果较好,男性和女性拟合死亡率曲线均呈上升趋势。男性和女性均存在极限年龄,男性2000年、2010年和2020年的极限年龄分别为114.3岁、120.3岁和125.5岁,女性2000年、2010年和2020年的极限年龄分别为122.2岁、125.7岁和130.4岁。男性极限年龄低于女性、男性和女性极限年龄均随年份增加而上升,符合男性死亡率高于女性、死亡率呈现改善趋势的特征。


基于EVT的高龄死亡率模型估计的极限年龄,高于当前保险行业生命表中极限年龄105岁10~15岁。保险行业生命表主要应用于产品定价和各类精算评估,极限年龄的修改主要影响105岁以后的死亡及生存责任。对于保障期间为终身的死亡责任,极限年龄的修改仅影响死亡给付的时间,考虑折现因素后影响较小;对于生存责任,极限年龄延长会增加生存金给付次数,但增加的生存金给付均发生在105岁以后,对给付金额现值的影响有限,且当前行业真正承担长寿风险的产品占比很小。综上所述,前述极限年龄调整对保险行业当前存量业务的影响较小。未来,随着死亡率的持续改善和人口老龄化的加剧,长寿风险与日俱增,保险行业应加强对极限年龄的持续研究,为量化长寿风险提供参考。


请点击 ▼

欢迎订阅2025年度《保险研究》

《保险理论与实践》


编辑:于小涵


中国保险学会

构建保险大社区

微信:iicbxzx

中国保险学会
构建保险大社区
 最新文章