R语言对巨灾风险下的再保险合同定价研究案例：广义线性模型和帕累托分布Pareto distributions分析

科技科技 2024-09-11 17:21 浙江

原文链接：http://tecdat.cn/?p=13854

本文为非人寿保险课程的一部分，该示例对1900 -2005年间的“ 美国标准化飓风损失 ”数据集进行研究（2008），我们使用了广义线性模型和帕累托分布Pareto distributions分析。该数据集以xls格式提供，首先我们来导入它（点击文末“阅读原文”获取完整代码数据）。

相关视频

数据导入和清理

> library(gdata)
> db=read.xls(data.xls",sheet=1)

excel电子表格的问题在于某些列可能具有预先指定的格式（例如，损失为000,000,000格式）

> tail(db)
    Year Hurricane.Description State Category Base.Economic.Damage
202 2005                 Cindy    LA        1          320,000,000
203 2005                Dennis    FL        3        2,230,000,000
204 2005               Katrina LA,MS        3       81,000,000,000
205 2005               Ophelia    NC        1        1,600,000,000
206 2005                  Rita    TX        3       10,000,000,000
207 2005                 Wilma    FL        3       20,600,000,000
    Normalized.PL05 Normalized.CL05  X X.1
202     320,000,000     320,000,000 NA  NA
203   2,230,000,000   2,230,000,000 NA  NA
204  81,000,000,000  81,000,000,000 NA  NA
205   1,600,000,000   1,600,000,000 NA  NA
206  10,000,000,000  10,000,000,000 NA  NA
207  20,600,000,000  20,600,000,000 NA  NA

要获取我们可以使用的格式的数据，考虑以下函数，

> stupidcomma = function(x){
+ x=as.character(x)
+ for(i in 1:10){x=sub(",","",as.character(x))}
+ return(as.numeric(x))}

然后将这些值转换为数字，

> base=db\[,1:4\]
> base$Base.Economic.Damage=Vectorize(stupidcomma)(db$Base.Economic.Damage)
> base$Normalized.PL05=Vectorize(stupidcomma)(db$Normalized.PL05)
> base$Normalized.CL05=Vectorize(stupidcomma)(db$Normalized.CL05)

从现在开始，这是我们将使用的数据集，

> tail(base)
    Year Hurricane.Description State Category Base.Economic.Damage
202 2005                 Cindy    LA        1             3.20e+08
203 2005                Dennis    FL        3             2.23e+09
204 2005               Katrina LA,MS        3             8.10e+10
205 2005               Ophelia    NC        1             1.60e+09
206 2005                  Rita    TX        3             1.00e+10
207 2005                 Wilma    FL        3             2.06e+10
    Normalized.PL05 Normalized.CL05
202        3.20e+08        3.20e+08
203        2.23e+09        2.23e+09
204        8.10e+10        8.10e+10
205        1.60e+09        1.60e+09
206        1.00e+10        1.00e+10
207        2.06e+10        2.06e+10

数据探索

我们可以直观地看到1900年至2005年的207次飓风的成本（这里的_x_轴不是时间，它只是损失的指数）

> plot(base$Normalized.PL05/1e9,type="h",ylim=c(0,155))

点击标题查阅往期内容

极值分析：分块极大值BLOCK-MAXIMA、阈值超额法、广义帕累托分布GPD拟合降雨数据时间序列

左右滑动查看更多

通常，计算保险合同的纯保费时有两个部分。索赔数量（或此处的飓风）以及每项索赔的个人损失。我们已经看到了个人损失，现在让我们集中讨论年度频率。

> db\[88:93,\]
   years counts
88  2003      3
89  2004      6
90  2005      6
91  1902      0
92  1905      0
93  1907      0

平均而言，我们每年大约遭受2次（主要）飓风，

> mean(db$counts)
\[1\] 1.95283

广义线性模型预测

在预测模型中（此处，我们希望为2014年的再保险合同定价），我们可能需要考虑飓风发生频率的某些可能趋势。我们可以考虑用glm预测线性趋势或指数趋势

我们可以绘制这三个预测，并预测2014年（主要）飓风的数量，

    constant   linear exponential
126  1.95283 3.573999    4.379822
> points(rep((1890:2030)\[126\],3),prediction,col=c("black","red","blue"),pch=19)

观察到改变模型将改变纯粹的溢价：如果预测不变，我们预计飓风将少于2（主要），但是随着指数趋势的发展，我们预计将超过4。

这是预期的频率。现在，我们应该找到一个合适的模型来计算再保险条约的纯保费，并具有（高）免赔额和有限（但大）赔付额。合适的模型是一个帕累托分布（见Hagstrœm（1925年）。

估计帕累托分布尾部指数

显然，主要飓风造成的损失惨重。

现在，考虑一家拥有5％市场份额的保险公司。我们将考虑\ tilde Y\_i = Y\_i / 20。损失如下。考虑一个再保险条约，其免赔额为2（十亿），有限承保范围为4（十亿），

对于我们的帕累托模型，仅考虑5亿美元以上的损失，

       xi      beta 
0.4424669 0.6705315

八分之一的飓风达到了该水平

\[1\] 0.1256039

计算再保险合同的预期价值

鉴于损失超过5亿，我们现在可以计算再保险合同的预期价值，

现在，我们预计每年的飓风会少于2（主要）

> predictions\[1\]
\[1\] 1.95283

每个飓风给我们的保险公司带来超过5亿的损失的机率是12.5％，

> mean(base$Normalized.PL05/1e9/20>.5)
\[1\] 0.1256039

并假设飓风造成的损失超过5亿美元，那么再保险公司的预期还款额（百万）

> E(2,6,gpd.PL\[1\],gpd.PL\[2\])*1e3
\[1\] 330.9865

所以再保险合同的纯保费就是

\[1\] 81.18538

覆盖40亿，超过2个。

本文中分析的数据、代码分享到会员群，扫描下面二维码即可加群！

本文摘选《R语言对巨灾风险下的再保险合同定价研究案例：广义线性模型和帕累托分布Pareto distributions分析》，点击“阅读原文”获取全文完整资料。

点击标题查阅往期内容

面板平滑转换回归(PSTR)分析案例实现

R语言时变面板平滑转换回归模型TV-PSTR分析债务水平对投资的影响

面板平滑转换回归(PSTR)分析案例实现

R语言自适应平滑样条回归分析

R语言时间序列数据指数平滑法分析交互式动态可视化

R语言中的广义线性模型（GLM）和广义相加模型（GAM）：多元（平滑）回归分析保险资金投资组合信用风险敞口

R语言预测人口死亡率：用李·卡特（Lee-Carter）模型、非线性模型进行平滑估计

基于R统计软件的三次样条和平滑样条模型数据拟合及预测

R语言实现CNN（卷积神经网络）模型进行回归数据分析

R语言中的多项式回归、B样条曲线(B-spline Curves)回归

R语言泊松Poisson回归模型分析案例

在R语言中实现Logistic逻辑回归

R语言用多项式回归和ARIMA模型预测电力负荷时间序列数据

R语言用逻辑回归、决策树和随机森林对信贷数据集进行分类预测

R语言机器学习实战之多项式回归

R语言自适应平滑样条回归分析

R语言区间数据回归分析

R语言逻辑回归和泊松回归模型对发生交通事故概率建模

R语言线性回归和时间序列分析北京房价影响因素可视化案例

R语言惩罚logistic逻辑回归（LASSO,岭回归）高维变量选择的分类模型案例

R语言用标准最小二乘OLS，广义相加模型GAM ，样条函数进行逻辑回归LOGISTIC分类

R语言实现CNN（卷积神经网络）模型进行回归数据分析

R语言中实现广义相加模型GAM和普通最小二乘(OLS)回归

R语言中使用非凸惩罚函数回归(SCAD、MCP)分析前列腺数据

【视频】R语言实现CNN（卷积神经网络）模型进行回归数据分析

R语言ISLR工资数据进行多项式回归和样条回归分析

R语言中的多项式回归、局部回归、核平滑和平滑样条回归模型

R语言随机搜索变量选择SSVS估计贝叶斯向量自回归（BVAR）模型

R语言如何和何时使用glmnet岭回归

R语言基于线性回归的资本资产定价模型（CAPM）

Matlab马尔可夫区制转换动态回归模型估计GDP增长率

R语言MCMC:Metropolis-Hastings采样用于回归的贝叶斯估计

http://mp.weixin.qq.com/s?__biz=MzU4NTA1MDk4MA==&mid=2247546205&idx=8&sn=2f8e4acdf116e13f603136d6c3c96f47