管青青
巨災是指發生頻率較低,但損失金額十分巨大的自然災害或人為災難,如地震、臺風、洪水和恐怖襲擊等。 根據慕尼黑再保險公司的統計資料顯示, 2018 年全球共發生850 起自然巨災事件,災害造成10400 人失去生命,直接經濟損失總額高達1600 億美元。 從1970 年到2017 年,按全球巨災所致死亡人數統計的前十大事件中,地震自然災害事件出現了6 次。 由此可以看出,一次偶然巨災事件對社會、經濟會帶來許多無法估計的損失,地震巨災保險的需求在不斷增加,而相關保險產品的覆蓋程度仍相對較低。
在國內,關于地震巨災保險的研究主要集中在對我國地震保險的風險評估。 田玲和姚鵬(2013)以地震巨災為例,研究了關于我國地震災害損失分布函數。 郝軍章和崔玉杰(2016)在POT 模型框架下,采用1961 ~2011 年中國發生的4.5 級以上地震樣本,討論了地震的巨災風險度量與保險模式機制。 劉昕龍等(2017)研究地震巨災保險共同體的風險轉移效率,探討了不同模式下巨災風險轉移效率及破產概率。 李云仙等(2017)提出用混合模型對地震巨災風險進行評估,并討論了混合模型的貝葉斯統計分析方法。
本文運用廣義帕累托分布和廣義可加等分布模型對巨災指數保險進行相關研究,以我國新疆維吾爾自治區的地震損失數據為樣本進行實證分析,運用R 軟件對數據進行處理,建立地震損失數據分布模型,嘗試根據地震震級設計合適的地震指數保險產品,并對地震巨災指數產品進行定價,計算其純保費。
廣義帕累托分布充分地利用樣本數據的信息,主要用于研究超過某個閾值的樣本損失數據所服從的分布。 其分布函數具體形式表示如下:

其中ξ是形狀參數,σ是尺度參數。 當尺度參數不變,形狀參數越大,廣義帕累托分布的尾部越厚。 當形狀參數ξ→0時,廣義帕累托分布趨于指數分布,因此,廣義帕累托分布也可以表示為:

其中,當ξ>0 時,x≥0;當ξ<0 時,0≤x≤σ/ξ。
廣義可加模型在廣義線性模型的基礎上,在線性預測值中引入非參數函數,建立一般意義上的回歸模型,廣義線性模型僅是其中的一個特例。 廣義可加模型由三個成分組成,分別為隨機成分、系統成分和連接函數。
1. 隨機成分
同廣義線性模型,因變量的觀測值yi是相互獨立的隨機變量,且服從指數分布族。 常用的指數分布族分布類型包括正態分布、泊松分布、二項分布、伽馬分布、逆高斯分布和Tweedie 分布。
2. 系統成分
在廣義線性模型系統成分的基礎上添加了非參數函數部分,使得模型的應用更加普及。 一般形式為:

其中xi表示線性影響的解釋變量觀察值,xk表示非線性影響的解釋變量觀測值,βi表示模型的回歸系數,fk( ·)是非參數解釋變量的光滑函數。
3. 連接函數
通過連接函數將隨機成分與系統成分連接起來,其表現形式為g(μi) =ηi。
通常模型結構如下:

其中,μi=E(Yi),Yi服從指數分布族,fr是非參數解釋變量的光滑函數。
本文選取的實證數據為1990 ~2017 年期間發生在新疆維吾爾自治區的地震災害事件(5.0 震級以上),數據來源于《中國大陸地震災害損失述評》《中國大陸地震災害損失評估匯編》和中國地震信息網。 收集了1990 ~2017 年間共79 次地震災害數據,數據包括了每次地震發生的時間、地點、震級和地震造成的直接經濟損失。 在分析地震數據之前,需要將地震直接經濟損失數據基于國內生產總值調整到2017 年的水平。
損失次數是指在一個保險期間內,保單所發生的事故次數或索賠次數。 損失次數的取值為非負整數,可以用非負的離散型隨機變量進行描述。
應用泊松分布、負二項分布和幾何分布分別對新疆地區的地震損失次數進行擬合,其參數估計值和AIC 值如表1 所示。

表1 損失次數的參數估計值和AIC 值
從表1 可以看出,泊松分布的AIC 值最小,因此泊松分布對每年的地震次數數據擬合的比較好,參數估計值為3。
對新疆維吾爾自治區地震震級數據進行一個簡單的描述性統計分析,發現新疆維吾爾自治區從1990 年至2017 年最大震級為8.1 級,如表2 所示。

表2 新疆維吾爾自治區地震震級數據描述性統計分析 (單位:里氏)
圖1 為繪制的新疆維吾爾自治區震級直方圖和密度曲線,縱軸是地震的震級,橫軸是震級的密度,可以發現地震震級大多集中在5 級至6 級之間。

圖1 震級直方圖及密度曲線
從表2 和圖1 可以觀察出,新疆維吾爾自治區地震震級的分布具有尖峰厚尾的分布特征,可以嘗試用廣義帕累托分布、伽馬分布、對數正態分布和韋布爾分布對地震震級的數據進行擬合,運用極大似然法估計模型參數的估計值,最后對各個分布模型進行KS 檢驗,如表3 所示。

表3 震級分布模型的參數估計值
從表3 可以發現,廣義帕累托分布模型、伽馬分布模型和對數正態分布模型的KS 檢驗的P值都大于0.05,說明在95%的置信水平下不能拒絕樣本數據服從于廣義帕累托分布、伽馬分布和對數正態分布;而韋布爾分布的KS 檢驗的P值大于0.01,說明在99%的置信水平下不能拒絕樣本數據服從于韋布爾分布。 再對比四者的AIC 值,廣義帕累托分布的AIC 值最小,因此選擇廣義帕累托分布對地震震級進行建模分析。
1. 震級與經濟損失的函數
地震自然災害造成的經濟損失與震級的高低一般呈現出正相關關系,震級越高造成的經濟損失越大,震級越低造成的經濟損失越小。 在地震震級與直接經濟損失的近似函數關系中,以地震震級為預測變量,以經濟損失為響應變量,建立廣義可加模型,其模型的數學形式如下:非參數平滑函數,ε為殘差變量。 其中把震級作為連續性變

在上式中,loss 是經濟損失,β0為截距項,f為震級對應的量進行平滑處理,使得模型擬合效果更好,同時給震級做平滑處理會使得模型的AIC 值減小。
震級與對數直接經濟損失的散點圖如圖2 所示,可以看出震級與地震經濟損失存在非線性關系。 右圖是正態分布回歸模型的AIC 值,在對數地震直接經濟損失與震級的函數關系中,模型中對震級使用了三次樣條平滑函數,繪制出自由度從1 至10 之間的AIC 值,可以發現在自由度為3 時,模型的AIC 值最小。

圖2 震級與對數地震直接經濟損失散點圖和AIC 值
使用R 語言中的Gamlss 程序包中的Gamlss 函數建立對數地震損失與震級的正態分布回歸模型,把震級作為連續性變量進行平滑處理,使得模型擬合效果更好。 給震級做平滑處理會使得模型的AIC 值減小。 圖2(a)中的曲線就是對數地震損失與震級函數曲線的擬合值。
2. 震級指數分類
在本文中,震級一直作為連續性變量處理,現在為了把震級轉換為一個合適的分類變量,引用R 語言中的Evtree 程序包,其中Evtree()函數是一種進化學習算法,它不僅提供了一個最優的分類和回歸方法,而且在預測精度上具有更好的性能。 因此,再結合震級與經濟損失之間的函數關系,探索出將震級轉化為分類變量的最優區間端點。 由上文可知,對震級變量使用了三次樣條函數,三次樣條函數的自由度從1 到10 變化時,當自由度為3 時,模型的AIC 值最小,由此確定出震級與經濟損失之間的函數關系。 如圖3 所示,根據樣條函數估計結果使用進化算法劃分出最優分類的區間端點。 在表4中,列出了各個區間震級的頻數。

圖3 震級指數分段區間

表4 震級指數分類區間頻數表
從圖3 和表4 可以看出,本文把新疆維吾爾自治區的震級劃分為3 類,第一類震級是在4.8~5.7 級區間之內,從1990年至2017 年發生在一類區間的地震共有42 次,發生一類震級的概率大概為0.5455;第二類震級是在5.7~6.1 級區間之內,二類震級共有15 次,其發生二類震級的概率估計大概為0.1948;第三類震級是在6.1 級以上,共發生20 次,發生三類震級的概率大概是0.2597。
因為新疆維吾爾自治區從1990 年至2017 年間發生最高等級的地震是8.1 級地震,所以可以考慮把新疆維吾爾自治區的地震指數保險產品中震級指數的限值設定為8.5 級地震,超過這個保險范圍保險公司只給最高賠償限額。
3. 地震指數保險產品的純保費
首先,根據不同類別的地震震級設定不同的賠付額度,表5 對各個震級類別的經濟損失數據做了描述性統計分析,設定的賠付金額是根據大于各個震級類別的經濟損失的均值。 第一類震級設定的賠付標準為15000 萬元;第二類震級設定的賠付標準的50000 萬元;第三類震級設定的賠付標準為200000 萬元。

表5 各個震級類別的經濟損失數據描述性統計分析 (單位:萬元)
各個類別的純保費的計算結果如表6 所示。

表6 地震指數保險產品的純保費 (單位:萬元)
相較于傳統地震保險產品,地震指數保險更適應于當下保險市場的發展。 指數保險是為管理自然災害風險而誕生的新型保險工具,在風險識別、風險評估以及風險轉移方面起到重要作用。 雖然我國地震指數保險的發展相較于國際上許多發達國家較晚,但是我國已經具備發展地震指數保險的條件,地震巨災指數保險的發展在我國未來可期。
結合新疆維吾爾自治區從1990 年至2017 年的地震災害損失數據,構建地震指數保險精算模型。 在地震損失次數模型中,通過用不同的損失次數模型進行擬合,比較了模型的擬合效果,確定了每年地震發生次數服從泊松分布,均值λ=3;在地震震級損失模型中,嘗試了用伽馬分布、威布爾分布、對數正態分布和廣義帕累托分布對震級進行了擬合,通過對比發現廣義帕累托分布對震級擬合效果最好;通過研究震級與經濟損失的近似函數關系,建立經濟損失與震級廣義可加模型,并以此對震級指數進行分段處理,把震級指數劃分為不同的區間,最后計算出不同類別震級指數的純保費。
其次,根據本文建立的地震損失模型,地震指數保險產品的純保費公式如下:類別震級所對應的純保費;λ為地震損失次數的參數估計

在上式中,P1、P2和P3分別為地震指數保險產品中不同值;M1、M2和M3是不同類別震級所對應的賠付標準;F(x)為震級的分布函數,震級服從廣義帕累托分布;a0、a1、a2和a3是震級區間所對應的 區 間 端 點 。
震級的尾部分布函數數學形式如下:

在理論上,純保費是期望索賠頻率與期望索賠強度的乘積,期望索賠頻率是計算損失次數分布的均值,期望索賠強度是計算損失金額分布的均值。 但在地震指數保險產品中,要考慮到地震指數對純保費的影響,由于指數保險的賠付依據是事先設定的參數是否達到觸發標準,與實際損失金額無關。 使用地震震級的分布函數計算出震級區間的概率值,其中,一類震級的損失概率為0.4379;二類震級的損失概率為0.1607;三類震級的損失概率為0.2601,再與各類震級的賠付金額相乘得出的結果相當于期望索賠強度的值。 由于地震損失次數服從于泊松分布,均值為λ=3,所以期望索賠頻率的值為3。