張開強
【摘 要】本文結(jié)合非壽險精算中普遍存在的具有層次性和相關性的數(shù)據(jù)結(jié)構,在分層模型的全新視角下,充分借鑒分層模型的理論研究成果,對分層模型在非壽險定價與索賠準備金評估中的應用研究的最新成果進行了系統(tǒng)梳理和總結(jié),并將貝葉斯方法、隨機模擬、信度理論、數(shù)據(jù)分析技術、科學計算等融合其中,在此基礎上,提出了一些有待深入探索和進一步擴展的新思路,這對提升我國非壽險精算學科的統(tǒng)計分析體系,促進我國非壽險精算學科的發(fā)展具有重要的科學研究意義。
【關鍵詞】非壽險;分層模型;貝葉斯方法
一、引言
分層模型是20世紀90年代在國際上形成并正被迅速推廣應用的新的統(tǒng)計分析技術。分層模型通過設置自身的概率子模型來確定模型參數(shù)的方式,擴展了標準的線性模型、廣義線性模型和非線性模型。這些標準模型在進行統(tǒng)計分析時,通常要求觀測數(shù)據(jù)來自獨立( 隨機) 變量,而在很多精算和統(tǒng)計問題中,更多需要處理縱向數(shù)據(jù)、空間聚類數(shù)據(jù)、甚至更一般的聚類數(shù)據(jù),這些數(shù)據(jù)都不滿足獨立性假設,且具有一定的層次結(jié)構。由數(shù)據(jù)的層次結(jié)構,可將數(shù)據(jù)劃分為不同層次的目標組,進而引入分層模型的概念。這種分層建模方式可以將復雜問題分解為相互聯(lián)系的各個組成部分,為科學研究提供了一種新的分析框架。
在非壽險精算學中,定價與索賠準備金評估是兩大核心專題。定價是否充足合理,直接影響到財險公司產(chǎn)品競爭力和公司盈利水平20世紀90年代,英國精算師把GLM引入到非壽險定價中,20年來GLM在很多國家的非壽險定價實務中取得了長足發(fā)展。盡管如此,GLM仍存在一定的缺陷,如當某些分類解釋變量在某些水平上的數(shù)據(jù)量很少時,會使得這些水平參數(shù)估計的標準誤差很大。另外,在這種情況下,直接應用GLM也會面臨待估計參數(shù)個數(shù)過多的問題。為了解決這一問題,精算師試圖將信度理論融入到GLM框架中,涌現(xiàn)出了一些統(tǒng)計模型與方法的應用研究,如廣義線性混合模型,分層廣義線性模型等。作為更一般意義下的分層建模技術,不但為具有相關性和層次結(jié)構的非壽險經(jīng)驗數(shù)據(jù)提供了一種處理大規(guī)模分類問題的自然方式,而且HGLM能提供貝葉斯信度建模的統(tǒng)一框架,也很容易將信度理論融入到GLM或非線性建??蚣苤小_@些優(yōu)勢注定了分層建模技術成為當前國際精算理論研究的熱點問題。
索賠準備金通常是財險公司資產(chǎn)負債表中份額最大的負債。在確定財險公司的經(jīng)營業(yè)績和償付能力方面,都依賴于索賠準備金負債的準確評估,因此合理評估該負債對財險公司意義重大。目前,關于索賠準備金評估的隨機性方法研究已經(jīng)成為非壽險精算熱點之一,尤其在采用嚴格的統(tǒng)計模型與方法度量準備金的波動性,進而模擬準備金的預測分布方面,已經(jīng)取得了很大進展。在這方面的研究中,針對損失流量三角形( 按事故年和進展年對損失數(shù)據(jù)整理得到的二維數(shù)據(jù)表) 建立模型假設,并結(jié)合隨機模擬方法來得到準備金的預測布。這種主流的評估方法沒有體現(xiàn)出流量三角形數(shù)據(jù)隨時間反復觀測的縱向特征。分層模型作為分析縱向數(shù)據(jù)的一種自然方式,可以把損失流量三角形視為分層數(shù)據(jù),每個事故年對應的數(shù)據(jù)可作為一個目標,進而應用分層模型來研究索賠準備金的評估問題,這樣不但體現(xiàn)了同一事故年損失數(shù)據(jù)的縱向特征,以反映組內(nèi)數(shù)據(jù)的相關性,而且也考慮了不同事故年由未觀測到的特征所導致的異質(zhì)性,這是一個新的研究思路,有待于深入探索。另外,近年來貝葉斯方法已經(jīng)成為分層模型中的重要方法之一。如果能把HGLM非線性分層模型與貝葉斯方法結(jié)合起來,應用馬爾可夫蒙特卡羅隨機模擬方法,可以設想這為得到準備金的預測分布提供了另一種思路。最后,在準備金評估中,結(jié)合損失進展過程的建模方法,如各種增長曲線模型和光滑模型等,將這些模型納入分層建模技術中,也可以有效避免尾部進展因子的選定問題,這些問題的深入探索已成為索賠準備金評估的最新研究方向.
二、分層模型
分層模型的基本思想在于: 模型的某些參數(shù)本身需要建模,即在分層模型中,一些模型參數(shù)不是通過樣本數(shù)據(jù)來估計,而是通過模型的超參數(shù)使用極大似然估計或相關的優(yōu)化技術來估計,這些模型自帶的參數(shù)有時也稱為隨機效應; 另外一些參數(shù)是通過樣本數(shù)據(jù)直接估計的,這些參數(shù)也稱為固定效應,從中可以看出,分層模型的核心思想是通過在預測量中引入隨機效應,來體現(xiàn)目標組內(nèi)數(shù)據(jù)的相關性和不同目標組間的異質(zhì)性。這一部分將從以下個方面對分層模型的理論進行系統(tǒng)梳理和總結(jié)。
(一)從LM到一般化的分層線性模型的理論研究
對于某些不滿足獨立性并具有層次性的數(shù)據(jù)結(jié)構(如聚類數(shù)據(jù)、縱向數(shù)據(jù)),標準的LM不再適合。LM要求觀測變量具有獨立性,即模型中只含固定效應變量,因而沒有考慮數(shù)據(jù)間的相關性和層次結(jié)構。作為推廣,在線性混合效應模型中,既含固定效應變量,又含隨機效應變量,且隨機效應變量服從正態(tài)分布。有關隨機效應的經(jīng)典文獻可以參考little等。該文獻對一些標準統(tǒng)計術語,基于固定效應的估計量和基于隨機效應的預測量之間的差異,LME的參數(shù)估計方法\模型檢驗和診斷以及不同LME模型之間擬合效果的比較等進行了系統(tǒng)總結(jié),并使用SAS軟件對實施LME的大量數(shù)值實例進行了細致討論。LME的更一般推廣是分層線性模型,此時隨機效應變量的分布可不局限于正態(tài)分布.目前,LME已在社會 學中得到了充分的應用,經(jīng)典著作為Randernbush和Brky。
匯總這些研究,可以得出從LM到HLM推廣具有以下四方面的優(yōu)勢。第一,與LM相比,采用LME和更一般的HLM將會避免模型過度參數(shù)化.第二,在LME和HLM中,隨機效應參數(shù)通過模型的超參數(shù)估計,采用信度加權平均來計算。從信度理論的角度講,標準的LM和按類別分組后的LM都是分層模型的特例,即對應于HLM的隨機效應的方差分別趨于0和無窮時的情況。第三,通過僅僅向LM模型中加入附加超參數(shù)的方式,分層建模技術潛在地可以實現(xiàn)更好的擬合。第四,分層模型是嵌套模型,可以使用對數(shù)似然統(tǒng)計量、赤池信息準則,貝葉斯信息準則等比較不同模型的優(yōu)劣,權衡模型的復雜性和擬合效果,最終選擇合適的模型。
(二)線性分層模型的理論研究
實際中,變量之間也可能存在非線性關系,對于那些不可線性化的非線性模型,以及更適合采用非線性模型來描述的問題,采用一個具體非線性函數(shù)形式可以清晰地為這些問題建模。以增長曲線為例,對增長過程的主觀判斷以及經(jīng)驗有助于確定選擇哪一類曲線。二是模型的簡潔性。精心挑選的非線性函數(shù),有時能為一個非線性過程建立比含有多個多項式的線性模型更少的參數(shù)。同時,非線性分層建模方法也可以避免模型過度參數(shù)化。三是對觀測樣本外數(shù)據(jù)的有效性。當然,使用一個模型對樣本外數(shù)據(jù)進行外推,始終會面臨預測效果不佳的可能。然而,在選定一模型時,非線性分層模型至少提供了根據(jù)對具體問題的了解程度進行判斷的思路。與一個缺乏簡潔性或更多非理論性的曲線擬合方法相比,這樣一種方法操作更有效。
值得注意的是,在使用HLM估計參數(shù)時不需要設定參數(shù)的初始值,而使用非線性分層模型估計參數(shù)時則需要設定參數(shù)的初始值,不同的初始值會導致模型不一定收斂,或者不能收斂到一個正確的結(jié)果.通過快速觀察殘差圖更有助于判斷結(jié)果是否正確.在大多數(shù)情況下,可以通過簡單分析方法輔助選擇初始值.如在貝葉斯非線性分層模型中,可以參考參數(shù)的極大似然估計,選取合適的先驗分布來得到參數(shù)的后驗分布.另外,為了估計模型參數(shù),需要使用MCMC方法模擬完整的后驗分布,進而使用每個參數(shù)的模擬樣本值實施推斷。
三、啟示和建議
本文在分層模型的全新視角下,結(jié)合非壽險精算中普遍存在的具有層次性和相關性的數(shù)據(jù)結(jié)構,探討了國外非壽險定價與索賠準備金評估的最新研究方向致力于為我國非壽險精算學科建立一套完善一致的統(tǒng)計分析架構。
綜上所述,本文面向國際精算理論研究前沿與熱點,結(jié)合財險公司目前對精算技術的需求,以分層模型的全新視角,充分借鑒分層模型的理論研究成果,對分層模型在非壽險定價與索賠準備金評估中的應用研究的最新成果進行了系統(tǒng)梳理和總結(jié),并提出了一些有待深入探索和進一步擴展的新思路。其中,涉及分層模型對非壽險精算其他專題和技術(如經(jīng)驗費率厘定\信度理論、貝葉斯方法、隨機模擬數(shù)值方法等)的包含與擴展,這必將深化對非壽險精算諸分支、諸方法的理論研究,提升非壽險精算學科的統(tǒng)計分析體系,促進非壽險精算學科的發(fā)展。
【參考文獻】
[1] 段白鴿, 張連增.分層模型在非壽險精算學中的應用研究評述[J].統(tǒng)計研究, 2013, 30(5):98-105.
[2] 盧志義, 劉樂平.廣義線性模型在非壽險精算中的應用及其研究進展[J].統(tǒng)計與信息論壇,2007,22(4):26-31.
[3] 孫維偉, 張連增. 基于HLM2的算例分析及其在中國非壽險精算中的思考[J].統(tǒng)計與決策,2016(22):4-8.