摘 要:本文主要探討大數據對保險業的影響,并以實例說明在大數據背景下傳統壽險產品定價的改進以及新型保險產品的開發情況。首先基于實際數據對于保險業大數據現狀進行了統計分析,給出了保險業數據量現狀以及數據使用效率的統計結果;其次以實際大數據量為基礎,對傳統的壽險產品定價進行了改進,獲得了更優的市場比較優勢;最后,以大數據量為基礎,打破傳統壽險產品的思維定式,開發出新型的保險產品并對產品風險進行了精確測定。
關鍵詞:大數據;數據挖掘;精算定價;保險創新
中圖分類號:F840 文獻標識碼:B 文章編號:1674-2265(2013)12-0069-05
一、前言
大數據又稱為巨量數據、巨量信息、海量數據,指的是所涉及的信息量非常巨大,以至于傳統的軟件和技術無法進行有效的信息獲取。大數據技術就是在這種海量數據下有效的數據分析技術,即能夠在各種各樣類型的數據中,快速獲取有價值信息的能力。
作為金融行業的分支,保險因為自身的特點而與大數據關系更加密切,它天然就具有大數據的特征,這是因為:
第一,眾所周知,保險業是經營風險的行業。它的產品本質就要求對標的物風險進行精確測定。而如何測定這些風險,一方面需要金融模型和數理技術,另外一方面就需要數據信息,兩者缺一不可。海量數據為保險公司測定風險提供了“天然”的機會。對于保險公司來說,大數據技術實際上就是如何利用公司的海量數據來界定風險。
第二,保險公司的利潤來源于收取的保費和未來的賠付支出的差額,這其中的賠付支出即為保險公司的風險,而該風險與標的物的未來風險密不可分。保險公司實際上是對這些風險發生的概率進行預測,這和大數據的本質不謀而合——大數據的一個關鍵核心就是預測。
第三,保險經營的每個過程都和大數據密不可分。保險公司經營過程中涉及產品定價、核保核賠、產品銷售、投資、風險管控等,這其中每一步都在不斷利用數據,同時也在不斷產生數據。
實際上,從信息量來看保險業,大數據時代早已經提前到來。隨著信息技術的發展,保險公司每時每刻都要積累大量的數據信息,整個數據量的級別呈現爆炸式增長。但同時要看到,保險行業的大數據技術還剛剛起步,保險公司還沒有充分且主動地利用大數據提供的優勢。
二、保險業大數據現狀
在大數據現狀調查中,本文集中統計了保險業的情況。統計所涉及的公司包括117家保險公司,占大陸全部保險公司的97%以上,基本上可以代表保險業的整體情況。在117家保險公司中,有58家人身險公司和59家財產險公司。人身險公司當中外資公司23家、中資公司35家;財產險公司當中中資公司38家、外資公司21家。
統計的結果是數據量。在保險公司里,數據量主要包括這樣幾部分:
第一是保單數據及保單維持數據。這部分數據基本上都在業務系統中。
第二是核賠理賠數據。這部分數據大部分也在業務系統中,同時部門內部也有對應的數據庫。
第三是投資理財數據。因為壽險經營時間長,保費投資是壽險經營的重要方面,所以這部分數據在壽險公司中體現最為明顯,導致大量的金融市場數據集中在投資部門。這部分數據通常和業務系統是分離的。
第四是定價數據。這部分數據是精算部門用來定價和利潤測試,以及用來向保監會報送各類報表運算的時候需要的,有相當一部分來自于業務系統。
第五是風險管理數據。這部分數據相當零散,且涉及以上各類數據,同時還包括公司的財務乃至宏觀管理數據。本文在統計中也把行業公共數據以及監管數據納入其中統計。
對每家公司進行全部數據的估算后加和,結果扣除公共數據(金融市場數據以及公共行業數據和監管數據)就得到中國保險業整體的數據量情況。圖1給出了最后的統計結果。
從圖1可以看出,中國保險業的數據量呈井噴式增長,這也說明了大數據是目前保險業必須面對的考驗。
同時對個體公司進行詳細分析,來考察一家普通保險公司在生產經營過程中需要面對的數據量。圖2給出了相應的結果。
[圖2:普通保險公司所面臨的數據量]
可以看出,對于普通保險公司來說,其面臨的數據量和整個行業的數據量沒有本質的區別,這也充分說明保險業的深化改革已經有一定成效,保險公司的充分競爭已經得到很好的體現。在這樣海量數據信息的背景下,保險公司在定價、營銷、經營以及風險管理方面都必須引入大數據技術來獲得相對于行業的比較優勢。
那么實際情況如何呢?本文對保險業2008—2012年的數據使用效率進行了統計和分析。這是一個很復雜的問題,在此本文主要給出在產品定價方面的結果。大數據的特點是容量大(Volume)、速度快(Velocity)和資料多樣性(Variety)。本文的評價也是從這個角度來進行的。需要說明的是,在統計過程中,限于公司保密等原因,結果僅僅包含25家壽險公司和23家財產險公司。但結果總體上也反映了在定價方面保險業大數據技術的發展程度。
圖3真實地反映了目前保險公司在定價方面的數據效率,近5年基本上沒有特別大的變化,并沒有充分挖掘大數據的潛力,在大數據技術上還有很長的路要走。正是基于這種現狀,本文嘗試從大數據背景出發,以壽險定價為例來說明大數據技術的初步應用。
三、壽險產品精算定價的“再精算”
通常,壽險產品定價是基于壽險精算模型進行純保費(精算現值)的計算,然后使用“資產份額”和“宏觀定價法”來確定實際保費。這個過程中,涉及的數據量實際上僅僅包括傳統的生命表(保監會規定)以及部分抽樣數據,這部分數據僅僅占可利用數據的5%左右。
在保險公司持續經營的情況下,新開發的一種保險產品,它在傳統數據依賴上可能只需要一些精算部門的經驗數據,以及傳統的已經做好的模型,只需要修改一些基本假設和預訂費率、預訂利率以及預訂死亡率即可。
在大數據背景下,與此保險產品有關的數據范圍擴展到了整個業務部門乃至核保核賠部門,這些部門的數據經過多年的積累能夠進行有效連接,形成一個龐大的后臺數據記錄。以某一家普通保險公司為例,該數據連接后形成了一個900M的數據記錄池,這些客戶的記錄無疑能夠對傳統定價有很大的幫助,能夠將精算定價的結果進行“再精算”過程。
壽險產品中最重要的就是死亡率。在傳統定價方法中,使用的是2000—2003年生命表。該生命表已經使用多年,反映了當時的死亡狀況。對于一款推向市場的壽險產品,它所面臨的人群實際上是未來的客戶,他們的死亡率狀況與2000—2003年生命表已經有很大差異。
利用大數據平臺,可以構造龐大的分年齡和分時間死亡率表,在處理之后得到表1,截取的是2003—2009年,國家統計數據實際是從1983年開始的。
四、壽險產品的細化分類與創新
進入21世紀以來,金融業的創新層出不窮,保險業也在面臨著創新的壓力,大數據為保險業的創新提供了數據基礎和機會。保險本質上是“大數定律”,對于任何一個群體來說,只要投保的數量足夠多,就可以應用“大數定律”。保險產品的定價本質上就是對“風險”的度量,只要風險能夠度量,就能夠給出一個合適的價格,以此價格出售產品就能夠保證收支平衡。這正是保險產品運作的方式。
但對于風險的度量和精確測算并不是一件容易的事情。所以傳統的保險產品都人為限定為“標準體”;其他的“非標準體”都被保險例外條款而排除在外。這個過程實際上浪費了大量的數據和信息。
大數據修正了大數定律,拓展了風險覆蓋的程度,保險公司可以基于數據優勢,進行群體的細化處理,針對不同群體開發不同的保險產品,從而啟動新的贏利增長點,開發出新的業務模式。
本文以壽險為例,以上述900M數據加上該公司健康險5年的數據以及合作醫院的跟蹤數據為基礎(總數據基礎大約在1.5G左右),開發針對重疾患者的定期壽險產品。對于該產品定價來說,很重要的因素有兩個:第一個就是首年發病率,它實際上衡量了新產品與傳統產品的“偏差”——意味著健康體從健康狀態轉移到了疾病狀態,進入了“意向購買人群”;第二個就是病死率,即疾病人群的死亡率,作用與傳統壽險的死亡率相同。具體測算步驟如下:
第一步,從該公司的承保理賠庫中篩選出重大疾病保險的承保理賠記錄,篩選出所需字段,添加需要計算的字段,如年齡段、疾病種類、理賠數、暴露數、保單周年日等。
第二步,1999—2011年13年中具體某一年的測算方法為:假設保單周年日與被保險人生日是重合的,以保單周年日為分界點,將該年度一分為二,分別記有保單年度1、年齡段1、理賠數1、暴露數1和保單年度2、年齡段2、理賠數2、暴露數2。對保單記錄做出調整(如失效日期調整、滿期日調整、多次索賠合并調整等)后,按照矩估計精算法為每條保單記錄分別計算出其在該年度前后兩部分的理賠數1、暴露數1和理賠數2、暴露數2。按照年齡段對上述數據進行分類匯總,即可得到該年度內不同年齡段的理賠數和暴露數,二者相比即為該年齡段在該年內的重疾發病率。
第三步,13年中的每一年均重復上述處理過程,共計算13次。結果可得到13年中每一年不同年齡段的理賠數、暴露數和重疾發病率。將13年的理賠數、暴露數再次按照年齡段分類匯總,即可得到不同年齡段總的理賠數和暴露數,二者相比即得到該年齡段的總重疾發病率。
第四步,上述步驟所得結果是所有重疾的一個疾病總發病率情況,也可分疾病種類測算出每一種具體疾病不同年齡段的發病率情況,測算方法與上述步驟相同。
以癌癥患者與糖尿病患者為例,發病率和病死率測算結果分別如表4和表5所示。
實際上,中國糖尿病患者有9000多萬,其他重疾且可保群體數量在3億左右,相當于美國人口數量。這部分群體因為本身處于高風險狀態,所以對保險的需求比正常人更加強烈。但在傳統保險框架內,他們卻因為“非標準體”的原因而被拒保,這是一個巨大的矛盾。基于大數據,保險公司可以對該群體進行細分,并精確測定其風險水平,推出適合的保險產品。
五、結論
綜上所述,有以下幾點結論:
第一,保險本身是經營風險的行業,測算風險、把握風險和利用風險是保險公司競爭力的核心體現,所有這些都需要獲得信息,獲得大數據背后的有用信息。通過對中國保險業的大數據現狀進行調查和統計,本文給出了目前保險業的大數據概況。統計數據表明,中國保險業利用大數據的效率很低,僅維持在7%左右,遠遠沒有充分利用大數據“數量巨大、速度快捷、形式多樣”的特性。
第二,在保險的技術核心層面,大數據為壽險定價提供了“再精算”的機會,能夠讓保險產品更真實地反映風險狀況、獲得定價優勢、在市場中搶占先機、增強公司的風險管控能力。
第三,在保險公司的經營層面,大數據為“壽險產品創新”提供了很多機會。保險公司可以充分利用數據優勢來開發新產品、新技術,以拓展市場。
總而言之,大數據為保險公司提供了“機遇”。保險公司必須重視發展大數據技術,以期在大數據背景下的金融市場中獲得競爭優勢。
(責任編輯 孫 軍;校對 XQ,SJ)