摘要:論文主要探討保險公司如何應用大數據,包括其在保險產品定價、客戶價值挖掘以及巨災風險估計方面的應用。首先基于實際調查結果對中國保險業的數據量進行了統計分析,并給出了數據使用效率的統計結果;其次以具體數據為基礎,利用大數據方法和思想對傳統的保險產品精算定價進行了改進,包括壽險產品以及財產險產品,該結果使保險公司獲得了更大的比較優勢;再次還基于壽險公司以及健康險公司的數據融合,通過設計全覆蓋的保險產品來挖掘客戶價值,并獲得產品定價結果;最后還基于跨公司和行業的大數據應用,利用極值理論對中國巨災風險進行了建模,使之能夠應用于保險公司的保險和再保險業務中。
關鍵詞:大數據;精算定價;客戶價值;巨災風險;極值理論
文章編號:2095-5960(2014)02-0036-07;中圖分類號:F840;文獻標識碼:A
一、引言
信息是金融行業中最重要的資源之一,而數據是信息最直接的表現方式。隨著電子技術發展以及世界金融市場交易規模的迅速擴大,金融行業中的數據量呈爆炸式增長趨勢,如每一天世界金融產品交易數據達到500G以上,其中保險公司的數據占比達到12%(第一屆CCF大數據學術會議,國家會議中心,2012年12月)。這充分說明金融行業已經進入了“大數據時代”。
按照Kenneth Cukier在《Big data》中的定義,大數據又被稱為巨量信息、海量數據等,指的是所涉及的信息量非常巨大,超過傳統軟件和技術所涉及的范圍[1],而所謂的大數據技術或大數據能力就是在這種海量數據下有效的數據分析技術,即能夠利用各種各樣類型的巨量數據,快速獲取有價值信息,并使之應用的能力[2]。鑒于金融行業的巨量數據存量以及每天的新增數據規模,大數據分析能力對其尤為重要[3],保險公司是金融行業的重要組成部分,也不可避免要面對大數據現狀,充分利用巨量數據來推動業務發展和創新,提升競爭力也自然成為當前最迫切的任務[4][5]。
為了詳細了解我國國內的大數據情況,我們對中國保險業進行了數據情況的統計(以下簡稱“中國保險業大數據背景調查”)。該統計所涉及的保險公司共122家,其中包括58家人身險公司、59家財產險公司以及5家再保險公司。在人身險公司中,中資公司35家,外資公司23家;在財產險公司中,中資公司38家,外資公司21家。這些公司的業務規模占全部保險市場的95%以上,可以認為調查結果具有一定的普遍性。
我們統計的數據種類包括以下五類:一是保單數據及保單維持數據:這部分數據組成了保險公司的業務系統,以專業的數據庫軟件來操作。二是核賠理賠數據:這部分數據隨著電子化進程加快,大部分也在業務系統中,同時部門內部也有對應的數據庫。三是投資理財數據:因為壽險經營時間長,需要對保費保值增值,所以壽險的保費投資是經營的重要方面,導致這部分數據非常豐富,相對來說,財產險公司中,這類數據量比例較小。四是定價數據:這部分數據是精算部門用來定價和利潤測試,以及用來向保監會報送各類報表運算時候需要的數據,有相當一部分來自于業務系統。五是風險管理數據,這部分數據相當零散,且涉及以上各類數據,同時還包括公司的財務數據、行業數據、監管數據、宏觀經濟數據乃至宏觀管理數據。六是再保險公司公司數據,再保險公司承擔保險公司的分出業務,通常掌握了很多家原保險公司的數據,具有比原保險公司更多的數據,這部分數據盡管有相當一部分來自于原保險公司,但大數據的核心并非是關注數據的重復問題,而是如何利用數據進行快速決策,所以我們把再保險公司的數據也統計在內。
我們對所有參與統計的原保險公司前五類數據并匯總,然后加上再保險公司數據,由此構成中國保險業整體的數據情況。這里需要注意到:匯總過程中會有很多冗余數據,例如投資相關的金融市場數據等,但從大數據的核心出發,這些數據應該不作區分。原因如下:
首先,大數據的本質是快速和預測,而并不關心重復數據的冗余情況,對重復數據冗余的處理其實是降低大數據應用效率的,大數據更關心的是基于整體的巨量信息快速進行決策和分析[6][7]。
其次,每家公司在經營過程中,即需要考慮公司本身特有的信息、特有的數據,同時也必然和其他公司一樣面對公共的信息、公共的數據,這些數據都是他們決策基礎[5]。
最后,重復的數據雖然存在但其對決策的影響其實是不同的,這和一同協作的數據有關,也和每家公司的大數據能力有關,換句話說,對每家公司來說,即使是重復的數據但也意味著不同的信息。
這種現狀正是本文研究的出發點,我們將以掌握的數據為基礎,在定價、巨災分析以及健康險方面進行大數據應用研究的嘗試。
二、跨部門大數據應用:壽險產品精算定價
產品精算定價能力是保險公司的核心競爭力之一,大數據在精算定價中的應用核心就是從“樣本精算”過渡到“全量精算”。
對壽險來講,保險公司基于“精算模型”,并使用“資產份額”和“宏觀定價”等方法來確定實際保費。對財險公司而言,保險公司通常利用歷史數據來獲得“損失模型”,并通過分析各因素作用來獲得最終保費。傳統的這些過程中,一般只涉及公司所掌握數據的很小一部分,是“樣本精算”,但為了獲得更大的市場空間,保險公司有必要利用大數據來獲得“定價”的比較優勢,實現“全量精算”。這里我們僅以壽險定價為例來進行應用研究。
壽險公司在長期經營過程中積累了大量的數據和信息,同時外部環境變化也積累了海量數據,而傳統的壽險產品定價對這些數據置若罔聞,仍然是基于保監會公布的00—03生命表和一些公司的有限信息來進行,這必然不能反映真實的風險狀況,也喪失了市場競爭中的比較優勢。
這里以一家普通的保險公司為例來說明大數據應用。我們將數據范圍擴展到公司的全部部門(包含整個業務部門乃至核保核賠部門),這些部門的數據經過唯一的ID(如身份證號)鏈接,形成一個龐大的海量數據記錄,在舍棄一些信息并整理后(僅包含索賠引起的死亡率信息)形成了一個900M的數據庫,涵蓋的時間是2003—2009。該數據即是進行“全量精算”的基礎。接下來,我們對數據庫進行整理并加上國家統計的數據(來自于《中國人口與就業統計年鑒》),獲得了從1983年開始的分年齡段死亡率表(表1)。
根據此定理,我們利用大數據的信息來進行參數估計,方法是最小二乘法或極大似然估計。保險公司僅需要在大數據的基礎上,進行程序運算,給出對應的距離或其他信息,就可以得到該極值分布的具體參數。如我們以上述例子為樣本,可以得到其參數估計值分別為-0.7和1.8。有了損失分布,財產險公司就可以用來進行定價或者進行分保安排,而再保險公司就可以進行風險控制。
五、結論
通過以上大數據在保險公司中的具體應用,我們得到幾點結論:
第一,保險公司應該在定價中充分利用公司所掌握的全部數據,讓定價從“樣本精算”轉移到“全量精算”上來,讓每個部門數據都發揮作用,通過整合和利用大數據技術,達到更精確的風險定價,從而獲得更大的定價空間。
第二,保險公司自身應該重視數據接力,甚至保險公司之間應該加強數據合作,通過針對性的保險產品覆蓋來實現客戶價值挖掘,擴大保險市場。
第三,保險公是不但要重視本行業的數據積累,還要重視并挖掘其他行業的數據價值,通過與自身數據的融合來實現大數據所帶來的價值。
參考文獻:
[1] Viktor and Kenneth, Big Data: A revolution that will transform how we live work and think [M]. Eamon Dolan/Houghton Mifflin Harcourt Press, 2013.
[2] Redman T.The impact of poor data quality on the typical enterprise [J].Communications of the ACM,1998,41(2):79-82.
[3] 張寧,云計算在保險公司信息化中的應用[J].數學的實踐與認識, 2012, 42(27): 97-103.
[4] Eckerson W.Data Warehousing Special Report:Data quality and the bottom line JR. Applications Development Trends,2002.
[5] English LP.Improving Data Warehouse and Business Information Quality:Methods for Reducing Costs and Increasing Profits[M].New York:Wiley,1999
[6] Swartz N.Gartner warns firms of‘dirty data’ [J].Information Management Journal, 2007, 41(3):6-12.
[7] Kohn LT,Corrigan J M,Donaldson M S.To Err is Human:Building a Safer Health System[M].Washington:National Academies Press,2000.
[8] Zhang Ning, The modified mortality decomposition model and its application in the China longevity risk analysis, ICCIA12: 1462-1465.
[9] Zhang Ning, Introduction and computation of longevity risk index based on mortality rate decomposition model, Springer Communications in Computer and Information, 2012, 289:608-615.