黃山 尹龍威 孫海晨
關鍵詞:貝葉斯分類器 客戶畫像 續保概率 風險因素
0.引言
中國目前的車險費率制度,大多數符合“從車主義”。即車險保費多少,主要取決于這輛車本身的各項情況,如車的購置價、座位數、排量、購車年限等,根據這些數據計算出一個基本的車險保費價格,再根據這輛車的上年理賠次數來打不同的折扣。這就導致了中國的車險定價模式非常的單調,相似情況的車型,保費也都差不多。想要改變這種狀況就需要使其變為“從人主義”。需要對客戶進行精準畫像也需要對客戶是否續保概率進行預測。
1.客戶精準畫像
本文從三個大方向車輛、環境、人;10個小方向種類、年齡、性別、NCD等對客戶進行精準畫像。針對重要的文字信息,本文通過風險厘定將文字信息轉化為了數字信息。下面將選取這些數字信息以概率統計的方法對客戶進行精準畫像。
2.貝葉斯分類器
在上文我們對客戶車險的風險因素劃分了風險系數,將以上劃分標準作為類別集合,利用貝葉斯分類器對已有數據中的客戶進行分類,得到客戶的精準畫像。利用風險系數計算各類客戶的續保概率。貝葉斯分類器是一種分類的算法,但他是以概率統計的方法對類別進行劃分。利用概率統計中的貝葉斯公式進行計算,算法的特點就是不會確定樣本的類別,而是以概率的形式告訴這個樣本有多大可能屬于這一類。本文將續保不續保分為兩類,這樣通過將所得數據輸入分類器進行學習。當在輸入客戶得這些信息時,貝葉斯模型就會得到該客戶續保得概率。
貝葉斯分類法基于簡單的貝葉斯公式(1),即通過某對象的先驗概率計算其后驗概率,選擇具有最大后驗概率的類作為該對象所屬的類。
本文以同品牌同車系的1000組大眾帕塞特客戶相關信息輸入貝葉斯分類器進行學習。另找了10個大眾帕塞特客戶的信息輸入已經訓練好的貝葉斯分類器模型進行檢驗。
3.結論
選取10個大眾帕塞特客戶的信息輸入已經訓練好的貝葉斯分類器模型進行檢驗,結果如下:
從1000組數據的訓練樣本學習后的貝葉斯分類器分類精準度可以在80%。而且也成功的從對客戶的畫像中得到了該客戶續保的概率。