徐高凱 楊杉
當(dāng)前,大數(shù)據(jù)的普遍應(yīng)用引起了社會(huì)經(jīng)濟(jì)的變革,同時(shí)也給保險(xiǎn)業(yè)帶來了深遠(yuǎn)的影響。在客戶信息擁有量巨大的金融行業(yè),將龐雜的數(shù)據(jù)進(jìn)行深度挖掘和對(duì)未來數(shù)據(jù)進(jìn)行預(yù)測(cè)以供精確營(yíng)銷,在企業(yè)的長(zhǎng)期發(fā)展中有不可忽視的作用。在保險(xiǎn)行業(yè)中,理賠這項(xiàng)工作,既是風(fēng)險(xiǎn)的晴雨表,也是反映保險(xiǎn)行業(yè)的經(jīng)營(yíng)狀況的重要依據(jù)。
目前在人壽保險(xiǎn)的保險(xiǎn)數(shù)據(jù)當(dāng)中,理賠數(shù)據(jù)、退保數(shù)據(jù)的比例較高,該保險(xiǎn)公司面臨著企業(yè)理賠風(fēng)險(xiǎn)較大、個(gè)別險(xiǎn)種設(shè)置不合理導(dǎo)致用戶粘性有所下降的情況,這非常不利于企業(yè)長(zhǎng)期可循環(huán)發(fā)展,因此對(duì)理賠用戶特征進(jìn)行分析與選擇,可以使公司在用戶發(fā)展上更有方向性。
以四川人壽保險(xiǎn)的理賠數(shù)據(jù)為研究對(duì)象,對(duì)該保險(xiǎn)理賠數(shù)據(jù)用戶進(jìn)行行為畫像。采用excel數(shù)據(jù)分析、SPSS statistics中均值過程、描述統(tǒng)計(jì)、頻率分析和數(shù)據(jù)可視化的方法,對(duì)理賠信息中的險(xiǎn)種、賠款金額、費(fèi)用類型以及每一類費(fèi)用類型與客戶信息之間的關(guān)系展開分析,希望較為全面地完成關(guān)于理賠用戶的數(shù)據(jù)畫像。
數(shù)據(jù)來源
通過在人壽保險(xiǎn)公司數(shù)據(jù)庫(kù)中觀察,為了數(shù)據(jù)的完整性,對(duì)新投保、續(xù)保、理賠、退保四個(gè)方面的數(shù)據(jù)進(jìn)行獲取后進(jìn)行篩選,其中理賠數(shù)據(jù)包含了機(jī)構(gòu)險(xiǎn)種、賠償金額、費(fèi)用類型、總保費(fèi)、保額、理賠用戶的基本信息等16列21萬(wàn)條數(shù)據(jù)。
數(shù)據(jù)清洗
表中年齡、險(xiǎn)種都是單個(gè)年齡或單獨(dú)險(xiǎn)種,還有費(fèi)用類型需要經(jīng)過數(shù)據(jù)的清洗過后才能夠進(jìn)行主題分析。由此把excel表中的年齡以18為一個(gè)分界標(biāo)準(zhǔn),共分5個(gè)年齡段,分別是小于18歲、18-36歲、36-54歲、54-72歲以及72歲以上,把險(xiǎn)種分為S、L、B、Y、4、6這6大類險(xiǎn)種,進(jìn)行完數(shù)據(jù)清洗過后的表格更加的能夠準(zhǔn)確的得出研究主題的結(jié)論與意義。
研究險(xiǎn)種的賠款風(fēng)險(xiǎn)以及各險(xiǎn)種賠款金額的均值差異
數(shù)據(jù)中共有6類險(xiǎn)種,其中Y險(xiǎn)種的平均賠款金額最高,且其賠款風(fēng)險(xiǎn)最高,賠款金額變化大,穩(wěn)定性較差。觀察這六類險(xiǎn)種的方差、標(biāo)準(zhǔn)差得到其中Y險(xiǎn)種兩個(gè)數(shù)據(jù)都遠(yuǎn)大于其余險(xiǎn)種。而B險(xiǎn)種的賠款額方差、標(biāo)準(zhǔn)差值明顯小于其他險(xiǎn)種,因此B險(xiǎn)種的賠款金額的數(shù)據(jù)變化小,較穩(wěn)定。險(xiǎn)種的平均賠付金額范圍在630-4500、19000-24000這兩個(gè)區(qū)間內(nèi),說明理賠數(shù)據(jù)的均值區(qū)間是差別較大的,數(shù)據(jù)分散性較大,與數(shù)據(jù)的機(jī)構(gòu)、險(xiǎn)種變化相關(guān)。
研究每一類費(fèi)用類型的主要年齡段分布情況
數(shù)據(jù)中可得到非意外類型的年齡平均值是在46歲左右,峰度小于0,數(shù)據(jù)呈現(xiàn)扁平狀態(tài),偏度大于0,數(shù)據(jù)右偏,右偏數(shù)據(jù)分布密度稀疏,年齡大的用戶分布稀疏,則非意外類型的人大部分集中在均值附近或者是均值左偏的部分,所以非意外類型的人更多的集中在46歲以下;疾病類型的年齡平均值在47歲左右,峰度小于0,呈現(xiàn)扁平分布,偏度大于0,說明數(shù)據(jù)往右偏,右偏數(shù)據(jù)分布密度稀疏,則疾病類型的人大多集中在均值47歲左右以及47歲以下范圍,而意外類型的平均值為45歲左右,峰度小于0,呈現(xiàn)扁平分布,偏度大于0往右偏,所以意外類型的年齡分布也和非意外和疾病一樣,分布在均值附近以及均值以下,也就是在45歲周圍及以下。
從研究的箱型圖中得到非意外類型:由于箱體短胡須短的一端是位于下方,說明非意外類型的用戶年齡處于偏低的水平更為集中,異常值集中在上方,說明數(shù)據(jù)分布右偏,在疾病的箱型圖中可以看到,數(shù)據(jù)更加集中在年齡偏低的水平,年齡大的用戶的分布稀疏。在意外的箱型圖中可以看到數(shù)據(jù)也是更加的集中在年齡偏低的水平處的。
研究各費(fèi)用類型中哪些保險(xiǎn)機(jī)構(gòu)更易產(chǎn)生賠付金額
1.疾病費(fèi)用類
根據(jù)疾病費(fèi)用統(tǒng)計(jì)指標(biāo)得:在疾病費(fèi)用類型中,510781是產(chǎn)生賠付最多的機(jī)構(gòu),這一機(jī)構(gòu)對(duì)準(zhǔn)疾病的賠付保險(xiǎn)受眾多,而513999的機(jī)構(gòu)在疾病費(fèi)用類幾乎沒有賠償。總體數(shù)據(jù)偏度大于0,呈現(xiàn)右偏,峰度小于0,其為扁平分布。
2.意外費(fèi)用類
根據(jù)意外費(fèi)用統(tǒng)計(jì)指標(biāo)得:在意外費(fèi)用類型中,510120是產(chǎn)生賠付最多的機(jī)構(gòu),可見510120這一機(jī)構(gòu)對(duì)準(zhǔn)意外的賠付保險(xiǎn)受眾較多,而513999的機(jī)構(gòu)在意外費(fèi)用類幾乎沒有賠償。偏度大于0,呈現(xiàn)右偏,峰度小于0,可見其為扁平分布。
3.非意外費(fèi)用類
根據(jù)非意外費(fèi)用統(tǒng)計(jì)指標(biāo)得,在非意外費(fèi)用類型中,511024是產(chǎn)生賠付最多的機(jī)構(gòu),可見511024這一機(jī)構(gòu)對(duì)準(zhǔn)非意外的賠付保險(xiǎn)受眾較多,而513999的機(jī)構(gòu)在非意外費(fèi)用類出現(xiàn)了賠償,可見513999機(jī)構(gòu)的保險(xiǎn)的客戶理賠對(duì)準(zhǔn)性、靶向性是非常高的。偏度大于0,因此為右偏,而峰度小于0,可見其為扁平分布。
結(jié) 論
個(gè)人信息依法交易、流通、共享是大數(shù)據(jù)時(shí)代的必然現(xiàn)象。在傳統(tǒng)的保險(xiǎn)業(yè)中,存在著如何獲取新用戶、如何進(jìn)行風(fēng)險(xiǎn)控制、如何留住客戶以及如何觸發(fā)客戶的消費(fèi)等眾多問題,大數(shù)據(jù)的分析運(yùn)用使這些問題迎刃而解,以現(xiàn)存的保險(xiǎn)理賠數(shù)據(jù)資源作為依托,進(jìn)行數(shù)據(jù)整合并加以利用,對(duì)傳統(tǒng)的保險(xiǎn)分析模式進(jìn)行適應(yīng)時(shí)代的改造,從而提高企業(yè)的經(jīng)濟(jì)效益。大數(shù)據(jù)運(yùn)用于保險(xiǎn)業(yè),理賠用戶的數(shù)據(jù)得到分析后有利于了解用戶行為,改善優(yōu)化保險(xiǎn)內(nèi)部問題。因?yàn)閭€(gè)人信息在金融行業(yè),特別是在保險(xiǎn)業(yè),具有多樣性、敏感性的特點(diǎn)。當(dāng)今經(jīng)濟(jì)增速放緩,我們需要加大對(duì)價(jià)值較高的數(shù)據(jù)的挖掘力度,因此需要通過大數(shù)據(jù)分析、數(shù)據(jù)可視化來將數(shù)據(jù)顯化和動(dòng)態(tài)化。這也使得保險(xiǎn)理賠營(yíng)銷行動(dòng)目標(biāo)明確、可追蹤、可衡量、可優(yōu)化,從而形成以數(shù)據(jù)為核心的保險(xiǎn)營(yíng)銷閉環(huán),使理賠營(yíng)銷行動(dòng)得到良性循環(huán)。
經(jīng)過數(shù)據(jù)分析后用戶總體特征主要呈現(xiàn):年齡均值范圍在45-47之間,婚姻狀況主要為已婚人群,性別結(jié)構(gòu)呈現(xiàn)的是女多男少。
在理賠數(shù)據(jù)中,主要進(jìn)行六類險(xiǎn)種的賠付金額的方差等數(shù)據(jù)比較分析,通過對(duì)方差、標(biāo)準(zhǔn)差值、均值的大小比較后發(fā)現(xiàn)Y險(xiǎn)種對(duì)保險(xiǎn)公司的賠款風(fēng)險(xiǎn)較高。而B險(xiǎn)種較穩(wěn)定,風(fēng)險(xiǎn)較低。另外6類險(xiǎn)種賠款金額的數(shù)據(jù)都呈現(xiàn)右偏、尖端分布的情況。情況變動(dòng)不大。其中,F(xiàn)險(xiǎn)種的右尖端分布情況更加明顯。
從數(shù)據(jù)表格可得意外和非意外以及疾病這三種類型理賠數(shù)據(jù)的均值為45-47之間,并且三種類型的數(shù)據(jù)都在年齡均值左右分布,再由箱型圖也進(jìn)一步輔助說明,在三種類型中用戶更加集中分布在均值和均值(47歲)以下,分布的密度較為平均。
對(duì)于理賠數(shù)據(jù)總體主要多數(shù)集中在小于編號(hào)為512000的機(jī)構(gòu)前,512000機(jī)構(gòu)后總體賠付少,對(duì)意外的理賠也較少。在疾病費(fèi)用類型中,510781是賠付最多的機(jī)構(gòu);在意外費(fèi)用類型中,510120是賠付最多的機(jī)構(gòu);在非意外費(fèi)用類型中,511024是賠付最多的機(jī)構(gòu)。而經(jīng)過研究后發(fā)現(xiàn)511399這一保險(xiǎn)機(jī)構(gòu)的保險(xiǎn)類型靶向性較高,只對(duì)準(zhǔn)非意外中其他和其他疾病這兩類承擔(dān)著較少且指向性強(qiáng)的保險(xiǎn)理賠。
建 議
在大數(shù)據(jù)時(shí)代,面對(duì)復(fù)雜的重要參數(shù)進(jìn)行仔細(xì)的研究形成用戶畫像,本文主要是將險(xiǎn)種等重要參數(shù)進(jìn)行分析,雖不能直接地反映出體系的用戶行為,但是也可以呈現(xiàn)許多可供選擇和改善的地方。
通過對(duì)各類險(xiǎn)種的賠款金額均值進(jìn)行研究,發(fā)現(xiàn)賠款風(fēng)險(xiǎn)最高的是Y險(xiǎn)種,最低的是B險(xiǎn)種。因此在公司推銷業(yè)務(wù)時(shí)有側(cè)重的推薦用戶購(gòu)買B類險(xiǎn)種,而改善Y險(xiǎn)種的業(yè)務(wù)銷售,降低保險(xiǎn)公司的理賠風(fēng)險(xiǎn),保證用戶的保險(xiǎn)權(quán)益最大化。
利用大數(shù)據(jù)實(shí)行“隱私差別化”管理,不斷從一般信息中挖掘管理價(jià)值與經(jīng)濟(jì)價(jià)值,是信息保護(hù)與利用博弈的必然選擇。在理賠數(shù)據(jù)表中理賠費(fèi)用類型的年齡都偏向于47歲以下,說明47歲以下是一個(gè)理賠高風(fēng)險(xiǎn)的年齡段,因此保險(xiǎn)公司在推銷業(yè)務(wù)和用戶管理時(shí)多關(guān)注這一年齡段的人群,可考慮為此年齡段的人群提供適合的保險(xiǎn)套餐,根據(jù)不同理賠用戶的群特征量身定制出差別化,多樣化的理賠險(xiǎn)種。
理賠機(jī)構(gòu)同時(shí)應(yīng)加強(qiáng)靶向性的保險(xiǎn)分布,專注于意外理賠、疾病理賠或者是非意外理賠中的一個(gè)方面。隨著社會(huì)發(fā)展,一些理賠機(jī)構(gòu)和險(xiǎn)種覆蓋種類太多,雖然滿足了綜合性保險(xiǎn)的現(xiàn)實(shí)需求,提供了便捷的一條龍服務(wù),但因?yàn)楦鱾€(gè)方面都需兼顧,理賠數(shù)額太大,企業(yè)運(yùn)轉(zhuǎn)風(fēng)險(xiǎn)性加大,并不有利于企業(yè)的可持續(xù)性發(fā)展。
[本文系四川大學(xué)錦城學(xué)院青年教師科協(xié)資助]
(四川大學(xué)錦城學(xué)院計(jì)算機(jī)與軟件學(xué)院)