999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

機器學習技術在保單失復效管理工作中的應用

2020-05-18 12:02:34林鵬程唐輝鞠芳
現代信息科技 2020年20期

林鵬程 唐輝 鞠芳

摘? 要:為了保障保險公司長期穩健發展,保單管理工作須采取現代科技手段加以完善。文章通過對保險公司歷史上大量不同時期失效保單特征進行分析,研究構建了基于Stacking多模型融合技術保單失復效模型。該模型能預測失效保單客戶在短期內復效概率,并制定相關復效督導管理策略和差異化服務策略。通過基于帕累托法則的實證分析,采用Stacking多模型融合技術構建的失復效模型較其他集成算法構建優勢明顯,特別是將模型融入PDCA管理實踐中,能夠為保單精細化管理提供有效的數據支撐,具備良好業務價值。

關鍵詞:Stacking;隨機森林;XGBoost;LightGBM;保單復效;帕累托法則;PDCA

中圖分類號:TP181? ? ? ?文獻標識碼:A 文章編號:2096-4706(2020)20-0088-06

Application of Machine Learning Technology in the Management

of Lapse and Reinstatement of Policy

LIN Pengcheng,TANG Hui,JU Fang

(Research and Development Center of China Life Insurance (Group) Company,Beijing? 100033,China)

Abstract:In order to ensure the long-term and stable development of insurance companies,the management of policies must be improved by modern technology. The article analyzes the characteristics of a large number of lapsed policies in different periods in the history of insurance companies,and researches and builds a policy lapse and reinstatement model based on Stacking multi-model fusion technology. The model can predict the recovery probability of lapsed policy customers in the short term,and formulate related recovery supervision and management strategy and differentiated service strategy. Through empirical analysis based on the Pareto principle,the lapse and reinstatement model constructed by using Stacking multi-model fusion technology has obvious advantages over other integrated algorithm construction. In particular,the model is integrated into PDCA management practice,which can provide effective data support for the refined management of insurance policies and has good business value.

Keywords:Stacking;random forest;XGBoost;LightGBM;policy reinstatement;Pareto principle;PDCA

0? 引? 言

失效保單是指投保人與保險公司的保險合同以約定分期支付保險費;在投保支付首期保險費后(除合同另有規定外),投保人超過規定的期限六十日未支付當期保險費,從而進入合同效力中止狀態。失效保單在保險合同效力中止期間發生的保險事故,保險公司不承擔保險責任[1]。因此,如果保險公司(特別是壽險公司)中存在大量失效保單,潛在構成損害保險消費者利益的風險,極易引發投訴糾紛,影響公司及行業形象,同時可能滋生營銷員個人違法犯罪行為[2]。

銀保監會早在2015年明確做了關于《中國保監會關于人身保險失效保單專項清理工作情況的通報》,要求各大保險公司應建立失效保單定期清理工作機制,對人身保險失效保單進行實時監控和管理各保險公司采取失效保單管理的措施。在具體執行層面,往往采取兩大方式:首先,防范失效保單產生,主要是通過加強保單續期率的管理,并且通過公司基本法來考核個人續收服務情況;其次,重點要嚴格控制失效保單數量管理,主要是定期對失效保單進行清查,進行復效督導管理(復效即指依照前條規定合同效力中止的,經保險人與投保人協商并達成協議,在投保人補交保險費后,合同效力恢復[3])。

然而,開展持續的失效保單復效督導管理工作難度較大,這里有三方面的原因:第一,有的壽險公司特別是在成立之初,由于急于擴大業務規模,容易形成了重售前、輕售后的管理氛圍;第二,由于長期壽險保單,營銷員一般只拿到客戶投保前幾期傭金,后期傭金過低或無傭金,造成營銷員無動力去管理失效保單;第三,失效保單客戶是否因遺忘或者資金周轉不靈等非主動因素導致失效,復效需要營銷員與客戶逐一拜訪聯系,這對于從業多年的老業務員來說,由于客戶數量較多,容易產生因新單壓力怠慢老客戶的情況。

綜上所述,復效督導管理問題核心是平衡投入和產出效益的關系,即在不影響團隊新單展業的同時,如何劃分合理有限的團隊資源,實現復效管控利益最大化。從管理學角度來看,存在對帕累托法則[4]的迫切需求:團隊只需花20%的精力就能實現80%的復效管理目標。

因此,基于上述潛在需求,中國人壽保險股份有限公司研發中心AI小組在技術上希望根據歷史經驗結合大數據分析,及時尋找最佳的復效意愿客戶群體;建立一套相關保單失復效預測模型,對客戶復效意愿能夠精準預測,在滿足帕累托管理法則基礎上,同時實現對失效保單客戶的差異化服務管理。

保單復效業務屬于個人協議支付場景;在金融領域智能化模型中應用,該類場景主要集中在銀行信用卡還款、信貸催收等領域。例如:文獻[5]通過SPSS軟件對某銀行原始用戶數據進行處理,通過PCA對數據集中變量進行篩選,將用戶分為違約和非違約兩類,并通過實例說明邏輯回歸方法在信用卡風險評估模型構建中的應用,并驗證其可行性和有效性。文獻[6]針對單一BP神經網絡算法的不足,利用遺傳算法對BP神經網絡進行優化,并通過信用卡消費行為數據集驗證,可以有效提高信用卡消費行為風險評估中的檢測率和準確率。文獻[7]利用貝葉斯網絡模型,采用交叉驗證法,對美國最大的P2P公司進行借款人信用體系預測。

在保險領域中,研究個人協議支付預測行為,特別是復效預測研究的相關文獻較少,目前主要有保單續期繳費預測研究,比如文獻[8]利用Logistic回歸算法、KMO因子分析構建保單續期預測模型,驗證模型的可行性。文獻[9-11]分別從壽險公司基層管理視角,分析失效保單的成因、防范策略和應對建議。

上述方法在一定程度上為保單失復效預測模型提供了技術參考,但是考慮到大型保險公司的客戶數據存儲主要是以結構化為主,客戶特征還存在稀疏性強的特點,往往更適合采用樹形算法進行分類預測[12],為了提升單個決策樹算法的穩定性,往往采用諸如Bagging、Boosting和Stacking等集成學習進行模型構建。

本文分別利用目前主流的RandomForest、XGBoost、LightGBM以及Stacking融合集成學習算法進行失效保單復效預測模型研究,進一步探討模型在滿足保單失復效帕累托管理法則的可行性,經對比分析,選擇了Stacking多融合算法進行本文的機器學習算法;由于失效保單復效督導工作具有持續性要求,將保單失復效模型納入PDCA管理模式[13],效果顯著,可供后續類似場景參考使用。

1? 相關集成學習技術簡介

當前運用人工智能機器學習技術解決實際問題,大多數采取集成技術。機器學習中的集成技術,是指將多個單一功能的分類器,采取一定的策略進行組裝結合,用以增強整體預測性能。單一功能的分類器也稱基礎分類器,例如決策樹、邏輯回歸等這種算法。通常來說,集成方式又分同質集成和異質集成。同種類型基礎分類器組合在一起的叫同質集成,目前比較典型的有Bagging和Boosting這兩種方式;不同類型基礎分類器組合在一起的叫異質集成,目前比較典型的方式有Stacking方法[14]。

1.1? Bagging方式

如圖1所示,主要是將同一集合的訓練樣本通過T次隨機采樣的方式形成T組大小與初始樣本相同的采樣集,分別對應T個弱學習器進行訓練,采取一定的結合策略(分類場景使用投票策略,回歸場景使用均值策略),最后形成一個強學習器。

如果學習器采用決策樹作為基礎分類器,該集成環境下比較典型的算法是隨機森林(Random Forest),除了具有上述功能外,隨機森林還有其他優點:自有的袋外估計(out of bagging,OOB)方法能夠準確估計泛化誤差,且更不易出現過擬合問題;算法抗噪聲能力強,便于并行處理機制。

1.2? Boosting方式

如圖2所示,主要是通過每個弱學習器預測結果相加,根據給定的損失函數計算集成模型中下一個弱學習器的預測內容和自身弱學習器的權重,通過反復迭代,最終形成一套強大的學習器的過程。

XGBoost[15]是Gradient Boosting的實現,每個學習器采用CART決策樹的方式進行訓練,同時在計算損失函數的時候引入二階泰勒公式展開進行擬合,把新一輪對樣本權重大小的要求轉換為對新CART樹結構的要求,通過采用近似精確貪心策略,遍歷樣本所有特征求解,計算最佳分裂點,從而形成強大分類器。

其優化過程如下:

(1)

其中,gi和hi為泰勒公式的一階導數和二階導數,L為總損失函數,l為每個樣本的損失函數,yi為樣本真實標注值,xi為樣本特征,r為葉子參數,T為葉子結點個數,wj為樣本正則。通過定義Ij={i|q(xi)=j}將上述公式中對所有樣本進行最小損失計算,轉換為對CART樹的葉子節點要求。

(2)

當? 時,具有最小的損失函數。

LightGBM[16],在原理上和XGBoost類似,但是在功能實現上主要采用基于直方圖的方法將連續特征離散化,在選取特征分裂點的時候,只需遍歷直方圖;相對于XGBoost的預排序方法計算分裂增益,存儲上降低了內存的消耗;另外在決策樹的生長策略方面LightGBM采用的是leaf-wise的策略,即只選擇最大增益的葉節點來生長;XGBoost是采取level-wise的策略,即對同級節點統一進行生長,最后留下增益最大的節點,策略上LightGBM的效率要高很多。

1.3? Stacking方式

如圖3所示,該方式可對大型數據集(通常百萬級別以上)使用的一種強化組合學習方式,該方式下的分類器分為兩類。一類是初級學習器,通常可采用異質分類器,比如Bagging、Boosting方式下各種強分類器。經各自分類器訓練后,采用交叉驗證的方式獲得每個樣本的預測結果數據。另外一類是元學習器,通常采用非線性分類器(例如邏輯回歸或者決策樹等),將異質分類器的訓練結果進一步訓練,最終獲得強大的分類效果。

根據研究表明,訓練異質分類器需采用K折交叉驗證的方式,避免讓元分類器出現過擬合現象,同時將原始特征結合異質分類器獲得的分類效果,可進一步豐富和完善原始樣本的表征能力,這樣結合元分類器效果更加顯著,例如周志華教授的Deep Forest級聯結構采用了此類方法[17]。

無論采用哪種集成方式,在性能方面較之前非集成的傳統機器學習,都具有顯著的提升。三種集成方式具有各自特點,本文將針對保單失復效訓練數據逐一進行效果驗證,通過對比挑選合適的集成算法。

2? 實證分析-構建保單失復效模型

隨著我司近些年來業務量不斷攀升,在業務數據方面,特別是在保單續期管理過程中積累大量的歷史數據。這些數據主要來源于兩大業務領域,一方面來自客戶續期繳費服務跟蹤管理,這里包含客戶繳費行為等特征數據;另外一方面來源于失效保單的復效跟蹤管理,包含激勵復效措施等分布特征數據。本文模型即基于這些數據進行實證構建。

2.1? 樣本情況

為了獲取合理的樣本分布,本文對我司過去20年內不同時點的處于兩年內失效狀態的保單進行抽樣,將短期內(例如1個月)發生復效的保單定義為正樣本,其余定義為負樣本,其中剔除抽樣重復的失效保單,數據情況如表1所示。

2.2? 特征預處理

為了提升模型運算效率和降低特征的冗余度,需對特征做一系列處理。首先須通過統計缺失率、IV值以及相關系數等方法進行初步篩選;其次,針對將收入、保費等連續值特征進行對數化處理,用來消除因時間變化,相關統計量發生明顯偏移的情況;同時,針對類型特征進行編碼化處理,將整體數據集變成數值型變量;最后,采取LR模型、GBDT訓練對特征進行二次篩選,篩選可能關聯度較高的重要特征。

同時,根據現有客戶保單繳費行為,基于RFM方式,進一步衍生計算客戶交費習慣等特征。

最后,保單失復效建模特征將聚焦于保單屬性、客戶畫像以及客戶交費習慣三大類主題。

2.3? 模型構建過程

如圖4所示,整個模型構建過程,將失效保單訓練樣本總量進行合理拆分,分別為模型樣本和驗證樣本。模型樣本用于構建模型使用,訓練模型的參數;其中取模型樣本的一小部分(約10%左右)作為測試樣本,用于調整模型參數,增強模型可用性。驗證樣本主要集中測試模型的泛化能力,評估模型的相關泛化水平是否達到預期的業務水平。

其中預測模型將分別使用RandomForest、XGBoost、LightGBM和Stacking融合算法進行構建。

為了使評估模型能力更加針對業務實際情況,在評估時不僅采用AUC、KS等技術指標進行評價,同時還須考慮模型的運行時效以及滿足帕累托法則情況。

2.4? 效果對比分析

為了得到充分合理的對比效果,需要對每一種算法進行參數調優,方法是采用網格搜索和貝葉斯調參優化結合,經過1 000次系統自動迭代,最優參數如表2所示。

其中RandomForest、XGBoost和LightGBM采用的是Sklearn庫,Stacking融合算法采用的是mlxtend庫。

經過模型多輪學習構建,得到相關性能指標如表3所示。

根據對比分析可以看出,Stacking融合算法效果最優;從算法執行效率來看LightGBM執行最快;但是同時可以看出XGBoost從預測效果角度略低于Stacking融合算法,但是從執行效率角度遠快于Stacking融合算法,幾乎與LightGBM相當。

進一步地,結合我們保單失復效預測使用場景,使用帕累托法則進行分析,方框內容是為了便于四種算法對比效果分析,可以看出通過四種算法同樣抽取模型得分在0.7以上的保單進行效果統計對應的數值來看,基于Stacking算法的效果最好,結果如圖5所示。

從圖5可以看出,Stacking融合算法相對具備較強的帕累托特性,即只需集中精力管理30.00%的全量失效保單,即可實現覆蓋81.82%當月復效保單,而XGBoost算法,也基本上達到了80.00%的水平,從原理上來說,這兩種算法都滿足當初所設定的使用精簡人力成本高效管理復效工作的目標。

由于保單失復效管理屬于定期清查工作,本身對模型實時性響應要求并不那么嚴格,為了獲得更好的泛化能力,本文的模型最終選取基于Stacking融合計算作為我們的建模算法。

3? 實際應用效果

為了持續加強保單失復效模型所起的作用,在場景設計上,我們借鑒PDCA循環理論。如圖6所示,通過模型計算復效概率得分,科學制定高復效意愿跟蹤管理計劃,以目標為導向具體指導銷售人員進行差異化復效督導措施,通過分析實際復效效果與模型預期的偏離程度,找出當前復效以及模型存在的問題,制定相關的整改措施,并進一步優化模型效果,持續改進和加強保單失復效模型在管理工作中的作用。

模型使用除了便于使管理人員進行帕累托法則督導外,銷售人員在執行復效服務工作時,可根據保單失復效模型得分采取差異化溝通計劃,提高復效服務的工作效率;針對不同的復效意愿,采用不同的復效溝通方式。

如圖7所示,以下為模型在分公司試點的效果,與業務自然情況的對比分析,以及根據模型預測結果建議采取溝通措施計劃。

如表4所示,在差異化復效溝通方面,針對高復效意愿的客戶,可借助微信/短信提醒方式,節省溝通時間成本;對于復效意愿較為普通的客戶,采取合適的激勵措施引導客戶復效;而針對復效概率低的客戶,可采取直接推薦優選其他更加合適的保險產品進行溝通。

值得一提的是,在分公司試點期間,由于對復效考核要求要進一步細化為期初(失效日期在本年度前的保單)和期內(失效日期在本年度的保單)兩項指標。根據生產運營經驗來看,失效時間越長的保單,其本身復效難度也是越大,如圖8所示,這個正好同保單失復效模型的SHAP特征可解釋性完全一致。

4? 結? 論

本文在對比多種集成算法模型的基礎上,建立起了基于機器學習算法的保單失復效模型,并且基于公司歷史積累的海量數據,對比評估RandomForest、XGBoost和LightGBM和Stacking融合算法在滿足帕累托法則的對比分析研究。實證結論表明,采用Stacking多融合算法,在非及時響應的批處理環境下,具備較強的泛化能力。

保單失復效管理影響著保險公司長期健康穩定的發展,通過將模型引入PDCA持續優化場景設計,能夠為保險機構提供科學可靠的管理決策支持,同時將營銷員從繁重的催收工作解放出來,提升自身工作效率,改善客戶服務水平,具備較強的實踐參考價值。

參考文獻:

[1] 邢秀芹.保險學 [M].北京:北京郵電大學出版社,2008.

[2] 朱小平,吳婷.期交失效保單風險點探析及應對 [N].中國郵政報,2016-06-30(4).

[3] 全國人民代表大會常務委員會.中華人民共和國保險法 [R/OL].[2020-09-20].http://www.npc.gov.cn/wxzl/gongbao/ 2015-07/06/content_1942828.htm.

[4] 百度百科.二八效應 [EB/OL].[2020-09-20].https://baike.baidu.com/item/%E4%BA%8C%E5%85%AB%E6%95%88%E5%BA%94/5155000?fromtitle=%E5%B8%95%E7%B4%AF%E6%89%98%E6%B3%95%E5%88%99&fromid=7224763#2.

[5] 阿明翰,張達敏,李偉.邏輯回歸在信用卡風險評估模型構建中的應用 [J].內江科技,2016,37(9):41-42.

[6] 劉嵐,王霞,林紅旭,等.基于混合BP神經網絡算法的信用卡消費行為風險預測 [J].科技管理研究,2011,31(17):206-210.

[7] 黎月.基于貝葉斯網分類器的互聯網借貸風險評估 [J].北方經貿,2018(6):106-107.

[8] 盧文祥.基于logistic回歸模型的保險單續款預測研究 [D].哈爾濱:哈爾濱工程大學,2017.

[9] 羅忠敏.失效保單的負面效應與應對策略 [J].華南金融研究,2002(6):53-55.

[10] 韓焱.失效保單的成因及防范對策 [J].保險研究,2002(4):41-42.

[11] 賈佳麗.河北壽險業“失效保單”存在問題及改善建議 [N].中國保險報,2018-04-03(12).

[12] MURTHY S K. Automatic Construction of Decision Trees from Data:A Multi-Disciplinary Survey [J]. Data Mining and Knowledge Discovery,1998,2(4):345-389.

[13] 萬融.商品學概論:第5版 [M].北京:中國人民大學出版社,2013.

[14] 周志華.機器學習 [M].北京:清華大學出版社,2016:171-185.

[15] CHEN T Q,GUESTRIN C.XGBoost:A Scalable Tree Boosting System [C]//KDD16:Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data MiningAugust,2016:785-794.

[16] KE G L,MENG Q,FINLEY T,et al. LightGBM:a highly efficient gradient boosting decision tree [C]//NIPS'17:Proceedings of the 31st International Conference on Neural Information Processing Systems. Curran Associates Inc.,57 Morehouse Lane,Red Hook,NY,United States,2017:3149-3157.

[17] ZHOU Z H,FENG J. Deep Forest:Towards An Alternative to Deep Neural Networks [J].National Science Review,2019,6(1):74-86.

作者簡介:林鵬程(1980—),男,漢族,福建龍巖人,中級工程師(一級),碩士研究生,研究方向:AI算法在金融企業的應用;唐輝(1981—),男,漢族,湖北天門人,高級工程師(一級),碩士研究生,研究方向:企業信息管理。

主站蜘蛛池模板: 99re热精品视频国产免费| 欧美一区二区福利视频| 亚洲一区二区黄色| 国产女人在线| 亚洲AV无码不卡无码| 一本综合久久| 日本精品一在线观看视频| 国产在线精品99一区不卡| 国产一区在线观看无码| 2021国产精品自产拍在线| 亚洲热线99精品视频| 国产一级在线观看www色| 香蕉久人久人青草青草| 国产夜色视频| 色偷偷一区| 99久久精品国产精品亚洲| 国产精品高清国产三级囯产AV| 男人的天堂久久精品激情| 亚洲色图在线观看| 夜夜操天天摸| 国产在线98福利播放视频免费| 亚洲天堂免费在线视频| 国产高清在线精品一区二区三区| 国产精品55夜色66夜色| 国产成人一区二区| 亚洲国产成人精品青青草原| 久久精品嫩草研究院| 2018日日摸夜夜添狠狠躁| 婷婷综合缴情亚洲五月伊| 国产精品亚洲综合久久小说| 日日拍夜夜嗷嗷叫国产| 国产xx在线观看| 精品久久久久久成人AV| 久久熟女AV| 亚洲最大综合网| 国产日韩精品欧美一区灰| 在线精品亚洲国产| 亚洲中文字幕在线一区播放| 精品少妇人妻一区二区| 久久久久88色偷偷| 找国产毛片看| AV在线麻免费观看网站| 国产成人精品高清不卡在线| 最新国产你懂的在线网址| 中文字幕有乳无码| 成人午夜网址| 国产大片黄在线观看| 国产一级片网址| 久久精品人妻中文系列| 青青国产视频| 国产在线精品99一区不卡| 亚洲国产天堂在线观看| 亚洲人成网7777777国产| 欧洲一区二区三区无码| 精品国产网站| 国产成人福利在线| 国产在线观看精品| 伊人久久大香线蕉影院| 久久综合九九亚洲一区| 蜜桃臀无码内射一区二区三区| 毛片网站观看| 青青极品在线| 久久人人97超碰人人澡爱香蕉| 久久精品人人做人人爽电影蜜月| 亚洲天天更新| 成人一区在线| 亚洲美女一区二区三区| 国产主播福利在线观看| 日韩精品专区免费无码aⅴ| 91欧洲国产日韩在线人成| 国产乱人免费视频| 九九线精品视频在线观看| 高清不卡一区二区三区香蕉| 在线一级毛片| 热伊人99re久久精品最新地| 91青青草视频| 国产在线观看一区二区三区| 国产一区在线视频观看| 又黄又湿又爽的视频| 五月天综合网亚洲综合天堂网| 国产一区在线视频观看| 亚洲 成人国产|