滕毅 陳麗君 朱和勝
為了提高郵政金融網點的營銷能力,為營銷經理提供精準營銷的依據,本文采用數據挖掘的方法針對金融客戶的購買行為進行分析,找出購買各類金融產品的客戶群體特征。本文對廣東郵政某金融網點的客戶數據進行了采集并建立起統一視圖,然后采用K-means聚類算法對客戶數據進行聚類分析,所選用聚類屬性是按照當前客戶的各類金融產品的百分比進行分析,并且將算法的結果結合客戶的基本屬性對所有金融客戶進行細分,并針對某些共性的客戶進行精準的產品推薦。
入世之后,銀行業內的競爭越來越激烈,如今銀行的核心競爭力已經轉化為對優質客戶的競爭和搶奪。在新經濟的規模和特征下,銀行業對數據中心及客戶分析的需求已經形成。
興業銀行已經通過對還款數據的分析比較區分優質客戶,根據客戶還款數額的差別,提供差異化的金融產品和服務方式。以興業證券為例,通過盈利率數據分析對客戶進行分類,分析出適合開發或營銷的目標客戶群,市場團隊根據分析結果采取針對性策略拓展客戶,成功率提高30% 以上。
2012 年,平安旗下各專業公司將陸續正式加入央行征信系統。征信系統的核心在于數據采集,數據樣本越大,規律性更強,價值也更大。平安集團有7400 萬客戶,這些個人信息數據累積起來,對于平安創新互聯網金融,將起到關鍵的作用。
當前郵政代理金融客戶中,3.6%的客戶占了80.5%的資產,7.6%的客戶占用了17%的資產,88.8%的客戶占用了2.5%的總資產。如果忽略不同資產類型帶來的收益率的不同,3.6%的客戶為郵政代理金融收入的80.5%。然而,我們目前針對這80.5%的客戶只有兩個細分群體,就是金卡客戶和鉆石客戶,且該細分群體除了資產級別之外,不帶有任何關于客戶個人喜好、行為等的分群,這顯然對于我們維護客戶關系是存在很大弊病的。
客戶細分是了解客戶進行市場細分和目標市場營銷的前提。準確的細分市場和差異化營銷策略是目前企業市場營銷所必須面臨的難題[5]。數據挖掘的分類和聚類的方法都可應用于客戶分群。本項目采用聚類方法指導客戶分群,為郵政金融市場營銷的客戶分群提供完整的解決方案,并以實際案例驗證其可行性。
模型
問題定義。本文某市某金融網點的客戶數據,根據客戶的基礎信息以及客戶金融產品購買情況進行分析、聚類,并按照以網點為單位輸出當前網點的營銷客戶列表并帶有客戶的偏好的屬性標簽。
數據選擇。本文以當前郵政廣州市某代理金融網點數據為例,進行說明。根據所定義的問題,該問題涉及到客戶基礎表、產品表以及客戶產品關聯表。其中,客戶基礎表主要用來記錄客戶15個基礎屬性,分別為:客戶姓名、客戶號、身份證號、性別、年齡、籍貫、就業狀態、月收入、行業、崗位、學歷、單位性質、客戶登記、客戶分類、累計積分。產品表主要包含產品的種類、名稱、明細、客戶收益以及企業收益等信息。客戶產品關聯數據表,主要是將客戶與其所購買的代理金融產品相關聯,主要包含以下屬性:月份、客戶號、客戶姓名、類型、產品名稱、月末余額、月均余額。
聚類算法的實現。通過抽取的特征利用已有的數據聚類算法(K-means)對數據進行分析,計算每個客戶之間的相似情況(距離),根據距離的大小將特征屬性相近的客戶劃分為一個群體,而將特征屬性相差較大的客戶劃分為不同的群體,從而得到不同目標客戶群。這些目標客戶群(簇)具有共同的特征屬性,而不同群間特征差異較大,通過客戶群的劃分后再結合客戶群的共性特征進行數據分析,得到相應客戶群體共性特征的數字化描述。K-means算法是一種典型的分割聚類算法,由于其算法的簡單性以及算法實現的簡便性,因此在數據挖掘中應用最為廣泛[7]。
本文采用聚類算法針對客戶數據進行聚類分析,主要是針對客戶按照選定的聚類屬性進行聚類。聚類算法的實現過程如下:1)選取K的取值(本文取值:12);2) 選取初始質心點,做為聚類的簇心;3)讀取第每條記錄,計算第二條記錄到簇心的距離,并將其歸于距離質心最近的簇,然后再重新更新簇心。然后重復計算第三條記錄到最后一條記錄;4)然后重復步驟2,直至質心不再變化。
聚類結果。分析聚類后的客戶分類,將具有相似屬性的簇進行合并,最終歸并為7個簇,其中:
針對簇1的客戶,營銷人員可以重點進行保險、理財產品的銷售,這部分屬于高端客戶,且年齡在54歲左右,注重自身的報賬且具有一定的理財意識,是當前該網點基金理財產品的購買主力。
簇2屬于老齡客戶,相對于其他的老齡客戶來說,這部分屬于高端老齡客戶。他們的資產相對較多,營銷人員如果有意想要引導他們購買理財的話,建議分紅型的保險是最合適的。
簇3屬于理性的高端客戶,一般儲戶,可以引導的購買一些理財和保險,但難度相對來說較大。
簇4屬于當前該網點保險產品的主要購買力,但從數據上分析,購買保險具有一定隨機性,即營銷人員“逮一個算一個”,且從年齡結構上看,屬于偏年輕,主要分布在40-44歲。
簇5屬于50歲以上老人群體,主要偏向于儲蓄,但可以適當的推薦保險。
簇6屬于資產在2w以下,主要集中于儲蓄,可引導的進行理財,例如基金定投。
簇7主要是流失客戶。
針對以上七類客戶,本文統計其客戶區間分布,88.3%客戶主要分布在簇3, 4, 5, 6。高端人數較少(簇1,2),對網點日常營銷來說,建議網點針對簇3,4,5,6推出特定的營銷策略。在注重高端客戶的同時,重點開展對網點主力客戶的針對性營銷。
廣東省郵政目前正在針對客戶大數據進行初步分析,已經針對客戶購買的代理金融產品進行數據預處理,根據客戶購買的產品的差別以及客戶為網點利潤的貢獻額度進行綜合考慮,對郵政代理金融客戶進行客戶細分,同時為客戶提供差異化的金融產品和服務方式。為了進一步應用大數據,我省郵件計劃將銀聯刷卡的數據與客戶進行匹配,掌握客戶日常的消費行為,同時挖掘潛在的大客戶。將客戶匹配到網點,將數據進行下發,網點的營銷團隊在分析數據的基礎上采取針對性的策略拓展客戶。