蔡秋茹,柳益君,羅 燁,葉飛躍
摘 要:電信業是典型的數據密集行業,數據挖掘應用開發對電信企業的發展有重要意義。其中,客戶分群可以準確認識客戶總體構成,使得服務和營銷更具針對性。在此以常州市電信企業為例,利用商業數據挖掘自動化軟件KXEN給出電信客戶分群的解決方案。實踐證明,利用KXEN軟件不僅大量減少了建模時間,而且得到的解決方案是成功有效的。
關鍵詞:數據挖掘;電信企業;客戶分群;KXEN軟件
中圖分類號:TP31113文獻標識碼:A
文章編號:1004-373X(2009)20-097-03
Research on Telecom Customer Segmentation Based on KXEN
CAI Qiuru,LIU Yijun,LUO Ye,YE Feiyue
(Jiangsu Teachers University of Technology,Changzhou,213001,China)
Abstract:Data mining application is very vital for Telecom.Customer segmentation can analyze customer composition and promote serve quality.In this study,a resolution of customer segmentation for Changzhou Telecom in Jiangsu province is proposed based on the commercial automatic data mining tool KXEN.Results show that KXEN saves much modeling time and the resolution is efficient.
Keywords:data mining;telecom;customer segmentation;KXEN software
0 引 言
隨著計算機技術的飛速發展,尤其是數據庫技術的普及,人們面臨著日益擴張的數據海洋,原來的數據分析工具已無法有效地為決策者提供決策支持所需要的相關知識,從而形成一種獨特的現象“豐富的數據,貧乏的知識”。數據挖掘又稱為數據庫中知識發現,它是一個從大量數據中抽取挖掘出未知的、有價值的模式或規律等知識的復雜過程。目的是在大量的數據中發現人們感興趣的知識 [1-3]。
電信業是典型的數據密集行業,利用數據挖掘得到有用的知識,能更好地向用戶提供服務,發現更多的商機。電信的數據挖掘應用開發,主要包括客戶分群、客戶流失分析、客戶發展分析、客戶行為分析等專題分析。客戶分群意指根據一個或多個客戶屬性組合把所有客戶劃分成不同的類,同類內的客戶具有最大的相似性,異類間的客戶具有最大的差異性。通過對客戶合理的類別劃分,并對當前客戶以及預期的客戶群做區段分析,判斷不同區段的突出特點,對客戶總體構成有準確的認識,對客戶的服務和營銷更具針對性[4-7]。對客戶分群可以達到如下目標:
(1) 了解客戶的總體構成;
(2) 了解各種客戶價值的客戶群體特征;
(3) 了解流失客戶的客戶群體特征;
(4) 了解客戶群體的消費特征;
(5) 了解各信用等級的客戶群體特征。
客戶分群后的結果可應用于:對不同價值分段的客戶進一步分析以了解各個分段的客戶組成;對流失傾向高的客戶進一步細分以采取不同的挽留策略;對交叉銷售的目標客戶進一步細分以采取不同的行銷策略。
常用的數據挖掘技術包括關聯分析、異類分析、分類與預測、聚類分析以及演化分析等。其中,聚類分析可以解決客戶分群問題。
1 KXEN特點分析
KXEN是三大數據挖掘軟件(SAS/EM,KXEN,SPSS/Clementine)之一,與其他兩者不同,KXEN專注數據挖掘的高端技術,是面向結果、而不是面向方法的。用戶不需要專業的統計學背景和機器學習的理論,而只需要知道數據和分析的問題,對于每種問題,KXEN都提供一種簡單的解決方案。商業數據挖掘自動化軟件KXEN具有以下特點[8,9] :
(1) 在數據準備階段,KXEN可以自動處理缺失值、奇異值、進行自動化編碼。KXEN獨特的預處理編碼技術和特征選擇方式,大量減少了建模時間。
(2) KXEN在建模時不用額外的磁盤空間來存儲數據,數據直接在數據倉庫內部處理,很好地利用了數據倉庫的性能,節省硬件成本,符合現在的Knowledge Discovery in Database的理念。
(3) KXEN共有四個模塊(穩健回歸、聰明分群、關聯規則和時間序列)來解決所有的商業數據挖掘問題。一個商業問題只有一種算法,因此不需要用戶選擇算法。所有算法都基于Vapnik的結構風險最小化(Structured Risk Minimization)理論。
(4) KXEN進行自動建模,不需要進行模型的參數設置,KXEN引擎采用結構風險最小化理論,找到最佳模型。
(5) 結果的可解釋性。KXEN所有組件的設計都使之對最終用戶呈現有意義的結果。
由于上述特點,KXEN改變了傳統的數據挖掘方法,數據準備時間從以前的占整個建模周期的70%到現在的幾乎不用花時間(見圖1和圖2)。而KXEN的模型與傳統工具創建的模型一樣精確健壯。
圖1 傳統的數據挖掘方法
圖2 基于KXEN的數據挖掘方法
2 實例研究
2.1 業務問題
電信運營商定義的客戶分群的商業目標是“對市數十萬公眾客戶,從價值和行為的分析維度進行客戶分群,以了解不同客戶群的消費行為特征,為發展新業務、流失客戶保有、他網用戶爭奪的針對性營銷策略的制訂提供分析依據,并實現企業保存量、激增量的戰略目標”。將此商業目標轉化為數據挖掘的可行性方案:從價值和行為維度,考察客戶業務擁有與使用、消費行為變化、他網業務滲透等方面屬性,采用聚類分析的數據挖掘技術對研究的目標客戶進行客戶分群,對各客戶群進行特征刻畫和屬性分析,為針對性營銷確定目標客戶群,并根據客戶群屬性和營銷目標量體裁衣制訂恰當的營銷方案。
2.2 應用分析
這里在常州選擇了營銷服務相對薄弱的小型商客作為目標客戶群,取得目標客戶群的近一年的相關數據。其中小型商客是指客戶有1,2門電話、小靈通的客戶,不包含已經安裝寬帶的客戶,有效小型商客為23 074戶。基礎表涵蓋了以下數據:
(1) 用戶及客戶的基本信息:包括客戶身份信息、聯系方式、產品擁有情況、入網時長、服務開通情況、優惠套餐信息、客戶服務信息(投訴、咨詢、催繳情況)等;
(2) 價值信息:包括業務月租費、使用費、優惠費用及增值業務、新業務、信息費和卡類、結算費用、繳欠費信息等;
(3) 行為信息:包括時長、次數、跳次、發話不同號碼數、時長集中度、次數集中度等。
KXEN軟件分群采用結構風險最小化的K-Means算法實現。這里使用KXEN軟件從價值緯度(V)將客戶分為6個價值分群,從行為緯度(B)將客戶分為5個行為分群。其中參加分群的V變量有21個,B變量有15個。然后對V變量按總費用進行群排序,形成VB矩陣交叉圖(見圖3和圖4)。在組成的交叉矩陣中選出1 000人以上的8個戰略客戶群SS1-SS8,共有客戶17 128戶,占總客戶的比例為74.23%。
圖3 客戶群VB矩陣交叉圖
圖4 小商客戰略群(SS1-SS8)矩陣圖
根據分群結果,計算出每個群的平均收入進行客戶價值分析:
ARPU=客戶群總收入/m
式中:m為該群客戶人數,ARPU(Average Revenue Per User)為每用戶平均收入。圖5是各群分布氣泡圖。圖5中氣泡的大小代表客戶數的多少。SS7,SS8客戶群最大。橫軸方向越靠右,表明客戶價值越高。SS1,SS2,SS3群為高值的小商客;SS7,SS8為低值小商客。縱軸表明客戶的消費趨勢值情況,橫軸以下為下降趨勢,偏離越多,下降值越大。SS2群下降最多,SS1上升最為明顯。
以中值下降的SS6戰略客戶群為例進行特征分析,可得到該群特征如下:
(1) 群為中值下降群,ARPU值為93.35元。總費用趨勢下降較明顯,月均下降5.28元,各項費用均呈下降趨勢。
(2) 該群客戶為長話低值客戶,長話主要使用傳統長途。
(3) 使用他網卡較多,但他網IP卡下降趨勢明顯。SS6群使用非電信卡消費均值最高,長話流失嚴重。
針對上述情況,采用的營銷策略是用超級IP、商務行、17908卡等有針對性地開展策反工作。
圖5 小商客戰略群(SS1-SS8)分布氣泡圖
3 結 語
數據挖掘可以對大量數據進行自動分析,學習新的潛在模式。聚類分析能夠解決客戶分群問題,從而應用于電信目標市場營銷[10]。在此采用數據挖掘工具KXEN,并依據其方法給出一個電信客戶分群的解決方案。實踐證明這里提供的電信目標市場營銷客戶分群的解決方案是成功有效的。
參考文獻
[1]張建萍,劉希玉.基于聚類分析的K-means算法研究及應用[J].計算機應用研究,2007(5):166-168.
[2]朱明.數據挖掘[M].2版.合肥:中國科學技術大學出版社,2008.
[3]Olson D,石勇.商業數據挖掘導論[M].呂巍,譯.北京:北京機械工業出版社,2007.
[4]陶露菁.基于數據挖掘的電信客戶分群設計和實現[D].南京:南京大學,2005.
[5]鄧曉梅.基于數據挖掘的電信客戶細分模型研究[D].大連:大連理工大學,2006.
[6]張國祚.DW,OLAP和DM在電信經營分析系統中的研究與應用[D].南京:南京郵電學院,2005.
[7]蘇寧軍.采用聚類分析的數據挖掘技術進行電信市場客戶分群[EB/OL].http://www.billingchina.com/html/2006-07-03/1726.html,2006.
[8]劉文.凱森(KXEN)商業數據挖掘[EB/OL].http://www.datom-i.com,2008.
[9]劉文.KXEN市場細分教程[EB/OL].http://www.amteam.org/print.aspx?id=606090,2007.
[10]張永紅.電信大客戶營銷[M].北京:人民郵電出版社,2008.