楊欣
(北京農業職業學院,北京 100012)
基于客戶行為數據構建客戶分群模型的分析與探討
楊欣
(北京農業職業學院,北京 100012)
客戶分群是企業從大眾營銷向差異化營銷過渡的必由之路,也是未來保持競爭優勢的基礎。隨著社會經濟的發展和用戶需求的多元化,企業需要把識別客戶特征作為一項核心的市場分析活動,關注如何保持和拓展現有的客戶價值。文章從移動通信運營商的角度,闡述了建立客戶分群模型的理論基礎和技術手段,根據客戶行為數據采用聚類的數據挖掘方法構建總體模型,并對數據規范性、聚類算法以及模型分析方法等進行說明,提高客戶分群的有效性及應用價值。
客戶分群;模型;聚類;算法
在當前移動通信領域競爭日益激烈的情況下,企業必須認識到客戶才是運營商最重要的資產,運營商必須關注如何保持、拓展現有的客戶價值。識別客戶特征是一項核心分析活動,通過了解客戶的概貌可以指導運營商如何制定合理有效的營銷策略。
使用數據挖掘技術對客戶進行細分就可以識別具有相似特征的客戶群,這樣就可以了解各種不同的、具有各自特征的客戶情況,從而基于客戶分群工作進行進一步的客戶分析和市場策略制訂。因此客戶分群模型建立的意義主要就是通過對客戶進行分群,分析各種客戶群的特征來為企業管理層提供決策支持。
就市場營銷的理論來說,營銷手段可以分為幾個層次:首先是大眾營銷,對所有客戶進行不考慮特性差異的宣傳;然后是基于市場細分的營銷,把客戶分為幾個群體,對每個群體進行針對性宣傳,也就是所說的一對一精確營銷。
客戶細分的基本依據是每個客戶作為消費者對同一產品的具體功能需求和關注點是不同的。作為服務提供者的運營商必須盡可能地考慮這些差異,發現存在于客戶中的具有不同特征或消費習慣的客戶群體,在此基礎之上面向不同群體執行更具針對性的管理或營銷策略。
客戶分群總的來說有兩大類方法,一類是手工方法,一類是自動方法。手工方法就是人為地進行客戶劃分,即業務人員根據自己的業務知識以及對客戶的了解程度,出于某種管理或者營銷上的目的把客戶分為幾個群。這種分群的劃分原則是預先已知的,比如按照客戶消費額劃分成 “高價值客戶”、“低價值客戶”;按照是否大客戶劃分為“普通用戶”、“大客戶用戶”。這種手工進行客戶細分的方法通常只能考慮少數幾個變量,如果想多考慮一些變量,尤其是大部分連續型的行為變量,就必須使用自動分群方法了。
自動分群是通過使用數據挖掘提供的聚類算法,確定自己認為會有價值的輸入變量,通常數量較多,通過挖掘算法根據數據的特點決定把客戶分為不同群體,分出來的群與群之間差異盡可能大,群內差異盡可能小。
客戶分群的關鍵在于根據什么變量來進行細分。在移動通信行業,商家可以獲得的數據很多,主要有客戶行為數據、人口統計數據以及一些附加數據。其中客戶行為數據包括客戶通話清單數據、客戶賬務數據以及客戶撥打客服電話的記錄等,這些都是通過計算機采集到的,具有很好的數據質量,同時也是最有價值的客戶信息,是了解客戶特征的最重要的數據。因此,根據客戶行為數據進行客戶分群會具有更高的可用性。
客戶分群模型的建立需要依靠數據挖掘技術。通過客戶分群挖掘,企業能發現過去所不知道的客戶類型,對自己的客戶有更科學、更全面的了解,這無疑會使客戶管理工作和營銷工作能夠更容易地進行。比如,通過客戶分群了解不同客戶群的詳細的、特有的需求,這樣就能夠發現新的營銷機會;通過客戶分群了解不同客戶群的特點,這樣就能有針對性地開展差異化客戶服務,增加客戶滿意度;還可以基于客戶分群進行有針對性的營銷宣傳活動,這樣的宣傳會比無目標的大眾宣傳更加有效;等等。
數據挖掘技術可以分為兩種類型:預測型數據挖掘和描述型數據挖掘。
預測型數據挖掘是要從一系列數據中找出特定變量 (稱為“目標變量”)與其他變量(稱為“預測變量”)之間的關系,也就是掌握預測變量是如何影響目標變量的。
描述型數據挖掘是要在一系列預先不知道有任何關系的數據中查找關系的技術。描述型數據挖掘常用的技術有聚類和關聯分析。
聚類是要把整個數據庫分成不同的群組。它的目的是要使群與群之間差別很明顯,而同一個群內的數據盡量相似。與預測型挖掘不同的是,聚類是無指導的學習,體現在方法上就是不用指定目標變量。聚類算法有兩種:劃分聚類法和層次聚類法。其中劃分聚類法可以指定聚為幾類,層次聚類法由算法根據數據情況自動確定聚為幾類。神經元網絡和K-Means是比較常用的聚類算法。聚集之后最主要的是對分群的結果給出商業角度的解釋,這樣才有實際意義。
客戶分群就很適合使用聚類的方法。首先,通過聚類的數據挖掘把所有客戶按照特征分成幾群,建立客戶分群模型;其次,分析各群客戶的特征,主要是行為特征;再次,分析每一群客戶特征體現出來的信息有什么商業價值,為管理和營銷人員提供制定管理或營銷計劃的依據;最后,建立完善的分群模型維護流程以適應市場的變化。還可以從客戶發展的角度考慮,根據客戶產生的收益、客戶通話行為特征、客戶信用度風險等數據進一步建立客戶價值評估模型,對客戶群進行更深入的挖掘與分析。
3.1總體框架
(1)基于客戶行為數據,使用各種聚類算法生成客戶分群模型;
(2)分析不同算法得到的分群結果,選取最好的模型,好模型的標準是群與群之間差異盡量大而群內差異盡量小;(3)使用挖掘工具提供的數據探索工具分析各客戶群特征;(4)建立客戶信用度風險評估模型,給出每個客戶的信用度風險指標;
(5)建立客戶價值評估模型,根據客戶所產生的消費額、客戶通話行為以及客戶信用度風險指標建立一個全面評估客戶價值的客戶價值函數,更合理地評估每個客戶的價值。
3.2數據規范性
K-Means聚類算法是采用計算距離來度量記錄之間的差異大小。這種方法決定了聚類所輸入的數值大小不同對結果的影響是不一樣的。取值比較大的變量,比如通話時長,變量單位通常是秒,值都非常大,這樣在計算對象差異性的時候,這個變量的影響就會很大;然而對于一些取值比較小的變量,比如通話次數,取值就不會很大,這樣計算差異的時候該變量的影響度就會減小。
在進行聚類之前應該對數據進行規范化處理,這樣可以大大提高聚類的效果。常用的規范化方法有最大-最小規范化和Z-SCORE規范化。其中最大-最小規范化是把數據在指定的區間內進行等比縮放;Z-SCORE規范化是計算每一個變量與平均值之間的差異大小和平均差異(使用標準差或者平均絕對偏差)的比值。本文采用的是Z-SCORE規范化方法,具體過程如下:
(1)計算平均絕對偏差(mean absolute deviation)Sf
式(1)中,x1f,…,xnf是變量f的n個度量值,mf是f的平均值,即:
(3)計算斜率

以上三步都是通過SQL在數據庫中進行的,這樣經過規范化后的數據就可以用來進行聚類了。
3.3建立聚類模型
K-Means聚類算法對于處理大數據集情況的效率是很高的,因此選擇使用K-Means算法進行聚類。K-Means算法工作流程如下:
(1)任意選擇K個對象作為初始的簇中心(K預先指定);
(2)Repeat;
(3)根據簇中對象的平均值,將每個對象重新賦給最類似的簇;
(4)更新簇中的平均值,即計算每個簇中對象的平均值;
(5)Until不再發生變化,直到達到某個閾值。
在實際的模型建立過程中,通過聚類共獲取到12個客戶群,這里不再進行詳述。
3.4模型分析
分析方法是把模型提供的各變量組內均值做最大-最小規范化后,劃分出各類的優勢特征和弱勢特征,從而給各組一個描述性的名字。給出的名字反映的是該組最大特征,但并不是唯一特征。分析過程中把各變量規范化為0~10的公式如下:
V_N=((V-MIN_V)/(MAX_V-MIN_V))×10(4)
式(4)中,V是被規范化的值、V_N是被規范化后的值、MIN_V 是V值所在變量的最小值、MAX_N是V值所在變量的最大值。
這樣變量的所有值將會被規范化為從0到10的區間,原值被等比縮放。這樣一個值在同一個變量中比其他值大還是小就很明顯了。各值只和同一個變量的其他值有可比性。在分析過程中,規范化后的值被標上了不同顏色,這樣對各類進行分析的時候對其優勢字段、弱勢字段就能一目了然。
分析過程中判斷一個變量是否優勢字段,不光看某類中這個變量大還是小,還要看其他類在該變量上的取值情況。例如,如果某類中一個變量取值很大,但是其它類在該變量上的取值同樣也很大,那么這個變量就不是優勢變量。
以上僅是對客戶分群模型構建的初步分析,通過模型可以得到各群用戶的顯著特性,并針對各客戶群的特性給出一定的市場建議。可能有些建議并不是很可行,但客戶分群的思想以及所獲取的客戶分群模型還是極有效的,未來基于該模型可以做很多事情,達到目標明確、事半功倍的效果。
例如,通過了解各客戶群的優勢特征和弱勢特征可以識別新的營銷機會,從而有針對性地進行差異化套餐設計;客服部門可以參考客戶分群的結果對不同類型的客戶進行有針對性的差異化客戶服務;市場部門再設計促銷活動的時候,可以參考客戶分群情況來選擇正確的宣傳目標和途徑;客戶分群還可以與離網預測模型相結合,在進行客戶挽留的時候了解挽留目標的特征無疑是很有幫助的。
10.3969/j.issn.1673-0194.2015.21.036
TP315
A
1673-0194(2015)21-0074-02
2015-07-27
楊欣(1981-),女,山西太原人,北京農業職業學院講師,碩士,主要研究方向:企業管理、信息化管理。