冀慧杰,倪 楓,劉 姜,趙 燚
(上海理工大學 管理學院,上海 200093)
客戶關系到企業的生存與發展,贏得客戶的青睞就能獲得市場.市場營銷理念在發展過程中越來越重視客戶的需求,以顧客為核心,把滿足顧客需求作為首要任務.不斷提高顧客滿意度,培養忠誠客戶對企業至關重要.根據中國電子商務報告,2018年我國電子商務交易規模繼續擴大并保持高速增長態勢,全年實現電子商務交易額31.63 萬億元,同比增長8.5%.隨著網購消費者數量逐漸增加,對客戶的管理更加有必要而且方便有效.通過細分客戶,分析每一類客戶群體的購買行為以獲得不同客戶群體的價值,有利于企業實施差異化營銷策略.網絡的發展真正實現了精準營銷,電子商務企業可以方便地獲得客戶的購買記錄,包括購買內容、購買時間以及購買金額等,通過客戶購買數據可以分析客戶偏好,準確衡量客戶價值,制定出適合相應細分客戶群的營銷策略.
RFM 模型可用來衡量客戶利潤貢獻度和忠誠度,廣泛應用于零售及其它行業.Chen 等使用RFM 模型對在線零售商的客戶進行分析,通過聚類算法和決策樹識別每個客戶群的主要特征[1].徐翔斌等提出改進的RFP 模型,用利潤指標替換金額指標對電子商務網站客戶進行細分,但是對指標設定的權重是隨機的,缺乏一定的客觀性[2].徐文瑞用層次分析法(AHP)確定RFM 模型中的各指標權重[3].包志強等通過改進RFM 模型對百度外賣客戶進行價值分析,用主成分分析確定各指標權重[4].熊蘭等通過對零售企業的產品類別進行區分,將客戶的價值按產品類別區分,創建多層級的客戶價值模型[5].Zhang 細化了RFM 指標,利用K-means 聚類算法為體育文具產業進行客戶數據挖掘給予指導[6].綜合各學者研究來看,RFM 模型仍是根據客戶消費行為衡量客戶價值的有效方法,本文借鑒以往學者對RFM 模型各指標的改進并結合本文研究構建RFMT模型.其次,以往文獻關于權重的確定大多采用層次分析法(AHP),有些學者會采用客觀法例如主成分分析和熵權法,然而皆未考慮RFM模型各指標之間存在關聯的問題.本文基于灰色系統理論利用灰色關聯度為改進的RFMT 模型指標確定權重,綜合整個因素指標空間的影響,分析各指標對衡量客戶價值的影響程度大小.最后,由于K-means算法存在對初始聚類中心以及聚類數敏感等缺點,本文運用K-means++和肘部法則對其進行改進,進而對在線零售商的客戶的購買行為進行分析,并將客戶分為價值由高到低的客戶群.
企業在進行客戶關系管理時,經常使用RFM 模型來分析客戶價值,尤其是零售業的客戶管理.RFM 模型通過3 個指標來衡量客戶的價值,即Recency (最近購買時間)、Frequency (購買頻率)以及Monetary (購買金額).其中最近購買時間R指的是客戶最后一次購買產品的時間與對客戶購買行為分析時間的間隔,間隔越小表明客戶對產品印象越深刻,因此對廣告、促銷活動等反應越快,更容易發生重復購買行為;購買頻率F表明客戶在一段時間內購買產品的次數,頻率越大意味著客戶頻繁購買產品,對企業品牌或該類產品已形成偏好,更容易發展為忠誠客戶;購買金額M是客戶直接為企業帶來的價值.高價值客戶往往購買頻率高、購買間隔時間短以及購買金額高.
RFM 模型的優點在于收集數據容易,3 個指標能夠清楚地解釋顧客的行為.RFM 模型能夠清楚表征客戶當前價值,然而在如今市場競爭激烈的情況下,客戶的潛在價值即未來能夠帶給企業的價值更加重要.王客富認為客戶的保持時間與忠誠度有密切聯系[7].客戶的忠誠度則是客戶潛在價值的體現,因此擴展RFM模型對客戶忠誠度進行度量.傳統的RFM 模型指標不夠全面,并且指標的權重確定大多以主觀判斷為主,影響結果的客觀性.為了更準確地對在線零售商的客戶進行當前和潛在價值分析,提出改進的RFM 模型,選取客戶的平均購買時間間隔(R)、客戶在活躍時間內的購買頻率(F)、平均每筆訂單交易金額(M)和客戶在一年內的活躍時間(T) 4 個指標構建RFMT 模型.為了抵消購買頻率與購買金額之間的多重共線性關系,用平均訂單交易金額代替總購買金額;客戶的購買頻率描繪客戶在一年內的訂單數量,訂單數量越多,客戶的購買金額越大,為企業貢獻的價值越大,RFM 的3 個指標衡量了客戶的當前價值.F和T指標是對客戶潛在價值的衡量,客戶的活躍時間能夠反映客戶對企業的忠誠度,活躍時間越長,購買頻率越大,說明客戶的滿意度越高,越容易發生購買行為.所構造的RFMT模型各指標的計算公式如下:

其中,BT表示客戶在活躍時間內發生購買行為的天數;MT表示總購買金額;TL表示最遠一次購買時間;TF表示最近一次購買時間.
RFM 模型中各指標對客戶價值的影響程度是不同的,通過對RFM 模型中的指標賦予不同的權重能夠幫助企業更準確地分析客戶行為,采取科學的管理措施.人們所面臨的實際決策問題的各因素指標之間的關系表面上看不明確,實際上卻并不是獨立的,常存在相互聯系,這是灰色的關聯性在起作用[8].灰色關聯分析的基本思想是通過確定參考數據列和比較數據列的幾何形狀相似程度來判斷其聯系是否密切,通常可以運用此方法來分析各個因素對于結果的影響程度.采用灰色關聯法確定指標權重的優點在于其可以挖掘出數據本身具有的關聯性,從而避免了如層次分析法等所包含的主觀因素的影響.本文在衡量電子商務客戶價值時所采用的實驗數據是有限的,根據以往文獻對客戶價值的衡量在有限的信息下提煉出了RFMT 的4 個指標.RFMT 這4 個指標是根據客戶購買時間、客戶購買金額以及客戶的訂單量4 個指標計算得到,由計算公式可得各個指標相互之間存在關聯,RFMT 模型及指標關聯性如圖1所示.各指標在時間和購買行為上存在一定的關聯性,因此可以將客戶價值看作是一個灰色系統,通過灰色關聯度尋求RFMT各指標對客戶價值的影響程度.通過灰色關聯度[9,10]確定各指標權重,指標的權重值即代表了對客戶價值的影響程度.

圖1 RFMT 客戶價值分類模型
利用灰色關聯度確定指標權重的計算方法如下:
步驟1.根據數據處理結果選取購買時間間隔、購買頻率、平均購買金額以及客戶活躍時間4 個指標變量形成矩陣:

步驟2.從4 個指標中選出各自的最優值作為參考數據列,最優值代表最理想的客戶類型,即客戶價值最高.記為:

步驟3.指標數據值的范圍相差較大,采用均值化方法進行無量綱化處理.無量綱化后的數據形成新的矩陣:

步驟4.計算第i個數據的第k個指標與參考序列相比較的關聯系數:

其中,k=1,2,3,4,ρ為 分辨系數,0 <ρ<1,一般取ρ=0.5.

步驟5.對每一個指標的關聯系數求平均值:

步驟6.做歸一化處理即可得到各指標的權重:

K-means 算法是數據挖掘最經典的聚類算法,也是客戶細分經常使用的方法.算法的基本思想是根據樣本之間的距離分類.先指定所需分類類別K類,隨機生成K個聚類中心,將各個樣本分到離聚類中心最近的一類,通過不斷迭代更新聚類中心,達到最優分類效果.算法采用誤差平方和準則函數SSE 作為聚類準則函數.K-means 算法的缺點是對初始聚類中心的選取是隨機的,聚類的結果和所需時間依賴初始質心的選擇,并且需要預先設定聚類數.為了解決K-means 對初始點敏感的問題,Arthur 等提出了K-means++算法,對K-means 隨機選擇初始聚類中心的方法進行了改進,即在選取初始聚類中心時使各聚類中心點之間的距離盡可能遠,結果證明K-means++能顯著改善分類結果的最終誤差[11].為了改善聚類數設定的問題,本文利用SSE 評價聚類結果,通過肘部法則確定最佳聚類數.算法的具體步驟如下:

其中,x為每一簇內的樣本點,μi表示第i個簇的聚類中心點.

算法1.K-means++算法1) 從數據集中隨機選取一個樣本作為初始聚類中心;2) 首先計算每個樣本與當前已有聚類中心之間的最短距離(即與最近的一個聚類中心的距離),用D(x)表示;接著計算每個樣本被選為下一個聚類中心的概率 ;3) 重復第2)步直到選擇出共K 個聚類中心.4) 使用選出的聚類中心用K-means 聚類.5) 比較不同聚類數得到的SSE 值,利用肘部法則確定最終聚類數目.D(x)2∑x∈X D(x)2
數據集從UCI Machine Learning Repository 數據庫中獲得,這是一個跨國數據集.該在線零售商總部位于英國,成立于1981年,主要銷售各種場合的獨特禮品.該企業的主要客戶來自英國和歐洲各地,之前主要通過郵寄目錄,通過電話下訂單的模式經營.目前,該企業已完全轉向了電子商務,積累了大量客戶的數據,因此可根據積累的數據集對客戶進行管理.該數據集其中包含2010年12月1日至2011年12月9日之間在英國注冊的非商店在線零售的所有交易.該公司的許多客戶都是批發商,因此客戶與企業的每筆交易中可能包含多種商品,每筆交易有唯一的發票編號,默認為一次購買.數據集包含了4296 個客戶在一年內的訂單數據,共有406829 條交易記錄,包含7 個變量,各變量含義如表1所示.Python 是目前最流行的用來做數據分析與數據挖掘的語言,本文利用Python 軟件進行實驗.對該數據集處理,構造RFMT 模型以及進行聚類分析,驗證所提客戶價值分類模型的可行性,為電子商務企業的客戶管理提供參考.
首先從原始數據集中提取出有用的信息經過分析得到的RFMT 數據表如表2所示.如編號為12346 的客戶,平均購買時間間隔為1 天,購買頻率為4 次,平均購買金額為22.25,活躍時間為1 天,說明該客戶在一天內發生了4 次購買交易.

表1 數據集的變量描述

表2 RFMT 指標數據樣本
其次利用灰色關聯度確定各指標權重.從4 個指標中選出最優值即從購買時間間隔數據中選取最小值,從購買頻率、平均購買金額以及客戶活躍時間數據中分別選出最大值組成參考數據列,參考數據列各指標構成了企業理想的客戶即價值最高的客戶.經過灰色關聯分析后得出的各指標權重值如表3所示.

表3 灰色關聯度確定指標權重值結果
表3結果表明,指標F和T的權重值相對較大,平均購買金額M的權重最小.分析可知該權重值結果以客戶潛在價值最大是影響客戶價值的最重要因素.對電子商務企業來說,客戶的潛在價值即客戶忠誠度才是最重要的.客戶平均購買金額與購買頻率有關,購買頻率越大則總購買金額越大,這在實際中反映了購買金額的大小不能準確體現出客戶的價值,即一次大金額的購買行為可能沒有多次頻繁小批量購買的客戶帶來的價值更高,因此購買頻率更能體現出客戶的當前價值.客戶活躍時間越久則忠誠度越高,流失傾向越低,T指標代表了客戶價值中的潛在價值,因此T指標的權重值較高.平均購買時間間隔與購買頻率息息相關,購買頻率越多則平均購買時間間隔越小,R指標越低,意味著客戶需求量大且對企業產品形成偏好.分析權重結果及各指標的實際意義,平均購買金額越大的購買頻率和活躍時間對客戶價值高低影響最大,平均購買金額影響最小.
最后由于選取的平均購買時間間隔、購買頻率、平均購買金額以及客戶活躍時間4 個指標的意義不同、數據范圍差異較大,為了消除對聚類結果的影響,對數據按下列公式進行無量綱化處理.

本文首先使用K-means++算法進行聚類,設置分類數目K的范圍為[1,8],根據聚類代價函數即誤差平方和SSE繪制分類效果圖如圖2所示.然后根據肘部法則聚類數應為K=2,但分為兩個簇時誤差較大,考慮到對客戶分群的需要,確定聚類數為K=4,這時的誤差平方和較小且能對客戶群進行細致的劃分.設定聚類數目為4 時,分群結果及客戶價值排名如表4所示.

圖2 不同聚類數目下SSE 值

表4 聚類結果
根據聚類結果每一客戶群的聚類中心點并結合上節各指標權重值對每一客戶群體的消費行為進行分析,發現客戶群在平均購買金額上沒有體現出太大的差異,但結合頻率來看總購買金額差異較大.這也正好說明了該企業需要關注的是客戶的購買頻率和購買時間間隔.表4結果表明在平均購買時間間隔、購買頻率和客戶活躍時間3 個指標上各客戶的行為差異顯著.
客戶群1 在購買頻率和活躍時間上是所有群體中表現最差的,但是平均購買時間間隔是最小的,結合購買時間間隔和活躍時間來看可以說明客戶群1 的客戶處于兩種狀態:已流失和新客戶.客戶群2 的活躍時間是最長的、購買頻率和購買金額最高,平均購買時間間隔也較短.客戶群3 的活躍時間較長,但是在平均購買時間間隔和購買頻率上表現均較差.客戶群4 在平均購買時間間隔上和購買頻率上表現較為顯著,但是活躍時間較短.
本文根據該實驗數據集進行聚類分析得出的結果,結合對每一客戶群各個指標的分析,按照價值排名和客戶群的行為特征將該企業客戶分別定義為:重要保持客戶、重要發展客戶、重點關注客戶和一般價值客戶.
對重要保持客戶,即客戶群2.該客戶群體人數為831 人,他們價值排名第一,是企業所有客戶中最為理想的客戶類型.該客戶群的生命周期最長、購買最頻繁、交易的金額也最大,說明該客戶群是滿意度最高的,已對該企業產品形成偏好,能持續為企業帶來價值.面向該類客戶群,企業需要積極提供售后服務,定期回訪與關懷,主要是向該客戶咨詢其關于產品和服務的看法,對該客戶群采取服務差異化的策略,維持好與該客戶群的關系,發展該客戶群成為企業的忠誠客戶群.
對重要發展客戶,即客戶群3.該客戶群價值排名第2,有913 人.該客戶群在平均購買時間間隔、購買頻率和購買金額上僅次于重要保持客戶群,但活躍時間較低.為避免該客戶群發生流失行為,企業應該投入更多的精力和資源去關注這類客戶,面向該客戶群體進行宣傳以實現精準營銷,并給予該客戶群一些購買優惠,促使該客戶發生持續購買行為,延長該類客戶的生命周期,使該客戶群發展為企業的高價值客戶.
對重點關注客戶,即客戶群1.客戶群1 的人數是最多的,同時因為此類客戶處于兩個狀態:已流失或者新客戶,這說明企業中存在大量流失的客戶或新增很多新客戶.對電子商務企業來說,這兩類客戶至關重要.客戶流失率較大的話,企業很難培養出龐大的忠誠客戶群,同時該企業的口碑會受到影響.新客戶較多時,企業應該盡量保留住該客戶群.如果流失客戶人數占比較多,企業需要關注導致客戶流失的原因,分析流失客戶群購買的產品,發現問題后及時調整其產品和服務策略,降低流失率;如果新客戶數量居多,企業需要分析是由于特殊節日還是最近的營銷活動所帶來的新客戶,同時在未來的一段時間里需要經常面向這些新客戶宣傳,在客戶心中留下印象,關注該類客戶的動態,促使新客戶發生重復購買行為,使其成為長期客戶.
對一般價值客戶,即客戶群4.雖然他們的活躍時間相對較久,但購買頻率較少,平均購買時間間隔也較長,說明該類客戶不經常發生購買行為,只在有需要的時候會想到該企業并發生購買行為.且該客戶人數較少,為企業帶來的價值較低,是低價值客戶,因此企業只需做好廣告營銷,不用投入過多精力去關注該客戶群.
電子商務企業能夠收集到豐富的客戶購買行為信息,通過對客戶行為信息進行分析有助于企業更好地實施營銷活動.針對現有模型普遍基于RFM 和K-means對客戶價值進行分類,對指標權重的確定大多采用AHP 法,沒有考慮到RFM 模型指標相互之間的聯系.本文對真實的電子商務客戶龐大的交易信息進行分析,根據數據集所包含的客戶行為數據的信息,提出改進的RFMT 模型選取合適指標,采用灰色關聯的權重確定方法,并結合數據挖掘算法對客戶進行聚類分析.使用改進的RFMT 模型及灰色關聯度的權重確定方法,能更好地衡量客戶價值;根據肘部法則確定聚類數目,運用K-mean++聚類分析的結果誤差更小,基于RFMT模型對客戶群的分類更加細致,能幫助企業識別出需要重點關懷的客戶和重點關注的客戶,提高企業對流失客戶群的防范意識和對新客戶群體的重視.本文對客戶價值細分的方法也適用于其它電子商務企業,該模型能夠對客戶價值進行合理的辨別,通過識別出不同客戶群的價值及行為特征,有助于企業針對不同客戶群體采用不同的客戶關系管理手段,合理安排資源投入,實現效率最大化.