摘要:針對以往企業決策者難以掌握企業客戶的流失傾向,運用神經網絡的基本原理建立客戶流失預測模型,使得決策者在商業實施過程中能夠做到有的放矢,并且結合企業實例檢測了該模型的可靠性。
關鍵詞:客戶;經濟損失;神經網絡;客戶流失模型;可靠性。
中圖分類號:F224.33
文獻標識碼:A
一、引言
隨著中國企業體制改革的深入以及加入WTO后,中國各行各業面臨著前所未有的競爭壓力。面對這一強勁的壓力,國內許多企業把主要精力放在了拓寬市場、發展新客戶上,以至于冷落了老客戶,造成許多老客戶的流失。據調查發展一個新客戶所需要的費用是維持一個老客戶的6-8倍,同時,老客戶的交易額也往往要比新客戶大得多,因此,建立客戶流失模型,讓每個公司盡早地了解自己的客戶,對即將流失的客戶盡早地做出挽留措施,這樣可以大大地提高公司的競爭力。筆者的主要目的就是利用神經網絡的數據學習功能,通過對歷史數據的學習建立一個客戶流失模型,用于預測未來客戶的流失情況,以達到挽留即將流失的老客戶,使其繼續給企業帶來更大的效益。
二、神經網絡設計
神經網絡是基于生理學上的真實人腦神經網絡的結構和功能,并對其基本特性進行抽象、簡化和模擬而構成的一種信息處理系統。目前廣泛應用的BP神經網絡即反向傳播(Back Propagation)神經網絡,因其具有一些傳統技術所沒有的優點:良好的容錯能力、分類能力、并行處理能力和自學能力,在模式識別、圖像處理、預測和控制等方面得到很好的應用。筆者采用BP神經網絡建立客戶流失模型并進行預測,其拓撲結構由網絡的層數、隱層的節點以及節點的連接方式等組成。
(一)網絡層數的設計
BP算法的主要思想是把學習過程分為兩個階段:第一階段為正傳階段,即輸入信息經隱層處理并計算每個單元的實際輸出值傳輸至輸出層;第二階段為反傳階段。若輸出層未能得到期望的輸出值,則逐層遞歸計算實際值與期望輸出的差值即誤差,以便根據此差值調節各層神經元之間聯系的權值。其結構層數對網絡的性能具有重要的影響,嚴格意義上講,確定網絡層數的方法是通過大量實際問題的求解來尋求最合適的網絡層數。
(二)輸入和輸出層的設計
BP網絡的輸入與輸出層維數是根據所求解的任務和要求來確定。輸入層的配置必須考慮那些可能影響輸出的參數。這些參數隨問題的變化而變化。雖然網絡被假定為一個從輸入到輸出的未知函數和映射,但網絡的性能對輸入信息非常敏感,即輸入參數的合理選取可以提高網絡對未知問題預測的能力。根據影響客戶流失因素的程度,筆者選取業務年限等7個量化因子指標作為網絡的輸入(詳見3.3)。輸出層節點數為2,采用布爾型離散向量,(0,1)、(1,0)分別代表客戶流失、客戶沒有流失。
(三)隱層節點數的選取
筆者利用下述公式確定隱層節點數h
其中n為輸入節點數,m為輸出節點數。
同時,在網絡訓練過程中對h進行動態調整,即當網絡的誤差下降非常緩慢(小于0.01%),且網絡還沒有收斂到一定水平時,增加一個隱層節點。
(四)初始權值的確定
由于BP網絡的輸入與輸出關系是一個高度非線性映射關系,初始權值的選取對學習是否收斂影響很大。因此,在網絡訓練時,選取較小的不同的隨機數對網絡連接權值進行初始化訓練。
在上述分析的基礎上,針對客戶流失模型預測問題,經過多次調試,采用具有兩個隱層的四層BP網絡模型結構(如圖1所示)。其隱層節點數分別為22和8。隱層和輸出層都用s型轉換函數,分別為tansig、logsig、logsig。
三、數據的采集與處理
(一)數據的選擇
筆者選取某機械廠2005年的3500條客戶數據作為實驗數據。并隨機地選取2000個作為訓練樣本,1500個作為檢驗樣本。
(二)客戶流失的界定標準
作為訓練樣本和檢驗樣本,如何定量地確定一個客戶是否流失?經過一些數據分析,最終確定客戶是否流失的判斷條件是:
(1)客戶與公司半年沒有生意來往;
(2)客戶與公司半年的交易額僅為原來的1/3,而且,最近3個月沒有生意來往。
通過上述流失的判斷條件,我們對2005年的客戶數據重新整理發現2005年的3500個客戶中有652個客戶流失了,流失比例為18.62%。
(三)輸入因子的確定
通過對影響客戶流失狀況的因素進行分析,確定并選取業務年限(個月)、月交易額(萬元)、月交易頻率(次/月)、產品故障比例(%)、收入(萬元)、教育程度(小學:1,初中:2,高中:3,中專:4,大專:5,本科:6,研究生:7,博士以上:8)、年齡(歲)等7個量化因子作為指標進行建模。收集到的部分原始數據見圖2。

(四)數據的處理
對于多因子問題,由于指標之間存在著不可公度性和矛盾性,各指標的量綱、數量級和指標類型也不盡相同。為了消除這種差異對預測結果的影響,在評價時首先要對樣本數據進行規范化處理。筆者采用“最小一最大標準化”的方法對原始數據進行預處理,即將原始數據壓縮到區間上。其計算公式如下:
四、系統建模

筆者采用MATLAB6.5編程,各參數要求分別為:顯示頻率為50,訓練的最大步數小于50000,學習速率為0.01,訓練目標誤差小于0.01。用2000個訓練樣本來訓練網絡,經過23974步運算,網絡達到精度要求,即SEE=0.00999942,圖3為訓練誤差隨訓練次數的變化關系圖。然后利用訓練好的網絡對1500個檢驗樣本進行預測,期望輸出值與模型輸出值部分數據見表1。考慮到如果一個大客戶將會流失,卻被誤判為不會流失,從而造成給企業帶來極大的損失。因此,為減少誤判幾率的發生,筆者采用當模型兩個節點的輸出都小于0.5時,視為流失,其他情況下,則采取大小比較法,大的為1,小的為0。如表1中的第11條記錄模型值是(0.4767,0.4121),按大小比較法則為(1,0),但是由于兩個數都小于0.5,該系統判為流失。表2樣本檢驗時模型值與實際值的對比結果證明訓練好的BP神經網絡模型結果是可行的,并且有良好的泛化能力。
五、實例
本文將2006年的3740個客戶的各指標值輸入訓練好的BP神經網絡模型,結果有694個客戶判為在2006年流失,流失百分比為18.56%,這個流失比例與2005年的(18.62%)基本相符合。針對這694個將要流失的客戶,領導層可采取有效措施進行挽留,使之繼續成為企業的客戶,給企業帶來利潤。例如客戶同意在合同期滿后再簽2年的合同,就可以享受終生免費維修,在合同簽訂后的第一年,購買各種型號的產品,可以免費獲得相應配件一套等。
六、結論
綜上所述,利用BP神經網絡構建客戶流失模型的方法是可行的,通過運用此客戶流失模型進行客戶流失的預測也是可行的,它可以為決策者及時了解客戶流失情況發生,使得商業決策有了明確的實施對象。同時,還可以通過改變流失判斷條件,重新劃分客戶樣本,也可以改變輸入因子,通過此方法訓練出適合各個領域的企業客戶流失模型。
(責任編輯:習文)
注:本文中所涉及到的圖表、注解、公式等內容請以PDF格式閱讀原文。