程昊 樊重俊
引言
近年來,數據挖掘與數據倉儲成為企業掌握瞬息萬變的市場動向的利器。其中,最主要的功能在于能在龐大的數據庫中,找出前所未有的知識,并進一步地整合與累積成為企業賴以生存的商業智慧的一部分。換言之,數據挖掘提供管理者一個有效率的信息獲取方式,從龐大的使用者數據與交易記錄,取得隱含其中的寶貴信息。而傳統上利用市場調查與問卷方式來了解客戶滿意度的方式,可能會因為抽樣方式的不佳、受試者填答的真實性等等,而導致取樣誤差或分析偏差,進而影響結果的準確性;從現有企業的數據庫中利用數據挖掘的技術來進行數據分析,在許多的研究中都證明了可得到較佳的結果,此為本研究動機之一。所以,本研究將針對某知名電商企業所能提供的客戶數據庫做深入的分析,期望能利用數據挖掘技術中的人工類神經網絡方法來對客戶進行分類,并評估此模型的適當性。本研究的主要目的在于建立與評估人工類神經網絡模式應用于某電商企業的客戶流失模型;而主要的研究問題,則在于如何建立某電商企業的客戶流失模型,并希望能由電商企業所提供的客戶數據庫,挖掘出流失客戶的主要特性。
一、網絡客戶流失研究
客戶流失通常是指客戶終止使用企業的服務或產品。流失客戶可分為兩類,一類是已經流失的客戶,另一類是潛在的流失客戶,此類客戶表現出將要流失的趨勢,與企業的聯系及交易的頻率、金額等逐步減少。客戶流失預測是客戶關系管理(CRM)體系中一個重要的研究問題,現代客戶關系管理是以客戶為中心的一系列企業管理方式。CRM通過管理和分析存儲的客戶歷史數據,提升企業的產品和服務,幫助企業發展新客戶和保持老客戶,提高企業的競爭力。為有效地保持老客戶,需要構建高效的預測模型,發現潛在流失客戶。
客戶流失預測研究經過多年發展已經獲得不錯的成果,客戶流失中的一些問題也得到有效的解決。目前的研究,主要是客戶流失預測為分類問題。根據研究的發展階段以及不同階段,其使用的方法有聚類算法、回歸分析、決策樹算法等。這些算法構建的預測模型雖然可解釋性較強,但隨著數據量的增加,特別是進入大數據時代,對數據的處理能力嚴重不足。因此,使用人工智能的方法進行預測,人工智能中具有代表性的算法是人工神經網絡。
二、預測模型及規則
在某電商企業所提供的客戶數據庫中,經數據前置整理與數據剔除后共剩下7個變量可用,分別為性別、年齡、會齡、訂單金額、付款方式、居住地區與流失狀況;按流失及未流失的比例共抽出37 400筆數據作為訓練模式之用,而剩下的12 200筆數據則保留為測試之用。由于人工類神經網絡對于變量的選取有較大的自由度,沒有如回歸分析般的限制。因此,在網絡結構中的隱藏層數目、隱藏層中神經元數目、訓練的學習率大小等,都需要以主觀邏輯判斷,或以不同組合加以測試,并沒有一定道理可資遵循。因此,對本研究所需的網絡參數設置進行說明:一是輸入層的輸入變量,共有7個自變量,分別為性別、年齡、會齡、訂單金額、付款方式、居住地區、與流失狀況,因此設置7個輸入層的輸入變量。隱藏層數目,考慮網絡的學習速率,本研究采用的隱藏層數目為1。二是隱藏層中神經元數目,本研究設置隱藏層中神經元數目為11、12、13。三是訓練與測試樣本比例,訓練樣本與測試樣本的比例為8∶2,各為374與122筆。四是訓練的學習率,以0.002、0.004、0.006三種組合測試。五是輸出層的輸出變量。本研究為分類型的網絡問題,因此輸出層的輸出變量為l(未流失)、2(流失)的二元變量。
三、驗證預測規則準確率
本研究在人工類神經網絡模式的建構方面以MathWorks公司所出版的matlab軟件進行分析。在網絡參數的相關設置中,學習率將測試0.002、0.004、0.006等三種組合,而有關網絡停止訓練準則方面則以訓練數據的RMSE值(roott mean squared error,RMSE,均方根誤差)小于或等于0.0001,或最多訓練10 000次為條件,并以擁有最小測試數據RMSE值的網絡結構為最佳的網絡模式。在本研究中則以隱藏層中神經元數目為11、學習率為0.00U4的RMSE為最小(如表1所示),且重復測試10次,其值均在0.361793~0.363392之間,可見非常穩定。而由表2得知,整體的正確判別率為54.09%,而個別的判別正確率以{1-1}的比率最高,為92.3%,意即原始群體為第1類的樣本(未流失)被正確地判別到第1類(未流失)的比率為92.3%。
由上述的分析可知,本研究發現經由人工類神經網絡所分類出的流失客戶,其整體的正確判別率為54.09%;而檢視其分類后的結果,發現流失客戶的重要特征為男性、年齡介于30~40歲、會齡為1年、訂單金額為8 001~9 000元、以現金支付方式、居住在上海市內的客戶。此外,鑒于以往使用經驗法則來辨別客戶是否流失、進而采取保留客戶措施的手法不甚符合科學研究的精神,因此本研究所提出的人工類神經網絡的模式建構程序,不但在辦識客戶流失的正確率高,且執行效率頗佳,對于電商企業在進行客戶保留措施的決策上提供相當重要的線索,是一項值得建議使用的工具。
結語
本研究所提出的人工類神經網絡的模式建構程序,主要的目的是希望通過人工類神經網絡的學習、辨識能力,來發展一個更為快速、精確的分類模式。此外,為驗證所提模式的有效性,本研究利用某電商企業所提供的數據來進行實證研究。結果顯示,人工類神經網絡的整體分類績效為54.09%,具有頗佳的分類效果。所以,運用人工類神經網絡于電商企業以執行客戶流失分析是一項值得建議使用的工具。
參考文獻:
[1] ?武小軍,孟蘇芳.基于客戶細分和AdaBoost的電子商務客戶流失預測研究[J].工業工程,2017,(2):99-107.
[2] ?葉志龍,黃章樹.線上客戶流失的建模與預測研究[J].管理現代化,2016,(3):96-98.
[3] ?邵帥鋒.基于BP神經網絡對保險公司客戶流失進行分析和預測研究[D].蘭州:蘭州大學,2016.
[4] ?高潔.基于灰色模型和神經網絡的客戶流失量預測[J].內蒙古師范大學學報:自然科學漢文版,2015,(6):765-768.
[5] ?王學文,單其帥,魏彥鳳.基于BP神經網絡的電信客戶流失風險預測[J].科技視界,2013,(28):113-114.
[6] ?馮倩.網購客戶流失的實證分析[D].重慶:西南財經大學,2013.
[7] ?任劍鋒,張新祥.電子商務客戶流失的建模與預測研究[J].計算機仿真,2012,(5):363-366.
[8] ?林睿,遲學芝.基于人工神經網絡的電商客戶流失分析模型[J].電腦知識與技術,2012,(3):665-667.