趙穎 秦睿 林翠波 俸亞特
摘 要:客戶流失預警作為防止汽車4S店客戶流失的重要手段,不僅為當代車企提供了有效的經濟效益保證,也為車企對未來決策帶來了新的研究依據。為建立汽車4S店客戶流失預警分級標準,該文從客戶基本信息、車齡、車輛銷售價格、貸款金額、維修保養次數、維修保養時間等29個指標著手,基于粒子群優化BP神經網絡算法,建立汽車4S店客戶流失預警分級標準模型。該模型首先預測出客戶流失概率,然后根據值為0-1之間的概率大小分為1-5共5個等級,其中1表流失可能性很小,5表示流失可能性很大。最終得到測試集客戶流失預警從1到5等級的比例分別為71.39%、3.75%、3.50%、5.86%和15.50%。同時,通過訓練集中有78.65%的客戶未流失作為先驗概率,判定預測概率小于等于先驗概率為客戶未流失,大于先驗概率為客戶流失,得到該模型總體的準確率為91.71%。
關鍵詞:粒子群優化算法 BP神經網絡 客戶流失預警 分級標準 主成分分析
伴隨著我國汽車擁有量的不斷提高以及汽車行業經營環境的變化,國內汽車銷售行業面臨著巨大的競爭壓力,在汽車行業中,整車銷售的紅利時代已經過去,“高質量的售后服務”成為消費者選擇的一大要點,汽車售后服務已經成為各汽車廠家和經銷商最重要的利潤來源。當前,國內汽車售后服務同質化,可供選擇的店家多樣化且自由化,客戶的忠誠度逐漸降低,客戶流失問題日益凸出,售后服務成為我國汽車生產企業的軟肋,客戶流失成為售后服務領域共同的難題。因此,對汽車4S店客戶流失預警進行研究,為汽車4S店對流失客戶制定分類針對性的挽回策略提供依據,可以提高汽車4S店的管理效率,促進汽車服務行業中售后服務的管理,獲得良好的口碑[1],具有巨大的理論意義和實踐意義。
客戶流失預測發展歷程分為三個階段[2],分別是運用傳統統計學方法預測客戶流失階段、運用人工智能方法預測客戶流失階段、運用統計學習理論基礎預測客戶流失階段。目前客戶流失預測相關研究較多,運用神經網絡、決策樹、邏輯回歸、聚類分析等構建針對電信客戶的客戶流失預測模型[3-11],運用神經網絡等方法構建針對財務風險的客戶流失預測模型[12-16]。但在汽車4S店客戶流失預警方面的文獻較少,目前有運用TFM和RFM模型對汽車4S店客戶流失進行識別和預測[2,17-19],運用決策樹、隨機森林、Xgboost和Adaboost模型對汽車4S店客戶流失進行識別[20]。
現今,神經網絡是實現客戶流失預警模型的有力工具,目前已經成為預測客戶是否流失的重要模型,但其也存在容易陷入局部最優和在數據量較大時所需時間較長等問題。粒子群優化算法作為一種進化計算技術,簡單容易實現并且沒有許多參數的調節,目前已被廣泛應用于解決約束優化問題、解決函數優化的問題和神經網絡訓練等應用領域。因此,將粒子群優化算法與BP神經網絡相結合[21],可以更好實現汽車4S店客戶流失預警。
針對當前汽車4S店客戶流失日益凸顯、售后服務亟待提升等問題,本文提出了建立汽車4S店客戶流失預警分級標準模型,從客戶基本信息、車齡、車輛銷售價格等29個指標入手,基于粒子群優化BP神經網絡算法,對汽車4S店客戶是否流失進行預測。
1 模型構建
本文采用粒子群優化算法與BP神經網絡相結合的模型構建汽車4S店客戶流失預警標準,模型構建具體步驟如下:
(1)根據系統的復雜程度確定BP 神經網絡的結構,確定依據來源于數據和實際問題。假設樣本數據集有n個解釋變量,1個被解釋變量,那么BP神經網絡的基本結構為n個輸入神經元,1個輸出節點,隱含層神經元個數為以及其他參數,這些參數可以根據經驗值設定;
(2)將BP神經網絡中的權值和閾值映射到粒子上,粒子群搜索空間的維度數為,并設置粒子群優化部分的參數,和是固定的加速度常數,取值范圍在1到2.5之間;
(3)確定粒子群的適應度函數,確定判斷準則,即誤差精度,適應度計算公式為,
其中,N表示訓練集的樣本個數,為第i個樣本的觀測值,表示第i個樣本模型輸出的預測值。然后,迭代結束在適應度最低的粒子對應的位置,即問題的最優值;
(4)隨機初始化粒子群,產生一定數量的粒子及其相應的速度,組成一個群體;
(5)用粒子群優化算法訓練BP神經網絡,計算各自粒子的適應度,與誤差精度進行比較,若小于誤差精度則確定每個粒子的當前最好適應值和全局最優適應值。然后,在每一次迭代過程中,粒子通過個體極值和全局極值更新自身的速度和位置;
(6)更新粒子的位置和速度后,再計算新的粒子的適應度值,由于這里是對經典BP模型進行改進,所以采用的是神經網絡誤差計算使用的均方誤差函數,計算新粒子的適應度值;
(7)輸出最好的粒子,利用該粒子反映射出神經網絡的權值和閾值,即BP神經網絡的初始權值和閾值;
(8)將改進的BP神經網絡模型進行訓練,得到最終模型;
(9)利用上述模型對汽車4S店客戶的流失預警進行分級,共分為5級,具體劃分標準如表1所示。
客戶的流失預警分級構建流程如圖1所示。
2 汽車4S店客戶流失預警分級標準實證分析
2.1 數據來源
本文數據來源為全國應用統計專業學位研究生案例大賽“案例A”中的數據。
2.2 主成分分析
本文對客戶年齡、客戶性別和車主性質等29個指標進行數據預處理后,將其作為研究汽車經銷商客戶流失影響因素,運用主成分分析法對眾多變量做降維處理。為保留更多信息,本文保留前15個主成分,其含有原始變量至少80.8%的信息量。
2.3 客戶流失預警分級
將15個主成分帶入粒子群優化BP神經網絡的汽車4S店客戶流失預警分級標準模型進行訓練。
(1)粒子群優化BP神經網絡訓練過程
本文將訓練集中的15個主成分作為輸入樣本,模型輸出的汽車客戶流失的概率作為粒子群優化BP神經網絡的模型輸出,隱含層神經元個數定為5,從而確定粒子群優化BP神經網絡模型結構為15-5-1型,并設置BP神經網絡最大迭代次數為500,訓練結束的誤差精度為0.1,激活函數使用sigmoid函數,初始權值和閾值則是粒子群優化得到的最優粒子。
并且,設置粒子群優化BP神經網絡中粒子群優化算法部分的初始參數,設置和固定的加速度常數均為2,權重為0.2,最大迭代次數100。
將主成分分析后的訓練集中的34329個樣本數據,帶入上述設定好參數的粒子群優化BP神經網絡中進行訓練,得到如下優化過程中最優個體適應度值的折線圖2。
根據圖2最優粒子適應度值折線圖可以看出,整體呈現下滑趨勢,在迭代次數為100次時,出現了最優粒子最小適應度值為0.128,即測試樣本的誤差平方和降低到了0.128。將訓練集帶入訓練后的粒子群優化BP神經網絡模型對訓練集進行預測,探究該模型預測效果的好壞,得到粒子群優化BP神經網絡模型對訓練集進行預測的準確率達到了91.71%。
隨后,利用該粒子群優化BP神經網絡模型對測試集中6453個樣本數據進行測試,輸出測試集中每個汽車客戶流失的概率,根據模型構建章節中的汽車4S店客戶的流失預警分級標準表,對測試集中的汽車4S店客戶的流失預警進行分級并計算各等級比例,部分結果如下表2,并得到測試集汽車4S店客戶的流失預警各等級比例如下表3。
根據表3測試集汽車4S店客戶的流失預警各等級比例可以看出,在6453個客戶中,有71.39%的客戶流失可能性很小,有3.75%客戶流失可能性較小,3.50%的客戶流失可能性一般,有5.86%客戶流失可能性較大,而有15.50%的客戶流失可能是很大,需要加強對這批客戶的溝通與往來,防止客戶流失。
(2)分級標準模型評判
訓練集汽車4S店客戶的流失預警各等級比例如下表4。
從表3與表4可以看出,模型預測沒有偏離訓練時的效果,模型具有良好的穩定性。
2.4 模型評價
為判斷粒子群優化BP神經網絡模型預測的性能,本文將使用混淆矩陣來評判,即可以根據汽車客戶流失預測情況做出評判,通過設定汽車客戶流失預警的閾值,判斷該汽車客戶在模型預測中是否為流失客戶。
將訓練集中汽車客戶按是否流失進行分類,78.65%的客戶是未流失的,21.35%的客戶是流失的,得到客戶未流失的先驗概率為0.7865。本文使用該先驗概率作為判定客戶預測概率是否流失的閾值,若通過模型預測出來的客戶流失概率大于0.7865,則判定該客戶為流失,若預測值小于等于0.7865,則判定該客戶為未流失,進而得到訓練集的混淆矩陣如下表5。
27002個實際未流失客戶中有26344個預測為未流失客戶,有658個預測為流失客戶,在7327個實際流失客戶中有2190個被預測為未流失客戶,有5137個預測為流失客戶,整體預測正確率為91.71%,說明模型預測出的概率效果很好,達到預期目標,為后續進行汽車4S店客戶的流失預警分級打好良好基礎。
運用預測命中率和預測覆蓋率評價。其中預測精確率(Precision)為在實際流失的客戶中,模型預測出流失客戶所占的比例,預測命中率可以表示預測模型的精準性。
預測召回率(Recall)表示在真實流失的客戶中,被模型預測為流失客戶所占的比重,這是描述預測模型適用性的評價指標。
經過訓練集訓練的粒子群優化BP神經網絡的預測精確率為88.65%,說明客戶流失預警預測模型的精準性比較良好;預測召回率為70.11%,客戶流失預警預測模型適用性較強,也為后續流失預警等級劃分打下良好的基礎。
根據基于粒子群優化BP神經網絡的汽車4S店客戶的流失預警分級標準模型預測得到的結果發現,絕大部分客戶在短時間內是不會流失的,而另外一小部分的客戶會在短時間內流失,這也與實際的流失情況一致,先驗概率展現的是有78.65%客戶未流失,而流失預警等級劃分中1到3等級占比為78.77%,兩個占比是非常接近的,只相差0.12%,說明流失預警等級劃分中,4S店需要著重關注4和5兩個等級的客戶,因為這部分客戶有非常大的概率在較短時間內流失。綜上所述,說明基于粒子群優化BP神經網絡的汽車4S店客戶的流失預警分級標準,整體效果非常好,具有良好的預測能力,能為4S店后續的決策提供依據。
3 結論
本文基于粒子群優化BP神經網絡算法,設立汽車4S店客戶流失預警分級標準,給出相應的流失得分,實現對汽車4s店客戶流失預警。
在設立汽車4S店客戶流失預警的分級標準時,首先,基于粒子群優化BP神經網絡建立汽車4S店客戶流失預測分級模型,計算出相應的概率,以此定義客戶流失的分級標準,將概率p(0
基金項目:廣西高校中青年教師科研基礎能力提升項目《基于多模態UGC數據的游客滿意度提升研究》(2023KY0850);桂林旅游學院科研項目《基于函數型數據的景區客流量預測研究》(2023C02)。
參考文獻:
[1]Xuwei Qin, Lusheng Shao, Zhong Zhong Jiang. Contract Design for Equipment After-sales Service with Business Interruption Insurance[J].European Journal of Operational Research,2020,284(1):184-192.
[2]張寬.基于TFM模型的汽車4S店客戶流失預警技術應用研究[D].蘭州:蘭州理工大學,2019.
[3]Huang B,Kecvhadi M T,Buckley B.Customer churn prediction in telecommunications[J].Expert Systems with Applications,2012,39(1):1414-1425.
[4]Farquad MAH,Ravi V,Raju S B. Churn prediction using comprehensible support vector machine:An analytical CRM application[J].Applied Soft Computing,2014,19:31-40.
[5]Rizopoulos,Dimitris. Max Kuhn and Kjell Johnson. Applied Predictive Modeling. New York, Spring[J].Biometiics,2018,74(1):383-383.
[6]Dahiya K,Bhatia S. Customer churn analysis in telecom industry[C].2015 4th International Conference on Reliability,Infocom Technologies and Optimization (ICRITO).IEEE,2015:1-6.
[7]Li M,Yan C,Liu W,et al. An early warning model for customer churn prediction in telecommunication sector based on improved bat algorithm to optimize ELM[J].International Journal of Intelligent Systems,2021.
[8]Xu NL. Research and application of prediction model of telecom customer loss based on big data technology[J].ICT,2018,12(02):66-71.
[9]Li W,Zhou C. Customer churn prediction in telecom using big data analytics[C]//IOP Conference Series:Materials Science and Engineering[J].IOP Publishing,2020,768(5):052070.
[10]Zhao M,Zeng Q,Chang M,et al. A Prediction Model of Customer Churn considering Customer Value: An Empirical Research of Telecom Industry in China[J].Discrete Dynamics in Nature and Society,2021.
[11]Toor A A,Usman M. Adaptive telecom churn prediction for concept-sensitive imbalance data streams[J].The Journal of Supercomputing,2021:1-29.
[12]Odom M,Sharda R.A neural networks model for bankruptcy prediction[R].Proceedings of the IEEE International Conference on Neural Network,1990:163-168.
[13]Tam K,Kiang M.Predicting bank failure:a neural network approach[J].Applied Artificial Intelligence,1992,8:927-947.
[14]Boritz J E,Kennedy D B.Effectiveness of neural network types for prediction of business failure[J].Expert Systems with Applications,1995,9:503-512.
[15]Back B T,Sere K.Neural network and genetic algorithm for bankruptcy prediction[J].Expert Systems and Applications,1996,11:407-413.
[16]馮珍慧.基于粒子群優化BP神經網絡的上市公司財務風險預測研究[D].濟南:東華大學,2017.
[17]徐宏霞.汽車4S店客戶流失預警模型的研究[D].哈爾濱:黑龍江大學,2021.
[18]王玉鳳,孫文秀,杜夢嬌.改進RFM模型的汽車4S店客戶細分研究[J].計算機時代,2021(06):44-48.
[19]楊曉利.基于互聯網+的A汽車4S店客戶保持策略研究[D].北京:北京理工大學,2016.
[20]任露露.基于機器學習算法的汽車4S店流失客戶識別[D].蘭州:蘭州大學,2021.
[21]Huang J,He L.Application of improved PSO-BP neural network in customer churn warning[J].Procedia computer science,2018,131:1238-1246.