


摘 ?要:隨著中國電信業改革不斷深入,電信市場日趨飽和,各大運營商都面臨日益嚴峻的客戶流失率飆升問題,如何識別高風險流失客戶是運營商最為關注的問題。因此,文章借助西安財經大學行知學院校企合作單位的真實客戶數據,通過R語言編程,使用數據挖掘中的決策樹模型來形成一個系統的客戶流失預警監測過程,幫助合作企業提前識別高風險客戶流失。結果發現畫像符合套餐使用月數在25個月以上、有服務合約、是集團用戶的客戶更不易流失。
關鍵詞:數據挖掘;客戶流失;預警;決策樹
中圖分類號:TP319 ? ? ?文獻標識碼:A 文章編號:2096-4706(2020)13-0055-03
Abstract:With the deepening reform of Chinas telecom industry and the saturation of the telecom market,major operators are facing the increasingly serious problem of soaring customer lose rate. How to identify high-risk customer lose is the most concerned issue for operators. Therefore,with the help of the real customer data of school-enterprise cooperation units of Xingzhi College of Xian University of Finance and Economics,this paper through R language programming,uses the decision tree model in data mining to form a systematic early warning and monitoring process of customer lose,and helps cooperative enterprises to identify high-risk customer lose in advance. The results showed that the portrait was more than 25 months old,signed a service contract,and the group users were less likely to lose customers.
Keywords:data mining;customer lose;early warning;decision tree
0 ?引 ?言
我國主要的3家電信運營商分別是中國移動、中國電信和中國聯通。在過去的10年里,這3家公司都得到了極其快速的發展。這種發展主要來源于移動通訊設備的普及以及發卡量的增長。但是,在過去的5年里,客戶量的增長速度緩慢,同時發卡量似乎不再增長。如何實現業務增長,成了三大運營商頭痛的問題。與此同時,運營商之間相互挖客戶墻角的問題時有發生,客戶流失率的急劇上升成為了各大運營商最為直接的難題,尤其是優質客戶的流失更是會造成企業極大的經濟損失。從運營成本來看,引進新用戶的成本遠高于維護一個優質的老客戶,會對企業的收益產生較大影響。因此,為了幫助企業在客戶流失前提前做出預警防范,文章使用數據挖掘分類算法中的組合預測樹模型建立了一套具有實際意義的預警檢測系統,為企業留住客戶提供指導策略。
1 ?變量的獲取與說明
本案例使用的數據來自某移動公司當月的客戶信息統計,該企業為我校對口實踐實習單位,共4 975條數據,缺失值已處理。因變量是否流失的數據來源于下一個月,自變量的數據來源于當月。數據包含8個變量:1個因變量、7個自變量,其中定性變量6個,定量變量2個。因變量為流失客戶,為定性變量,1代表客戶流失,0代表客戶未流失;套餐金額為定性變量,共3個水平:1為96元以下,2為96到225元,3為225元以上;改變行為為定性變量,1代表曾改變過套餐金額,0代表未曾改變過套餐金額;服務合約為定性變量,1代表曾經簽訂過服務合約,0代表未曾簽訂過服務合約;關聯購買為定性變量,1代表同時辦理一項其他業務,2代表同時辦理兩項其他業務,0代表沒有辦理其他業務;集團用戶為定性變量,1代表是集團用戶,0代表不是集團用戶;額外流量、套餐使用月數均為定量變量。
2 ?描述性分析
2.1 ?集團用戶對客戶流失的影響
通過繪制馬賽克圖,了解是否是集團用戶在流失用戶中所占比例的大小。在圖1中,橫坐標表示客戶是否流失,縱坐標表示客戶是否為集團用戶。結果顯示,在流失的客戶群體中,不是集團用戶所占比例較大,是集團用戶所占比例較小,說明是集團用戶的客戶更不易流失。同時通過卡方檢驗得知二者所對應的概率P值小于0.000,應該拒絕集團用戶和流失用戶之間相關獨立的原假設。說明集團用戶與客戶流失不獨立,是否是集團用戶對客戶是否流失有顯著影響。
2.2 ?服務合約對流失客戶的影響
通過服務合約與客戶流失兩變量的二維列聯表與卡方檢驗來分析其影響顯著性。由表1交叉列聯頻數表可知,在客戶流失的個體中,無服務合約的客戶有3 340人,有服務合約的用戶為554人。無服務合約用戶中客戶流失的個體占88.9%,有服務合約用戶中客戶流失個體占45.5%,說明有服務合約用戶的個體更不易流失。服務合約與客戶流失服從自由度為1的卡方檢驗,對應的概率P值小于0.000,應該拒絕客戶流失與服務合約之間相互獨立的原假設。說明服務合約與客戶流失不獨立,是否簽約過服務合約對客戶是否流失有影響。
3 ?預警模型的建立
3.1 ?數據挖掘
數據挖掘是從當下海量不完全、模糊的數據中提取未知但隱藏在其中的潛在有價值信息的過程。數據挖掘常使用的軟件有Weka、KNIME、RapidMiner、R-Programming、Kaggle
等,常使用的算法包括分類算法、聚類算法、關聯規則等,其中分類算法包括決策樹、邏輯回歸、神經網絡、支持向量機、Boosting等,本文通過使用分類算法中的組合決策樹在R軟件中完成數據挖掘全過程。
3.2 ?組合決策樹的構造
決策樹分類是最典型的一種分類方法,從實例集中構造決策樹,先根據訓練子集形成決策樹,然后根據葉節點的類稱號進行檢驗記錄分類。其核心環節在于解決訓練記錄的分裂和何時停止分裂的問題。解決第一個問題的關鍵在于屬性測試條件的合理決策;解決第二個問題最好的辦法是當樣本數量小于某個特定閾值時停止分裂。通過使用RStudio軟件編程建立的組合決策樹算法調試代碼如下:
install.packages("ipred")
library(ipred)
set.seed(1234)
m=m[,-1]
m$流失用戶<-as.factor(m$流失用戶)
m1<-bagging(m$流失用戶~.,data = m,nbagg=25,coob =TRUE)
pre<-predict(m1,m,type = "class")
hx<-table(m$流失用戶,pre)
E1<-(sum(hx)-sum(diag(hx)))/sum(hx)
并且,得到的預警監測模型如圖2所示,在根節點中總樣本量為4 975人,其中流失客戶有3 894人;最優特征變量為使用月數在取值25處將決策樹分裂為0、1兩部分,其中預測客戶未流失1 020人,預測客戶流失3 955人,預測未流失人數中與真實未流失結果一致的有1 020人,預測流失人數中與真實流失結果一致的有3 894人。結果顯示使用月數是客戶是否會發生流失的最重要因素,當使用月數大于等于25時,客戶流失率最低。
通過數據挖掘方法中的決策樹分類模型進行客戶的流失監測,將預測結果和真實數據進行對比做組和決策樹混淆矩陣,結果如表2所示,真實未流失客戶有1 081人,預測未流失客戶有1 020人,精確率=1 020/(1 020+61)=94.36%,準確率=(1 020+3 894)/(1 020+61+0+3 894)=98.77%,預警模型的預測準確率高達98.77%。
4 ?遏制用戶流失的措施
手機客戶流失預警監測結果說明,在使用月數這一特征上,用戶使用月數小于25個月的用戶基本都流失了,使用月數大于25個月的用戶都得到了保留。在關聯性購買特征中,沒有辦理過其他業務的用戶容易流失,辦理過其他業務的用戶能得以保留。對于服務合約特征來說,有服務合約用戶的個體更不易流失,應該注意無服務合約這一用戶群體可能會流失。集團用戶特征中,非集團用戶中客戶流失的個體占88.1%,集團用戶中客戶流失個體占45.0%,說明是集團用戶的個體更不易流失,運營商也應注意不是集團用戶的群體可能會有流失的危險。其他影響因素因效果不顯著,均未進入預警模型。
所以運營商應在推廣各種套餐、關聯購買活動、簽訂服務合約、辦理集團用戶等方面加大力度取得客戶信任,使得客戶對運營商更加信任,進而將客戶的套餐使用月數提升到25個月以上。除此以外,運營商可以從以下幾方面著手遏制用戶的流失。
4.1 ?提升用戶的忠實度
提升忠誠度對每一個以客戶為中心的企業來說都是長久生存之道。結合老客戶的使用習慣、話費回贈、專屬優惠等活動制定出不同的VIP高級套餐,以保證老客戶的高端心理預期;考慮新客戶的現有需求制定靈活多變的新穎策略,吸引新客戶的使用好感,提升新客戶的留存率,進而提升老客戶的轉化率。同時,在售后服務上要人性化,舉辦溫馨的送愛心活動,讓新老客戶不僅有產品享受,更有家一樣的溫暖體驗。
4.2 ?加強對品牌自身的推廣和創新
5G時代洶涌而至,對每個企業來說機遇和挑戰并存。在宣傳方面,應借助互聯網優勢,采取多樣化流量推廣,例如在微博、抖音、B站、微信等社交媒體上通過各種視頻、文案等宣傳企業品牌文化和優惠套餐活動,尤其是需要將利益化的點可視化;在運營模式上,借助互聯網對客戶群體實行網格化管理,實現“一網撒天下,客戶盡在掌握中”的全局運營管理模式,不錯過一個新客戶,不放棄一個老客戶;在產品創新上,要與時俱進,不斷研發新的核心產品,提高企業核心競爭力,要不斷招募年輕人才,創新出更為特色、更為符合客戶需求的營銷手段。
4.3 ?定制差異化營銷策略
在營銷方面,可以借助數據挖掘方法對真實的客戶數據進行客戶人群細分,進而完成精準的人物畫像,按照客戶的不同喜好、不同消費層面、不同需求,劃分為4~8種畫像描述,然后針對不同畫像的客戶定制不同層級的個性化服務和優惠活動,同時要及時把握自身品牌的差異化塑造,從情感、文化、家庭歸屬感等方面來及時調整自身定位,提升品牌核心競爭力。
5 ?結 ?論
客戶流失率的日益增長已經成為電信行業各大運營商最為棘手的問題之一,而數據挖掘技術的產生便為解決該問題提供了極大的便利。本文通過大量查找文獻、研究相關理論基礎,并結合企業真實客戶數據,使用R語言做數據挖掘建立模型,基于決策樹的構建,形成了手機客戶流失預警系統,經混淆矩陣的準確率評估,該模型基本達到預期效果,可以將其用在解決該企業客戶流失管理的實際問題中。但由于數據中存在所選因素的種類有所欠缺、與客戶相關的其他信息不夠全面等問題,模型的準確性有待進一步提升。
參考文獻:
[1] CALZADA-INFANTE L,?SKARSD?TTIR M,BAESENS B. Evaluation of customer behavior with temporal centrality metrics for churn prediction of prepaid contracts [J/OL].Expert Systems With Applications,2020,160.[2020-05-28].https://www.sciencedirect.com/science/article/abs/pii/S0957417420303778.
[2] 李鑫.基于數據挖掘的電信客戶流失預警研究 [D].昆明:云南財經大學,2020.
[3] 張磊.基于深度學習的電信客戶流失預測研究 [D].昆明:云南財經大學,2020.
[4] 趙慧珂.流失客戶的識別、預警與對策研究 [D].天津:天津財經大學,2019.
[5] 周艷.基于數據挖掘技術的電話經理業務支撐系統設計與實現 [D].長沙:湖南大學,2016.
[6] 王玉玲.中國電信B公司寬帶客戶流失預警及對策研究 [D].秦皇島:燕山大學,2018.
[7] 程勇,梁吉祥.基于數據挖掘的掌銀客戶流失預測建模方法研究 [J].中國金融電腦,2019(8):51-60.
[8] 張利利,馬艷琴.基于數據挖掘技術的航空客戶流失與細分研究及R語言程序實現 [J].數學的實踐與認識,2019,49(6):134-142.
[9] 姜輝輝.WA移動分公司存量客戶營銷策略研究 [D].邯鄲:河北工程大學,2020.
[10] 王曉婷.邢臺移動用戶流失預警系統分析與設計 [D].北京:北京郵電大學,2010.
作者簡介:楊英英(1989—),女,漢族,陜西延安人,專職教師,助教,碩士研究生,研究方向:數據分析。