


[摘 要]本文將決策樹算法應用于移動客戶的流失分析中,使用SPPS-Clementine軟件中的C 5.0算法,對某企業某段時間的移動通信投訴數據進行分析,目的是根據移動通信公司投訴數據進行分組,發現流失度大的客戶的共同特征屬性,以便對流失度大的客戶做好挽留工作,改善客戶關系,提升企業核心競爭力。
[關鍵詞]決策樹;投訴;流失度;移動通信;客戶
doi:10.3969/j.issn.1673 - 0194.2016.22.044
[中圖分類號]F224 [文獻標識碼]A [文章編號]1673-0194(2016)22-00-02
0 引 言
移動通信客戶的流失分析一直是企業關注的熱點問題,如何做到提升客戶滿意度,防止客戶流失,加強客戶分類管理,吸引潛在客戶群體,提高運營商服務質量,是提升企業核心競爭力的關鍵所在。本文使用決策樹算法,對某企業投訴數據進行分析,目的是發現流失客戶的共同屬性,做好客戶關系管理工作。
1 決策樹算法
決策樹算法最早是由J.R.Quinlan提出的ID3方法,其建樹算法具有思想簡單、識別樣本屬性效率高的優點,ID3方法成為20世紀80年代末機器學習領域當中最有影響力的算法之一。在20世紀90年代的時候,J.R.Quinlan提出ID3改進版,即C 4.5方法。C 4.5方法是用信息論中互信息率來選擇屬性作為決策樹的結點,使決策樹識別樣本的效率得到了不小的提升。C 5.0算法是C 4.5的升級版,多數用在商業領域數據挖掘技術當中。主要針對大數據的分類,它的決策樹歸納與C 4.5很相近。
ID3算法的流程是對訓練集樣本的數據進行預處理,計算出訓練集樣本屬性劃分前的熵;然后計算出訓練集樣本屬性劃分后的熵,通過比較樣本屬性劃分前后的熵,計算出前后熵的差值;取最大差值的行列進行合理劃分,劃分出來后數據集所有元素標簽確立唯一性,有且只有一個屬性;若無法確定唯一屬性,則回到第一步,重新比較分析,直到建樹成功,整個建樹過程結束。
2 決策樹算法在移動通信客戶流失分析中的應用
2.1 實驗數據集
本次實驗過程使用的數據集有2 711個樣本,有投訴內容、故障行政區、使用網絡類型、責任原因、終端描述、客戶品牌和客戶流失度7個屬性,見表1。
2.2 實驗過程
選取某移動通信公司的客戶投訴數據,將Excel表格導入SPPS-Clementine軟件當中,首先選擇“源”下方“Excel”確保數據導入軟件當中;選擇“字段選項”下方“類型”確定模型的類型,最后選擇“建模”下方的“C 5.0”算法。數據流如圖1所示。
模型對訓練集選取樣本50%、75%、100%的數據,對客戶流失分析的準確度分別為97.88%、98.12%、98.01%,如圖2所示。
2.3 結果分析與討論
利用SPPS-Clementine軟件中的C 5.0算法,對移動通信客戶的流失行為進行分析,分別選取樣本的50%、75%、100%數據集進行分析,準確度依次為97.88%、98.12%、98.01%。從實驗結果可以看出,選取75%樣本的準確度較精確,但是所有的取樣精確度之間數據相差不大。從圖2可以看出,決策樹算法在移動通信客戶流失分析中的應用是可行的和有效的,為移動通信公司進行客戶流失分析提供了一種分析的思路和解決方法。
3 結 語
本文通過對某通信公司投訴數據流失度分析表明,C 5.0算法表現出更良好的適應性,對用戶流失度分析更精確、更高效、更方便。
主要參考文獻
[1]劉堯坤.顧客投訴管理與處置技巧[M].廣州:廣東經濟出版社,2005.
[2]徐遠純,盛昭瀚,柳炳祥.一種基于決策樹算法的客戶流失危機分析方法[J].計算機與現代化,2004(8).
[3]趙小寧,李鳳霞.因子分析法和聚類分析法在網上銀行客戶滿意度研究中的應用[J].時代金融,2015(3).
[4]蔣斌.數據挖掘技術在客戶關系管理中的運用[J].云南大學學報:自然科學版,2006(z1).
[5]于莉. 數據挖掘技術在移動通信業中的應用研究[D]. 天津:天津大學, 2006 .