999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于數據挖掘的移動客戶離網預警分析

2018-05-21 08:46:30王志楠
科學與財富 2018年7期
關鍵詞:用戶模型

摘要:及時識別具有離網傾向的客戶對于寬帶運營商具有十分重要的意義。本文以某市移動公司為例,針對不平衡移動數據,采用人工合成少數類過采樣算法(SMOTE)進行重抽樣,而后采用決策樹、Adaboost兩種分類算法構建離網預警模型,最終選取分類精度最高的SMOTE樣本與Adaboost算法組合模型作為移動寬帶客戶離網預警模型,并據此為運營商提出相應建議。

關鍵字:不平衡樣本;重抽樣;Adaboost;離網預警模型

一、引言

隨著“寬帶中國”戰略的實施,寬帶建設已上升為國家戰略性公共基礎設施建設工程。寬帶業務市場蒸蒸日上的同時,想要保持并擴大市場占有率和利潤,寬帶運營商必須在爭取新客戶的同時,也致力于保留既有用戶。因此,建立寬帶離網預警模型來準確有效地識別出“預離網”用戶,根據特定用戶的需求制定出個性化的營銷方案,有效挽回客戶顯得尤為重要。然而,移動寬帶客戶行為數據存在在網客戶和離網客戶比例嚴重失衡,對不平衡的寬帶離網用戶數據進行重抽樣則尤為必要。本文將運用人工合成少數類過抽樣方法進行重抽樣,以平衡移動寬帶離網用戶和在網用戶數,在此基礎上,通過決策樹、Adaboost兩種分類算法,構建移動寬帶用戶離網預警模型,發掘引致用戶離網的重要因素。

二、移動寬帶用戶離網數據預處理

1、指標選取及數據預處理

移動寬帶離網數據量較大,數據復雜程度較高,因此對移動寬帶離網數據進行數據預處理是極為必要的。本文所用數據來自2017年1-3月某省移動公司寬帶用戶數據庫,包括1-3月內某市的部分寬帶在網及離網用戶信息,共計306100條,提取的變量主要涵蓋客戶基本信息、寬帶消費情況、與寬帶關聯的手機號碼消費特征,涉及的變量有42個,主要為三大類:客戶基本信息、寬帶消費情況、手機消費特征。經過指標變換、異常值處理及缺失值處理后,共保留22個變量,305905條用戶數據,其中在網客戶30萬條,離網客戶5905條,

2、不平衡樣本抽樣

由于移動寬帶離網離網用戶中,在網用戶數據約30萬,而離網用戶數據僅有5000左右,存在比例的嚴重失衡,為了提高模型估計精度,需對不平衡樣本進行重抽樣使離網與在網客戶數達到平衡。本文采用SMOTE合成少數類過采樣算法,最終抽得154711條。

三、移動寬帶用戶離網預警模型構建

在構建分類預測模型之前,本文對重抽樣樣本與初始樣本進行了測試集與訓練集的劃分,將各樣本按照3:1的比例隨機劃分成訓練樣本和測試樣本,其中訓練樣本用于模型的建立,測試樣本用于測試所建立模型的性能。

1、決策樹模型

使用原始樣本與重抽樣樣本的訓練樣本構造決策樹模型,通過計算,最終得到原始數據+決策樹模型的誤判率為0.118,,AUC值為0.789,可知,對于決策樹模型來說,SMOTE人工合成少數類過采樣算法提高了決策樹模型對少數類的分類性能,人工合成樣本(SMOTE)的決策樹模型估計效果優于原始數據。

根據所建的決策樹模型,可得到變量的重要性排序,從各變量重要性對比來看,原始數據與人工合成樣本(SMOTE)所構建決策樹模型篩選出的重要變量大致相似,在變量重要性位次上有稍許不同,可總結為影響客戶離網行為的重要變量分別有:包年/包月、寬帶主資費、輔資費、寬帶是否辦理融合業務、寬帶月均ARPU、寬帶ARPU波動率、寬帶網齡、停機次數等與寬帶消費息息相關的變量。

2、Adaboost分類算法

運用Adaboost算法對兩類樣本進行建模,得到了模型評估結果,SMOTE樣本的Adaboost模型誤判率為0.0510,低于原始數據0.1454,AUC值為0.935,高于原始數據0.855。可見,重抽樣樣本均顯著提高了模型的分類性能。將Adaboost算法所得的前十位變量重要性排序對比發現,兩種樣本所構建的Adaboost模型選取的重要變量大致相似,只是在變量位次上有所不同。

3、移動離網寬帶預警模型的選擇

本文將誤判率與AUC值作為模型分類性能的評判標準。基于上節對各類模型誤判率和AUC值的比較發現,人工合成樣本的Adaboost算法的組合模型估計效果最佳,因此最終選定SMOTE抽樣所構建的Adaboost模型為移動寬帶離網預警模型。利用當月客戶行為信息,通過該模型即可判斷客戶是否將有離網行為,將有預離網行為客戶名單提取出來,通過電話回訪等措施,制定相應的挽回措施。

四、結論與建議

構建效果最優的預警模型對于移動寬帶運營商做好維系挽留工作具有重要的意義。通過對比分析兩類樣本與兩種分類算法的組合預警模型,最終發現分類效果最優的是使用SMOTE抽樣方法結合Adaboost算法的預警模型。分析得到離網客戶的重要變量特征表現:寬帶主輔資費較高、寬帶月均消費較低、 近三月消費波動較小、手機主叫時長較短、未辦理寬帶融合業務、寬帶網齡較長、停機次數較多的城市用戶。據此為移動運營商制定相應的營銷策略提供建議如下,首先,大力推廣包年套餐,逐步延長包月時長。其次,制定多種優惠措施,吸引用戶辦理寬帶融合業務。同時,關注經常停機用戶和低消費客戶,通過客戶回訪等方式,詢問客戶停機原因,切實了解客戶需求,幫助客戶選擇合適的套餐組合。最后,針對寬帶網齡較長,即將到期的寬帶用戶,通過電話回訪和續費催繳等方式,并配合優惠活動,鼓勵寬帶用戶續繳。

參考文獻

[1]謝邦昌,朱世武,崔嵬.移動電話客戶流失數據挖掘[J].數理統計與管理,2005,24(1):62-68.

[2]張維國.移動用戶流失預警及挽留對策研究[D].電子科技大學,2013.

[3]隆曼.基于數據挖掘的電信行業客戶流失管理研究[D].西南財經大學,2013.

[4]李毅,姜天英,劉亞茹.基于不平衡樣本的互聯網個人信用評估研究[J].統計與信息論壇,2017,(02):84-90.

作者簡介:王志楠(1993—),女,山西朔州人,山西財經大學2015(統計學)學術碩士研究生,研究方向:數據挖掘.

猜你喜歡
用戶模型
一半模型
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
3D打印中的模型分割與打包
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
Camera360:拍出5億用戶
創業家(2015年10期)2015-02-27 07:55:08
100萬用戶
創業家(2015年10期)2015-02-27 07:54:39
主站蜘蛛池模板: 又爽又大又黄a级毛片在线视频| 久久久久亚洲精品无码网站| 亚洲天堂精品视频| 九九热视频精品在线| 精品国产91爱| 成人永久免费A∨一级在线播放| 国产精品思思热在线| www精品久久| 国产地址二永久伊甸园| 在线观看无码av免费不卡网站 | 国产成人精品亚洲日本对白优播| 久久精品国产一区二区小说| 热思思久久免费视频| 国产靠逼视频| 免费一看一级毛片| 国产精品污视频| 色偷偷男人的天堂亚洲av| 国产高清免费午夜在线视频| 91免费观看视频| 毛片网站免费在线观看| 成年女人a毛片免费视频| 亚洲国产看片基地久久1024| 在线a视频免费观看| 一级毛片在线免费看| 欧美亚洲激情| 国产91线观看| 伊人久久久久久久| 亚洲色图欧美视频| 少妇精品在线| 中文字幕在线欧美| 激情综合婷婷丁香五月尤物| 亚洲一区二区三区中文字幕5566| 国产精品九九视频| 91精品国产情侣高潮露脸| 午夜不卡福利| 国产成人精品亚洲77美色| 亚洲人网站| 亚洲无码高清一区二区| 夜精品a一区二区三区| 欧美日韩中文字幕在线| 国模极品一区二区三区| 国内精品视频区在线2021| 99久视频| 狠狠色婷婷丁香综合久久韩国 | 伊人婷婷色香五月综合缴缴情| 亚洲天堂精品视频| 精品视频91| 伊人久综合| 亚洲成人高清无码| 综合五月天网| 色成人综合| 亚洲精品无码人妻无码| 日韩中文精品亚洲第三区| 无码aⅴ精品一区二区三区| 日本精品αv中文字幕| 精品夜恋影院亚洲欧洲| 91小视频在线观看免费版高清 | 亚洲AⅤ波多系列中文字幕 | 国产日韩欧美精品区性色| 亚洲毛片在线看| 伊人丁香五月天久久综合 | 日韩中文字幕免费在线观看| 欧美福利在线播放| 欧美成人区| 亚洲国产成人无码AV在线影院L| 欧美不卡二区| 国产精品妖精视频| 亚洲侵犯无码网址在线观看| 国产精选小视频在线观看| 九九热这里只有国产精品| 毛片在线播放网址| 日韩av高清无码一区二区三区| 亚洲中文精品人人永久免费| 免费看美女自慰的网站| 99ri精品视频在线观看播放| 国产日韩欧美一区二区三区在线| 欧美一级视频免费| 久久人人妻人人爽人人卡片av| 欧美午夜在线播放| 亚洲国产精品久久久久秋霞影院| 99视频在线免费看| 中文字幕欧美日韩|