999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于Spark平臺的電信行業(yè)用戶流失預(yù)警

2017-05-06 15:31:25侯興政
現(xiàn)代經(jīng)濟(jì)信息 2016年36期

侯興政

摘要:電信行業(yè)用戶數(shù)據(jù)量呈現(xiàn)指數(shù)型增加,傳統(tǒng)分析挖掘技術(shù)已經(jīng)不能勝任如此龐大的工作。為此,引入大數(shù)據(jù)平臺組件Spark進(jìn)行大數(shù)據(jù)分析,進(jìn)而提升分析挖掘的效率。電信用戶的流失造成了運營商經(jīng)濟(jì)利潤嚴(yán)重下滑,利用隨機森林算法構(gòu)建預(yù)警模型,挽留可能流失用戶,保證運營商的市場份額。

關(guān)鍵詞:流失預(yù)警;Spark技術(shù);隨機森林算法

中圖分類號:TPl81

文獻(xiàn)識別碼:A

文章編號:1001-828X(2016)036-000369-01

隨著通信技術(shù)的迅猛發(fā)展和手機的普及應(yīng)用,電信行業(yè)應(yīng)用系統(tǒng)的規(guī)模迅速擴大,行業(yè)內(nèi)應(yīng)用所產(chǎn)生的數(shù)據(jù)量則呈現(xiàn)爆炸性增長趨勢,因此尋求有效的大數(shù)據(jù)處理技術(shù)、方法和手段已經(jīng)成為現(xiàn)實世界的迫切需求。中國移動一個省的電話通聯(lián)記錄數(shù)據(jù)每月可達(dá)0.5PB~1PB,不少專家預(yù)測全世界數(shù)據(jù)量未來10年將增長40余倍,年均增長保持在40%左右。

電信行業(yè)的海量數(shù)據(jù)為數(shù)據(jù)挖掘技術(shù)提供了發(fā)揮自己獨特作用的機會,目前也已經(jīng)存在廣泛的場景應(yīng)用,尤其是對于行業(yè)客戶流失的預(yù)警分析。如何減少客戶流失,提高客戶的挽留率,已經(jīng)是電信業(yè)的當(dāng)務(wù)之急。客戶流失預(yù)測是基于歷史數(shù)據(jù),對已流失的用戶進(jìn)行分析,找出這些流失用戶的行為特征,對現(xiàn)有用戶挖掘預(yù)測出可能流失的部分,并有針對性地采取相應(yīng)的挽流政策。為提高海量數(shù)據(jù)進(jìn)行分類預(yù)測的運行效率,我們引入大數(shù)據(jù)平臺的spark組件。spark是基于內(nèi)存計算的大數(shù)據(jù)并行計算框架,基于內(nèi)存計算,提高了在大數(shù)據(jù)環(huán)境下數(shù)據(jù)處理的實時性,同時保證了高容錯性和高可伸縮性,spark是MapReduce的替代方案,而且兼容HDFS、Hive等分布式存儲層,融入Hadoop的生態(tài)系統(tǒng),并彌補MapReduce的不足。如今,Spark分析技術(shù)已經(jīng)被騰訊、雅虎、淘寶、優(yōu)酷土豆等大型互聯(lián)網(wǎng)公司廣泛使用。

首先,我們將流失用戶定義為上一月分出賬繳費,而本月未出賬繳費的用戶。構(gòu)建用戶流失預(yù)警模型,需要結(jié)合業(yè)務(wù)知識進(jìn)行字段的選取,并加大時間跨度,捕捉更加細(xì)節(jié)的變化,分析用戶的使用情況的細(xì)微波動。選取的字段有標(biāo)識用戶唯一性的用戶編號、分類類型的標(biāo)志是否流失、是否為融合業(yè)務(wù)用戶、VIP會員級別編號、在網(wǎng)時長、資費產(chǎn)品、是否參與合約計劃、發(fā)展渠道的類型、每月費用均值、費用波動、本地語音通話均值、本地語音通話波動情況長途語音通話均值、長途語音通話波動、漫游語音通話均值、漫游通話波動、通話次數(shù)均值、通話次數(shù)波動、流量使用均值、流量使用波動、繳費金額均值、繳費金額波動、近三月是否有過欠費行為、語音飽和度、流量飽和度;同時,通過不斷改變模型的參數(shù),調(diào)優(yōu)分類預(yù)測模型效果,以達(dá)到最高的精確率。最終,將預(yù)測數(shù)據(jù)分配給客戶服務(wù)部門,整合銷售服務(wù)資源,根據(jù)客戶的需求,設(shè)計個性化的營銷策略,快速反應(yīng),以此達(dá)到召回流失客戶,挽留流失概率高的客戶,實現(xiàn)對客戶的守護(hù)。

構(gòu)建模型選用的分類預(yù)測算法為隨機森林,它是組合分類器(ensemble)的一種,組合分類器作為一種復(fù)合模型,由多個分類器組合而成。首先,個體分類器進(jìn)行投票。然后,組合分類器基于投票返回類標(biāo)號預(yù)測結(jié)果,進(jìn)行最終判別,因此組合分類器往往比個體分類器更加準(zhǔn)確。隨機森林內(nèi)的每個個體分類器都是一顆決策樹,構(gòu)造決策樹時,每個結(jié)點隨機選擇F個屬性作為該結(jié)點劃分的候選屬性。每一棵樹都依賴于獨立抽樣,并在森林中所有樹具有相同分布的隨機向量的值。分類時,每棵樹都進(jìn)行投票,隨機森林返回最終得票數(shù)最多的預(yù)測類別。對于每次迭代使用有放回抽樣,這樣使得某些元組在抽取的樣本中重復(fù)出現(xiàn)或者未出現(xiàn),這樣就保證了樹的多樣性。隨機森林算法對錯誤和離群點的表現(xiàn)出很好的魯棒性。隨著森林中決策樹的數(shù)目增長,森林的泛化誤差會收斂,這樣就不存在過擬合問題。在數(shù)據(jù)處理過程中,往往會遇到數(shù)據(jù)不平衡問題,即感興趣的一類只有少量數(shù)據(jù)。提高類不平衡數(shù)據(jù)分類準(zhǔn)確率的方法有過抽樣和欠抽樣。其中,過抽樣是復(fù)制稀有類的元組,而欠抽樣則是隨機地刪除多數(shù)類別。

對于分類模型所構(gòu)建的結(jié)果,我們可以通過幾個評價度量指標(biāo)進(jìn)行衡量。首先,引入混淆矩陣,真正例TP是正確分類的正元組,真負(fù)例TN是正確分類的負(fù)元組,假正例FP是錯誤標(biāo)記為正元組的負(fù)元組,假負(fù)例FN是錯誤標(biāo)記為負(fù)元組的正元組。分類的準(zhǔn)確率是被正確分類的元組所占的百分比,但是準(zhǔn)確率存在著弊端,在處理不平衡數(shù)據(jù)時,往往會給出錯誤的效果,為此,我們使用召回率和精確率:

召回率,也稱覆蓋率:被正確預(yù)測的正例在整個正例的比例;

精確率,也稱命中率:被預(yù)測為正例中真正是正例的比例;

并且,精確率與召回率是一對逆關(guān)系,往往需要降低一個為代價而提高另一個。

實例數(shù)據(jù)結(jié)果如下:

原始數(shù)據(jù)

訓(xùn)練集:2月份數(shù)據(jù)總數(shù):244.2082萬(不流失=229.7690萬;流失=14.5563萬)

測試集:3月份數(shù)據(jù)總數(shù):250.9384萬(不流失=234.7360萬;流失=16.2024萬)

準(zhǔn)確率:88.8%覆蓋率:90.45%命中率:97.42%

結(jié)合電信行業(yè)的業(yè)務(wù)知識,應(yīng)用挖掘理論建立起來一套科學(xué)的、完整的客戶流失指標(biāo)體系,有較高的預(yù)警效果,希望能將流失預(yù)測技術(shù)實際應(yīng)用于電信行業(yè),分析和預(yù)測客戶的消費行為特征,從而為建立用戶離網(wǎng)和欠費預(yù)警機制提供客觀的、可靠的數(shù)據(jù)支撐,為制定更好的客戶服務(wù)策略提供決策支持。

主站蜘蛛池模板: 国产成人无码播放| 国产成人乱码一区二区三区在线| 色欲不卡无码一区二区| 亚洲黄网在线| 全部免费毛片免费播放| 一本大道无码日韩精品影视| 欧美日韩亚洲国产| 国产成人你懂的在线观看| 国产亚洲精久久久久久无码AV| 欧美专区在线观看| 91精品aⅴ无码中文字字幕蜜桃| 色色中文字幕| 黄色在线网| 玖玖精品在线| 日韩亚洲高清一区二区| 亚洲第一视频网| 暴力调教一区二区三区| 久久精品日日躁夜夜躁欧美| 十八禁美女裸体网站| 真实国产乱子伦视频| 东京热av无码电影一区二区| 国产高清不卡视频| 福利一区在线| 亚洲中文字幕23页在线| 青青草久久伊人| 国产成人精品日本亚洲| 国产丝袜无码一区二区视频| 精品剧情v国产在线观看| 六月婷婷激情综合| 欧美国产三级| 成人免费午间影院在线观看| 亚洲制服中文字幕一区二区| 欧美日韩中文字幕在线| 青青青国产精品国产精品美女| 国产欧美日韩综合一区在线播放| AV老司机AV天堂| 波多野结衣在线se| 精品福利国产| 国产精品成人免费视频99| 免费在线一区| 天堂亚洲网| 欧美亚洲一区二区三区导航| 亚洲五月激情网| 久久国产乱子| аⅴ资源中文在线天堂| 人人妻人人澡人人爽欧美一区 | 国产精品亚洲综合久久小说| 亚洲第一网站男人都懂| 亚洲二三区| 免费观看欧美性一级| 亚洲一区免费看| 亚洲精品成人7777在线观看| 日韩成人在线网站| 国产成人高清在线精品| 91精选国产大片| 久久99国产综合精品女同| 国产日韩欧美视频| 女同久久精品国产99国| 伊人精品视频免费在线| 狠狠色丁香婷婷| 日韩亚洲综合在线| 亚洲精品无码在线播放网站| 日韩麻豆小视频| 国产在线98福利播放视频免费| 精品国产免费第一区二区三区日韩| 丝袜无码一区二区三区| 中文字幕乱码中文乱码51精品| 美女潮喷出白浆在线观看视频| 天堂亚洲网| 57pao国产成视频免费播放| 国产成人精品免费av| 免费国产高清视频| 996免费视频国产在线播放| 69精品在线观看| 国产欧美中文字幕| 免费A∨中文乱码专区| 国产麻豆va精品视频| 亚洲乱伦视频| 蜜桃视频一区二区| 成人日韩欧美| 国产剧情一区二区| 在线精品欧美日韩|