999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于R語言的運營商4G用戶流失預(yù)警模型研究

2017-07-06 11:36:58曾國文趙寶峰王波
移動通信 2017年10期
關(guān)鍵詞:用戶模型

曾國文 趙寶峰 王波

【摘 要】為了減少運營商核心資源的流失,降低4G用戶流失率,通過采用與大數(shù)據(jù)技術(shù)緊密結(jié)合的R語言技術(shù),從消費異動、競爭對手影響、不正常沉默和長期異地漫游等維度設(shè)計建模指標(biāo),基于邏輯回歸分析搭建了4G用戶流失預(yù)警模型,并通過卡方檢驗和ROC分析等方法驗證了模型的正確性。該模型預(yù)測效果明顯,可以很好地對4G用戶的狀態(tài)進(jìn)行精準(zhǔn)定位,以達(dá)到對4G用戶的保有。

【關(guān)鍵詞】4G用戶 流失預(yù)警模型 R語言 邏輯回歸

1 引言

隨著數(shù)據(jù)通信與多媒體業(yè)務(wù)的發(fā)展,第四代移動通信(4G)快速興起,為移動通信用戶提供了“高速對話”,通信運營商全業(yè)務(wù)經(jīng)營已成趨勢,這也加劇了市場競爭,為了獲得更多的市場占有率,運營商想方設(shè)法降低用戶流失率,以減少用戶離網(wǎng)現(xiàn)象的發(fā)生。研究表明,若一個公司的用戶流失率降低5%,則利潤將會增加25%~85%[1]。企業(yè)往往獲得一位新用戶的費用是比較高的,但是挽留一位用戶有時僅僅只需要一個電話或者策略[2]。因此,運營商需對用戶屬性進(jìn)行精準(zhǔn)定位,試圖挽留存在流失傾向的用戶資源[3]。4G用戶資源儼然已成為運營商核心資源,如何通過建立數(shù)據(jù)挖掘模型進(jìn)行4G用戶流失預(yù)警,對有流失傾向的用戶進(jìn)行精準(zhǔn)定位是當(dāng)前重要課題。本文通過對用戶流失歷史情況進(jìn)行統(tǒng)計分析,歸納出用戶流失的共有特性,設(shè)計建模指標(biāo),搭建4G用戶流失預(yù)警模型并提出相應(yīng)的挽留政策,最終目的是降低用戶流失率[4]。

2 建模技術(shù)及模型選擇

2.1 建模技術(shù)選擇

R語言一直是統(tǒng)計學(xué)家的經(jīng)典工具,它是一種開源軟件編程語言與操作環(huán)境,主要用于統(tǒng)計分析、繪圖、數(shù)據(jù)挖掘。R語言具有豐富的統(tǒng)計方法,擁有強大的統(tǒng)計功能,是一套完整的數(shù)據(jù)處理、計算和制圖軟件系統(tǒng),提供數(shù)學(xué)計算的環(huán)境,用戶能夠靈活地在其中進(jìn)行數(shù)據(jù)分析,甚至創(chuàng)造出符合需要的新的統(tǒng)計計算方法。

此外,大數(shù)據(jù)處理是潮流和趨勢。當(dāng)前出現(xiàn)了以Hadoop家族為代表的用于開發(fā)和運行處理大規(guī)模數(shù)據(jù)的軟件平臺,重點是全量數(shù)據(jù)分析,而R語言的重點則是樣本數(shù)據(jù)分析,這兩種技術(shù)結(jié)合在一起剛好取長補短。因此,本文采用R語言作為數(shù)據(jù)建模語言,后續(xù)的建模過程均基于R語言開展。

2.2 模型選擇

用戶流失即企業(yè)原有用戶不想或不再使用該企業(yè)的服務(wù)[5]。用戶流失的原因多種多樣,如:Kenveney通過對消費品用戶流失原因進(jìn)行分析,將用戶流失類型分為價格流失型、產(chǎn)品流失型、服務(wù)流失型、技術(shù)流失型、便利流失型等;Madden、Savage和Coble以澳大利亞ISP市場不同的移動用戶消費行為為研究對象,提出定價、不方便性、核心服務(wù)失敗、服務(wù)接觸失敗、服務(wù)失敗的反應(yīng)、競爭對手、道德問題等因素影響用戶流失意愿[6]。

邏輯回歸分析方法[7]是數(shù)據(jù)挖掘技術(shù)中的分類方法,也是基于統(tǒng)計理論的識別技術(shù)。其主要目的是進(jìn)行分類,同時預(yù)估事件發(fā)生的概率,優(yōu)點是能處理二值因變量,不需滿足其他多變量技術(shù)所要求的假設(shè),可進(jìn)行模型精確度和擬合優(yōu)度的檢驗以便評估模型的預(yù)測力等。

本文采用了邏輯回歸技術(shù)來搭建4G用戶流失預(yù)警模型。從運營商的角度來看,用戶狀態(tài)可分為在網(wǎng)和離網(wǎng)。其中,在網(wǎng)為依然使用運營商為其提供的服務(wù);離網(wǎng)為不再使用,也即是流失。判斷用戶狀態(tài)屬于一個典型的二分類變量問題時,可采用邏輯回歸分析來處理。邏輯回歸模型公式如下[8]:

(1)

由于邏輯回歸模型是非線性模型,所以就少了像線性模型那樣的約束,如自變量與因變量需具有線性關(guān)系等。其實邏輯回歸本質(zhì)上是線性回歸的一種,只是邏輯回歸中的因變量是未知的類別變量取某一個值的概率[9]。邏輯回歸是一個被邏輯方程歸一化后的線性回歸,事實上以上模型公式只需進(jìn)行l(wèi)og it變換即可變換成線性形式,公式如下:

log it (2)

4G用戶流失預(yù)警模型設(shè)計流程如圖1所示:

3 用戶流失預(yù)警模型構(gòu)建

3.1 分析思路

本文將搭建4G用戶流失預(yù)警模型,其研究過程主要實現(xiàn)以下目標(biāo):

(1)定義4G用戶的消費異動、不正常沉默、呼轉(zhuǎn)競爭對手、異地漫游這4類流失類型的口徑,完成建模指標(biāo)的設(shè)計;

(2)搭建4G用戶流失預(yù)警模型;

(3)對模型進(jìn)行評估驗證。

建模過程:該業(yè)務(wù)問題是一個二元預(yù)測問題(是否流失),并且與之相關(guān)的數(shù)據(jù)大都是數(shù)值型的數(shù)據(jù),適合采用邏輯回歸的方法來建模。

3.2 建模指標(biāo)設(shè)計與分析

通過對已流失4G用戶進(jìn)行觀察、統(tǒng)計和分析,發(fā)現(xiàn)在用戶流失之前可能會出現(xiàn)以下方面的情況,可圍繞這些情況進(jìn)行建模指標(biāo)的選取:

(1)消費異動:與歷史消費水平相比,突然出現(xiàn)消費異常波動,一般通信行業(yè)選取ARPU(Average Revenue Per User,每用戶平均收入)值作為衡量用戶消費水平的指標(biāo),因此設(shè)計建模指標(biāo)包括近三個月ARPU標(biāo)準(zhǔn)差、(本月ARPU-前三均值)/前三均值;

(2)競爭對手影響:用戶日常聯(lián)系的主要通信圈子外網(wǎng)占比增加,網(wǎng)外通話占比增加,受競爭對手客服的影響或者有呼轉(zhuǎn)到競爭對手的情況,因此設(shè)計建模指標(biāo)包括本月網(wǎng)內(nèi)通話次數(shù)占比、本月網(wǎng)外通話時長占比、本月網(wǎng)外主叫次數(shù)占比、本月競爭對手客服主被叫通話次數(shù)、本月呼轉(zhuǎn)競爭對手次數(shù);

(3)不正常沉默:通信行為出現(xiàn)突然減少乃至不正常沉默,從通話時長、通話次數(shù)和4G流量的使用情況綜合考量,因此設(shè)計建模指標(biāo)包括(本月通話時長-前三均值)/前三均值、最近三個月MOU(Minutes Of Usage,平均每戶每月通話時間)值標(biāo)準(zhǔn)差、(本月通話次數(shù)-前三均值)/前三均值、前三月通話次數(shù)均值/本月通話次數(shù)、最近三個月聯(lián)系次數(shù)標(biāo)準(zhǔn)差、本月4G流量;

(4)長期異地漫游:若用戶近期經(jīng)常在異地漫游,則有可能該用戶主要生活在異地,并有可能換號,因此設(shè)計建模指標(biāo)包括(本月異地漫游通話次數(shù)/本月通話總次數(shù))-(異地漫游通話次數(shù)前三均值/通話總次數(shù)前三均值)、(本月異地漫游通話次數(shù)/本月通話總次數(shù))-(上月異地漫游通話次數(shù)/上月通話總次數(shù))、本月異地漫游通話次數(shù)、上月異地漫游通話次數(shù);

(5)其他:統(tǒng)計分析還發(fā)現(xiàn)流失用戶與入網(wǎng)時長關(guān)系緊密,入網(wǎng)時長越長,流失的可能性就越小,因此把入網(wǎng)時長也作為建模指標(biāo)。

3.3 數(shù)據(jù)準(zhǔn)備與數(shù)據(jù)探索

(1)數(shù)據(jù)準(zhǔn)備

從廣東移動某分公司經(jīng)營分析數(shù)據(jù)集市,通過ETL獲取上述建模指標(biāo)所需數(shù)據(jù)源,數(shù)據(jù)提取的口徑完全參照該運營商市場部門日常工作需求。如提取2015年涉及上述指標(biāo)所需的在網(wǎng)和離網(wǎng)4G用戶消費及通信行為基礎(chǔ)數(shù)據(jù)集,總樣本數(shù)為559 185,其中選取訓(xùn)練集和測試集比例為6:4。

將所有基礎(chǔ)數(shù)據(jù)集從數(shù)據(jù)集市導(dǎo)出到R語言建模環(huán)境,在該建模環(huán)境對數(shù)據(jù)進(jìn)行預(yù)處理,采用統(tǒng)計方法計算生成數(shù)據(jù)建模指標(biāo)。因變量為用戶是否流失,也即該字段判斷用戶是在網(wǎng)還是已經(jīng)離網(wǎng);自變量為用戶消費通信行為各指標(biāo)字段。

(2)數(shù)據(jù)探索

在對基礎(chǔ)數(shù)據(jù)進(jìn)行數(shù)據(jù)探索的過程中,發(fā)現(xiàn)存在缺失值,因此利用R語言函數(shù)進(jìn)行缺失值分析。繪制缺失值統(tǒng)計圖如圖2所示:

考慮到缺失值或異常值對統(tǒng)計分析結(jié)果和建模結(jié)果會產(chǎn)生不利影響,因此直接剔除缺失的數(shù)據(jù)和消費波動很大的數(shù)據(jù)。

進(jìn)行建模指標(biāo)的相關(guān)性分析時,部分指標(biāo)的相關(guān)性分析結(jié)果如圖3所示:

回歸分析一般假設(shè)建模變量之間都是獨立不相關(guān)的,如果有任何兩個變量存在強相關(guān)性,則只需保留其中一個而刪除其余變量[9]。將建模指標(biāo)中存在明顯相關(guān)的指標(biāo)進(jìn)行篩選剔除,使得所有自變量都不顯著相關(guān),避免自變量之間存在很強的共線性而導(dǎo)致模型效果不好。

采用箱線圖、直方圖、分析曲線等統(tǒng)計圖表技術(shù)對各建模指標(biāo)數(shù)據(jù)進(jìn)行分散分布情況分析,發(fā)現(xiàn)異常指標(biāo),尋找奇異值,并進(jìn)一步進(jìn)行數(shù)據(jù)清洗和數(shù)據(jù)轉(zhuǎn)換,以確保建模數(shù)據(jù)的有效性。

3.4 數(shù)據(jù)建模與模型評估

(1)數(shù)據(jù)建模

本文研究過程中將樣本數(shù)據(jù)按0.6、0.4的比例分為訓(xùn)練集和測試集,進(jìn)行數(shù)據(jù)建模分析的時間窗口設(shè)置如圖4所示:

采用R語言邏輯回歸函數(shù)對已經(jīng)完成數(shù)據(jù)清洗和轉(zhuǎn)換的訓(xùn)練集數(shù)據(jù)建模指標(biāo)進(jìn)行邏輯回歸建模,經(jīng)過反復(fù)多次的建模指標(biāo)分析,剔除掉P-Value值小于0.05的指標(biāo),再用評估函數(shù)對模型結(jié)果進(jìn)行初步評估,具體如圖5所示:

從上述評估結(jié)果可以發(fā)現(xiàn),所有變量的P值均小于0.05,這說明通過了顯著性檢驗。至此,已完成了基于R語言搭建的通信運營商4G用戶流失預(yù)警模型,下面需要對模型進(jìn)行深入評估。

(2)模型評估

先對模型進(jìn)行卡方檢驗,檢驗結(jié)果如圖6所示:

隨著變量從第一個到最后一個逐個加入模型,模型最終通過顯著性檢驗,這說明由上述這些變量組成的模型是有意義且正確的。

采用ROC曲線(Receiver Operating Characteristic Curve,受試者工作特征曲線)分析方法這樣一種可視化的方法來衡量模型的優(yōu)劣。該曲線的橫坐標(biāo)、縱坐標(biāo)分別表示1-反例的覆蓋率和正例的覆蓋率。采用R語言專有函數(shù)包計算ROC曲線各項結(jié)果值,并用繪圖函數(shù)繪制圖形,具體如圖7所示。

ROC分析思想來源于統(tǒng)計學(xué)的決策理論,ROC曲線越凸則說明判斷模型價值越高,并可以通過計算ROC曲線下的面積做定量分析,面積越接近1,表明模型效果越好[10]。

圖7中,AUC即為ROC曲線和y=x直線之間的面積,模型的優(yōu)劣是通過該面積大小來判斷的,而對于一般情況而言,AUC大于0.7就能夠說明模型是比較合理的。上述結(jié)果中,AUC為0.86,這表明本文研究中建立的模型是合理的。

使用已建好的模型計算測試數(shù)據(jù)集流失概率,取流失概率大于0.5的用戶預(yù)測其潛在流失,再與實際情況比較得到命中率為pv=74%,而在隨機的方式下抽取出正類的比例為k=10%,從而可得pv/k=7.4,預(yù)測效果提升了7.4倍,同時計算模型的整體準(zhǔn)確率達(dá)到了91.4%,因此本文研究搭建的模型效果是明顯的,模型預(yù)測的準(zhǔn)確率也能達(dá)到較高水平,可從消費異動、競爭對手影響、不正常沉默和長期異地漫游等維度指標(biāo)建模準(zhǔn)確地預(yù)測用戶是否潛在流失。

4 結(jié)論

本文采用能夠很好地結(jié)合大數(shù)據(jù)技術(shù)的R語言來建模,并從消費異動、競爭對手影響、不正常沉默和長期異地漫游等維度創(chuàng)新性地設(shè)計建模指標(biāo),最終成功搭建了4G用戶流失預(yù)警模型。通過卡方檢驗和ROC曲線驗證了模型是正確的、合理的,計算提升值提升了7.4倍,且計算模型的整體準(zhǔn)確率達(dá)到了91.4%,這表明模型預(yù)測效果是明顯的,從而驗證了本文研究的模型有助于對有流失傾向的用戶進(jìn)行精準(zhǔn)定位,以便及時地進(jìn)行預(yù)警挽留,達(dá)到對核心資源的保有。

參考文獻(xiàn):

[1] 方紅. 讀者流失預(yù)警模型及其在公共圖書情報機構(gòu)中的應(yīng)用[J]. 黑龍江科技信息, 2007(4): 103.

[2] 嚴(yán)偉. 如何防范客戶流失[J]. 企業(yè)管理, 2003(6): 52-54.

[3] 林明輝. 基于BP網(wǎng)絡(luò)的通訊行業(yè)客戶流失預(yù)警模型研究[J]. 陜西學(xué)前師范學(xué)院學(xué)報, 2016,32(3): 146-149.

[4] 顧光同,王力賓,費宇. 電信客戶流失預(yù)警規(guī)則及其信度測定實證研究——以云南電信為例[J]. 云南財經(jīng)大學(xué)學(xué)報, 2010,26(6): 94-98.

[5] 肖水清. 基于CRM探討電信業(yè)的客戶流失問題[J]. 現(xiàn)代計算機, 2006(1): 57-59.

[6] SY Hung, DC Yen, HY Wang. Applying data mining to telecom churn management[J]. Expert Systems with Applications, 2006,31(3): 515-524.

[7] 施朝健,張明銘. Logistic回歸模型分析[J]. 計算機輔助工程, 2005,14(3): 74-78.

[8] 付杰,方芳,嚴(yán)克文. 基于Logistic回歸的通信業(yè)客戶流失預(yù)測與挽留研究[J]. 鄂州大學(xué)學(xué)報, 2015,22(6): 110-112.

[9] 任康,李剛. Logistic回歸模型在判別分析中的應(yīng)用[J]. 統(tǒng)計與信息論壇, 2007,22(6): 71-73.

[10] 萬柏坤,薛召軍,李佳,等. 應(yīng)用ROC曲線優(yōu)選模式分類算法[J]. 自然科學(xué)進(jìn)展, 2006,16(11): 1511-1516.

猜你喜歡
用戶模型
一半模型
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
關(guān)注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
3D打印中的模型分割與打包
關(guān)注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關(guān)注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
Camera360:拍出5億用戶
100萬用戶
主站蜘蛛池模板: 成人福利视频网| 亚洲精品午夜天堂网页| 全免费a级毛片免费看不卡| 亚洲嫩模喷白浆| 99久久亚洲精品影院| 精品国产Ⅴ无码大片在线观看81 | 男人的天堂久久精品激情| 免费一极毛片| 久久精品亚洲专区| 午夜电影在线观看国产1区| 亚洲男人的天堂久久香蕉 | 亚洲高清无在码在线无弹窗| 狼友av永久网站免费观看| 亚洲一级毛片在线观| 蜜桃视频一区二区三区| 99热这里只有精品免费国产| 久久一日本道色综合久久| 日韩在线第三页| 三上悠亚精品二区在线观看| 特级做a爰片毛片免费69| 国产成人亚洲毛片| 免费a在线观看播放| 激情六月丁香婷婷四房播| 色婷婷色丁香| 国产视频大全| 一本无码在线观看| 国产95在线 | 在线国产毛片手机小视频| 日本道中文字幕久久一区| 日本五区在线不卡精品| 亚洲国产精品人久久电影| 99热国产这里只有精品无卡顿"| 一级一级特黄女人精品毛片| 国产福利拍拍拍| 亚洲精品成人福利在线电影| 一级爆乳无码av| 国产成人高清在线精品| 高清免费毛片| 2021国产精品自产拍在线| 亚洲三级a| 国模在线视频一区二区三区| 国产女人水多毛片18| 日本国产一区在线观看| 韩国自拍偷自拍亚洲精品| 日韩精品免费一线在线观看| 永久免费av网站可以直接看的 | 五月婷婷中文字幕| 91免费观看视频| 欧美视频在线第一页| 青青网在线国产| 丰满人妻中出白浆| 色欲国产一区二区日韩欧美| 日韩精品高清自在线| 国产91色在线| 玖玖精品在线| 72种姿势欧美久久久久大黄蕉| 欧美另类第一页| 亚洲人妖在线| 亚洲人成网站色7799在线播放 | 中文字幕人成人乱码亚洲电影| 久久性视频| 亚洲成在线观看| 国产一级一级毛片永久| 色噜噜在线观看| 99视频国产精品| 日本免费一级视频| 国产成人精品第一区二区| 毛片在线区| 欧美有码在线观看| 全部免费毛片免费播放| 91po国产在线精品免费观看| 亚洲黄色视频在线观看一区| 一级香蕉人体视频| 日本欧美一二三区色视频| 久久精品这里只有国产中文精品| 亚洲视频免| 强乱中文字幕在线播放不卡| 国产亚洲视频免费播放| 性网站在线观看| 伊人成人在线视频| 伊人精品视频免费在线| 亚洲精品天堂在线观看|