隨著3G時(shí)代的到來,國內(nèi)電信市場競爭日趨激烈,電信運(yùn)營商的經(jīng)營模式逐漸從“技術(shù)驅(qū)動(dòng)”向“市場驅(qū)動(dòng)”、“客戶驅(qū)動(dòng)”轉(zhuǎn)化。這就要求運(yùn)營商要采取以客戶為中心的策略,根據(jù)客戶的實(shí)際需求提供多樣化、層次化、個(gè)性化的服務(wù)解決方案。
電信增值業(yè)務(wù)是憑借公用電信網(wǎng)的資源和其它通信設(shè)備而開發(fā)的附加通信業(yè)務(wù),其實(shí)現(xiàn)的價(jià)值使原有網(wǎng)絡(luò)的經(jīng)濟(jì)效益或功能價(jià)值得到進(jìn)一步提升,是運(yùn)營商提供給消費(fèi)者的信息服務(wù)。增值業(yè)務(wù)的種類很多,例如短信、彩信、手機(jī)上網(wǎng)、電子信箱、可視電話、手機(jī)電視等,多以語音、文字、圖形、圖像等多媒體形式生動(dòng)、直觀、形象地表示和傳遞信息。
增值業(yè)務(wù)是運(yùn)營商提供給消費(fèi)者的更高層次的信息服務(wù),要求運(yùn)營商提供的產(chǎn)品應(yīng)符合不同消費(fèi)群的個(gè)性化需求,這使得傳統(tǒng)的電信增值服務(wù)行業(yè)的大眾營銷策略已很難適應(yīng)新形勢的發(fā)展要求。充分獲取并利用相關(guān)數(shù)據(jù)信息,使用數(shù)據(jù)挖掘方法發(fā)現(xiàn)潛在客戶并展開針對(duì)性營銷,已成為運(yùn)營商重點(diǎn)關(guān)注的市場拓展方法之一。
數(shù)據(jù)挖掘是從大量的、不完整的、有噪聲的、模糊的、隨機(jī)的實(shí)際應(yīng)用數(shù)據(jù)中,提取隱含在其中的、人們事先并不知道的、具有潛在價(jià)值的信息和知識(shí)的過程。它的出現(xiàn)為自動(dòng)和智能地把海量的數(shù)據(jù)轉(zhuǎn)化成有用的信息和知識(shí)提供了手段。
數(shù)據(jù)挖掘在電信行業(yè)的應(yīng)用包括如下幾個(gè)方面:
1)關(guān)聯(lián)分析:其目的是挖掘出隱藏在數(shù)據(jù)間的關(guān)聯(lián)關(guān)系。例如,訂購手機(jī)視頻通話包月套餐的顧客同時(shí)訂購手機(jī)電視套餐的概率較高,這就是一條關(guān)聯(lián)規(guī)則。
2)分類/預(yù)測:其目的是產(chǎn)生一個(gè)分類模型,該模型能把數(shù)據(jù)庫中的數(shù)據(jù)項(xiàng)映射到給定類別中。分類數(shù)據(jù)挖掘主要利用歷史數(shù)據(jù)找出規(guī)律,建立模型,并應(yīng)用模型預(yù)測未來數(shù)據(jù)的種類、特征等,可用于電信行業(yè)的潛在客戶發(fā)現(xiàn)。
3)聚類:聚類是把一組個(gè)體按照相似性歸成若干類別,使得屬于同一類別的個(gè)體之間的距離盡可能小,而不同類別個(gè)體間的距離盡可能大。聚類通常用于根據(jù)客戶消費(fèi)行為特征劃分為不同的用戶群,開展針對(duì)性營銷。
4)偏差分析:從數(shù)據(jù)庫中找出異常數(shù)據(jù),如短信群發(fā)、欺詐行為的發(fā)現(xiàn)。
5)時(shí)間序列:從序列數(shù)據(jù)庫中發(fā)現(xiàn)相對(duì)時(shí)間或者其他順序所出現(xiàn)的高頻率子序列。其最初是通過在帶有交易時(shí)間屬性的交易數(shù)據(jù)庫中發(fā)現(xiàn)頻繁項(xiàng)目序列,以發(fā)現(xiàn)某一時(shí)間段客戶的購買活動(dòng)規(guī)律。
增值業(yè)務(wù)精確營銷是通過分析現(xiàn)有的增值業(yè)務(wù)訂購關(guān)系數(shù)據(jù),使用統(tǒng)計(jì)分析或數(shù)據(jù)挖掘方法找出針對(duì)不同業(yè)務(wù)具有潛在營銷價(jià)值的目標(biāo)客戶。
數(shù)據(jù)挖掘方法可以從兩個(gè)方面發(fā)現(xiàn)增值業(yè)務(wù)的潛在用戶:
2.1 用戶消費(fèi)能力和消費(fèi)行為差異角度
通過分析使用某增值業(yè)務(wù)的用戶和未使用用戶的消費(fèi)行為數(shù)據(jù),找出兩者的消費(fèi)行為差異,尋找和探索表征客戶使用習(xí)慣的指標(biāo)變量,以建立客戶的特征模型。從現(xiàn)有未使用該增值業(yè)務(wù)的客戶中篩選出符合此特征模型的用戶群,并預(yù)評(píng)估其營銷成功的概率,對(duì)其中營銷成功概率較高的潛在用戶開展有針對(duì)性的營銷服務(wù),使之發(fā)展成為該增值業(yè)務(wù)的用戶。
2.2 增值業(yè)務(wù)交叉銷售角度
交叉銷售是一種以企業(yè)和客戶的現(xiàn)有關(guān)系為基礎(chǔ)去推銷另一個(gè)產(chǎn)品的營銷策略,是通過對(duì)現(xiàn)有客戶擴(kuò)大銷售來增加利潤的一個(gè)有效手段。運(yùn)營商通過收集和積累客戶大量的購買信息,并對(duì)相關(guān)數(shù)據(jù)進(jìn)行處理、統(tǒng)計(jì)和分析,在全面掌握客戶消費(fèi)能力、消費(fèi)習(xí)慣、信用情況等信息后預(yù)測客戶下一步要購買的產(chǎn)品和服務(wù),從而有針對(duì)性地向客戶推薦特定的產(chǎn)品,以便提高產(chǎn)品的營銷成功率。
增值業(yè)務(wù)交叉銷售通過分析現(xiàn)有客戶對(duì)增值業(yè)務(wù)訂購和使用信息,分析同一業(yè)務(wù)不同產(chǎn)品之間的內(nèi)在聯(lián)系,掌握客戶使用偏好,對(duì)于某特定產(chǎn)品篩選出具有潛在價(jià)值的客戶,使?fàn)I銷服務(wù)更具針對(duì)性,擴(kuò)大產(chǎn)品的用戶群體。
以機(jī)器學(xué)習(xí)的觀點(diǎn),分類是一種有指導(dǎo)的學(xué)習(xí),即每個(gè)訓(xùn)練樣本的數(shù)據(jù)對(duì)象已經(jīng)有類標(biāo)識(shí),通過學(xué)習(xí)可以形成表達(dá)數(shù)據(jù)對(duì)象與類標(biāo)識(shí)間對(duì)應(yīng)的知識(shí)。從這個(gè)意義上說,分類的目標(biāo)就是根據(jù)樣本數(shù)據(jù)形成類知識(shí),并對(duì)源數(shù)據(jù)進(jìn)行分類,進(jìn)而預(yù)測未來數(shù)據(jù)的歸類,可用于潛在客戶的挖掘。
目前常用的分類器構(gòu)造方法包括:基于決策樹模型的分類器構(gòu)造方法(如ID3、C4.5、IBLE、 SLIQ、SPRINT等)、基于統(tǒng)計(jì)模型的分類器構(gòu)造方法(如貝葉斯方法)、基于神經(jīng)網(wǎng)絡(luò)模型的分類構(gòu)造方法、基于遺傳算法的分類器構(gòu)造方法、基于粗糙集的分類器構(gòu)造方法等。由于電信企業(yè)的用戶資料存在非數(shù)值類型數(shù)據(jù),相對(duì)于神經(jīng)網(wǎng)絡(luò)算法而言,使用決策樹算法可免去許多預(yù)處理工作,且模型結(jié)果易于解釋。針對(duì)電信業(yè)超大規(guī)模數(shù)據(jù)量,決策樹C5.0算法具有很高的執(zhí)行效率,并且在面對(duì)數(shù)據(jù)遺漏和輸入字段很多的問題時(shí)非常穩(wěn)定,故本文采用C5.0算法創(chuàng)建決策樹。建模過程如圖1所示。

圖1 建模過程圖
C5.0算法根據(jù)能夠帶來最大信息增益的字段拆分樣本。其算法思想是:第一次拆分確定的樣本子集隨后再次拆分,通常是根據(jù)另一個(gè)字段進(jìn)行拆分,這一過程重復(fù)進(jìn)行直到樣本子集不能再被拆分為止。最后,重新檢驗(yàn)最低層次的拆分,那些對(duì)模型值沒有顯著貢獻(xiàn)的樣本子集被剔除或者修剪。
以某運(yùn)營商“手機(jī)報(bào)潛在客戶挖掘”為例,通過該運(yùn)營商用戶使用電信業(yè)務(wù)的一些基礎(chǔ)數(shù)據(jù)資料,包括用戶資料(如客戶類型、入網(wǎng)時(shí)長等)、用戶業(yè)務(wù)使用信息(如月均彩信條數(shù)、GPRS流量等)、用戶消費(fèi)信息(如ARPU、增值業(yè)務(wù)費(fèi)用等),終端支持信息、用戶手機(jī)報(bào)訂購信息(是否訂購手機(jī)報(bào))等。這些數(shù)據(jù)清洗工作完成后,抽取連續(xù)三個(gè)月的數(shù)據(jù)進(jìn)行數(shù)據(jù)探索,掌握各因子的數(shù)據(jù)分布情況,并結(jié)合業(yè)務(wù)經(jīng)驗(yàn)設(shè)計(jì)反映預(yù)測結(jié)果且與結(jié)果直接、間接相關(guān)的衍生因子。然后,取10萬名連續(xù)使用三個(gè)月手機(jī)報(bào)的在網(wǎng)用戶和1萬名最近兩個(gè)月未使用手機(jī)報(bào)的用戶作為訓(xùn)練集,使用C5.0算法對(duì)訓(xùn)練集數(shù)據(jù)建立預(yù)測模型,以“是否手機(jī)報(bào)用戶”為輸出變量,其余為輸入變量。訓(xùn)練結(jié)果為用戶手機(jī)報(bào)業(yè)務(wù)用戶特征的決策樹。
Apriori 算法是一種最具影響的挖掘布爾關(guān)聯(lián)規(guī)則頻繁項(xiàng)集的算法。其基本思想是把關(guān)聯(lián)規(guī)則挖掘分為如下兩步:
第一步:從事務(wù)數(shù)據(jù)庫中找到所有支持度不小于用戶指定的最小支持度閾值的頻繁項(xiàng)目集。在數(shù)據(jù)挖掘中,支持度不小于用戶給定的最小支持度閾值的項(xiàng)目集簡稱頻繁項(xiàng)目集。
第二步:使用頻繁項(xiàng)目集產(chǎn)生所期望的關(guān)聯(lián)規(guī)則。關(guān)聯(lián)規(guī)則的置信度不小于用戶指定的最小置信度閾值。
以手機(jī)報(bào)深度營銷為例(指向目前使用手機(jī)報(bào)的用戶推薦其它不同類型的手機(jī)報(bào)),交叉銷售挖掘的研究思路為:分析各種手機(jī)報(bào)之間的關(guān)聯(lián)程度,篩選使用了較強(qiáng)關(guān)聯(lián)中后項(xiàng)的用戶。建模步驟如下:
1)根據(jù)客戶的手機(jī)報(bào)訂購關(guān)系,分析挖掘客戶同時(shí)訂購多種手機(jī)報(bào)的情況,根據(jù)關(guān)聯(lián)度判定規(guī)則,對(duì)訂購各手機(jī)報(bào)產(chǎn)品進(jìn)行關(guān)聯(lián)度計(jì)算,判斷出哪些手機(jī)報(bào)之間具有較高的支持度和可信度。
2)從多種視角分析不同手機(jī)報(bào)之間關(guān)聯(lián)度高的原因,例如哪類用戶同時(shí)訂購了新聞早晚報(bào)和鳳凰時(shí)事周刊,為優(yōu)化產(chǎn)品結(jié)構(gòu)和捆綁營銷提供支撐。
3)選擇訂購了某種手機(jī)報(bào),但未訂購和該種類型關(guān)聯(lián)程度較高的手機(jī)報(bào)的用戶,作為該手機(jī)報(bào)的潛在用戶。
1)模型驗(yàn)證
分類模型的驗(yàn)證方法是對(duì)檢驗(yàn)集數(shù)據(jù)應(yīng)用模型結(jié)果規(guī)則集,用命中率、查全率、Gains圖、Lift圖等對(duì)應(yīng)用結(jié)果進(jìn)行準(zhǔn)確性和模型效果評(píng)估。關(guān)聯(lián)規(guī)則模型通過多期數(shù)據(jù)的支持度、可信度、提升度等指標(biāo)衡量。此外也包括通過多期歷史數(shù)據(jù)進(jìn)行驗(yàn)證,以確定模型的表現(xiàn)是否穩(wěn)定。模型的穩(wěn)定性主要用于測試模型是否在未來具有較好表現(xiàn),是否符合預(yù)期。
2)模型調(diào)優(yōu)
模型調(diào)優(yōu)的目標(biāo)是根據(jù)模型評(píng)估結(jié)果,對(duì)模型進(jìn)行優(yōu)化,使檢驗(yàn)指標(biāo)具有較好的綜合表現(xiàn)。模型調(diào)優(yōu)可以通過設(shè)計(jì)合理的衍生因子、調(diào)整平衡節(jié)點(diǎn)、修改挖掘方案等實(shí)現(xiàn)。
3)營銷效果評(píng)估
該某運(yùn)營商“手機(jī)報(bào)潛在客戶挖掘”案例為例,使用手機(jī)報(bào)數(shù)據(jù)挖掘模型從樣本數(shù)據(jù)中發(fā)現(xiàn)8903名目標(biāo)客戶,通過客服人員電話營銷,實(shí)際呼通4741人,實(shí)際訂購1238人,營銷成功率為26%。而此前該運(yùn)營商手機(jī)報(bào)外呼營銷成功率在9%-11%之間,挖掘模型提供的數(shù)據(jù)營銷效果明顯,營銷成功率約是原來的2~3倍,取得良好的經(jīng)濟(jì)效益。
本文從用戶消費(fèi)行為差異角度和增值業(yè)務(wù)交叉銷售角度建立了精確營銷模型,分別應(yīng)用于潛在客戶的挖掘和對(duì)同一種增值業(yè)務(wù)不同產(chǎn)品的深度營銷,在某地市的手機(jī)報(bào)營銷中取得了預(yù)期效果。
在3G時(shí)代,增值業(yè)務(wù)已成為各大運(yùn)營商市場爭奪的焦點(diǎn),使用數(shù)據(jù)挖掘方法實(shí)現(xiàn)增值業(yè)務(wù)精確營銷已成為拓展客戶的重要途徑。然而數(shù)據(jù)挖掘的特殊性在于模型的調(diào)整、優(yōu)化是一個(gè)持續(xù)改進(jìn)的過程。隨著增值業(yè)務(wù)產(chǎn)品的不斷豐富,建立多種業(yè)務(wù)交叉銷售的模型成為下一步需要重點(diǎn)研究的內(nèi)容。
[1]段云峰,等.數(shù)據(jù)倉庫及其在電信領(lǐng)域中的應(yīng)用[M].北京:電子工業(yè)出版社,2005.
[2]王肇剛.基于網(wǎng)絡(luò)拓?fù)浼s束的時(shí)序數(shù)據(jù)挖掘算法研究與應(yīng)用.北京郵電大學(xué),2009.
[3]婁蘭芳,潘慶先.基于集合運(yùn)算的頻繁集挖掘優(yōu)化算法[J].山東大學(xué)學(xué)報(bào)(理學(xué)版),2008.