


[摘 要]隨著5G時代的到來,如何在日趨飽和的市場環(huán)境下準確挖掘潛在存量用戶的5G業(yè)務需求,是運營商亟待解決的問題。文章利用因子分析和K均值聚類算法分析,結合電信客戶的消費行為特點,給出了電信客戶細分的實際解決方案。實證結果表明,該方法對細分挖掘電信客戶有積極作用。
[關鍵詞]聚類算法;K均值;因子分析;客戶細分
[DOI]10.13939/j.cnki.zgsc.2021.04.120
1 引言
隨著移動通信技術的發(fā)展,高速的網絡應用場景,如網絡購物、高清在線視頻、掃碼支付、刷臉識別正逐步普及在中國的大中城市。而5G技術的出現(xiàn),使虛擬現(xiàn)實、自動駕駛、遠程醫(yī)療等前沿應用也應運而生。據(jù)相關研報顯示,到2020年年底我國的5G基站數(shù)將達到65萬個左右,5G套餐用戶預計突破2億人次,實現(xiàn)全國所有二三線城市的市室外的5G信號全覆蓋,重點的縣城及鄉(xiāng)鎮(zhèn)也將逐步得到覆蓋。面對用戶量日趨飽和的市場格局,運營商不得不面臨新一輪的市場份額爭奪,如何精準營銷到每一個潛在用戶群體,讓未來5G用戶量得到快速增長,以滿足自身投資回報和用戶需求是一個亟待解決的難題。
大數(shù)據(jù)的普及以及數(shù)據(jù)挖掘技術的出現(xiàn),使得運用統(tǒng)計學方法來對運營商海量客戶進行精準細分、確定潛在用戶成為可能。文章將通過因子分析及K均值聚類方法,對已有數(shù)據(jù)中的手機用戶群體進行細分,并從中找到最可能升級變更為5G高端用戶的早期潛在客戶群體。
2 電信客戶細分的基本思路和流程
電信運營商在每次技術通信迭代時,都需要建設新一代的基站,投資巨大,5G的建設更是如此,為了盡快產生收益回籠資金,在發(fā)展新一代資費套餐時,必定相較于3G、4G時代要高很多。故而在現(xiàn)有用戶群體內挖掘具有高消費、高使用量的高層次用戶使之快速轉化為5G用戶,成為5G產品精準營銷的關鍵。
文章數(shù)據(jù)集所涉及的信息變量多,共涉及11個信息特征,包括用戶“年齡”“累計在網時長”“當月總出賬金額”“近三月月均出賬金額”“當月累計使用流量”“上月結轉流量”“套餐外使用數(shù)據(jù)流量”“當月語音主叫通話時長”“套餐外主叫通話時長”“合約時長”“交費金額”等項目,故而采用因子分析能夠有效降低數(shù)據(jù)集維度,為細分客戶群提供關鍵依據(jù)。
而本數(shù)據(jù)集數(shù)據(jù)量大,數(shù)據(jù)多以數(shù)值型為主,能夠很好地體現(xiàn)K均值聚類簡潔高效的運算特點。
3 實證因子分析
因子分析是根據(jù)變量間相關性強弱把變量進行分組,使得同組內的變量之間相關性較強,而不同組的變量間相關性則較弱。從而找出具有代表性的幾個重要公共因子,來替代原有的所有變量。在不損失數(shù)據(jù)集信息量的情況下實現(xiàn)降維,減少了數(shù)據(jù)分析的復雜程度。
文章數(shù)據(jù)集中相關數(shù)值變量較多,通過因子分析有助于找到關鍵的公共因子提高分析準確率。
3.1 因子分析前置判斷
首先通過SPSS軟件實現(xiàn)因子分析,對預處理的數(shù)據(jù)集首先采用建設檢驗,確定數(shù)據(jù)集是否適合進行因子分析。采用KMO檢驗和BARTLETT球形檢驗,結果如表1所示。
其中KMO統(tǒng)計量為0.735,BARTLETT球形度檢驗,近似卡方839129.508,顯著性水平P值0<0.05,表明本數(shù)據(jù)集具有良好的構建程度,適合做因子分析。
3.2 主成分法求解因子載荷陣原理及步驟
通常當抽取的前m個主成分累積貢獻率大于80%時,就認為能夠反映原有變量的信息了。表2是采用主成分分析提取公因子后的總方差解釋表。
表1中顯示前四個因子的載荷平方和總計欄特征值均大于1,累積值達到80.051%,基本可以代表原數(shù)據(jù)集中的客戶信息。
3.3 成分矩陣公因子維度分析
旋轉后的成分矩陣見表3,從表中可以看出,公因子1與用戶消費水平方面的關系相關性較高,公因子2在用戶手機號累計在網時長和合約使用時長方面相關性較高,體現(xiàn)了客戶的品牌忠誠度,公因子3在語音通話上關系較密切,公因子4在上網流量方面相關性較高。為此在進行K均值分類時,選取了“當月累計使用流量”“當月語音主叫通話時長”“近三月月均出賬金額”“累計在網時長”幾個指標,分別從客戶上網、通話、消費能力、品牌忠誠度四個維度對客戶進行聚類分析。
4 實例K均值分析
在進行因子分析后,繼續(xù)使用K均值算法對數(shù)據(jù)集電信客戶進行分類,K均值分算法,也被稱作K-means算法,是以距離作為相似度的指標的算法,通過樣本點到類別中心的誤差平方和,作為聚類好壞的評價標準,通過不斷迭代的方法使總體分類的誤差平方和函數(shù)最終達到一個最小值的聚類方法。
4.1 K均值原理及算法步驟
(2)對于每個樣本的xi,將其中標記為距離類別中心,最近的類別,即:
(3)將每個類別中心迭代更新為屬于該類別的所有樣本的均值,即:
(4)重復后面的兩步,直到類別中心最終的變化小于某特定閾值。
4.2 K均值算法難點解析及處理方法
K均值算法使用中有兩個難點,一是得到的聚類結果嚴重依賴于初始簇中心的選擇,如果初始簇中心選擇不好,就會導致聚類結果出現(xiàn)局部最優(yōu)解,給數(shù)據(jù)集客戶分類帶來偏差,因此文章通過對K均值聚類算法充分迭代和多次運行取平均的方式規(guī)避這個問題的出現(xiàn)。
二是K均值的選取,K均值通常取決于對所分析數(shù)據(jù)集特征的了解。文章的數(shù)據(jù)集內均為電信客戶,目的是找到已有客戶群體中具備足夠消費能力和使用量的前端客戶群,使之轉化為未來高層次的5G客戶。為處理好K值選擇,特參考經典的客戶細分模型對電信進行分類數(shù)量的選擇。
在經典的客戶細分模型中,客戶往往被按層分為頂層、大、中、小四類,如圖1所示。
通常頂端客戶群體只占總客戶量的1%~5%,大客戶占到總客戶群體的5%~10%,但這部分客戶消費能力強、品牌忠誠度高,往往貢獻了全部用戶收入的一半以上。這也就是通常所說的二八理論。依據(jù)這一特性,對數(shù)據(jù)集進行探索性實驗,將K值確定為3。最終聚類結果如表4和表5所示。
4.3 聚類后客戶群體特征分析
由表4可以看出,頂層用戶的數(shù)量較少,只有4139人,基本符合經典客戶理論里的數(shù)量占比,大客戶群體占到了所有客戶群的10%左右,這兩部分客戶群體是初期5G產品的重點營銷對象。下面通過表5具體看一下客戶的消費能力分界和通信產品的基本使用情況。
表5中頂層客戶的近三月和當月花費都普遍較高,而且當月流量使用量巨大,由于話費幾個月來都維持高位,推測用戶平時流量使用量都普遍很高,按月均近30G的使用量,屬于高端套餐用戶內的大流量使用者,平日流量使用場景較多,應該是有較高消費能力的青年人,熱衷追劇和游戲。由于5G技術的網速更快,應用場景更多,所以流量使用率也會更高,故頂層用戶無疑是5G產品的首選目標客戶。
大客戶群體與頂層客戶費用相差不多,但流量使用量相對頂層客戶少很多,月均4G~5G屬于較高使用水平,應該是有一定消費能力的中青年辦公族,對5G的需求不如頂層用戶大,但因為具備較高的消費能力,能使用較貴的高端套餐,是三個群體中平均在網時長最長的客戶群體,品牌忠誠度高,故此也是未來轉化為高消費5G產品的重要群體。
中小用戶的語音和數(shù)據(jù)流量均不是很大,月均消費也低很多,屬于市場中的基礎性用戶,目前的3G、4G網絡速度基本已經能滿足他們的需求,由于消費能力原因,他們暫時不會是5G套餐的優(yōu)先使用者,但由于這一群體最為廣泛,基數(shù)最大,是未來5G全面普及后的重要營銷對象,但同時這一群體在網時間短,所以這部分客戶流失概率大,在5G初期就應該在這部分群體中樹立良好的5G品牌形象,培養(yǎng)這一客戶群體5G時代的品牌忠誠度,挖掘其潛在需求,為日后全面的5G營銷做好準備。
5 結論
文章以電信業(yè)客戶近一個月的使用情況為數(shù)據(jù)集,通過因子分析和聚類分析為分析工具,對相關數(shù)據(jù)集內電信客戶進行了細分,并應用客戶細分理論對聚類數(shù)量分析進行了測試,最終確定了最好的分類數(shù)量。實證分析中,依據(jù)4G時代以來電信運營商更加注重流量營銷、注重客戶的月消費貢獻和流量使用情況的特點,對分類后客戶進行了具體的消費行為分析。最終結果符合客戶細分理論的基本特點、用戶行為特征,也符合文章定位潛在的5G高端客戶群體的初衷。表明文章所采用的算法模型可以有效識別出不同消費特點客戶群體,是一種有效的電信客戶細分方法。
參考文獻:
[1]MAHMOOD EGHTESADIFARD.An integrated approach to the selection of municipal solid waste landfills through GIS,K-Means and multi-criteria decision analysis[J].Environmental Research,2020(6).
[2]烏韋.大數(shù)據(jù)時代移動互聯(lián)網廣告精準營銷研究[D].重慶:西南大學.2016.
[3]鄭美容.K-means聚類算法分析研究[J].信息與電腦(理論版),2012(7).
[4]王國順,權明富,李小文.基于客戶消費行為細分的營銷決策分析[J].南開管理評論,2005(2).
[5]姜天赟,江燕,王衛(wèi)權.美國媒體融合發(fā)展觀察[J].傳媒,2019(3).
[6]馮貴蘭,李正楠,周文剛.大數(shù)據(jù)分析技術在網絡領域中的研究綜述[J].計算機科學,2019(6).
[作者簡介]薛龍(1984—),男,漢族,山西太原人,對外經濟貿易大學統(tǒng)計學院在職人員高級課程研修班學員,研究方向:項目管理、數(shù)據(jù)化運營、企業(yè)競爭力。