趙雁航,劉昌興,周 陽,馮 博,魏 迪
(中國移動通信集團吉林有限公司網絡優化中心 吉林 長春 130000)
在本次研究中,我們選取了影響用戶感知最為重要的視頻、語音、網絡三個維度來搭建用戶的感知評價體系,首先選取WGCNA(加權基因共表達網絡法)算法,從海量的用戶感知類指標中選取能夠全面而又客觀的反映用戶感知情況的9項重點指標(每個維度選取連接度最高的前3項),并利用熵權法分別賦予該9項指標不同的權重,然后通過PCA(主成分分析)算法將每個維度的3項指標降至一維,同理利用熵權法給每個維度賦予不同的權值,最終將維度權值和子項權值的乘積作為每項指標的末端權值,然后通過k-means聚類算法來確定每一類指標的感知得分的閾值,最終用單項得分乘以對應權值得到單用戶的感知得分,通過用戶的感知得分確定出質差用戶并進行精準營銷,并通過關聯質差用戶和網元定位出感知差問題小區,從而進行相對應的網絡優化措施,從而提升用戶感知[1]。
搭建用戶感知評價體系,第一步就是指標的選取,所以當面對海量的用戶感知類指標時,哪些指標能夠客觀而又全面的代表用戶的真實感知情況是面臨的第一個問題,本文選取了WGCNA算法進行指標的選取,這是一種生物信息學的算法,其目的是探索基因網絡中的核心基因以及各基因之間的關系,以此來挑選核心基因,算法基于數據客觀計算得到指標重要性(連接度表征重要性)從而進行指標選擇,指標的重要性體現為該指標的變化對網絡整體的影響,等于該指標與網絡中其它每個指標的全面相似性的總和。因此可以將基因模塊類比為用戶的感知指標項,將基因網絡類比為用戶感知指標集合,于是挑選影響用戶感知核心指標的過程,就可以類比為利用WGCNA算法尋找核心基因的過程,本文最終通過WGCNA算法為視頻、語音、網頁三個維度分別選取連接度最高的3項指標。
選取完關鍵指標之后,每個指標的重要程度是不同的,哪些指標影響程度大?哪些指標影響程度小呢?在這里我們引入了信息論里面熵的概念,信息是系統有序程度的度量,而熵是系統無序程度的度量,那么對于某項指標來說,就可以用其熵值來判斷其離散程度,指標離散程度越大,該指標對綜合評價體系的影響就越大,那么權重就越大。首先,通過PCA算法將每個維度的3項指標降維至一維,通過熵權法確定出每個維度的維度權值,同理利用熵權法為同一個維度內的不同指標賦予不同的子項權值,最終每項指標的末端權值即為維度權值和子項權值的乘積,本文選取了全省2萬用戶的話單數據作為樣本數據,通過熵權法計算,最終得到各項指標的權值詳情見表1。

表1 各項指標的權值
利用K-Means聚類算法,設置4個聚類中心,將每個聚類中心作為一個數據切分點,因此每個指標均可劃分為5個得分區間,對應的將用戶每個維度的指標均劃分成5個級別,根據指標的好壞,賦予基礎分1、2、3、4、5分,對于同一個得分區間內的用戶,為了區分其感知的不同,再利用線性插值算法,讓離散的得分能連續化。
根據前文利用k-means聚類算法確定的每項指標的子項得分,與對應的指標末端權值進行乘積運算,最終將9項指標的得分進行求和,從而得到單用戶的感知得分。本文通過對全省1800萬用戶進行感知打分,根據用戶得分的分布情況,定義1周內任意5d感知得分均小于2.5分的用戶為質差用戶,從而得出全省26萬質差用戶,然后根據用戶的話單信息對用戶和小區進行相關關聯,定位出2500多個感知差的問題小區,經過現場驗證,問題小區命中率高達80.17%[2-3]。
本文主要是利用智能算法,對用戶感知類的多維指標數據,進行了數據分析與挖掘。最終確立了一個客觀完善的用戶感知情況綜合評價體系。并進一步的,利用機器學習算法,將感知情況與小區KPI指標進行了關聯,找出了造成用戶感知情況差的關鍵KPI指標,為現網優化工作提供了有力的支撐。