
摘要:面向大量用于描繪無線網絡性能的指標,該論文提出了一種以皮爾森算法為核心的指標關聯性判斷方法。該方法基于皮爾森相關系數構建算法,采用降維、相關性計算、加權、聚類等數據處理手段,并制成相應分析工具,在覆蓋、容量、干擾三大根因組合的多場景下,指出根本問題,為優化人員提供了優化方案選取思路,能有效指導異構網的優化工作。
關鍵詞:無線通信;皮爾森相關系數;指標;網絡優化
1.背景
在無線網絡優化工作中,面對的往往是復合型問題,僅僅依靠單一的指標優化,很難對實際問題進行有效的、準確的、全面的解決,優化方案偏離靶心,治標不治本。
現有優化指導策略提供的大多是基于單一指標的優化思路,如VOLTE高掉話問題,大部分指導書只會說明若是覆蓋問題引起就如何處理、若是干擾引起如何處理,缺乏指標間的關聯、降維體系,引導復合型網絡問題的解決。
2.目前存在的問題
目前主流優化方式主要存在以下兩點問題。
2.1.現有優化方式缺乏復合型問題分析指引
現有方法大多是從某項網絡指標的優化出發,敘述此項指標從各方面如何優化。但現網存在大量的“復合型”網絡問題,即多項指標存在惡化,在此情況下,必須有效梳理指標間關聯性,現有優化指導方案不能達到此目的。
2.2.現有優化方法缺乏根因指標關聯分析
在網絡優化工作中,我們將覆蓋、容量、干擾定義為網絡問題的根因指標,其他指標惡化為根因指標出現問題引發的上層問題,為“表象”。現有方法在僅針對某項指標,探討其由覆蓋、容量、干擾引起時應該如何處理,缺乏上層指標與根因指標之間的關聯性分析,導致關聯性差,優化精準度低,難以真正對接生產一線。
3.皮爾森算法的原理論述
為解決此關聯性問題,本論文引入統計學中皮爾森相關系數(Pearson correlation coefficient,又稱皮爾森積矩相關系數)用于表征網絡指標間相關性。
3.1.皮爾森相關系數簡介
兩個變量間的皮爾森相關系數定義為兩個變量間的協方差和標準差的商:
估算樣本的協方差和標準差,可得到皮爾森相關系數,常用英文小寫字母代表:
值介于-1和1之間,當兩個變量的線性關系增強時,相關系數趨于1或-1;當一個變量增大,另一個變量也增大時,表明它們之間是正相關的,相關系數大于0;如果一個變量增大,另一個變量卻減小,表明它們之間是負相關的,相關系數小于0;如果相關系數等于0,表明它們之間不存在線性相關關系。
3.2.皮爾森相關系數適配性討論
統計學一般認為,皮爾森相關系數通用約束條件為:
(一)兩個變量間有線性關系;
(二)變量是連續變量;
(三)變量均符合正態分布,且二元分布也符合正態分布;
(四)兩變量獨立。
網絡性能指標滿足以上1、2、3點,而第4點可通過指標間類別劃分達成彼此獨立。因此網絡性能指標與皮爾森相關系數的約束條件高度吻合,可利用皮爾森算法可以挖掘各項指標間的相關性,從而進行覆蓋、容量、干擾三個維度的根因指標相關性提取以及對其他類的數據清洗,確定根因,引導優化策略制定。
4.以皮爾森算法為核心的指標關聯體系
以皮爾森算法為核心,本論文提出一套挖掘指標相關性的關聯體系。
4.1.皮爾森系數實現
借助Python通過函數調用可實現指標兩兩之間皮爾森相關系數計算。
4.2.加權及聚類實現
簡易算法描述如下:
(一)對小區的全量指標進行篩選,找出問題指標,如小區A問題指標集{a1、a2、a3……};
(二)將每個問題指標與覆蓋、容量、干擾根因指標的皮爾森相關系數進行加權計算(Correlation×Weight),分別求出每項指標對應覆蓋、容量、干擾的分數,如問題指標a1對應分數為FG1、RL1、GR1;
(三)將問題指標與三大網絡問題類型進行關聯后,分數最大表示相關度最高,如問題指標a1的FG1最大,代表主要由于覆蓋問題造成a1指標惡化;
(四)根據各項問題指標計算得到的分數進行求和,得到覆蓋、容量、干擾的總分( FG=FG1+FG2+……+FGn,RL=RL1+RL2+……+RLn,GR=GR1+GR2+……GRn),對比后總分最大的項為問題小區的主要網絡根因。
至此,完成了一套以網元小區各項網絡指標為輸入、通過以皮爾森算法及加權計算為內核進行數據處理、輸出與問題小區眾多指標最相關根因指標的關聯系統。
5.輸出結果與試點情況
5.1.輸出結果
指標關聯體系輸出的覆蓋、干擾、容量3個維度根因指標的加權組合,共可窮舉25種組合,其中單一場景3種,復合場景22種。
通過對某地級市全量小區進行指標關聯,得出3種單一場景(弱覆蓋、高干擾、高流量)現網問題點占比約79%,表示約79%的小區僅在一項根因指標出現問題。剩余約21%為復合型場景,即兩類根因的復合、三類根因的復合。
5.2.試點案例
某市網絡問題小區A,在半年期間頻繁出現弱覆蓋、VoLTE切換差、下行低速率、高資源利用率等網絡問題,而回溯問題處理記錄,分析人員認為此問題主要是以解決VoLTE切換差為主,提出優化解決方案,大部分指標沒有顯著改善。
通過指標關聯體系工具進行單點分析發現,該網絡問題小區的覆蓋、容量根因指標均存在問題,且與覆蓋綜合打分更高,即上層指標變化與覆蓋情況變化相關性更強,依此結論進行了優化覆蓋為主、容量問題為輔的調整策略,效果顯著。
6.總結與展望
基于皮爾森算法的無線網絡指標關聯性判斷方法能夠較為有效地處理應對“復合型”網絡問題,將“上層”網絡指標問題向“根因”網絡指標映射,并形成工具,智能輸出處理建議,便于優化人員制定方案。目前本算法已在用戶感知指標的挖掘中初步應用,并在日常無線網絡優化工作中得到良好試用普及。
參考文獻
[1]中國移動通信集團廣東有限公司無線網優中心,1+N集中優化白皮書–V4.0[S]
[2]尹歡一,文志誠,馬正見.一種基于皮爾森相似度和距離權重的改進KNN算法[J].電腦知識與技術,2019,15(27):208-210.
作者簡介:黃琰奕,(1991.8 -),男,江西省鷹潭市,漢族,本科,中級工程師,長期從事無線網規劃、優化及其新技術的研究與實踐。