劉璐,楊丹,陳睿杰,李嘉,周熹
研究與開發
基于KPCA-GA-BP神經網絡的POI質量預測研究
劉璐1,楊丹2,陳睿杰2,李嘉2,周熹2
(1. 中國移動通信集團設計院有限公司重慶分公司,重慶 401121;2.中國移動通信集團云南有限公司,云南 昆明 650228)
目前移動網絡優化一般基于小區進行網絡質量評估及預測,遵循“升維研究,降維實施”的研究思路,提出了興趣點(point of interest,POI)網絡質量的柔性評價體系,但其涉及較多網絡關鍵績效指標(key performance indicator,KPI),導致POI網絡綜合質量評價體系較為龐雜且預測精度不高,為提高POI網絡質量預測精準性,采用核主成分分析(kernel principal component analysis,KPCA)算法對反向傳播(back propagation,BP)神經網絡的輸入變量進行相關性壓縮,簡化了BP神經網絡結構,然后通過遺傳算法(genetic algorithm,GA)優化了BP神經網絡連接權值及閾值參數。與傳統BP神經網絡預測結果進行對比,在預測準確度方面提高了10.90%,均方誤差性能顯著降低,對研究POI網絡質量的預測可起到較好的支撐作用。
POI柔性評價體系;核主成分分析;遺傳算法;BP神經網絡;POI質量預測
近年來,隨著移動無線網絡的大力建設,用戶規模及業務量急劇增長,無線網絡中覆蓋、干擾、容量等質量問題日益凸顯,傳統面向小區級的優化策略過于片面。遵循“升維研究、降維實施”的研究思路,向上構建興趣點(point of interest,POI)網絡質量評價體系,基于該評價體系動態識別POI網絡質量情況,并結合核主成分分析(kernel principal component analysis,KPCA)算法對評價體系中的多項關鍵績效指標(key performance indicator,KPI)進行降維壓縮處理,將此結果作為反向傳播(back propagation,BP)神經網絡的輸入,并采用遺傳算法(genetic algorithm,GA)對BP神經網絡參數進行優化調整,最后對POI網絡質量進行綜合、全面的預測評估。
目前大數據及地理信息系統(geographic information system,GIS)快速發展,基于各場景功能具備的社會經濟作用,POI[1]被劃分為最小無線網絡的評價單元,POI網絡質量評價體系以最小化路測(minimization of drive tests,MDT)技術數據[2]為主,結合測量報告(measure report,MR)數據輔助補充,動態識別POI內所轄主服小區,相較于傳統簇群,人為靜態鎖定服務小區方式更加靈活,可隨用戶業務分布進行智能識別并歸屬POI,形成柔性POI的“呼吸效應”。
基于MDT數據的POI動態劃分小區示意圖如圖1所示,小區MDT采樣點攜帶了詳細的經度、緯度信息,且與POI場景是多對多關系,即一個小區的MDT采樣點分布在多個POI場景中,而一個POI場景則納入多個小區的MDT采樣點,動態識別POI內所轄服務小區,而非人為定義其下掛小區數量,通過計算可獲取POI場景內各小區采樣點貢獻度。

圖1 基于MDT數據的POI動態劃分小區示意圖
(1)以POI C與POI E為例,在時刻,小區1(cell 1)僅覆蓋POI C及POI E兩個場景,即:
(2)在+0時刻,如果用戶在POI C內未占用cell 1的信號,則有:
傳統基于小區粒度的網絡質量評估[3],對于整體網絡評估結果往往過于片面,優化分析方案可能會陷入局部最優問題,無法形成綜合、全面的評估結果。為解決該問題,本文以用戶業務分布為導向,進行POI場景級的網絡質量評估分析,在網絡分析層面及優化執行層面尋求平衡,達到“網隨業動”的目的。
根據德爾菲(Delphi)專家調查方法[4]選取影響無線網絡的重要指標,17項KPI樣本見 表1。

表1 17項KPI樣本
注:無線電資源控制(radio resource control,RRC),物理資源塊(physical resource block,PRB),增強的單一無線語音呼叫連續性(enhanced single radio voice call continuity,eSRVCC),長期演進語音承載(voice over long-term evolution,VoLTE),演進型Node B(evolved Node B,eNodeB,特指LTE基站)
將小區質量指標升維至POI網絡質量指標,需要對表1中的各項KPI進行原始計數器(counter)的規則拆解,再通過第1.1節中POI動態識別小區的方法獲取小區明細,構建POI網絡質量評價模型,并依據正態分布原則劃分高、中、低質量優先級的標識,最終輸出統一標準化的數據源。
(1)小區KPI拆解及POI級指標匯聚
以無線接通率為例:小區無線接通率=(RRC連接建立成功次數/RRC連接建立請求次數)× (E-RAB連接建立成功次數/E-RAB連接建立請求次數),其中E-RAB為演進的無線接入承載。
POI無線接通率為POI內所轄所有服務小區的KPI counter分別進行規則計算,即:
以上述方法進行各項指標最底層counter的拆解、合并后得到各項初始POI網絡質量數據源,并對該數據進行標準化處理。
(2)數據標準化處理
利用式(1)對數據進行標準化處理,消除量綱差異。

(3)POI網絡質量評價

(4)POI網絡質量標識處理

KPCA的核心思想是對主成分分析(principal component analysis,PCA)算法的擴展[5-6],通過非線性核函數將原始數據從低維空間向高維特征空間映射,再通過計算映射后數據的協方差矩陣,得到相關特征值及特征向量,KPCA算法可解決PCA算法不能處理非線性相關的問題,降維輸出結果可作為BP神經網絡輸入數據源,再做進一步數據分析處理。具體實現步驟如下。

本文采用高斯(Gaussian)核函數進行映射求解:

(3)求解核矩陣:

(4)求解中心化后的核矩陣:

(5)求解核矩陣的特征值及特征向量:



(6)求解非線性主成分:

(7)對特征值進行從大到小排序,并根據各主成分累積貢獻率選取主成分,一般累積貢獻率>90%所對應的主成分數量[7]用來確定BP神經網絡的輸入變量。
BP神經網絡是一種按誤差反向傳播訓練的多層前饋網絡[8-9],其算法稱為BP算法,它的基本思想是梯度下降法,利用梯度搜索技術,以期使網絡的實際輸出值和期望輸出值的誤差均方差最小?;綛P算法包括信號的前向傳播和誤差的反向傳播兩個過程。即計算誤差輸出時按從輸入到輸出的方向進行,而調整權值和閾值則從輸出到輸入的方向進行,典型BP神經網絡的3層結構如圖2所示。

圖2 典型BP神經網絡的3層結構
GA優化BP(GA-BP)神經網絡[10-11]包括神經網絡結構確定、遺傳算法參數優化和BP神經網絡預測3個部分。其中,用GA賦值優化BP神經網絡的初始權值和閾值,可有效解決BP神經網絡對初始權值和閾值進行隨機或人為賦值的不穩定缺陷,使優化后的BP神經網絡能夠更好地預測函數輸出,其基本思想就是用個體代表網絡的原始權值和閾值,將初始化的BP神經網絡的預測誤差作為該個體的適應度值,并通過選擇、交叉、變異操作尋找最優個體,即最優的BP神經網絡初始權值及閾值,GA優化BP神經網絡算法流程如圖3所示。
GA優化BP神經網絡步驟如下。
(1)將第2.1節通過KPCA算法降維后的數據作為BP神經網絡的預測模型輸入變量,根據式(11)遍歷嘗試隱藏層神經元個數,直至選出最優解。


(2)設置神經網絡訓練參數學習率、最小誤差目標值、訓練迭代次數、訓練函數等。
(3)通過編碼符號串可表示個體串長度:






圖3 GA優化BP神經網絡算法流程

(7)變異運算針對個體的每一個基因座,按照變異概率指定其為變異點,并針對每個指定的變異點,對其基因值做取反運算或使用其他等位基因值進行替代,進而產生新的個體,則變異概率m為:

其中,為每代中變異的基因數量,為每代中群體擁有的個體數量,表示個體中基因串的長度。
(8)如遺傳算法模型達到設置最大遺傳代數值,則輸出優化BP神經網絡的初始權值W及閾值b至BP神經網絡進行前向網絡誤差計算,并反向更新其權值W及閾值b,直到達到設置的約束條件后結束模型參數優化,輸出最終的BP神經網絡模型。
為驗證該模型的有效性及準確性,以某地市連續3個月的第3周無線網絡KPI為原始數據源(排除節假日、特殊事件影響),通過第1節中POI網絡質量數據的清洗及處理方法,獲取關聯POI網絡質量高、中、低標識的KPI指標數據X,其中表示樣本數,=1,2,···,3 870;表示KPI維度,=1,2,···,17。
根據KPCA算法進行標準化數據的特征提取,可得到一組相互獨立又包含大量原始數據信息的主成分,一般將累計貢獻率大于90%作為降維標準,將原先17維輸入變量通過KPCA算法降維后得到4維變量數據,KPCA算法降維效果如圖4所示。

圖4 KPCA算法降維效果
將KPCA算法與PCA算法在同一條件下,即主成分累計貢獻率大于90%,進行各項性能比較分析,KPCA算法與PCA算法降維效果對比見表2。

表2 KPCA算法與PCA算法降維效果對比
KPCA算法在降維效果上比PCA算法提升約47.06%,但耗時卻增加36.2 s,這是因為PCA算法協方差矩陣大小與輸入變量樣本維數相關,而KPCA算法中核矩陣大小與輸入變量的樣本點相關,本例中樣本相對較小,核矩陣運算耗時較短,其在實際運用中是可接受的。

經過上述GA-BP神經網絡模型對輸入變量進行訓練,種群適應度與遺傳代數關系曲線(終止代數=100)如圖5所示,種群最佳適應度值在0.759 54及遺傳代數為34時趨于收斂穩定。

圖5 種群適應度與遺傳代數關系曲線(終止代數=100)
將相對誤差、均方誤差(mean square error,MSE)以及預測準確度作為模型性能的驗證標準,并與傳統BP神經網絡進行對比分析,結果如下。


基于BP算法的相對誤差范圍為7.722 7×10?5~4.335×10?1,基于GA-BP算法的相對誤差范圍為5.413 2×10?5~1.919 4×10?1。從結果數據上分析,GA-BP比BP算法更為平穩收斂,對誤差“削峰”更有效果。
基于BP與GA-BP算法的預測準確度對比見表3,基于BP與GA-BP算法對POI網絡質量的預測準確度進行對比,在同一標準條件下分別執行10組驗證測試,BP預測準確度均值為86.40%,GA-BP較BP提升10.90%,平均預測準確度可達到97.30%,其預測性能整體明顯優于BP算法結果。

表3 基于BP與GA-BP算法的預測準確度對比
基于BP算法與GA-BP算法預測結果均方差性能對比如圖7所示,基于BP算法預測結果與實際結果的MSE收斂梯度較為平緩,在BP神經網絡訓練100輪時,MSE性能指標仍未達到設置的目標值1×10?4,而基于GA-BP算法的MSE下降梯度明顯較快,在模型訓練至43輪時MSE達到3.288 3×10?5,已優于目標值,模型性能提升顯著。

圖7 基于BP算法與GA-BP算法預測結果均方差性能對比
本文依據“升維研究、降維實施”的研究思路,首先構建POI網絡質量評價體系,從傳統小區級轉變為POI級優化分析的策略,結合MDT定位數據柔性識別POI所轄主服小區,實現網隨業動的動態感知能力。并基于KPCA對原始數據進行壓縮降維,將此輸出變量作為BP神經網絡的輸入數據源,再采用GA對BP神經網絡的權值、閾值進行初始化調優,根據訓練及測試的驗證效果,該基于KPCA算法降維的GA-BP神經網絡模型具備較好的穩定性及準確性。
[1] 丁彥文, 許捍衛, 汪成昊. 融合OSM路網與POI數據的城市功能區識別研究[J]. 地理與地理信息科學, 2020, 36(4): 57-63.
DING Y W, XU H W, WANG C H. Research on urban functional area recognition integrating OSM road network and POI data[J]. Geography and Geo-Information Science, 2020, 36(4): 57-63.
[2] 劉璐, 陳睿杰, 李嘉. 基于MDT重疊覆蓋度數據的KNN-DBSCAN參數自適應調優研究[J]. 電信科學, 2022, 38(2): 119-129.
LIU L, CHEN R J, LI J. Research on adaptive optimization of KNN-DBSCAN parameters based on MDT overlapping coverage data[J]. Telecommunications Science, 2022, 38(2): 119-129.
[3] 蘇燦. 移動通信網絡優化實證研究[J]. 電信技術, 2019(S1): 19-21.
SU C. An empirical study on mobile communication network optimization[J]. Telecommunications Technology, 2019(S1): 19-21.
[4] 劉偉濤, 顧鴻, 李春洪. 基于德爾菲法的專家評估方法[J]. 計算機工程, 2011, 37(S1): 189-191, 204.
LIU W T, GU H, LI C H. Expert evaluation method based on Delphi method[J]. Computer Engineering, 2011, 37(S1): 189-191, 204.
[5] 彭令, 牛瑞卿, 趙艷南, 等. 基于核主成分分析和粒子群優化支持向量機的滑坡位移預測[J]. 武漢大學學報·信息科學版, 2013, 38(2): 148-152, 161.
PENG L, NIU R Q, ZHAO Y N, et al. Prediction of landslide displacement based on KPCA and PSO-SVR[J]. Geomatics and Information Science of Wuhan University, 2013, 38(2): 148-152, 161.
[6] 李新春, 房梽斅, 張春華. 基于KPCA和改進GBRT的室內定位算法[J]. 傳感技術學報, 2019, 32(3): 430-437.
LI X C, FANG Z X, ZHANG C H. Indoor positioning algorithm based on KPCA and improved GBRT[J]. Chinese Journal of Sensors and Actuators, 2019, 32(3): 430-437.
[7] 董鴿, 閔建中, 陳立范, 等. 基于MATLAB的中藥主成分分析數學實驗教學案例[J]. 現代商貿工業, 2021, 42(34): 142-144.
DONG G, MIN J Z, CHEN L F, et al. Math experiment teaching case of principal component analysis of traditional Chinese medicine based on MATLAB[J]. Modern Business Trade Industry, 2021, 42(34): 142-144.
[8] 馮玉芳, 盧厚清, 殷宏, 等. 基于BP神經網絡的故障診斷模型研究[J]. 計算機工程與應用, 2019, 55(6): 24-30.
FENG Y F, LU H Q, YIN H, et al. Study on fault diagnosis model based on BP neural network[J]. Computer Engineering and Applications, 2019, 55(6): 24-30.
[9] 溫廷新, 孔祥博. 基于KPCA-GA-BP的煤礦瓦斯爆炸風險模式識別[J]. 安全與環境學報, 2021, 21(1): 19-26.
WEN T X, KONG X B. Risk pattern recognition of the coal mine gas explosion based on the KPCA-GA-BP[J]. Journal of Safety and Environment, 2021, 21(1): 19-26.
[10] 宋超, 宋娟. 基于遺傳算法優化和BP神經網絡的短期天然氣負荷預測[J]. 工業控制計算機, 2012, 25(10): 82-84.
SONG C, SONG J. Parameter optimazation for BP neural network with GA on short-term gas load prediction[J]. Industrial Control Computer, 2012, 25(10): 82-84.
[11] 龐爾軍, 于虹, 唐貴基, 等. 基于遺傳算法優化的BP網絡變壓器可靠度計算[J]. 機電工程, 2013, 30(8): 997-1000, 1028.
PANG E J, YU H, TANG G J, et al. Reliability calculation of transformer based on GA optimized BP[J]. Journal of Mechanical & Electrical Engineering, 2013, 30(8): 997-1000, 1028.
Research on POI quality prediction based on KPCA-GA-BP neural network
LIU Lu1, YANG Dan2, CHEN Ruijie2, LI Jia2, ZHOU Xi2
1. Chongqing Branch of China Mobile Communications Group Design Institute Co., Ltd.,Chongqing 401121, China 2. Yunnan Branch of China Mobile Communications Group Co., Ltd., Kunming 650228, China
At present, in network optimization, network quality evaluation and prediction are generally based on communities, and a flexible evaluation system for POI network quality was proposed following the research idea of “research on dimensionality increase and implementation of dimensionality reduction”. However, it involves many network KPI, resulting in a relatively complex evaluation system for POI network comprehensive quality and low prediction accuracy. In order to improve the prediction accuracy of POI network quality, KPCA was used to compress the correlation of input variables of BP neural network, the structure of BP neural network was simplified, and then the connection weights and threshold parameters of BP neural network were optimized through GA. Compared with the prediction results of traditional BP neural network, the prediction accuracy is improved by 10.9%, and the mean square error performance is significantly reduced, it can play a better supporting role in the prediction of POI network quality.
POI flexibility evaluation system, kernel principal component analysis, genetic algorithm, BP neural network, POI quality prediction
TN92
A
10.11959/j.issn.1000–0801.2023004
2022–08–01;
2022–11–09
劉璐(1986? ),男,中國移動通信集團設計院有限公司重慶分公司工程師、高級咨詢設計師,主要從事無線網絡智能優化業務及相關咨詢設計工作。

楊丹(1986? ),男,中國移動通信集團云南有限公司工程師,主要從事無線優化大數據分析及相關管理工作。
陳睿杰(1987? ),男,中國移動通信集團云南有限公司工程師,主要從事無線優化大數據分析、智能運維工作。

李嘉(1989? ),男,現就職于中國移動通信集團云南有限公司,主要從事無線優化大數據分析、智能運維工作。
周熹(1993? ),女,現就職于中國移動通信集團云南有限公司,主要從事網絡優化研究工作。