雒 騰 張德鑫 桂貝貝 曾志勇
(云南財經大學 統計與數學學院,云南 昆明650000)
運營商在部署5G 網絡的過程中,需要合理地選擇覆蓋區域內的基站站址,進而通過部署基站來滿足用戶的通信需求[1]。而在整個無線網絡規劃流程中,高效的網絡估算對于精確的5G 網絡部署有著非常重要的意義, 無線傳播模型正是通過對目標通信覆蓋區域內的無線電波傳播特性進行預測, 使得小區覆蓋范圍、小區間網絡干擾以及通信速率等指標的估算成為可能。
本文數據來源于“華為杯”第十六屆中國研究生數學建模競賽,賽題提供的數據集包含多個小區的工程參數數據、地圖數據和RSRP 標簽數據, 其中工程參數數據記錄了各小區站點的工程參數信息,地圖數據記錄地形地貌等信息。RSRP 簽代表平均信號接收功率, 單位為dBm. 并將弱覆蓋判決門限Pth的值定為-103 dBm.若RSRP 預測值或實測值小于Pth則為弱覆蓋,若大于等于Pth則為非弱覆蓋。
華為競賽平臺希望我們站在設備供應商與無線運營者的角度,合理地運用機器學習來建立無線傳播模型,來對不同地理位置的RSRP 柵格的平均信號接收功率進行預測, 并有效識別出弱覆蓋區域, 幫助運營商精準規劃和優化網絡從而提升客戶體驗[3],其中使用均方根誤差來作為RSRP 預測的評價標準,為有效測試目標, 還將弱覆蓋識別準確率作為識別弱覆蓋區域的評價指標。
高效的機器學習模型建立依賴于輸入變量與問題目標的強相關性, 因此我們通過文獻資料查找可能影響無線發射機信號的因素[4],并通過模型以及大賽數據信息去設計出合適的特征變量,主要從兩個角度去設計可能影響的特征變量,即幾何位置、經驗信道模型涉及參數,最終構造出了7 個新特征如表1 所示。
2.3.1 幾何位置
對于影響無線發射機信號傳播的因素, 我們可以根據已知的幾何位置來挑選合理的特征. 目標柵格與發射機的地理位置關系如圖1 所示。
a.目標柵格與發射機的距離

表1

圖1

b.目標柵格與信號線的相對高度

c.天線與目標柵格的距離

d.天線與目標柵格相對高度的距離

e.發射機信號的強度


f.發射機所在柵格與目標柵格海拔差

2.3.2 經驗信道模型涉及參數


a.發射機的有效高度

b.場景糾正常數
查閱了 Cost231-Hata模型及其相關的理論背景知識,發現在模型場景糾正常數的定義為:

Cm相當于傳播路徑損耗的懲罰因子, 結合實際的地物類型名稱的編號含義,進行一定的分類區別對待,從而創造出新的特征,即場景糾正常數。
以上我們完成了特征分析和設計的工作, 下面我們來進行特征篩選.輸入變量也稱為“特征”,而選擇“少而精”的特征,一方面可以降低模型的復雜性,防止過擬合;另一方面也能夠提高模型運行效率.本文從相關性和重要性兩個角度來選擇特征,計算出各個特征與目標變量(RSRP)的相關性,并利用決策樹算法輸出各特征對RSRP 的重要性, 再進行加權平均求出二者的綜合得分,篩選出得分較高的15 個特征。
由于數據量比較龐大,因此我們隨機抽取了10 萬條數據進行研究分析,對上面篩選的特征數據利用Tensorflow框架構建了神經網絡模型[3], 隱藏層數設置為3,第一個隱藏層為300 個神經元,第二個隱藏層為200 個神經元,第三個隱藏層為100 個神經元.隱藏層神經元個數逐層減少,呈漏斗形,使得低級別的特征會逐漸被合并到高級別特征中。并且在每層采用了非飽和激活函數relu,之所以選用非飽和激活函數relu 激活函數,是我們考慮了梯度消失/爆炸問題.同時,為了避免多層神經網絡在模型訓練和模型預測過程當中可能出現的欠擬合和過擬合現象,我們必須要對多層神經網絡進行一定的防范措施, 本文我們采用了正則化以避免可能出現的過擬合現象,即采用dropout 正則化進行一定的防過擬合處理。
在此,通過Tensorflow框架構建的多層網絡的模型及其參數選擇就基本已經完成, 接下來的工作就是通過我們構建的多層神經網絡模型,代入訓練數據集,進行相應的模型訓練,最后得到預測值和實測值整體偏差的評價指標RMSE(均方根誤差)結果為11.8001, 弱覆蓋率的評價指標PCRR 為0.29, 符合大賽規定的大于0.2。
本文主要是通過構建無線傳播模型對目標通信覆蓋區域內的無線信號傳播的RSRP 進行預測,是一個回歸問題,并且還通過設置弱覆蓋判決門限對弱覆蓋情況進行檢測, 又涉及到了二分類問題. 因此在模型中用到的神經網絡框架可以移植到其他回歸或分類問題中,只需要改動數據預處理部分即可.這也是神經網絡的強大之處,回歸或分類問題,都可以通過增加神經網絡的復雜度(增加隱藏層、增加神經元)和改變輸出來實現。