張永棠 陳 俊
1 廣東東軟學院計算機科學與技術系 佛山 528225
2 南昌工程學院江西省協同感知與先進計算技術研究所 南昌 330003
在Hadoop、Spark等大數據處理技術迅猛發展的當下,MR(Measurement Report,測量報告)[1]對數據的采集處理時間已由原來的數天縮短到幾個小時。MR憑借成本低、海量數據且真實可靠的優點,已成為各地部署網絡優化平臺的主要輸入數據源,依靠MR數據進行多元化和精細化的網絡問題分析已成為網絡優化的主要手段。為全面分析和優化無線網絡質量,大量且長期開啟網絡MR上報功能,采集全量小區的全量MR數據用于分析網絡結構、性能和干擾等已經成為通信運營商網絡優化中的一項日常工作[2]。
作為網絡運行的輔助手段,MR功能不應成為影響網絡指標的因素,因此,我們有必要在現實網絡中驗證一下MR功能開啟后,對于網絡性能和基站負荷造成哪些影響,尤其是那些業務負荷本身就較大的基站。目前,現有MR相關論文大多集中在利用測量報告數據對網絡進行分析和優化方案的介紹[3],業內鮮有對MR功能開啟本身對網絡指標影響的評估;因此,常態化開啟MR功能,全量收集小區用戶上報的MR數據是否會影響到網絡運行指標和用戶的業務感知[4],成為一些通信設備提供商和通信運營商的首要考慮。
為解決以上問題,本文通過對網絡指標和基站性能監測的真實數據,在現網中評估MR任務開啟前后網絡性能變化的情況。
MR是指UE及ENodeB上報的測量結果經ENodeB設備輸出,在OMC-R側保存成測量結果的XML數據文件,通過北向接口供通信運營商上層應用提取使用[5]。
在連接狀態下,LTE的終端周期性或事件性向網絡側上報其所測量到的服務小區和鄰區的測量報告,結合這些信息,系統用于完成小區選擇、重選及切換等事件的觸發。為了更好的應用網絡數據來監控網絡的運行狀態,國內三大通信運營商均已規范了測量報告的采集方案[1],統一了各設備廠家上報的測量報告文件格式并規范了數據內容。LTE系統網管側OMC-R采集到的測量報告數據除了來自UE和ENodeB的物理層(PHY)、無線鏈路控制層(RLC)[6]的基本測量以外,還包含了在無線資源管理過程中計算產生的測量報告。UE測量產生的測量數據通過RRC信令上傳給ENodeB,連同ENodeB處產生的測量信息一起,被直接報送到OMC-R中,存儲在以MRO命名的周期性測量報告樣本數據文件中。為了便于對樣本數據的應用,周期性上報的樣本數據經過ENodeB或OMC-R的統計計算,以分段區間的樣本個數的形式存儲在以MRS命名的測量報告統計數據文件中。此外,事件觸發的測量報告樣本數據,被保存在以MRE命名的事件性測量報告樣本數據文件中。上層網管可以通過北向接口來獲取這些文件。測量報告數據采集及存儲示意圖如圖1所示。

圖1 測量報告數據采集示意圖
從整個測量報告的采集流程上看,測量報告的上報涉及到用戶終端UE、基站設備ENodeB、網管服務器OMC-R多處網元,并且伴隨周期性信令交互和測量指標的存儲計算過程,這勢必對基站設備和網絡性能指標產生一定的影響。
從基站角度來說,基站需要對終端上報的信令消息進行處理,合并需要自身計算并輸出的測量指標,開啟測量報告功能會使基站CPU及內存占用率略有抬升。如果CPU占用率過高,會引起基站規格下降,影響系統業務能力,對網絡可能產生沖擊,也會影響網絡指標。
另外,開啟異頻、異系統周期測量時,UE需要啟動測量GAP。由于UE在對GAP異頻或異系統進行測量期間,UE不能收發數據,所以做異頻、異系統周期測量用戶的上行和下行吞吐量會出現一定程度下降,繼而對用戶業務體驗有一定的影響。
在2017年11月21日零點起開啟某省移動公司三個地市的部分網格基站,為避免影響網絡中的用戶業務體驗,沒有開啟異頻測量相關測量指標。記錄下開啟前后幾天忙時(08:00~10:59,20:00~22:59)部分KPI及基站負荷指標。參與評估測試的基站規模如表1所示。

表1 現網試驗的地市的基站規模
測試內容:測量報告任務開啟后對設備和網絡性能的影響,具體包括測量報告任務開啟后對主設備性能的影響和網絡性能關鍵指標的影響。
測試步驟:1)根據網絡運行情況,選擇能夠開啟和關閉MR任務的若干基站,應包括日常負荷較重的基站若干,為盡量確保測試用戶環境的同一性,開啟和關閉MR功能應選擇在同一時間段;2)配置MR文件生成周期為15分鐘,MRO文件采樣上報周期配置為5120 ms,按照MR任務開啟步驟,打開MR功能及相應的測量指標;3)記錄MR功能開啟前后時間周期內的基站CPU負荷及網絡性能相關指標。
觀察對象:觀察開啟和關閉MR任務時,在各自的時間周期內的基站CPU負荷及其他性能統計指標的情況。
預期結果:MR功能開啟不應對網絡性能產生巨大影響。
1)KPI指標。從整體開啟MR的基站來看,比較開啟前(2017年11月17日至11月20日)和開啟后(2017年11月21日至11月23日)的3個地市忙時KPI平均指標,發現MR開啟未對上/下行用戶平均速率、RRC連接建立成功率、無線掉線率、上/下行丟包率這些關鍵指標造成影響,具體測試數據見表2所示。
2)基站負荷。為考察MR開啟對基站CPU占用率的影響,我們選擇基站數量最多的地市一的基站負荷進行統計,負荷采用8時~10時、20時~22時6個小時中最忙時段指標。經統計分析,我們發現MR開啟后基帶板CPU平均負荷上升0.1pp,最大負荷上升0.3pp,主控板平均負荷上升0.1pp,最大負荷上升0.5pp。負荷都只是略微上升,全網來看影響很小,具體如圖2所示。
為了進一步了解MR開啟對于高負荷基站的影響,我們選取地市一中基站負荷最高的14個基站作為評估對象,這些站開啟前基帶板最高負荷均大于30%,且主控板負荷大于20%。表3記錄了這些高負荷基站在MR開啟前后基站CPU平均占用率和最大占用率,需要說明的是由于網絡中終端和業務的隨機性,存在個別基站MR開啟前后變化不明顯,甚至CPU占用率開啟后低于開啟前的情況。

圖2 MR開啟前后的全網忙時基站CPU負荷對比

表2 MR開啟前后的KPI指標對比

表3 MR開啟前后高負荷站點的基站CPU負荷對比
1)KPI指標。比較2017年11月21日零時前后這些站的KPI平均指標,發現MR開啟前后這些站整體KPI指標無明顯變化趨勢,具體測試數據見圖3所示。


圖3 MR開啟前后的高負荷基站KPI指標對比
2)基站負荷。通過對表3中14個高負荷基站忙時基帶板和主控板CPU占用率的統計,得出結果如圖4所示。MR開啟后對主控板的影響稍大,但對于CPU最大負荷來講上升也不超過3 pp。

圖4 MR開啟前后的高負荷基站忙時的CPU負荷對比
測量報告信息可用于系統操作維護,觀察系統的運行狀態,通過對MR數據的分析,可以代替部分路測工作,對網絡質量、覆蓋和運行情況進行客觀的評估[2-3]。為了評估MR開啟對基站負荷及網絡KPI指標的影響,本文以江西移動公司三個地市部分基站為對象,在未開啟周期性異頻測量項的情況下進行了實際評估。結果表明,在不開啟周期性異頻測量項的情況下,MR開啟對KPI指標無影響,基站CPU負荷僅略有上升,全網忙時CPU最大負荷上升0.3~0.5pp,高負荷站CPU最大負荷上升不超過3pp。