鈕 遠
中國移動通信集團江蘇有限公司
5G(the 5th generation mobile communication technology, 第五代移動通信技術)建網初期采用了NSA(Non Standalone,非獨立組網)方案,控制面由 4G(the 4th generation mobile communication technology, 第四代移動通信技術) 網絡承載,保證移動性。用戶面在4G網絡和5G網絡建立雙連接,數據存在多條轉發路徑。那么,面對復雜的組網,如何實現4G/5G的關聯分析和快速隔離?如何識別VR(Virtual Reality,虛擬現實)/AR(Augmented Reality,增強現實技術)等新業務并開展主動式業務質量分析?這就要求我們在網絡建設的同時探索5G業務體驗管理方案。
針對NSA 組網方案,基于信令大數據,本文探索“1+4”項關鍵能力,以彌補5G建網初期傳統網管系統的不足,系統架構見圖1。“1”項基礎能力,即“NSA組網采集能力”;“4”項性能管理能力包括:面向新網絡,具備“NSA關鍵性能指標監控分析能力”;面向新用戶,具備“雙連接下單用戶感知溯源能力”;面向新業務,具備“eMBB(Enhanced Mobile Broadband,增強移動寬帶)業務場景體驗評估能力”;面向新終端,具備“5G終端庫自構建和在網評估能力”。
圖1 系統框架
5G網絡部署架構分為獨立組網和非獨立組網,現網組網架構采用非獨立組網NSA Option3x。NSA 3x組網對于eNodeB(Evolved Node B,4G基站)影響較小,綜合利用了5G初期LTE的廣度覆蓋和5G新技術提供的大帶寬。信令面連接由eNodeB與EPC(Evolved Packet Core,演進的分組核心網)建立,EPC與gNodeB(next generation NodeB,5G基站)間的信令面消息通過eNodeB轉發;用戶面連接由gNodeB與EPC建立,EPC與UE間的部分5G流量可以通過gNodeB分流給eNodeB。
采集點分析:現網信令監測探針可以采集到eNodeB與EPC間的S1-MME信令面和S1-U用戶面流量以及gNodeB與EPC間的S1-U用戶面流量。需要考慮5G用戶面流量識別方案,通過靜態配置gNodeB地址識別。
解析協議擴展:對于信令監測系統來說,沒有新增的采集點和新的協議解析,只是原有協議面向5G做了擴展,對應的字典表新增字段用于5G相應的上層分析,如表1所示。
表1 DPI協議變更匯總
3.3.1 NSA關鍵性能指標監控
通過分析NSA控制面關鍵流程以及新增流程,從接入性、保持性、完整性三個維度構建NSA關鍵性能指標體系。通過梳理控制面信令失敗碼定界規則以及網元/用戶/小區多維聚類,總結8大問題場景,進行劣化指標的自動定界,如圖2所示。
圖2 業務邏輯
系統視圖見圖3,主界面GIS(Geographic Information System,地理信息系統)呈現市級、小區級等關鍵性能指標,可針對關鍵性能指標設置預警;針對劣化的指標進行明細下鉆以及失敗場景初步定界。
圖3 系統視圖
性能告警案例:無線側原因導致E-RAB修改指示成功率低。
問題描述:E-RAB修改指示成功率平均在99.5%以上,6月17日和6月19日指標劣化超1pp告警。
問題定位:下鉆分析劣化時間點的明細,發現E-RAB修改指示失敗84%集中在無線側超時。典型超時失敗流程基站發送ERAB修改指示,20s無響應后重發或者發送釋放消息,攜帶原因值tS1relocoverall-expiry。通過聚類定位,發現劣化小區集中在鄧府山社區四期LF-1、鄧府山社區四期LF,優化后指標恢復正常。
3.1.2 劣化站點主動挖掘
非獨立組網,5G基站沒有S1-C,信令面承載在LTE,用戶面分流走4G或者5G?;谛帕铋_展劣化站點的主動優化,如圖4所示。針對NSA 4G錨點站,通過控制面Attach附著、E-RAB (Evolved Radio Access Bearer,演進的無線接入承載)修改流程中無線側失敗進行TOP質差錨點站聚類;針對NSA 5G站日流量超過10GB的站點,通過下行峰值速率、TCP重傳率聚類TOP質差5G站,周粒度開展主動優化。
圖4 NSA周劣化站點聚類
通過單用戶多接口關聯,完整回溯投訴用戶指定時間段全量信令流程。在NSA 3x架構下,單用戶感知溯源需要考慮如下特性:
(1)雙連接下用戶面多路徑一體化呈現。用戶面新增分流場景,5G終端和4G無線網、5G無線網之間建立雙連接,數據在終端與EPC之間可通過三條路徑傳輸(終端--gNB—EPC、終端--eNB—EPC、終端--eNB--gNB--EPC)。為有效定位業務異常,用戶面流程回溯時需進行多數據轉發路徑整合,按唯一的用戶號碼將全部業務單據關聯,單據中填寫每時間段對應網元信息。
(2)控制面新增承載遷移流程的前序關聯。針對Option3X組網方案,5G基站沒有S1-C,LTE承載控制面,保證移動性。接入流程相較LTE附著后面增加承載遷移流程。由于現網信令采集沒有包含X2接口,通過增加對E-RAB修改指示的前序流程的標記和分析,間接反映UE雙連接建立情況。
訴溯源案例:配置錯誤導致附著失敗。
問題描述:用戶投訴5G終端無法注冊5G網絡。
問題定位:通過回溯信令(圖5),發現該用戶存在多次附著失敗,附著失敗原因均為MME返回#15(No Suitable Cells In tracking area,本位置區無合適小區)。針對歷史單據進行分析發現,現網由于#15原因值導致的Attach失敗全部發生在PLMN(Public Land Mobile Network,公共陸地移動網)為46001的小區,同時這些小區的Attach Request附著請求也全部都是失敗,失敗原因均為#15。進行問題定位后發現,上述發生附著失敗的站點屬于新建站點。新建站點由于PLMN配置錯誤導致5G 終端在附著過程中MME返回Attach Reject,同時攜帶#15原因值,修改站點配置之后,5G終端附著成功。
圖5 單用戶投訴溯源案例
NSA組網方案主要為了滿足5G eMBB業務場景需求,針對eMBB典型VR視頻、云游戲進行業務特征分析和體驗建模。
3.3.1 VR視頻業務特征分析及體驗建模
以優酷VR業務特征為例(圖6),VR視頻播放是HTTP(hypertext transport protocol,超文本傳輸協議)多流,為TS(Transport Stream,傳輸流)復用機制。業務交互首先通過HTTP獲取目錄文件,后續根據目錄信息獲取TS視頻切片數據。對于TS視頻,典型做法通過解碼目錄文件獲取視頻各切片基本信息,然后跟蹤每個視頻切片的下載情況,基于當前時間與下載切片的累計播放時長判斷卡頓發生。該算法適用在沒有拖拽/暫停等理想視頻順序播放場景。通過測試發現實際卡頓發生期間,TS的重傳特性更能表征卡頓。實際發生卡頓時間點,有明顯的同一切片發生連續多次下載請求的信令特征。基于上述特征識別卡頓分片數,即相同編號的視頻切片文件重復請求下載,超過設定閾值則認為卡頓切片,將該片記為卡頓。
圖6 VR視頻業務特征
3.3.2 云游戲業務特征分析及體驗建模
目前VR游戲多為本地游戲,主要數據都是在游戲安裝時下載到本地,在本地渲染。未來游戲發展方向為云游戲,渲染在云端完成,節省本地GPU(Graphics Processing Unit,圖形處理器)資源,但是對帶寬需求很大。針對格來云游戲開展業務特征研究,如圖7所示。格來云游戲類似于網頁游戲,游戲運營方在服務器端進行畫面渲染并通過網絡傳輸到玩家手機。云游戲過程是TCP(Transmission Control Protocol, 議。從傳輸波形圖可以看出,傳輸行為為持續不斷地下行數傳,同時上行和服務交互頻繁,其中部分流體現為周期性探測行為。通過機器學習云游戲心跳流數傳特征,在此基礎上計算上下游的時延指標。
圖7 云游戲業務特征
現網5G終端較少,能掌握到的5G終端數據更少。表現在5G終端庫沒有有效維護起來,5G終端的能力集沒有全面獲取的途徑,5G終端在網表現主要依賴于人工撥測。
3.4.1 基于信令數據自學習5G終端庫
通過DPI深度解析信令,提取各關鍵信元的取值,識別5G終端并獲取終端所支持的能力(見圖8)。
步驟1:通過終端上報的雙連接能力識別5G終端;
步驟2:通過解碼Attach request附著請求的UE network capability終端網絡能力等信元獲取5G終端能力;
步驟3:通過S1-U UserAgent(用戶代理)字段提取終端機型信息回填。
圖8 5G終端庫自學習
3.4.2 5G終端在網表現評估
基于信令,對現網活躍5G終端從控制面和用戶面兩個維度開展質量評估(見表2)。目前NSA 5G終端數量較少,終端網絡性能指標差異不明顯。隨著商用后5G終端增多,將持續開展跟蹤分析。
表2 5G終端在網表現
面對5G建網初期復雜的組網方案,基于信令大數據,本文探索了“1”項基礎能力和“4”項性能管理能力,彌補了5G建網初期傳統網管系統的不足。目前系統已在江蘇南京、蘇州、無錫三個NSA商用市應用,有效支撐了日常運維。