無線局域網(WLAN)憑借其無線接入技術本身具有的應用靈活、安裝速度快、建設周期短等優勢,以及地理應用環境的無限制特性,成為3G發展和應用的有效補充。因此,中國移動進行了大規模的WLAN網絡建設,使之成為小區尤其是熱點地區重要的高速無線數據接入手段。

圖1 投訴問題比例
但由于WLAN網絡處于建設初期,多種問題引起了用戶的投訴。根據中國移動某分公司2010年11月至2011年2月投訴數據,從投訴占比看,排名前6位的投訴是設備故障、用戶多導致網絡慢、弱覆蓋、無覆蓋、用戶多導致擁塞、客戶端問題,占比均超過20%。
由圖1可以看出WLAN業務作為移動數據網絡的重要補充手段,急需提升用戶體驗,而網管系統是保障網絡質量,監控網絡性能的重要手段和依據。但在WLAN網管使用的過程中,系統提供的功能卻不能滿足用戶需求。本文將在介紹網管系統現狀的基礎上,通過分析網管數據來分析原因,并提出問題解決的建議。
隨著WLAN網絡的建設,中國移動制定了相關的WLAN網管規范,并建設了相應的網管系統。中國移動的WLAN網管系統定位于網元和網絡管理級的綜合網管平臺,對網元進行集中式管理,與WLAN設備之間存在直接互通的IP路由。WLAN網絡中的AP和AC設備納入省級綜合網管系統進行管理;AS和Portal納入中國移動總部數據網綜合網管系統進行管理??偛烤W管系統通過部省接口從省級網管實現對AC和AP的管理。WLAN網管組網方式如圖2所示。

圖2 中國移動WLAN網管系統圖
根據規范要求,省級WLAN網管采用SNMP等標準協議進行數據采集,主要實現AP、AC等設備的配置管理、性能管理、告警管理及拓撲管理等功能,其邏輯結構如圖3所示。

圖3 WLAN網管邏輯結構圖
目前,中國移動通信集團公司已經制定了詳細的WLAN網管規范,WLAN設備在入網時必須符合相關的網管規范要求,同時綜合網管的開發廠家也按照網管規范的功能要求對WLAN網管進行開發。但在現網的使用過程中,網管系統并不能滿足相關人員使用的要求。通過對網絡維護人員,市場人員,網管系統開發廠家和WLAN設備廠商的調研,并結合集團的規范和現網中使用的網管系統的功能進行對比,我們發現主要存在以下幾個方面的問題。
由于設備自身MIB中僅記錄當時的狀態(包括用戶數和累計數據量),不能提供瞬時流量等信息,因此WLAN網管系統需通過計算統計得到設備流量、性能等數據。但是存在較多不合邏輯或無法關聯對應的情況。例如在線用戶數以小數表示;當AC在線用戶數為0時,關聯用戶數卻很高;AP關聯用戶數比在線用戶數少的情況;業務綜合指標報表中在平均在線用戶數全部非0的情況下,峰值在線用戶數全部為0;關聯用戶數長期不變或數值過大;整個AC下掛AP流量為0等。
(1)故障類型不規范。目前,不同廠家的設備可提供的故障Trap信息的觸發原因和信息內容均不相同,網管系統目前沒有指定統一的故障類型,只是將廠家信息簡單記錄,這就造成多項相同故障信息以不同代碼形式分別統計。同時由于沒有對廠家設備的統一規定,導致某些報警功能越差的設備,在網管系統中故障數量越少,并不能真正體現實際的設備告警信息。故障類型不規范造成某些重要告警不能細化,例如對于廠家發送的不同原因的AP下線告警,網管系統全部歸入WLAN_FITAP_OFFLINE_ERROR告警,而沒有區別原因統計;
(2)故障等級的劃分有待進一步細化,故障等級報表和故障類別報表中對故障等級采用了不同的標識,故障等級報表中為2級(緊急、次要),故障類別報表中為2級(1、3),并且對于無線模塊故障、AP端口down等告警定義為較低級別,但是有些通知類TRAP卻定義為較高級別。
(1)不同類型報表對同一種指標的統計數據不一致。例如故障統計報表中各種統計方式得出的結果不一致,如按照故障類型和設備類型分別統計,得到的結果不同;
(2)同一指標在不同報表中定義不同。例如在按照故障類型和設備廠家統計的結果中,故障類型字段不同。
通過比對WLAN設備中原始網管數據和WLAN綜合網管數據的分析,我們認為出現以上問題的主要原因有如下3個方面:
(1)基礎信息的不準確:WLAN網管系統的原始數據采集于設備的MIB數據庫,OID是MIB中網管對象名稱,對OID的解釋不同造成了網管數據的歧義;
(2)設備不穩定:網管系統在進行數據采集時,遇到AC設備超時無法響應,網管系統無法獲知設備的狀態,導致信息缺失,而網管系統并沒有對數據的校驗和分析;
(3)OMC數據不準確:由于WLAN設備不是電信級設備,在OMC中的原始數據本身缺乏準確性,而且部分關鍵數據未能提供。
根據上文的分析,目前WLAN網管的主要問題是數據的問題,包括告警數據、性能數據等。由于現有WLAN網管系統是按照電信級網絡設備的網管系統要求進行建設,對數據的校驗功能較弱,因此本文建議在數據網管的架構中增加對數據質量管理的處理層,如圖4所示。
新增的網管數據處理層主要完成對采集數據質量監控服務,對采集數據的及時性、準確性、規范性做嚴格的監控。采集和數據監控服務分別對采集適配各個服務實例進程以及被管網元提供的網管接口進行監控,確保所有的采集任務能順利執行、采集的數據能正確適配和轉換,采集的數據符合標準的格式定義,同時提供日志和監控輔助界面,協助網絡維護人員進行監控和核查,數據處理層的具體功能要求包括如下方面。

圖4 網管功能架構圖
根據預先設定的延時門限,數據處理層對數據是否及時生成進行判斷,并立即將數據缺失情況用信息發布或短信方式發送到各數據維護責任人,并根據設定的補采機制自動補采。
數據處理層采用數據流監控的方式進行數據的跟蹤,以保障數據的完整性。一個具體的數據完整性的監控過程建議分階段進行,具體的示意如圖5所示。
數據處理層提供接口,便于網絡維護人員定義規則庫和基本的信息庫。建立WLAN網管數據字典,通過建立網管數據與廠家數據的唯一映射關系,明確各項數據名稱和意義,提高網管數據的可用性。同時,系統根據規則庫進行數據邏輯檢查。如定義某些屬性值不應超出某個范圍,則系統對數據進行核查時要核查數據是否與規則庫內存在的邏輯吻合。
系統通過數據自身的規律及限制條件,驗證數據在邏輯上的準確性,如比率數據應小于等于1、非空數據、非負數據等;通過數據間的業務關聯關系,驗證數據在業務上的準確性。

圖5 數據完整性監控過程
由于WLAN設備的處理能力限制,網管系統應該將大量的計算工作移到后臺進行工作,如端口流量的計算,可以在網管系統中實現,而不僅是從AC設備處采集流量指標。建議改進網管系統的數據處理算法,結合數據的業務屬性對原始數據進行計算,保證數據的可用性,具體的數據處理要求如圖6所示。
同時,增加采集粒度,對于不同的指標數據能夠分級的時間粒度進行采集,如對流量數據可以提高采集粒度,對于不關鍵的指標可以降低采集粒度,滿足網管功能的同時,減輕設備的處理負荷。

圖6 數據后臺處理
由于WLAN設備存在穩定性差,處理能力低等缺點,為實現對3G網絡的有效補充,必須通過有效的網管系統進行克服。而WLAN網管系統的開發不應按照以往電信級網絡設備的網管系統開發思路進行建設,應充分考慮到WLAN設備的特殊性,在網管系統的開發過程中將原來被動接受數據,呈現數據的模式,更改為數據校驗并智能處理的模式,以期對WLAN系統的建設提供更好地支撐。