張 琳
(中國聯合網絡通信有限公司四川省分公司,四川 成都 610016)
隨著電信運營商集約化運營體制的推進和2G、3G、4G、5G混合網絡運營,電信運營商的基站數目越來越龐大。但是,大部分網絡運維工作仍需依賴重復的手工流程實現。煙囪式的運維模式和傳統的建設轉維模式,使網絡無法進行全生命周期統一管理,數據孤島嚴重,故障無法實時感知。
為解決上述問題,網絡運維支撐軟件架構必然向平臺化、智能化、可視化和個性化方向演進。新開通基站全流程管控和健康評估作為網絡運維工作中的重要環節,目標是提高運維人員運行監控實時性,及時發現隱患問題,提高網絡用戶感知。
(1)基站狀態流轉健康自動評估通過可視化方式創建業務模型,簡化模型的學習和定義門檻,使自動評估功能快速適應網絡變化。
(3)系統架構具備一定的靈活性、可擴展性和安全性,并支持大規模的數據并發和高吞吐量。它主要分為數據源、接入中心、存儲中心、統一操作平臺、應用中心及管理中心6部分。
基于狀態流轉的規建維優基站健康自評估系統,屬于智能運維平臺中多個RPA機器人組合起來的一個專項應用。基站健康自動評估系統的能力基于智能運維平臺中的服務組件,以滿足當前管理內容為目標,按規則評估基站告警和性能指標,充分利用已有維護系統架構儲備和知識積累為基礎實施開展,采取兼容并蓄、差異為先的原則,對外構建統一指令接口層,實現網管接口發放統一,無縫銜接各廠家網管系統,全面高效地支撐現有網絡拓撲設備的日常運維。
系統采用組件化和微服務化開發,結合使用場景等特點,合理部署各服務的節點數和資源分配情況。整個部署過程簡單、方便、靈活,且耗時相對較少,如圖1所示。

圖1 流轉狀態流程部署圖
基站狀態流轉健康自動評估系統以流程編輯器為主要驅動,主要由以下功能組成[1]。
(1)個人中心:對接儀表盤接口數據,實現定制化儀表呈現。
(2)流程編輯器:用于創建復雜的流程方式(可視化建模)的取數、網管基站狀態查詢與評分機制。
分別取橡木桶貯藏后的獼猴桃果酒樣品和 4 ℃玻璃瓶密封保存的獼猴桃果酒樣品,各3個重復,隨機編號后進行品嘗打分。樣品的感官評定采用評分法,在學校范圍內篩選了2名具有專業資質的酒類品評教師和10名經過酒類品評培訓的學生(男、女各5人)組成品評小組。受試者被要求對果酒的整體感官質量(視覺、香氣和味道)進行評分,評分范圍在0到10之間。為此,將果酒樣品隨機編號,并用培養皿覆蓋。在20~22 ℃進行盲評,在品嘗過程中提供清水,品評前后使用清水漱口。單獨打分,避免互相影響,收集評分后去掉最高分和最低分各一個,然后計算平均值[15~17]。
(3)指令配置:用于創建指令和指令解析模板以及簡單的查詢任務。
(4)數據拼盤:用于通過指令采集數據和存儲。
(5)常用信息管理:用于創建接口、腳本、數據庫以及FTP服務器等支撐查詢的配置。
(6)任務管家:用于按計劃時間調度任務。
(7)消息中心:為各個應用系統或查詢對應專業提供便利統一的消息接入、消息推送、消息處理及消息管理能力。
(8)數據接入平臺:用于應對多種數據源的數據采集。
系統主要運行邏輯為“采集數據—判斷數據—輸出判斷結果”。通過模塊化設計,主要按實現邏輯將系統分為6個模塊——站點數據入庫,初始化基站數據,工程單驗告警查詢,站點KPI入庫,健康報告生成,健康評分以及狀態跳轉輔助流程。通過6個功能模塊將所需數據匯總至對應的數據表上存儲下來,映射至儀表盤的數據接口進行基站狀態流轉的定制化呈現,從而達到對基站入網生命周期的呈現。
(1)開通前。通過平臺數據對接獲取邏輯站點名稱信息,過程中以邏輯站點名稱進行網管登錄狀態查詢。若邏輯站點出現一個小區已激活則會流轉到觀察期,若未有任何一個小區激活則仍視為開通前。
(2)觀察期。邏輯站點出現一個小區已激活則視為站點進入觀察期。觀察期會對入網基站進行連續10日的即時告警查詢、網優KPI查詢以及用戶數業務量評估,并按規則輸出站點健康報告。若達標進入狀態試運行;若不達標,則停留于狀態觀察期。
(3)試運行。通過健康評估的站點所處的狀態,如圖2所示。
2.2.1 站點數據入庫
通過平臺構建定時入庫流程,并對入庫數據進行必要篩選,按照所需對應的基站數據錄入指定的表中構成起始數據。在此過程中會生成狀態——開通前。
2.2.2 初始化基站數據
網元錄入系統后,配置網元的登錄模板,支持telnet/ssh登錄方統一配置,包括統一網元配置和網元連通性配置。
(1)統一網元配置。根據實際情況搭配統一直連終端配置和統一登錄指令配置,生成網元的登錄配置。
(2)網元連通性配置:對配置網元進行連通性測試。
通過網元登錄設置后,以流程編輯化完成網元數據的初始化,成功登陸基站獲取小區狀態后生成狀態——觀察期。
2.2.3 工程單驗告警巡查
工程單驗告警巡查可通過指令模板構建的指令模板模型或者流程編輯器構建的流程模型來調用執行。指令配置可按需擴展,實現跨專業、跨廠家、跨設備的指令集管理。指令集配置約定了執行指令的網元類型、廠家、設備型號、使用的登錄模式、指令內容、可選擇的指令解析模板以及指令結束符號等。調用指令組件的模型將指定哪些網元執行哪些指令,執行指令按哪個解析模板進行解析推送給指令服務,指令服務執行和解析后輸出。
2.2.4 站點KPI入庫
采用內嵌腳本定時收錄網絡站點相關的KPI數據至對應的數據庫。
2.2.5 健康報告生成
通過觀察期連續10日對基站進行告警檢查判斷和KPI讀取判斷。根據既定健康報告規則輸出基站健康報告,完成觀察期站點健康評估。滿足條件進入試運行狀態,不滿足則停留在觀察期,并有平臺流程繼續檢查對應狀態,直到達到既定的健康水平才準許站點進入試運行狀態。在此過程中會生成狀態——試運行。同樣,通過流程編輯器內嵌的各個組件有機形成報告生成模式,并根據不同廠家進行分區報告存放,通過定制化的iframe儀表盤呈現站點導流狀態和報告下載按鈕[2]。
2.2.6 健康評分和狀態跳轉輔助流程
可視化配置異常檢測規則,實現查詢結果規則的任意配置。
2.2.7 狀態流轉管控儀表盤
根據既定狀態流轉規則產生相應的管控數據表,根據所需數據表使用儀表盤功能呈現所需數據,可實現按地市、按工期、按廠家呈現,做到一應俱全快速知曉新站入網狀態,通過郵件節點或者工單系統快速將現網情況反饋至對應處理人。
無線網維護中均涉及多個廠家的告警查詢,質量監控涉及建設、維護、資源以及性能等多系統查詢。維護人員每次都需要通過登錄不同廠家的網管,記住不同廠家的指令,在信息孤島中進行人工串聯,造成了很大的人力浪費。因此,建議利用流程編輯器、數據拼盤、常用信息管理等功能完整模擬人工工作流程,根據定制流程編輯實現不同廠家不同規則不同系統的自動錄入關聯,使得流程具備自動判斷能力。
分區輸出廠家健康報告后,通過平臺定制開發將對應健康報告推送至站點健康報告池列表中,使得運維人員對每個站點存在的健康問題一目了然,并快速做出處理預案,解決了以往運維人員、優化人員需要定期提取告警、采集網絡KPI的問題,減少了專業流轉層級,提高了一站式發現問題的速度,縮短了流程處理時間,有效減少了建設過程中因不規范建設流程、數據配置導致的網絡質量異動。