徐亞萍
(通號通信信息集團有限公司,北京 100070)
2020年4月20日,中華人民共和國國家發展和改革委員會首次明確“新基建”范圍,城際高速鐵路占據“第三位”。視頻運維管理系統應用互聯網、大數據等技術,實現鐵路視頻監控的智能運維,是對鐵路視頻從傳統基礎設施向智能交通基礎設施轉型升級的響應。
鐵路綜合視頻監控系統監控范圍廣,全路攝像機的接入容量已達到十幾萬路的規模,需要用戶全天候監控,因此對運維監控的需求愈加強烈。現有運維平臺包括視頻圖像質量診斷系統、視頻專業網管系統,分別對視頻圖像質量評估和視頻軟硬件設備實時監控。但在現場運維過程中還存在以下4類問題。
1) 視頻圖像質量系統:算法太專業難理解、算法準確性不高;
2) 視頻專業網管系統:優秀的底層開源框架設備監控,多渠道采集豐富的視頻監控系統軟硬件設備數據,并實現了可視化的監控數據展示,但存在數據簡單堆疊呈現、故障無法定位并全周期跟蹤的問題;
3) 未與生產管理相結合:系統對故障未提供流程化處理,故障工單派發處于手工紙質模式;
4) 缺乏指導分析決策:系統缺乏存儲容量預測,無法通過系統決定相關的資源是否進行擴充,相應的業務部署是否需要調整。
同時,現場運維過程中還存在旺盛的考核評估需求:視頻圖像質量診斷系統已經成熟應用于鐵路總公司,視頻質量運用情況已經作為鐵路部門的考核依據。更細化的考核手段將是用戶深層次的需求:運維人員考核、系統廠商質量評價、設備廠商質量評價。
針對以上問題及需求,如圖1所示構建集實時監控、質量評估、生產管理、分析決策、考核評估于一體的視頻運維管理系統是本文的主要研究內容。

圖1 視頻運維管理系統思路Fig.1 Conceptual framework of video operation and maintenance management system
鐵路視頻運維管理系統,覆蓋設備層、實時分析層、平臺層和應用層,如圖2所示實現從底層運行支撐到上層業務運行的一體化運維管理。

圖2 視頻運維管理系統架構Fig.2 Video operation and maintenance management system architecture
鐵路視頻運維系統通過IPMI、SNMP、zabbix agent、鐵標視頻數據等接口,獲取設備信息;將收集的數據進行數據處理:監控數據接入、接入適配、數據收斂;通過數據訪問總線(MQ、TCP等接口)將數據信息推送實時分析層進行圖像診斷、故障定位等;實時分析層產生的數據或服務支持引擎向上支撐應用層的用戶業務功能。
1)數據采集
支持多協議采集,兼容性強,實現軟硬件資源的整合共享與統一管理,將滿足攝像機、服務器、交換機、存儲設備、電源控制箱等基礎硬件以及視頻系統等應用服務的監控需求,如圖3所示。平臺 提 供 了 支 持 SNMP、IPMI、HTTP、TELNET、zabbix agent等多種協議的數據采集方式。

圖3 數據采集Fig.3 Data acquisition
2)數據監控
網管數據監控設備及其監控項如表1所示。

表1 數據監控設備及監控項Tab.1 Data monitoring devices and items
1)實時監控
對系統監控對象進行資源入庫管理及監控項管理,監控項需進行告警規則配置,如表2所示。

表2 告警規則配置Tab.2 Alarm rule configuration
2)圖像診斷
融入深度學習技術,提高準確率,將視頻丟失、亮度異常、偏色、對比度異常、雪花、模糊等作為不同的圖像種類,設計卷積神經網絡,將輸入圖像輸入網絡后,進行圖像的質量判斷;增加場景變更算法,利用深度學習的圖像相似性進行判斷;建立圖像質量診斷庫,進行算法的優化和評估。
抽象業務診斷算法,提高用戶交互友好性,滿足業務需要。
3)故障定位
通過數據分析,對圖像質量診斷的診斷結果和網管告警信息進行故障關聯,確定引起視頻故障的原因,自動定位故障位置。第一類故障:無法獲取實時視頻圖像故障。第二類故障:錄像斷點故障。錄像出現斷點時段內是否存在攝像機離線、服務離線、云存儲異常等告警,進一步分析路線斷點的根本原因是哪類故障造成的。
4)工單處理
智能故障定位的結果,自動生成工單,按照工區派發下去,運維人員解決故障并反饋歸檔,形成故障閉環管理,如圖4所示(產生故障→報警→定位故障→確認形成工單→下派工區→解決故障→ 故障處理反饋)。

圖4 工單處理流程Fig.4 Work order processing flow chart
5)預警分析
基于設備健康評估體系,為各種類型設備建立健康模型及適配算法,實現設備健康評估及趨勢預測,整個存儲容量的趨勢分析,通過采集模塊獲取狀態信息,設置閾值,系統預測模塊可預測存儲狀態達到預測的時間,并上報用戶提示用戶擴容。實現預警分析,指導用戶決策。
根據實時分析層不同模塊的組合,按需分配給用戶開放不同的產品形態,網管用戶分配實時監控權限,向上提供實時監控應用;圖診用戶分配圖像診斷權限,向上提供質量評估應用;結合多模塊故障定位、工單處理和預警分析模塊向上支撐生產管理、分析決策和考核評估就是整體的視頻運維管理系統。
系統采用分布式部署方案,如圖5所示。

圖5 分布式部署方案Fig.5 Distributed deployment scheme
視頻運維管理系統以核心和區域兩級分布式部署,區域zabbix proxy可以代替zabbix server檢查客戶端的情況,將數據暫時保存在本地,之后統一發給server,減輕server的負擔。
目前,視頻運維管理系統暫未在現場應用,與之相關的視頻圖像質量診斷系統及視頻專業網管系統已成熟應用在現場。
1)視頻圖像質量診斷系統
如圖6所示,圖診系統能夠有效地對視頻圖像出現的視頻丟失、偏色、亮度異常、視頻圖像對比度低等低質視頻以及常見攝像機故障問題進行診斷,有效預防因硬件問題導致的圖像質量低下所帶來的損失并已應用至以下場景。

圖6 視頻圖像質量診斷系統應用Fig.6 Application of video image quality diagnosis system
核心節點:國鐵集團。
區域節點:北京局、武漢局、濟南局、南昌局、廣州局、蘭州局、青藏公司、鄭州局應急指揮中心。
線路節點:京滬高鐵、京沈高鐵、海南東環線、深茂線、廣大線、昌贛線、杭黃線、青連鐵路、京張高鐵。
2)視頻專業網管系統
如圖7所示,網管系統可將服務器、交換機、攝像機、視頻系統、存儲容量等視頻軟硬件數據集中起來,實現資源的整合共享與統一管理。應用場景:京張鐵路。

圖7 視頻專業網管系統應用Fig.7 Application of video network management system
未來的視頻監控系統,建立以業務為導向的一體化運維平臺,充分利用大數據,以業務應用為中心,實現用戶體驗良好、高可用的實時監測和智能故障診斷,提供全局性、高效健壯、標準規范、自動化的監控解決方案并加以實現。