丁毅堅
播出系統運維數據采集及業務流程智能監控系統是根據實際工作需求形成的,集監測、管理于一身的智能化、綜合化監測、管理系統,是基于IP的信息化管理平臺,涉及軟硬件監管、信號流程監管、工作流監管、物理環境檢測、報警管理、日志管理、運維管理及客戶展現等內容。它的建成將輔助工作人員,對系統內的信號、設備、軟件、流程和環境等進行自動化、智能化的監管,并將監管結果展現給工作人員,當出現報警情況時,提供決策的輔助信息和詳細日志記錄和管理。網管系統采用信息集中采集、數據集中分析、分布分級報警的模式,真正做到輔助播出工作人員關注其應該關注的流程,同時讓技術維護人員第一時間發現系統問題、解決問題。
與此同時,網管系統軟件和播出系統播出軟件無縫結合、良好的對接,可以保證在不影響播出系統軟件(包括播控模塊、上載模塊、總控模塊和素材遷移/管理模塊等子模塊)和硬件的基礎上,為安全播出進一步提供保障和應急。最終開發完成的網管系統作為電視播出軟件系統的輔助系統,具備對電視播出中心的設備、軟件、機房環境等的狀態監測功能,實現了基于網絡口方式或串口方式的軟硬件監測和管理。網管系統提供了外部接口技術支持。
播出系統運維數據采集及業務流程智能監控系統主體架構如圖1。

圖1 主體架構圖
系統采用分層設計。各設備插件負責對各類軟硬件系統進行監視和控制,并進行各類數據的初步處理。
監控采集服務負責向監控終端及其他業務系統等提供接口,完成各業務模塊對監控子系統的業務管理功能,監控終端及業務系統向監控服務發送各類設備監控命令,實現對設備的監測和控制;各類分析插件用于與網管系統與其他各個業務系統(如播出等)進行連接,獲取業務信息,并結合業務信息和相應設備的運行情況,進行報警的分析和過濾;核心服務器需要對動態故障分析和場景處理、信號和系統設備關聯的邏輯報警進行判斷與處理;監控客戶端獲取監控服務的監視數據進行實時顯示。配置管理則對整個監控子系統的各類設備進行管理。
監控采集服務器是網管系統中負責數據采集和分析過濾的模塊,為監控核心服務器的業務流程提供基礎的數據支持。監控采集服務器和核心服務器采用服務器/客戶端的架構模式,通過網絡鏈路進行數據交換,共同完成系統監控任務。
監控采集服務器在詳細設計階段可以劃分為三大系統單元,包括設備信息管理單元、設備驅動管理單元、數據分析過濾單元。
設備信息管理單元負責服務器全局事件的調度,完成監控命令轉發,數據路由、監控結果回收,緊急事件處理等。設備驅動管理單元是監控服務器的核心,負責管理所有監控設備的信息結構,設備驅動,并連接實際物理設備進行數據采集。數據分析過濾單元負責對采集出的原始數據進行分析、過濾,生成相應的報警文件。
監控采集服務器內部分為監控信息管理器、驅動管理器和分析過濾器三大單元。驅動管理器負責連接物理設備進行數據采集,控制和采集接口負責與外部系統進行交互。公共組件單元為系統提供諸如日志、全局隊列、數據庫服務等支持。
數據采集更新流程如圖2。

圖2 數據采集更新流程圖
5.1.1 系統組成
系統由監控采集服務器、消息中間件、核心服務器和網管客戶端幾個重要應用服務組成。
5.1.2 通訊方式
系統中被監控設備由相應的設備驅動負責進行通訊和解析數據消息,得到設備運行狀態及告警信息。因設備提供通訊協議不同,主要有SNMP、串口、網絡三類通訊方式。本系統中配電柜、空調、溫控器使用串口通訊,播出業務通過網絡通訊,其他大部分周邊設備使用SNMP進行通訊。通訊方式以采集服務器輪詢為主,設備主動推送變更信息為輔助手段。
5.1.3 設備
系統所監控的周邊板塊設備、播出業務統一稱為設備,有統一的數據結構,針對不同設備開發了不同的驅動DLL,變更數據都經過驅動傳遞到采集緩存中,并進一步分析得到報警信息。采集服務器和核心服務器通過中間件進行通訊,本系統中播出系統業務監控、周邊板卡服務器等硬件設備分為不同的采集服務器管理。
5.1.4 客戶端
客戶端面相終端用戶,因辦公位置不固定,可以部署多個客戶端,每個客戶端可定制不同設備列表,當核心服務器獲得該設備變更后,會根據設備ID檢查哪個客戶端訂閱了此設備,從而推送設備信息到相應客戶端上。
播出業務流程監測主要包括節目單流程、素材流程,負責收集播出內部數據,按照播出業務進行智能分析,把業務流程更直觀的展現給用戶,方便用戶定位故障位置,找出錯誤原因,確保安全播出。
首先,運維程序可訪問播控系統數據庫,獲取數據庫節目單;其次,運維程序提供HTTP服務,等待播出、上載、節目單網關、時鐘、一致性檢測等軟件的心跳消息,判斷各模塊是否在線運行,同時接受各模塊推送的數據變更信息以及軟件報警信息;再次,運維程序根據播出時間,進行智能分析,檢查在線播出素材未關聯素材信息,并能夠通知網管系統;再次,網管系統提供播出驅動插件,用來和播控系統運維程序通訊,接受和主動查詢播控業務信息;再次,播出驅動獲得數據更新后,進行智能分析判斷,設置報警狀態,將更新數據及存在的報警信息通知到監控采集服務器;再次,監控采集服務器收到數據、報警更新消息后,根據預先定義邏輯進行分析和過濾,避免發送重復數據,造成核心服務器壓力過大,未被過濾的消息被投遞到中間件平臺;再次,核心服務器啟動后一直訂閱采集服務器投遞的消息,當收到消息后,進行解析構建核心數據緩存,并通過Web service調用通知監控客戶端刷新界面,或觸發報警動作;最后,網管客戶端接收到數據變更通知后,記錄數據變更日志到數據庫中,并觸發相應的邏輯圖或展示界面,如有報警可觸發相應的報警盒設置,提醒值班人員進行注意和處理問題。
首先,采集服務器主動輪詢設備,得到實時的設備信息。其次,設備狀態發生變更后,主動向采集推送變更數據。再次,采集服務器獲取到變更數據后,判斷設備狀態緩存池內是否存在設備的狀態記錄,判斷是否重復,如果重復則刷新數據變更時間;如果不存在或數據有,則傳遞數據到報警分析層。再次,采集服務器報警分析獲取變更數據后,根據設備ID及設備類型獲取到設備報警策略設置,判斷變更數據是否超出正常范圍,若數據值處于正常范圍內則生成數據變更請求,若超出正常范圍則生成報警請求并設置報警狀態和報警級別,將報警及數據繼續傳遞到核心服務器。最后,核心服務器接收到數據變更和報警請求后,根據設備ID判斷哪些客戶端訂閱了該設備,把設備數據變更信息和報警信息推送到相應的客戶端。
播出系統運維數據采集和業務流程智能監控系統,作為電視播出軟件系統的輔助系統,通過大量的技術創新,最終達到了性能穩定、功能全面、安全可靠和操作方便的目標。該系統智能地整合了播出系統中所需的監控信息,貼近值班運維工作的實際需求,一方面極大地豐富了播出系統的運維手段,有效提升了運維人員的運維效能,另一方面,系統的建成有效地為播出一線值班人員提供了及時、全面且準確的播出預警輔助訊息,切實提升了新環境下廣播電視安全優質播出工作的手段與方式。從而全面的提升了播出系統的安全播放水平和運維效率。