■文/茍明宇
高清互動監測系統建設方案
■文/茍明宇
本文主要對高清互動監測系統建設方案進行論述,并從設計原則、總體方案、系統特點優勢等方面進行分析,且根據筆者多年來的工作經驗和相關知識作出以下探討,希望能給予相關專業讀者借鑒。
高清互動;監測;系統特點;效果
隨著高清互動業務的不斷發展、高清互動用戶的不斷增加,目前采用的人工定期對系統進行巡檢的方式,由于高清互動系統結構復雜、設備環節多,導致監測出現脫節現象,存在故障感知和發現滯后、互動故障排查難度大的問題。
提供IP組播信號監測、信令推流監測、回看時移及點播監測、直播射頻監測功能監測系統很有必要,并提供統一的監測 門戶,實現對互動業務從信源準備到回看錄制,從信令交互到終端呈現的全流程 的監測,將有效縮短互動點播故障發現和故障定位所需時間,提高運維水平和服務質量。
1.1 獨立性原則
高清互動監測系統主要通過模塊之間的交互信令、碼流質量、聲畫質量進行監測,監測點設計和數據鏈路以分流、旁路、專網為主要技術路線,不影響且不依賴于業務系統而獨立工作。
1.2 模塊化原則
高清互動監測系統采用模塊化設計,以便于分布式部署、快速安裝以及系統覆蓋范圍的擴容和監測對象的擴展,同時便于分期建設、分步實施,也利用根據不同的需求實現不同的展示門戶。
1.3 分級部署原則
高清互動監測系統采用省中心、分中心兩級部署方案,同時支持擴展到分前端三級部署,適用于分布式部署和分級管理。
1.4 開放性原則
高清互動監測系統提供開放的數據采集接口,以便于第三方探針設備的接入。同時提供豐富的數據訪問接口,可供第三方系統調用。能夠與日后建成的全省運維管理平臺實現對接。
2.1 總體方案
據高清互動平臺業務監測系統模塊化設計、分布式部署的原則,本方案提供了如下圖所示的系統結構圖(圖1)。
首先,整個高清互動監測系統是一個綜合性的運維平臺,四個各有側重又互相關聯的子系統能獨立工作,并通過監測門戶將關鍵數據、關聯數據統一展示出來,通過監測門戶可以跳轉到各個子系統中進行深入的分析操作。
其次,每個子系統支持分布式部署,根據系統各自功能特點的不同,支持以地市為單位來組織展示頁面,提供對地市數據的匯總和實時告警;支持通過分布式架構管理更大規模的網絡。
最后,高清互動監測系統采用三層邏輯架構來實現,即采集層、平臺層和展示層,利于系統穩定運行和功能擴展。
2.1.1 采集層
采集層是高清監測系統與廣播電視網絡以及業務系統的接口層,用來完成鏈路信號和業務系統運行數據的采集與分析,主要包括IP碼流分析、互動信令分析、模擬終端和射頻分析等功能組件。
2.1.2 平臺層
平臺層是高清互動運營平臺監測系統的功能主體,每個子系統有屬于自己的平臺層軟件及設備,主要為各自子系統提供門戶服務、匯聚服務和統計服務。門戶服務完成展示層所需的數據預處理工作,包括系統數據綜合、業務流程綜合、報警關聯管理、數據匯聚接口、數據庫處理層等邏輯;匯聚服務是平臺層與采集層的紐帶,完成探針采集數據的收集、預處理、數據入庫、數據上傳下達等功能;統計服務用來支撐周期性的數據自動統計功能,完成統計任務調度、局部或全局的統計數據處理以及統計數據入庫等功能。
2.1.3 展示層
展示層由平臺層的WEB服務來實現,監測工作站可通過WEB瀏覽器來實現高清互動所有的展示與操作。主要包括門戶服務器、數據庫及報表服務器、集中存儲陣列。
2.2 IP組播信號監測
IP組播信號監測子系統的邏輯結構圖如下所示,接收IP組播節目流并完成碼流監測。監測數據分析匯總后入庫存儲,并可通過監測門戶進行展示查看。
監測報警系統,接收IP組播節目流,完成多畫面組合顯示,及視音頻異態監測。系統可通過語音、日志、OSD、數據庫、短信、標題欄、邊框等方式進行故障報警。報警數據及關注的節目入庫進行存儲,并可通過監測門戶進行展示查看(圖2)。
2.2.1 信令、推流監測
信令及推流監測子系統的邏輯結構圖如下所示,采集的結果送入匯聚統計服務器進行分析入庫,并為測門戶提供相應的支撐數據(圖3)。
2.2.2 回看、時移點播監測
時移回看與點播監測系統采用基于互動機頂盒改造而成的撥測終端進行點播、回看業務交互模擬,并將模擬產生的指標、告警進行分析、實時告警展示,形成一套完善的自動監測。
2.3 終端排障
終端排障功能設計的目的,是在已經知道某個互動終端明確的訪問故障的情況下,綜合利用信令、碼流、射頻三類探針,對點播的整個過程進行回溯和復現,進而確定故障環節的目的。典型的終端排障實現了根據任意卡號的完整業務鏈監測和完整碼流鏈監測。終端排障功能的實現,主要由以下幾個步驟構成:
2.3.1 用戶點播行為抽取
對用戶的所有點播信令數據進行分析,提取其中關于跟點播開始停止相關的關鍵信令,形成用戶點播記錄,以此作為分析的入口。
2.3.2 服務器內部交互信令提取
根據上面提取的用戶點播記錄,提取關鍵字段來關聯服務器內部的交互信令,形成完整的點播業務鏈,主要是根據S1接口中的SessionID去獲取SM跟VSS通訊的R2信令。
2.3.3 VSS推流情況獲取
根據上面定位的R2信令中描述的VSS推流源地址信息,可以去碼流監測探針檢測到的推流列表中去定位源地址相同的碼流,從而實現將用戶信令和VSS推流的關聯。
2.3.4 IPQAM調制信息獲取
根據上面定位的R2信令中描述的推流的目標地址信息(即IPQAM相應收留信息),同時綜合S1接口中描述的點播碼流調制后的頻點和節目號信息,控制射頻監測探針去提取相應頻點的節目,從而實現用戶信令和IPQAM調制后碼流的關聯,進而形成完成的碼流鏈路。
3.1 互動業務全鏈路監測
提供視頻、信令、碼流、射頻的全系列監測,可實現對基于NGOD架構的高清互動系統的全鏈路監測。
3.2 關鍵組件故障發現及預警
對 B O、S M、C D N、V S S、IPQAM、空分組等關鍵業務組件的性能壓力、響應時間等重要指標實時監測,提供相對值、絕對值等多種組合監測門限,實現業務層面的故障發現及預警,并以語音、短信等方式第一時間通知運維人員,系統告警平均響應時間最短為1分鐘。
3.3 可視化的終端故障定位
以空分組、機頂盒SN為入口,提供可視化的終端故障定位功能,將互動點播相關的信令、碼流、射頻信息綜合分析,準確定位系統故障點。
3.4 軟硬結合的撥測方案
采用了撥測管理服務器加互動業務撥測探針相結合的互動電視撥測方案,可實現對機頂盒點播過程的完整模擬。利用軟件的方式實現互動平臺登錄、頁面瀏覽、點播及回看節目列表獲取,形成撥測任務;部署于互動機頂盒中間件上的撥測探針軟件則負責接收撥測任務,并通過中間件執行,完成實際的點播動作和指標分析。
3.5 豐富的數據呈現及報表統計
提供了趨勢圖、柱狀圖、餅圖、流程圖、接口圖等豐富的界面方式,從不同維度呈現互動點播的上線用戶數、故障情況、業務組件壓力等關鍵指標。提供可定制化的上線用戶報表、故障報表、性能報表等統計表格,為日常決策提供有力依據。
3.6 精準的視音頻監測
系統支持視頻層面的監測,包含:黑場、靜幀、視頻丟失、視頻解碼異常、彩場、彩條、測試圖、馬賽克、亮度異常、視頻比對異常、臺標丟失等;能支持音頻層面的監測,包含:音頻丟失、音量過高、音量過低、音頻比對異常。
3.7 實用的報警管理機制
在準確的視音頻監測的基礎上,高清互動結合了廣電機房值班、運維的實際情況,從日常工作的細節出發,提出并完善了一整套的報警管理機制,使得系統能真正的實用、好用、易用。
高清互動監測系統實現了IP組播信號監測、信令推流監測、回看時移及點播監測、直播射頻監測功能,并提供統一的監測門戶,實現對互動業務從信源準備到回看錄制,從信令交互到終端呈現的全流程的監測,將有效縮短互動點播故障發現和故障定位所需時間,提高運維水平和服務質量,節省了大量的人力和時間成本,提高了高清互動系統故障定位準確度,降低了系統的維護門檻,為系統提前擴容提供數據依據,提升用戶體驗,故障分區域分類統計為及時發現系統潛在隱患和瓶頸提供了數據支撐,點播在線用戶分區域統計為市場的用戶發展策略提供數據支撐,系統按區域統計的活躍用戶為市場針對特定用戶制訂營銷手段提供數據依據。
[1]Comcast:Next Generation On Demand (NGOD) Architecture2.0.
[2]GB/T 17975.1-2000 《信息技術 運動圖像及其伴音信號的通用編碼第1部分系統》.
[3]GB/T 17975.2-2000 《信息技術 運動圖像及其伴音信號的通用編碼第2部分系統》.
[4]GB/T 17975.3-2000 《信息技術 運動圖像及其伴音信號的通用編碼第3部分系統》.
[5]Q/ABS101-2002:國家廣播電影電視總局.有線廣播電視分配網監控設備通用技術要求.
(作者單位:貴州省廣播電視信息網絡股份有限公司)
P451
A