張少欣
摘 要 文章提到的流化系統,在不改造終端、不移植客戶端的情況下,解決了云媒體業務推廣過程中嚴重影響新業務、新技術拓展的大量瀏覽器終端配置較低、型號較老、標準不統一等問題,提升了互動電視業務在瀏覽器終端上的操作體驗。文章描述的負載均衡管理和故障檢測流程,能有效保證系統的安全性、穩定性,進一步提升了用戶體驗。
關鍵詞 流化系統;負載均衡;故障檢測
中圖分類號 G2 文獻標識碼 A 文章編號 2096-0360(2018)16-0034-02
江蘇有線在全省進行云媒體業務的推廣過程中,各地市和區縣存在的大量瀏覽器終端存在配置較低、型號較老、標準不統一、無法升級成云媒體版本等問題,使得大量具備盈利前景的業務無法在全省進行統一下發,嚴重阻礙了互動電視新業務、新技術的拓展。
文章描述的流化系統,采用了免移植方案,在不改造終端、不移植客戶端的情況下,可以提供快速部署、統一業務體驗的應用服務,帶給不同終端的非云媒體互動用戶統一、高質量、低延時的用戶體驗。
1 系統組成
根據功能,流化系統主要包含接入網關型路由服務器、流化引擎服務器和管理服務器三種類型的服務器。
1)接入網關型路由服務器(CSR)。負責集成庫客戶端或者瀏覽器Javascript客戶端(免移植方式)的云端接入。實現HTTP協議和流化協議的轉換(免移植)。根據多種業務邏輯進行流化服務的業務路由,為每次請求選擇最適合的流化引擎來提供服務:基于服務類型;基于地域位置;基于服務優先級;基于負載均衡;基于機頂盒型號或用戶類型。會話管理和用戶歷史記錄的存取。
2)流化引擎服務器(CSE)。負責HTML5應用在前端的運行和渲染,實時響應終端的鍵值請求;對云端的渲染輸出進行實時捕獲、編碼和播出,支持IP ES的播出和QAM TS播出的雙模方式;無縫的跨服務器業務切換;會話管理;與IPQAM資源管理的集成。
3)管理服務器(CSM)。負責系統的整體配置、監控和日志報表:服務器級別;業務級別;整體系統級別。通過模擬流化請求并監測碼流的方式實現業務層面的設備監控。統計分析:并發分析;帶寬分析;使用時長分析;PV/UV;系統故障率。
2 網絡架構
流化引擎服務器:具有兩個電口,一個用于信令,一個用于推流。管理服務器、接入網關服務器均為2個業務口。
根據端口需求,各類設備先接入業務匯聚交換機,然后信令由業務匯聚交換機上聯至信令核心交換機;推流由業務匯聚交換機上聯至推流核心交換機。網絡架構如圖1所示。
由于是直接面向電視用戶的系統,系統必須充分保證7×24小時的安全播出,因此,需部署主前端系統和備份中心系統兩套互為備份的系統,且兩套系統必須滿足數據一致性、業務可用性、操作可行性要求。
3 負載均衡管理
接入網關型路由服務器和管理服務器通過F5[1]的四層負載均衡、采用輪詢方式進行負載均衡管理,流化引擎服務器采用CSR自帶的七層負載管理。
1)接入服務器四層負載均衡管理。如圖2所示,所有CSR服務器以一個CSR組的方式工作,同一個組內的CSR服務器間支持實時的Message Queue同步。管理系統下發的業務路由策略(含故障時移除服務器的修改)會通過四層交換發送至其中一臺CSR服務器上,在所有CSR服務器上即刻同步,并在每臺服務器上以配置文件方式保存下來。
在免移植方案中,CSR服務器用來實現終端和流化引擎服務器的中轉連接,并將基本會話信息存儲于共享的Oracle數據庫中。當某臺CSR服務器故障時,用戶請求重連至其他CSR服務器,通過查詢Oracle系統中關于該終端的會話信息,實現業務的無縫恢復。
一般情況下,用戶請求只向主前端系統的四臺接入服務器進行轉發,當主前端系統整體故障時,切換至備份中心系統的接入服務器。
2)管理服務器四層負載均衡管理。如圖3所示,實時監控信息和統計分析的日志數據通過四層交換負載均衡地發送至主前端系統的兩臺管理服務器上,任何一臺管理服務器出現故障,剩余的一臺都可以獨立完成工作。通過共享Oracle數據庫以及定期統計分析文件拷貝鏡像的方式,實現主前端系統和備份中心系統管理服務器的數據同步。
一般情況下,僅主前端系統的兩臺管理服務器提供服務。當主前端系統的管理服務器出現故障時,才通過四層交換切換至備份中心系統的管理服
務器。
4 故障檢測服務器檢測方式
為了提高系統的可用性,及時發現故障服務器,系統中部署了故障檢測服務器。由于故障檢測原理基于流化服務的軟硬件,所以實際部署中可抽取流化引擎服務器作為故障檢測服務器。檢測流程如圖4所示。
故障檢測的流程為:1)故障檢測服務器周期性檢測并校驗流化引擎服務器的圖像輸出內容;2)如果被檢測的流化引擎服務器輸出內容出現問題,包含畫面質量等服務狀態問題,故障檢測服務器將故障服務器通知接入網關型路由服務器,接入網關型路由服務器將此臺服務器從路由表中去除;3)接入網關型路由服務器報告至管理服務器;4)管理服務器發出對應告警信息。
當故障服務器問題解決后:1)故障檢測服務器將通知接入網關型路由服務器,接入網關型路由服務器將此臺服務器加入路由表中;2)接入網關型路由服務器通知管理服務器;3)管理服務器解除對應告警信息。
5 總結
通過在流化系統的部署過程中充分考慮負載均衡策略和備份系統的建設,并增設故障檢測服務器,滿足了系統的安全性、穩定性要求,進一步保證了低延時、高質量的用戶體驗要求,有利于加快云媒體業務在全省各類型終端上無差別地推廣。
參考文獻
[1]F5 Networks,F5 LTM配置指南[EB/OL].www.f5.com.cn,2011.