鐘建斌
摘要:高速公路監控中心由于集中了高速公路營運管理方面的多個應用系統,里面安裝部署了大量的各種服務器。隨著營運管理的需求不斷增加,還有更多的服務器安裝部署進來。然而監控中心機房在空間、供電、通風、消防等方面的資源的固定的,不能隨便增加。更重要的是,很多應用系統并不需要獨立的服務器去支撐。以上兩方面的原因,造成了監控中心機房在負載以及性能優化方面面臨極大的壓力。本文探討了高速公路監控中心機房服務器架設優化的幾個技術方面的方案。
關鍵詞:高速公路;監控中心機房;服務器
目前,我國高速公路機電系統一般由三大基礎系統組成:通信系統,收費系統以及監控系統。這三個系統的設備以及應用總節點都在路段監控中心機房。監控中心機房成了整個高速公路營運管理的核心。高速公路監控中心由于集中了高速公路營運管理方面的多個應用系統,里面安裝部署了大量的各種服務器。隨著營運管理的需求不斷增加,還有更多的服務器安裝部署進來,造成高速公路不斷的擴容升級。然而監控中心機房在空間、供電、通風、消防等方面的資源的固定的,不能隨便增加。更重要的是,很多應用系統并不需要獨立的服務器去支撐,往往造成服務器資源的極大浪費。以上兩方面的原因,造成了監控中心機房在負載以及性能優化方面面臨極大的壓力,很有必要對監控中心服務器部署架構進行優化,以實現應用優化、節約資源、節能減排以及便于維護的目的。
一、現狀分析
以XX高速公路為例,監控中心機房部署了多個系統的多臺服務器。有些服務器工作載荷很小,用戶訪問量需求也不大,性能要求不是太高;而有些服務器卻負擔著較大的用戶訪問量,性能需求較高。為了有效整合資源,釋放機柜空間,實現用戶訪問負載均衡,在不增加新服務器的情況下需要對多個服務器部署方式進行優化。
目前監控中心機房服務器部署現狀見下表:
二、技術方案
優化整合的原則是先考慮專用性和數據安全等級,然后是兼容性。采用集群冗余技術以及負載均衡技術對服務器系統進行優化。
圖一故障遷移示意圖
集群冗余技術原理
集群是一組相互獨立的、通過高速網絡互聯的計算機,它們構成了一個組,并以單一系統的模式加以管理。一個客戶與集群相互作用時,集群像是一個獨立的服務器。集群配置是用于提高可用性和可縮放性。集群技術使系統在故障發生時仍可以繼續工作,將系統停運時間減到最小。集群系統在提高系統的可靠性的同時,也大大減小了故障損失。
當集群中的一個系統發生故障時,集群軟件迅速做出反應,將該系統的任務分配到集群中其它正在工作的系統上執行。考慮到計算機硬件和軟件的易錯性,高可用性集群的主要目的是為了使集群的整體服務盡可能可用。如果高可用性集群中的主節點發生了故障,那么這段時間內將由次節點代替它。次節點通常是主節點的鏡像。當它代替主節點時,它可以完全接管其身份,因此使系統環境對于用戶是一致的。
高可用性集群使服務器系統的運行速度和響應速度盡可能快。它們經常利用在多臺機器上運行的冗余節點和服務,用來相互跟蹤。如果某個節點失敗,它的替補者將在幾秒鐘或更短時間內接管它的職責。因此,對于用戶而言,集群永遠不會停機。
負載均衡技術原理
負載均衡(又稱為負載分擔),英文名稱為Load Balance,其意思就是將負載(工作任務)進行平衡、分攤到多個操作單元上進行執行,例如Web服務器、FTP服務器、企業關鍵應用服務器和其它關鍵任務服務器等,從而共同完成工作任務。
負載均衡可分為硬件負載均衡設備解決方案和負載均衡軟件解決方案兩種。前者投資大,適用于大規模系統應用,后者性價比高,適用于小型系統。目前較為成熟可靠的負載均衡軟件有PRIMECLUSTER(PCL)SIS。
PRIMECLUSTER(PCL)SIS是一個功能強大的基于軟件的負載均衡產品,提供可擴展的容錯網絡服務。SIS幫助用戶建立一個可擴展的、可靠的并易于管理的服務器集群,提供了在Linux、Solaris、Windows環境下實現負載均衡(Load Balance)的高效、可靠和高性價比的方案。
PCL-SIS集群中的節點可通過一至多個虛擬IP(VIP)地址來訪問,在用戶面前就好象是一個網絡服務器。
PCL-SIS節點可以包括Linux、Solaris或Windows,它們共享不同服務的負載。有了SIS,用戶可配置每項服務的負載共享,還可運用多種負載均衡算法對特殊應用及站點需求進行細調。
PCL-SIS刪除了單一故障點并確保以下可用性:
●如果任一SIS節點或服務出現故障,SIS會對故障節點周圍的請求進行調度;
●任一出現故障的SIS模塊會得到適度修復;
●曾啟動過SIS的故障節點重啟之后將無縫加入集群,從而恢復最大性能。
●通過將出局包從NIC路由至功能節點,SIS可恢復NIC故障。
SIS具有以下特色:
●為所有外部用戶提供單一IP目標地址
●易于添加節點和服務
●基于每個端口的TCP和UDP服務配置
●多種可用的負載均衡算法
●無縫處理節點故障、服務故障和組件故障
●靈活的備份節點管理
本項目采用軟件負載均衡解決方案。
服務器負載的評價方式
目前京珠北監控中心的眾多服務器的負載情況可用以下三種方式進行評定:
1)事務請求頻率:對于管理型服務器,它的事務請求頻率相對較低;對于應用處理型服務器,它的事務請求相對較高。
2)網絡流量:網絡流量高的服務器負載相對較高。對于進行視頻處理的服務器,其網絡流量是最高的(視頻事件服務器、流媒體服務器和高清卡口服務器)。
3)運算任務:對于業務交叉程度較高的系統,其運算任務相對較高。例如監控服務器,既需要采集大量設備數據,也需要復雜的分析運算,其運算任務相對較重。這一點可以通過服務器CPU及內存資源的占用進行評估。
本項目將對各服務器的實時流量進行檢測,對服務器CPU及內存資源的占用進行情況評估評估,從而得到服務器負載曲線表。從而制定優化計劃。
由于高清卡口服務器(表一第8項)在專用性和數據安全等級上面較高,所以不做改動,保持原有獨立性。事件檢測服務器(表一第3項)由于要實時分析攝像槍傳送過來的圖像,工作負載也是比較高,所以建議保留原有獨立性。緊急電話服務器及防火墻\IPD管理服務器(表一第1、6項)由于都是需要Linux操作系統,所以可以合并為一臺機器進行部署。管理服務器以及監控服務器(表一第4、7項)可以合并進行服務器集群部署,提高系統的可靠性。防病毒服務器、以及媒體服務器(表一第2、5項)需要支撐大客戶訪問量所以建議擴充為三臺服務器進行負載均衡。可以用三臺服務器同時部署流媒體服務軟件,然后增加一套負載均衡軟件PRIMECLUSTER(PCL)SIS。通過系統設置將視頻分發的服務分別部署在不同的服務器上,以此達到訪問負載均衡的目的。這樣的改動需要對原有瀏覽客戶端軟件進行重新設置,將不同的視頻源參數(IP地址和端口)進行重新設置。
將不同的硬盤錄像機或其他視頻源分別鏈接到不同流媒體服務器進行分發。
軟件移植方式
1)防火墻\IPD管理服務器中的應用軟件以及數據庫管理軟件移植到緊急電話服務器上。
2)將兩臺HP G6/G7服務器從新安裝windows 2008 服務器軟件,并安裝集群軟件使之成為服務器集群。然后將管理服務器、監控服務器(視頻管理服務器)同時部署在兩臺服務器上面,而且同時連接到同一個IPSAN存儲器上。
3)將三臺IBM M2/M3服務器安裝windows 2008 服務器軟件,并同時部署流媒體服務軟件和防病毒服務器、,只是在三臺服務器上配置不同的流媒體訪問數據。然后從新設定流媒體瀏覽客戶端的地址設置。
4)需要對各交換機進行路由以及映端口射設置。
結語
該項目實施后,經過實際測試監控中心機房實現了能耗下降25.3%,剩余空間擴充了2各機柜,網絡負荷降低了18.7%,維護成本降低了30%左右。實踐證明,對監控中心服務器進行重新優化架構設計將能有效實現降低能耗,優化資源配置,降低維護成本等目的。
參考文獻:
[1]王國鑫,劉麗云,胡彬.網絡服務器配置與管理. 機械工業出版社,2010.9
[2]劉雪梅. 服務器端軟件性能分析和診斷. 北京郵電大學出版社,2011.7
[3]李智慧. 大型網站技術架構:核心原理與案例分析. 電子工業出版社,2013.10
[4]門伯里(Peter Membrey),豪斯(David Hows),普拉奇(Eelco Plugge)著,武海峰,陳曉亮 譯. 實用負載均衡技術:網站性能優化攻略,2013.5
[5]任永杰,單海濤. KVM虛擬化技術:實戰與原理解析,2013.10