張景川,席永杰
(山東廣電網絡有限公司臨沂分公司,臨沂 276000)
隨著廣電網絡集團客戶業務的快速發展、用戶的增長,廣電網絡公司機房需要投入大量的服務器用于業務部署和支撐,如何在有限資金投資的前提下實現業務快速部署、集中管理,達到系統高可靠性和高可用性的目標?同時又滿足降低網絡維護成本、提高維護效率、節能減排的要求,是我們在網絡管理工作中一個重點關注和努力的方向。在這里搭建先進的高性能虛擬化平臺進行服務虛擬化成為首選方案。山東廣電網絡有限公司臨沂分公司(以下簡稱“臨沂分公司”)中心機房數據業務系統建設較早,現有設備運維管理的缺陷及弊端日益凸顯,主要表現在如下:
(1)服務器數量多,維護成本居高不下。大部分應用分布在不同的物理服務器上,數十臺服務器占據大量的機柜資源。且由于服務器建設周期不等,部分老舊服務器性能不足、硬件故障率較高。大量的部件維護和購置更換等在增加人員工作量的同時更增加了維護成本。
(2)耗電量及運營成本的增加。從維護成本支出上計算,每臺服務器按中等負載約300W,在不考慮制冷設備耗電量的情況下,僅十臺服務器每年就需要消耗接近3萬度電。
(3)無備份運行安全性差。多數服務器目前基本上屬于單主機環境運行,且沒有集中的數據備份和管理,一旦業務系統出現故障無法實現快速的系統恢復和數據恢復,會造成業務長時間中斷。同時集客業務的客戶多是政府部門,現有硬件設施更是無法滿足政府對業務實時性的要求和業務系統數據安全性的要求。
(4)新增業務成本高。集客業務需求逐漸豐富,新增業務系統時需購置服務器及機柜,設備購置調試周期較長,無法實現新業務系統的快速上線。
(5)監控管理技術落后、效率低下。既有內網設備管理方式仍多數采取將放置在機柜中的服務器逐個接入KVM,通過KVM接入顯示器,通過顯示器進行切換分別進入不同的服務器進行維護操作。業務系統逐漸增多,維護人員需要管理的系統也越來越多,這種輪詢檢查的方式越來越成為制約維護效率提升的瓶頸。
結合業務應用現狀需求,臨沂分公司運行維護部新搭建了一套高性能Vsphere虛擬化云平臺,硬件方面使用多臺高性能服務器組成計算集群并通過NAS掛載多個高性能和大容量存儲。通過虛擬化技術,將分布在物理服務器上的硬件資源形成一體的CPU、內存和存儲資源池,并按需分配給每一臺正在運行的虛擬機。由此多個問題迎刃而解:
(1)實現資源整合。僅用5臺服務器、兩臺集群交換機、兩臺存儲僅一個機柜的空間即可虛擬化出一整套高性能平臺,其中計算資源池達到275.4Ghz,內存資源池達到638GB,整合利舊現有的存儲資源,使存儲資源池達到了近50TB,由此完全了滿足現網以及未來一段時間內各項目對服務器硬件資源的需求。
(2)實現節能降耗。利用P2V技術,將原本運行在物理服務器上的系統整體遷移到虛擬化平臺中,不僅可提高原系統的性能,老舊的物理服務器在完成業務割接后,即可下電下架以節省能耗和機柜空間資源。由此不再需要購置各種型號備件,而配置較新的服務器則進行虛擬化后將其計算資源和內存資源利舊整合到資源池中。目前,我們已將智慧黨建、蜂巢網管、大唐運維、PON網管、OTN網管、AAA計費認證、MSCP-DHCP服務器、DNS、辦公OA、Unio統一網管、FTP服務器等十余種服務進行虛擬化,并下電了多臺老舊的物理服務器。
(3)新業務可進行快速部署。當新業務需要上線調試時,可以根據業務應用需求分配資源大小,通過模板虛擬機的快速部署,進行測試和生產環境的快速搭建,不再需要購置新的物理服務器,縮短調試周期。例如最新的智慧黨建項目,僅用1個小時即快速部署6臺高性能虛擬機并將網絡調試測通。
(4)平臺高可靠性提高。整個虛擬化平臺支持動態遷移(vMotion)以及動態資源調度(DRS),可以在不關機的狀態下對硬件進行維護和升級,更可以實現集群內虛擬機在各個物理機的資源分配及負載均衡,從而保持了業務的高效性、可用性和持續性,多個高性能存儲可對虛擬機的整機進行定時備份,使各個系統的RTO和RPO滿足需求。
(5)整個平臺使用一套監控系統,即可實時對運行在資源池中的所有虛擬機和物理機進行資源監控和調配,可以便捷地對故障虛擬機進行遠程重啟、擴容資源、查詢告警等。
虛擬化云平臺,在山東廣電網絡有限公司臨沂分公司的集團客戶業務和應用服務上逐漸實現了業務快速部署、集中管理、降本增效、提高系統可靠性的目標,極大地提高了運維效率與對外服務能力。