韓貞輝,王斐斐,謝恒義,李曉陽,鐘 敏
(河南省地震局,鄭州 450016)
“十五”時期,依托“數字地震觀測網絡”項目建設了地震應急指揮技術系統,該系統包含Oracle 數據庫、地震觸發、企業總線、輔助決策等業務[1-2]。近年來依托該系統開發了地震應急專題圖自動出圖系統和地震應急服務產品推送與管理平臺。目前這些業務均部署在地震應急信息機房內,經過近10 多年的運行,服務器老化、運行不穩定和軟件無法更新等諸多問題逐步凸顯,系統維護、更新成本也在不斷增加。隨著地震應急業務信息化的飛速發展,需要在原應急業務的基礎上不斷拓展新的業務,這對硬件資源和軟件資源的要求更高,原有服務器盡管暫時能夠滿足使用需求,但也存在硬件老化、軟件無法更新等諸多潛在的難題[3-4]。機房多臺服務器只運行一個業務,直接導致硬件的利用率極低[5];系統運行連續性差、靈活性不夠和業務系統部署復雜等問題導致系統維護困難。
針對運維過程中面臨的現實問題,將物理服務器虛擬化成為有效的解決途徑。基于此,本文著重研究如何合理運用虛擬化技術,將原來在多臺服務器上的業務整合到虛擬機,在一臺高性能服務器上部署運行,實現一機多用、一機多能,充分發揮服務器的性能,利用虛擬機系統快速恢復優勢,有效保障了系統災備安全,提高了業務的運行效率和穩定性,大大降低了計算機資源能耗和資金成本,有效提升了地震應急業務的信息化水平,對全國地震系統業務的信息化應用和推廣具有重要的現實意義。
地震局地震應急業務主要部署在5 臺地震服務器和2 臺工作站,如圖1 所示,其中5 臺服務器在2010年配置,主要運行地震應急指揮技術系統;2 臺工作站在2015 年配置,主要運行地震應急專題圖自動出圖系統和地震應急服務產品推送與管理,已工作近7 年。

圖1 現有地震應急業務部署情況
據近幾年運維記錄顯示,基本上每周都會出現1次以上的故障,每次修復都需要花費1~2 h,硬件更新更需要花費很大一筆經費;由于原有業務軟件都是“十五”時期開發的,運行環境比較苛刻,新服務器搭載的操作系統無法滿足軟件的安裝運行要求,隨著地震應急業務量的不斷增加和地震業務信息化的要求逐步提高,要滿足地震應急業務的新需求和系統低成本高效運行,亟須通過搭建虛擬化平臺來解決硬件升級和軟件部署分散難以維護的問題。
虛擬化是指利用虛擬技術將物理機虛擬為邏輯機,每個邏輯計算機能同時兼容運行原物理機的操作系統和原有的工作業務[6]。這些邏輯計算機可通過虛擬化在一臺高性能計算機上運行,且應用程序在相互獨立的空間內運行而互不影響,極大提升系統運行效率[7]。
如圖2 所示,一般在機房主機安裝操作系統,并安裝服務或應用程序,操作系統與硬件是綁定的;在虛擬機結構中,計算機硬件安裝的是虛擬化平臺,在虛擬化平臺安裝操作系統,在操作系統安裝應用程序或服務,操作系統可不直接操作和依賴計算機硬件,能方便地拷貝到其他主機運行。一臺主機的虛擬機也可共享該主機的CPU和內存資源,節省了硬件部署成本,提高了資源利用率。

圖2 物理結構和虛擬機結構對比
虛擬化產品,也就是實現虛擬化的軟件,目前主流虛擬化軟件包括VMware WorkStation、Virtual Box 和Virtual PC等[8-9],通過對3 大軟件進行性能分析、對比研究發現(見表1),VMware WorkStation在部署相同數量的物理機情況下,能支持虛擬機數量最多,且在虛擬技術領域處于領先地位,總體表現性能優秀[10],本文選擇使用VMware Workstation 虛擬化平臺。它能實現在單一的計算機上同時運行不同的操作系統[11-12],并提供開發、測試、部署新的應用程序的最佳解決方案,并可模擬完整的網絡環境,實時快照,比物理機通過ghost軟件備份系統分區或整個磁盤在系統災備方面具有極大的優越性,并可拖曳共享文件夾,支持PXE等功能。

表1 3 大虛擬化軟件產品特點
為提高服務器的利用率,本文對現有系統及業務進行梳理和優化整合(見表2),將專題圖系統和災情報告管理及推送系統整合到1 臺虛擬主機,將5 臺應用服務器的業務優化整合到4 臺虛擬機,優化整合后的服務器數量減少30%,大大降低了運維難度。

表2 優化后業務部署
為滿足現有地震應急業務的需求,本研究按照優化后的地震應急業務分布(見表2),將地震應急業務部署到5 臺虛擬機,用1 臺高性能服務器物理主機運行5 臺虛擬機(見圖3)。每臺虛擬服務器配置雙虛擬網卡,分別采用僅主機(Host-Only)網絡模式和自動橋接(Bridge)網絡模式。虛擬服務器之間通過Host-Only 模式,實現一臺主機的內部網絡通信連接,避免外部物理網絡故障對整個系統帶來影響;虛擬服務器通過Bridge 模式,實現與外部網絡的互聯互通[13-14]。

圖3 虛擬化地震業務網絡結構
系統運行過程中,經常會遇到宕機的情況,而故障恢復能力對于地震應急業務的安全穩定運行具有重要意義。通過VMware workstation提供的快照功能,能實現在虛擬機關機或運行狀態瞬間保存當前狀態,當系統出現故障時,通過快照功能,選擇需要恢復系統快照的時間節點,實現系統的快速恢復[15],實現在每次更新完地震應急基礎數據后或系統進行維護更新后快速及時備份,本文以server0 為例通過快照,選擇要恢復的時間節點,快速修復故障。這種以時間命名的備份方式,更容易找到虛擬機要恢復到的時間節點,為系統的快速恢復提供有效的安全保障。

圖4 快照管理
本研究將物理機系統與虛擬系統在一定運行時間內的運行情況進行統計分析(見表3、4)。

表3 兩系統占用資源對比
由表3 可見,在系統進行虛擬化改造后,原本在7臺服務器上部署的業務,通過新增1 臺高性能服務器即可完全負載,更新成本也由14 萬元降到了2 萬元。虛擬化后的系統資源使用率也得到提高,節省了機房架設空間和耗電量。
由表4 可見,在同一時間、地點、震級等條件下,應急指揮技術系統及專題圖出圖系統的產出時間也大大縮短,系統故障恢復時間也從原來的1 h 縮短到了1 min,系統的穩定連續運行得到了有效保障。

表4 兩系統運行效率對比
本文探索通過虛擬技術,將現有地震應急業務進行虛擬化改造,結果表明,相比于原有系統,虛擬系統可大大節約配置成本和能源消耗,還能實現故障的快速處理,顯著提高了業務的連續性、可靠性和安全性,可為地震業務信息化升級改造提供參考,具有重要的現實意義。