班華堂
(浪潮商用機器有限公司,山東 濟南 250000)
云集群服務器系統以云計算作為平臺,將各類服務器進行聯動,使得服務器群可以在較短的時間內快速處理各類信息,在很大程度上提高服務器的運算處理能力。隨著技術經驗的逐步積累,云集群服務器系統適用范圍日益廣泛,逐步形成了支持各類異構設備與異構數據的網絡框架,可以根據用戶的使用需求實現信息數據的分類處理,在信息產業內部形成了更為精細化的分工。基于云集群服務器的技術優勢,在實際管理環節應當建立完善的監控管理體系,形成實時化、立體化的監控管理機制[1]。
通過對云計算、集群服務等技術概念的梳理,引導技術人員在思維層面形成準確的觀念認知,把握云集群服務器監控管理的基本要求,明確監控管理重點環節,為后續設計要點的梳理語義技術應用等提供方向性引導。
云計算利用信息網絡形成靈活共享的計算資源平臺,該平臺通過用戶訪問機制,使得用戶可以根據自身需求在較短的時間內快速獲取各類資源,在滿足信息獲取需求的同時降低常規性信息獲取難度。同時云計算技術以分布式基礎架構作為底層邏輯,其在很大程度上可以滿足服務器群拓展的需要,例如LaaS、PaaS以及SaaS等云計算架構極大地提升了云計算的適用性[2]。根據實際使用需求,技術人員通過選擇合理的云計算技術框架、動態添加各類物理設備以及融合相關應用程序,可以有效控制集群服務器的使用成本。集群服務器將多個獨立的服務器串聯起來組建成單一化的系統,這種系統構成使服務器信息處理能力得到提升,避免集群服務器運行出現過載的情況,造成系統崩潰。隨著相關技術經驗的持續積累,集群服務器系統的組成日趨完善,超級群服務器、PC服務器以及中檔服務器的使用兼顧了集群服務器運算處理能力與服務器使用成本管控。近些年來,信息產業發展過程中,基于技術創新與產品研發等不同的需求,技術人員將云計算技術與集群服務器結合起來構建了云集群服務器系統方案。由于系統結構復雜,為確保云集群服務器系統的正常運行,需要在系統內部構建起相應的監控與管理機制。通過監控與管理機制的介入,確保云集群服務器系統穩定運轉,減少設備故障的發生,實現持續性的信息處理、存儲服務。
由于云集群服務器系統監控管理涉及多個對象,監控管理任務體量較大,因此技術人員在云集群服務器系統監控管理設計環節應當采取簡化設計的原則,著力提高監控管理的容錯率,通過基礎設施層、中間件層、顯示層以及運維管理層等不同系統模塊的配合聯動實現云集群服務器系統的動態化監控,根據監控結果靈活調整系統狀態,確保云集群服務器系統平穩運轉[3]。
由于云集群服務器系統監控管理系統定位較為特殊且服務對象多元,為確保系統設計的有效性與合理性,技術人員有必要結合云集群服務器系統監控管理的特點,吸收借鑒過往有益經驗,梳理并明確設計要求。
云集群服務器系統涵蓋大量的服務器,在運行過程中形成了數量眾多的網絡節點。網絡節點作為監控管理的關鍵區域,通過監控管理架構的合理搭建,可以實現對網絡節點的有效覆蓋,保證云集群服務器監控管理活動的有序開展。基于這種認知,技術人員在監控管理架構組件環節可以從被監控服務器集群、監控管理服務器以及管理客戶端等模塊入手,設計完備的監控管理機制[4]。具體來看,被監控服務集群應當采取分布式部署的形式,根據技術能力劃定不同數量的子集群。子集群作為監控管理的對象,最大程度地消除監控管理盲區,提升云集群服務器系統監控管理的精準性。由于監控管理服務器主要功能在于對云集群服務器子集群開展持續的監控,因此每一臺監控管理往往對應多個云集群服務器系統子集群。以監控管理服務器為基礎,將子集群服務器運行過程中產生的各類監測指標進行匯總,針對匯總后的監控指標開展信息評估,以確保云集群服務器系統的運行狀態可以準確呈現。技術人員根據獲取到的相關數據,開展相應的管理舉措,做好云集群服務器系統的調度,確保系統負載均衡,規避系統風險。管理客戶端作為監控管理入口,用戶登陸客戶端后可以快速獲取云集群服務器的整體運行狀態,在此基礎上發出相應的管理指令,對服務器子集群的負載做好科學調整,以防范服務器故障的發生。管理客戶端設置環節,可以采用B/S框架,并設立Web監控模塊,便于用戶采取靈活的操作方案對云集群服務器系統開展精準管理。
在云集群服務器系統監控管理環節,技術人員需要有針對性地構建監控管理方案,對核心數據做好評估與分析。針對云集群服務器系統硬件系統、軟件程序運行的特點,選取監控管理指標,提高監控管理方案的可操作性。例如考慮到云集群服務器系統中服務器主機類型多樣,在監控管理方案設計過程中需要選擇多元化直觀的性能指標,實現云集群服務器性能的綜合判定。除了做好上述技術指標的選擇之外,還需要設置監控管理層次,構建完備化的監控管理體系[5]。實際性能檢測采集環節,技術人員依據檢測指標開展服務器監測、應用監測等工作,實現監測指標的有效覆蓋,減少監測漏洞的出現。服務器監測設計環節,技術人員以服務器主機作為監測管理對象,針對主機硬件、軟件的差異,采取相對應的監測措施。服務器類型與監測主要指標如表1所示。

表1 服務器類型與監測主要指標
技術人員通過設置不同的性能監測指標開展必要的監測分析,實現云集群服務器系統模式下服務器運行狀態的科學掌握,為后續服務器管理、維護等工作的開展奠定堅實基礎。云集群服務器系統中的軟件應用包括數據庫、Web服務以及應用服務,相應程序運行時會產生大量的數據,技術人員可以按照實時數據、每天數據或每月數據開展軟件程序性能監測以及管理等工作。在不同監測數據采集環節,利用數學模型針對性地完成指標數據的獲取、分析等操作。以每天數據為例,技術人員采用數據采集模型進行分析處理,即“hourvVauek=(,)/12,(0≤k≤23)”,其中hourvVauek表示一天內第k個小時服務器監測指標的平均值。監測周期為24 h,將每個監測周期內產生的各類監測性能指標以及相關戶數存儲到數據庫中,通過橫向對比逐步明確云集群服務器系統24 h內的運行狀態,為后續系統管理活動的開展提供引導。
云集群服務器監控系統的實現要求技術人員從實際角度出發,以科學性、實用性原則為基礎,在劃定系統設計框架的前提下整合現有技術資源,積極穩妥地推動云集群服務器系統監控管理工作的實現,確保系統平穩、高效運行。
云集群服務器監控管理系統運行管理環節,技術人員應當設立告警指標和監控管理閾值,同時設定監測數據預警的上限及下限,在此基礎上形成科學化的監控管理模式,確保云集群服務器的科學管理[6]。例如,當監測數據指標連續超過次要警告閾值并達到規定次數,則顯示為次級預警;當監測數據指標連續超過告警閾值并達到規定次數,則顯示為預警。技術人員根據預警信息,可以判定云集群服務器運行狀態,并有針對性地做好系統管理決策,確保云集群服務器系統平穩運行。
云集群服務器系統監控管理對于提升服務器信息處理能力有著極大的幫助,是信息產業升級的重要路徑,實現了對信息產業硬件服務能力與服務成本的全面兼顧。本文從多個角度出發,在明確云集群服務器系統基本特點的前提下,采取相應技術舉措,加速實現云集群服務器系統監控管理模式的構建。