李瑞軍 呂江 智霆
摘 要:近年來,隨著大數據、云計算等新興技術的飛速發展,各類信息系統對于基礎設施環境的依賴和要求越來越高。在此趨勢下,國內電子信息機房的建設規模和建設速度顯著增加,各類型與規模的數據中心不斷投入使用,因而通過對數據中心的運維體系與管理模式進行仔細研究,規劃設計出合理可靠運維管理系統與運維體系框架,保障數據中心長期運行的安全與穩定,具有重要的現實意義。
關鍵詞:數據中心 運維 管理系統 架構 設計
中圖分類號:TP391 文獻標識碼:A 文章編號:1674-098X(2015)03(c)-0010-01
1 數據中心及其運維管理系統現狀
自從1946年世界上第一臺電子計算機誕生之日開始,計算機機房伴隨計算機的發展已走過近70年的歷程,從最初以計算為核心,逐步轉變發展為計算、傳輸和存儲全面發展,名稱也逐步轉變為數據中心。數據中心全生命周期從始至終分為五部分,分別是:需求分析、規劃設計、施工安裝、檢測驗收與運維管理。其中運維管理作為數據中心生命周期的末端,歷時最長,其周期從交付使用開始,直至數據中心結束使用。從整體上,數據中心三成在建設,七成靠管理,通過科學管理,可以為業務提供信息系統服務、收回投資,達到預期目標。近年來,隨著大數據、云計算、互聯網等新興技術的飛速發張,我國數據中心建設的步伐也在逐步加快,拒不完全統計,目前國內在建和已建成的各類電子信息系統機房或數據中心已有幾十萬個。
2 數據中心運維管理系統匹配設計的基本原則
規模、可用性等級、類別,分別是系統與數據中心的匹配設計的組成部分。
第一,數據中心基礎設施的可用性等級的應與系統可用性設計相一致,在確立數據中心基礎設施的可用性等級的基礎上,運維管理系統的可用性設計等級應該與之匹配或提高。同一個數據中心中,如不同業務機房重要性有區別,則應區別設計可用性,并與之匹配等級相符的運維管理系統。第二,數據中心系統設計與數據中心類別相關,且功能與架構等方面都要進行相應的設計與匹配。因此,EDC與IDC的管理功能模塊與系統設計就會產生相應的區分,這是由于兩者的核心和管理重點的不同所導致。第三,運維管理系統的設計方案取決于數據中心的設計規模。運維系統的處理能力、運維監控點、運維壓力這三項指標會隨著數據中心規模的增大而增大。因此,總控中心系統已經成為大中型數據中心的標準配備,而對于小型機房則只需要實現基本信息采集監控功能即可。
3 數據中心運維管理系統架構設計與具體功能
數據中心組織管理架構與運維管理系統的架構設計應該具備一致性,以便充分發揮運維管理系統的信息化工具功能。為了使工作人員履行職能,在系統功能設計時必須全面周到,滿足管理、維護、監控及其他操作的需要。數據中心運維管理系統設計技術點較多,包括網絡通信技術、傳感技術、數據庫技術、工業自動控制技術、計算機軟件技術等,該系統通過采集、分析、處理等操作,及時跟蹤各種非智能和智能系統及設備的信息參數,獲取運行狀態,從而實現全面監控數據中心基礎設施的目的。通過實時掌控的數據中心運行狀態數據,通過對相關信息與資源進行分析并提供可能的決策建議,可以及時發現并處理故障,高效的對數據中心進行運維,保障數據中心的安全性與可用性。數據中心運維管理系統從功能結構與層次上劃分為四個部分,分別是監控系統、運行管理系統、總控中心系統以及基礎服務系統。
3.1 監控系統
監控系統由兩大子系統組成,主要完成對基礎設施的監控工作:(1)信息采集子系統。每個獨立的信息采集子系統均響應上層信息處理子系統的控制命令,同時又是下層信息處理子系統的前驅系統,負責將標準格式的信息傳輸到下層信息處理子系統,這些信息主要包括對安防、環境、供配電等監控對象的參數、狀態、設備屬性、配置、數據等。(2)信息處理子系統。信息處理子系統主要完成信息的匯聚,并作相應的處理及存儲。信息處理子系統數據來源于信息采集子系統,通過對數據進行處理與加工,按照告警規則產生新的告警信息,對告警信息進行分類并做過濾、關聯、壓縮操作,實現故障定位與數據中心的一體化監控。總控中心系統負責收集并顯示重要實時監控信息,信息處理子系統存儲其他數據并形成供運行管理系統調用的歷史資料庫,并輸出統計分析報告。
3.2 運行管理系統
運行管理系統利用一體化監控系統匯聚的數據加上用戶輸入的一些必要的管理信息,實現數據中心運維管理、能耗管理、資產管理、容量管理等,完成數據中心運行的“故障預防性管理”、“故障恢復性管理”及旨在降低運維難度與成本,提高工作效率的日常運維工作的信息化管理,使數據中心在高效運轉的同時,盡可能不發生故障或少發生故障,提高數據中心可用性,降低運行成本。
3.3 總控中心系統
總控中心又稱ECC,包含展示子系統與服務臺子系統兩部分。(1)展示子系統。展示子系統提供監控系統、總控中心系統、運行管理系統的統一門戶,提供了各種豐富的展示終端,如總控中心大屏幕系統、移動監控終端系統;提供豐富的信息展示方式與技術,如3D虛擬現實,溫度場等方針組態技術等;提供豐富的報警信息輸出方式,如聲光、短信、電話語音等。(2)服務臺子系統。運維值守與管理人員能通過服務臺的各種通信方式收集記錄用戶使用信息,借助知識庫,回復或解決用戶常見問題;分發、跟蹤復雜、疑難問題;通過監控展示信息,分析、發現異常運行情況,移動、跟蹤處理流程,回訪服務結果。電話呼入型子系統是服務臺子系統的重要構建,通過其接聽來電,并對來電進行自動分配,記錄和存儲所有來話信息。
3.4 基礎服務系統
系統日志、統一權限認證、在線幫助、系統管理等都屬于基礎服務系統提供的功能,是為上層功能構件提供的一些公共性基礎服務。
4 結語
降低運營管理成本與提高可用性是數據中心管理永恒的主題。通過數據中心運維管理系統的建設與實施,能夠有效幫助管理者增強數據中心可用性、提高運維效率并降低運維成本。隨著信息技術的不斷發展,運維管理系統已經成為現代數據中心必不可少的信息化工具,在數據中心的運行、維護、管理等方面,不斷發揮著越來越重要的作用。
參考文獻
[1] 魏曉玲.銀行設備管理系統的設計與實現[D].西安電子科技大學,2010.
[2] 敖翔.銀行設備維護管理系統的設計與實現[D].湖南大學,2008.
[3] 張亮.基于數據倉庫的銀行數據提取與應用研究[D].江西師范大學,2008.