李雅男
【摘 ?要】經濟發展形勢下,企業之間所面臨的競爭也變得越來越激烈。在社會經濟和數據信息技術持續發展中,數據中心現已成為影響企業穩步運行的重要因素。加強企業級數據中心運維管理能夠節省人力,讓相關的技術人員可以全身心的投入到系統、流程的優化工作中,逐步實現數據中心運維管理自動化,節約成本,企業通過數據中心的自動化管理能夠更安全、有效的展開工作。本文就企業級數據中心運維管理展開探討。
【關鍵詞】IT運維;運維管理規范;安全運維管理
引言
數據中心運維管理需要靈活的管理機制和方法,讓各技術層面協同工作有機配合并不容易,同時也需要企業數據中心管理人員提高管理水平,加強運維管理,向著高可用、高效穩定、低成本和運維管理自動化的方向發展。為此,我們需要進一步分析和探討數據庫中心的運維管理現狀,不斷完善和改進運維管理手段和能力,全方位提高運維管理水平。
1企業級數據中心運維管理面臨的挑戰
從上層業務的角度看,數據中心最重要的工作之一是計算,因此需要保障數據庫、服務器、中間件、Web等各種關鍵業務的正常運行,并根據性能參數和業務流量進行優化調整;從基礎設施角度看,需要將各種管理工具進行整合,在一個平臺里管理路由器、交換機、安全、存儲、服務器等各種設備,同時適應數據中心特有的可視化管理需求;從運維和服務的角度看,數據中心IT部門提供的服務流程是否合理,服務質量是否有保障,直接影響到業務部門的各種業務是否正常開展;從技術發展趨勢看,數據中心在完成標準化之后,要向自動化方向發展,就必須管理好硬件設備、軟件、網絡、安全、存儲等各種邏輯的、虛擬化的各種資源池等。因此,對數據中心的運行管理需要采用全新的管理模型和靈活的功能架構,并且充分考慮基礎設施、技術趨勢、業務運行、運維服務等各種管理要素,建立一個開放式、標準化、易擴展、可聯動的統一智能管理平臺,實現數據中心自動化管理。
2企業級數據中心運維管理工作范圍
企業級數據中心運維管理工作主要包含4個部分,其一是數據中心信息系統的運維管理,數據中心的信息系統主要包括運營支撐系統、企業資源管理系統、客戶服務系統、辦公自動化系統、監控系統等多種數據信息系統以及承載的小型機、服務器和網絡設備等硬件資源。其二是數據中心數據庫及存儲管理,數據庫是系統的核心,存儲是承載數據的硬件設備,保證數據庫及數據安全和存儲管理是數據中心運維管理工作的重中之重。其三是數據中心機房的網絡管理,對網絡設備包括交換機、路由器、防火墻、負載均衡等設備進行統一配置和管理,保證網絡的正常運行。其四是數據中心機房環境管理,對數據中心的監控以及機房環境進行管理,運維對象包括入侵監測系統、精密空調、視頻監控、環境監控、門禁系統、電力設備系統、消防系統等。數據中心運維管理的主要任務是配置管理、變更管理、故障管理、監控管理以及資源管理。配置管理主要是指對數據中心的核心系統、核心設備以及機房環境等配置相應的檔案庫,提高數據中心的運維管理水平,充分調動管理人員的工作積極性和主動性。變更管理主要是指根據數據中心的業務需求和運維管理需求,對網絡配置、存儲資源、軟件系統、硬件設備、機房環境,調整業務數據,升級和更換參數配置。故障管理主要是指數據中心對相關部門反映的問題和運維管理中出現的問題,及時進行處理和解決。監控管理是指對網絡系統的運行性能和運行狀況、存儲系統、信息系統、主機設備、機房環境等進行實時監控,定期進行巡檢和維護,全面掌握系統運行情況和運行趨勢。資源管理是指對數據中心的網絡資源、存儲資源、主機資源以及環境資源進行管理規劃,優化資源配置,根據不同的需求及時調整資源配置,提高數據中心資源利用率。
3提高企業級數據中心運維管理能力的有效策略
3.1提高運維管理人員的綜合素質,加強團隊建設
開展數據中心運維管理的系統化、專業化培訓,重視運維技術的學習,激勵管理人員探究數據中心的信息系統建設,提高對企業的認同感。運維人員管理問題,關鍵在于運維工作分配業績考核。可將運維人員根據技能層次水平分成一、二、三線支持,不同運維人員各司其職,能使有限的運維力量得到合理利用,整體工作效率將明顯提升,同時也方便對各自的工作業績進行評估,再據此制定相應獎懲措施和制定技能培訓規劃,也能提高員工工作積極性。加強運維團隊的建設和管理,有利于沉淀內部知識積累,快速培訓新員工,減少核心員工離職帶來的沖擊。
3.2企業級數據中心的安全運維管理
根據系統的重要性網絡安全、密集程度等因素企業級數據中心可以分為安全域和實施信息安全等級進行保護。根據不同的需求可以對信息安全資源進行優化整合,構建數據中心應急響應系統和災難備份系統,將信息安全設備的作用充分發揮出來。不斷的提升保障體系建設,并逐步的完善相關的安全機制,根據相應的安全管理制度,加強數據中心安全和防護能力。所以,企業級數據中心在進行安全體系建設時要結合實際情況,采取相應的安全措施,依法辦事,讓安全防護體系的構架更完善。
3.3企業級災備中心的運維管理
大型的數據中心都建有相應的災備中心,災備中心建設后,應當建立健全的災難恢復管理制度及災備中心運營管理制度:主要包括有災難報告制度,災難恢復審批制度、災難恢復處理流程、備份系統日常運行管理制度、備份系統替代運行狀態下的運行制度、數據一致性認可程序、生產系統復原后的回切處理流程、備份系統測試、災難演習制度等等,這些制度都是確保災備業務正常運營的強有力的措施,為今后的災備業務的價值發揮起到關鍵支撐作用。災備中心的運營管理非常復雜,從日常的運維到災難發生時的應急響應、恢復和回退,是一個專業的、持續運行的過程。
3.4確立以業務價值為核心的業務驅動管理的管理思想
首先需要找出數據中心信息系統和業務環境之間的關聯因素,深入分析業務環境對信息系統的影響。其次,仔細分析業務環境的變化內容,研究業務發展趨勢。最后,正確分析業務環境影響因素,評估業務環境的風險,提高數據中心建設發展決策能力。要在運維管理的戰略層面上建立“業務驅動”的運維治理和管理思想,使得業務部門的目標和運維管理的目標一致,都是為了企業整體戰略目標的實現,把對業務的支撐能力和管理實效,作為評價IT系統效用和運維部門工作的首要指標。只有這樣,才能在全企業范圍內建立“技術服務于業務發展”的意識和文化,是真正實現IT與業務融合,共同為企業的戰略目標服務。
3.5企業級數據中心運維管理的自動化
實現數據中心的自動化管理是數據中心的發展方向,如今IT服務管理成本逐步加大,其運維風險也不斷升高,所以需要通過數據中心自動化管理實現IT運維自動化,讓IT團隊實現資源轉型,提高服務水平。
結語
企業級數據中心運維管理是對計算機系統進行綜合集中管理,既面向資源又面向應用,同時還面向運維管理人員,是人才、技術、流程和工具緊密結合的系統工程,要不斷創新運維管理思路和方式,采用先進科學的技術手段,使企業級數據中心運維管理水平達到新高度,以適應時代發展的需要。
參考文獻:
[1]朱偉雄,王德安,蔡建華.新一代數據中心建設理論與實踐[M].北京:人民郵電出版社,2017.
[2]林予松,李潤知,劉煒.數據中心設計與管理[M].北京:清華大學出版社,2017(8).
(作者單位:信息化管理中心普光項目部)