王振宇
摘 要 隨著科技的不斷發展,信息技術水平不斷提高,推動了企業的信息化水平,提高了企業運營效率和競爭力。作為企業運營數據、計算和存儲的數據中心也成為各領域各行業的核心機構,但是目前數據中心運維管理水平普遍較低,不能適應和滿足網絡信息系統發展和業務發展實際需要。數據中心運維管理需要靈活的管理機制和方法,讓各技術層面協同工作有機配合并不容易,同時也需要企業數據中心管理人員提高管理水平,加強運維管理,向著高可用、高效穩定、低成本和運維管理自動化的方向發展。為此,我們需要進一步分析和探討數據庫中心的運維管理現狀,不斷完善和改進運維管理手段和能力,全方位提高運維管理水平。
關鍵詞 數據中心;運維管理;IT運維;運維服務;業務驅動管理;運維管理自動化
中圖分類號 G2 文獻標識碼 A 文章編號 1674-6708(2018)205-0148-02
如今,作為企業數據傳輸、計算和存儲的數據中心,集中了各種軟硬件資源和關鍵業務系統,這也讓數據中心的運維管理變得很困難。首先,依據上層業務的角度來看,計算是數據中心的主要任務,要確保服務器、數據庫、中間件和Web等運行正常。其次,依據運維和服務的角度來看,數據中心各個方面的服務質量和服務流程是影響企業業務的直接因素。最后,從技術發展趨勢方面來看,一定要將數據中心軟硬件資源的各項指標標準化,最終實現運維自動化。這一過程需要靈活的管理機制和方法,需要業務相關部門協調配合,健全運維管理機制,從而實現企業級數據中心高效運行。
1 企業級數據中心運維管理工作范圍
企業級數據中心運維管理工作主要包含4個部分,其一是數據中心信息系統的運維管理,數據中心的信息系統主要包括運營支撐系統、企業資源管理系統、客戶服務系統、辦公自動化系統、監控系統等多種數據信息系統以及承載的小型機、服務器和網絡設備等硬件資源。其二是數據中心數據庫及存儲管理,數據庫是系統的核心,存儲是承載數據的硬件設備,保證數據庫及數據安全和存儲管理是數據中心運維管理工作的重中之重。其三是數據中心機房的網絡管理,對網絡設備包括交換機、路由器、防火墻、負載均衡等設備進行統一配置和管理,保證網絡的正常運行。其四是數據中心機房環境管理,對數據中心的監控以及機房環境進行管理,運維對象包括入侵監測系統、精密空調、視頻監控、環境監控、門禁系統、電力設備系統、消防系統等。
數據中心運維管理的主要任務是配置管理、變更管理、故障管理、監控管理以及資源管理。配置管理主要是指對數據中心的核心系統、核心設備以及機房環境等配置相應的檔案庫,提高數據中心的運維管理水平,充分調動管理人員的工作積極性和主動性。變更管理主要是指根據數據中心的業務需求和運維管理需求,對網絡配置、存儲資源、軟件系統、硬件設備、機房環境,調整業務數據,升級和更換參數配置。故障管理主要是指數據中心對相關部門反映的問題和運維管理中出現的問題,及時進行處理和解決。監控管理是指對網絡系統的運行性能和運行狀況、存儲系統、信息系統、主機設備、機房環境等進行實時監控,定期進行巡檢和維護,全面掌握系統運行情況和運行趨勢。資源管理是指對數據中心的網絡資源、存儲資源、主機資源以及環境資源進行管理規劃,優化資源配置,根據不同的需求及時調整資源配置,提高數據中心資源利用率。
2 企業級數據中心運維管理面臨的挑戰
從企業級數據中心運維管理發展現狀看,主要體現出如下問題:
現狀一:IT運維人員成本偏高。據專業調查,大多數CIO表示最關心的是IT運維成本過高。原因是在過去的5年中,很多企業因為業務的需要實施了很多IT信息系統,使得系統運行越來越復雜,也越來越難管理。同時,IT運維成本過高的一個原因是IT運維的自動化程度很低,依靠手工流程來管理,不但使到運維效率不高,而且人力成本更是花費驚人。另一家國際知名調查機構Gartner調查發現,在IT運維成本中,源自技術或產品(包括硬件、軟件、網絡等)成本其實只占20%,而流程維護成本占40%,運維人員成本占40%。流程維護成本包括日常維護、變更管理、測試成本等;人員成本包括培訓、人員流失、招聘成本等。
現狀二:處在“救火式”的IT運維方式。國內在IT運維過程中,IT員工大多數只是處在被動低效率手工救火的狀態,只有當事件已經發生并已造成業務影響時才能發現和著手處理。這種被動“救火”會導致:IT運維人員終日忙碌,維護難度高,運維工作壓力大而不受重視;故障預警機制的不完善,往往是故障發生后或報警后才會進行處理,不但事倍功半而且故障還常常會出現惡性連鎖反應。IT運維服務人員的工作始終得不到業務部門的認可,而且工作量也難以量化。
現狀三:IT運維服務管理方式缺乏創新。IT運維服務管理方式效率低下。運維管理通常是企業運維部門根據技術類別需要培養各方面的IT運維人員,技術水平層次不齊,崗位設置不夠合理,技能考核不夠專業,技術監控水平落后,疏于管理,缺乏有效監督,工作效率低下,管理方式缺乏創新。
現狀四:運維管理技術落后。近年來信息系統的軟件和硬件都趨于集成化和實現云計算,對數據中心運維管理的能力提出了新的要求,目前數據中心的IT運維管理技術已經不能滿足各個行業業務發展周期變化的需求,限制了很多企業的創新和發展,需要不斷改進運維技術手段和運維方式,提高運維管理水平,滿足業務發展的需求。
3 提高企業級數據中心運維管理能力的有效策略
3.1 提高運維管理人員的綜合素質,加強團隊建設
管理人員是數據中心運維管理的關鍵核心,只有不斷提高運維管理人員的綜合素質,才能不斷提升數據中心運維管理的水平。可以通過多種形式,鼓勵管理人員學習更多的運維管理知識,提高自身的運維操作技能,充分調動工作人員的積極性和主動性。開展數據中心運維管理的系統化、專業化培訓,重視運維技術的學習,激勵管理人員探究數據中心的信息系統建設,提高對企業的認同感。endprint
運維人員管理問題,關鍵在于運維工作分配業績考核。可將運維人員根據技能層次水平分成一、二、三線支持,不同運維人員各司其職,能使有限的運維力量得到合理利用,整體工作效率將明顯提升,同時也方便對各自的工作業績進行評估,再據此制定相應獎懲措施和制定技能培訓規劃,也能提高員工工作積極性。加強運維團隊的建設和管理,有利于沉淀內部知識積累,快速培訓新員工,減少核心員工離職帶來的沖擊。
3.2 確立以業務價值為核心的業務驅動管理的管理思想
為了不斷提高數據中心運維管理的能力和水平,必須加強對業務環境的了解和分析,健全運維管理機制,提高決策能力。及時了解和研究業務環境,首先需要找出數據中心信息系統和業務環境之間的關聯因素,深入分析業務環境對信息系統的影響。其次,仔細分析業務環境的變化內容,研究業務發展趨勢。最后,正確分析業務環境影響因素,評估業務環境的風險,提高數據中心建設發展決策能力。
要在運維管理的戰略層面上建立“業務驅動”的運維治理和管理思想,使得業務部門的目標和運維管理的目標一致,都是為了企業整體戰略目標的實現,把對業務的支撐能力和管理實效,作為評價IT系統效用和運維部門工作的首要指標。只有這樣,才能在全企業范圍內建立“技術服務于業務發展”的意識和文化,是真正實現IT與業務融合,共同為企業的戰略目標服務。
3.3 引進先進的運維監控管理技術
企業級數據中心要積極引進先進的運維監控管理技術,不斷提高運維管理自動化水平。做好業務系統與信息系統的結合,利用先進的管理方式和自動化運維監控技術,不斷完善和提高數據中心系統的運行效能,構建以業務和客戶服務為中心的運維管理體系,加強技術能力團隊建設,制定規范的運維管理制度,提高數據中心運維管理效率。
3.4 數據中心運維服務管理的創新
企業級數據中心運維管理工作經過不斷發展和探索,目前主要包括自營管理和外包管理,隨著IT系統復雜程度的增加,對于IT運維能力的要求也越來越高,自營服務的成本已遠遠大于外包服務的成本,在某些非關鍵的領域,應該引入IT運維服務外包這一創新管理模式,以降低服務成本并得到專業的運維服務,同時將企業自己的IT運維人員解放出來,做更有價值和意義的工作。
IT運維服務外包存在一定風險,關鍵在于對于IT運維服務外包供應商的管理不到位,具體體現在招標環節疏于審查、過程監督環節疏于監管、以及事后評價環節疏于考核。通過在招標環節加強對供應商資質、能力水平、案例等考察可以有效的對供應商的資格進行把關;通過在服務過程中加強監督可及時發現供應商提供運維服務的真實能力水平;通過事后評價可以建立運維服務供應商的退出機制,保證供應商提供優質的運維服務。
4 結論
企業級數據中心運維管理是一項系統的工程。加強運維工作科學管理和高效運作,同時全面提升包括業務各部門協同管理、高效運作的能力,從而持續推進企業的信息化建設,建立與信息化發展相配套、相適應的整體設想,通過持續、科學的管理,保障企業信息化的快速,協調、可持續發展,滿足企業業務發展要求。企業級數據中心運維管理是對計算機系統進行綜合集中管理,既面向資源又面向應用,同時還面向運維管理人員,是人才、技術、流程和工具緊密結合的系統工程,要不斷創新運維管理思路和方式,采用先進科學的技術手段,使企業級數據中心運維管理水平達到新高度,以適應時代發展的需要。
參考文獻
[1]朱偉雄,王德安,蔡建華.新一代數據中心建設理論與實踐[M].北京:人民郵電出版社,2009.
[2]林予松,李潤知,劉煒.數據中心設計與管理[M].北京:清華大學出版社,2017(8).
[3]韋琛江,谷和啟.淺析企業級數據中心運維管理[J].信息系統工程,2013(8):66-67.endprint