楊高攀 嚴鵬飛
摘要:本文以企事業單位的數據中心運維為討論對象,通過對數據中心及運維相關內容的研究,對比了其與互聯網企業運維的異同,結合現階段企事業單位的運維存在的問題,綜合筆者在運維過程中的經驗,對企事業單位的運維提出意見和建議,希望對于此類運維提供一個有意義的參考。
關鍵詞:數據中心;主機房;運維管理;ITIL
中圖分類號? TP308? ? ? ? 文獻標識碼:A
文章編號:1009-3044(2019)21-0026-03
開放科學(資源服務)標識碼(OSID):
Abstract: Based on the enterprises and institutions of the data center operations and maintenance,through the research of the data center and the relevant contents of the operation and maintenance, this article compared the similarities and differences of its operations with the Internet enterprises. Combining with the present problems existing in the operations of the enterprises and institutions, integrated the author ‘s experience in the process of operation and maintenance , this article put forward opinions and Suggestions for the operations and maintenance of enterprises or institutions. This article is aimed at providing a meaningful reference for such operations.
Key words: Data center; Computer room; operation and maintenance management; ITIL
信息化為中華民族帶來了千載難逢的機遇,隨著互聯網、云計算、物聯網、大數據等現代信息技術的發展,科技創新日新月異,以數字化、網絡化、智能化為特征的信息化浪潮蓬勃興起,信息技術已然對國際政治、經濟、文化、社會、軍事等領域產生了深刻影響,在與生物技術、新能源技術、新材料技術等交叉融合過程中,正在推動產業變革并促進工業經濟向信息經濟轉型,信息化已是經濟社會發展的重要支撐和引擎,已經從傳統幕后的支撐角色轉變為前臺的引領角色,可以說,沒有信息化就沒有現代化,而數據中心作為信息化的基石,受到越來越多的關注和重視,沒有數據中心就沒有信息化。數據中心要充分發揮其基礎保障及支撐作用,除卻優良的規劃設計與建設外,就離不開完善充分的運行與維護,所以本文以企事業單位的數據中心運維為討論對象,通過對數據中心及運維相關內容的研究,對比了其與互聯網企業運維的異同,結合現階段企事業單位的運維存在的問題,綜合筆者在運維過程中的經驗,對企事業單位的運維提出意見和建議,希望對于此類運維提供一個有意義的參考。
1 數據中心與運維內容概要
1.1 數據中心
數據中心(Data Center)是為集中放置的電子信息設備提供運行環境的建筑場所,可以是一棟或幾棟建筑物,也可以是一棟建筑物的一部分,其由主機房、輔助區、支持區和行政管理區等功能區組成。主機房(Computer room)是主要用于數據處理設備安裝和運行的建筑空間,包括服務器機房、網絡機房、存儲機房等功能區域。數據中心在建設規劃初期就應根據本單位所處行業、使用性質、數據丟失或網絡中斷在經濟或社會上造成的損失或影響程度確定所屬級別,數據中心分為A、B、C三級,A級為“容錯”系統,可靠性和可用性等級最高;B級為“冗余”系統,可靠性和可用性等級居中;C級為滿足基本需要,可靠性和可用性等級最低,這三級的定位是向下涵蓋關系,在數據中心建設過程中還要綜合考慮安全、設備運輸、管線敷設、雷電感應、結構荷載、水患及空調系統室外設備的安裝位置等問題進行綜合分析和經濟比較,當數據中心按要求建設竣工驗收后,運維部門的重點工作就是對其中所有的基礎設施和電子信息設備進行運行與維護。
1.2 運維
運維是對運行與維護的簡稱,其核心工作及基本的職責是保證業務系統穩定、可靠、安全、高效地運行,價值體現在質量、成本、效率、安全。運維工作在不同企業的不同發展階段,有著不同的定位和職責,例如互聯網企業的運維就有網站運維、系統運維、網絡運維、數據庫運維、IT運維、運維開發、安全運維等方向,其已技術為主,管理次之。而在企事業單位的運維中,其運維工作通常由特定的運維部門完成,該部門會同時承擔業務工作和運維工作,其運維的主要任務在于管理,技術次之。
2 運維的發展階段、分類及相關內容
2.1 運維發展階段
有專家學者將運維的發展階段與人類社會生產發展階段進行類比,大致由“農耕時代”“工業時代”“信息時代”“智能時代”對應數據中心運維的手工運維、自動化運維、數據化運維、智能化運維。在手工運維階段也即運維的農耕階段,由于企業信息化規模較小且技術單一,企業的運維水平往往取決于團隊中核心運維人員的經驗,以人為運維機制核心。在自動化運維階段,通過各類運維工具去解決效率低下、操作不規范等問題。例如通過使用自動化監控類工具對數據中心的基礎設施和電子信息化設備的運行數據進行收集并分析。使用各種ITSM系統、CMDB系統、APM等專業工具進行運維支撐服務以及配置管理。在數據化運維階段,主要將前一階段積累的數據進行整理,并結合云計算、大數據分析等專業技術,對運維數據進行多維度分析,發現以前各階段均未能發現的問題,注重于分析與預測。在智能化運維時代,則是充分將AI人工智能引入運維過程,讓數據中心實現自我學習、自我管理,人只是作為AI的輔助而存在。
2.2 運維的形式
數據中心運維主要有三種形式,即自主運維、外包運維、自主與外包相結合的運維。由于數據中心內各類設備的專業度與集成度越來越高,只憑企業內部的運維人員幾乎不可能能將所有類型設備的維保任務全盤接下,另外供應商在提供設備的同時會附帶有限的維保服務,所以現在大部分企業采用自主與外包相結合的運維方式,把專業的事情交給專業的運維服務提供商去做。
2.3 運維的工作方式
現階段主要有兩種即駐場運維和遠程運維(包含現場巡檢)。駐場運維即在數據中心現場辦公,運維人員對數據中心內部的所有基層設施和電子信息設備進行性能檢測調優、故障排除、設備維修更換、系統升級及日常檢查等多種類型的工作。遠程運維與駐場運維的區別僅為辦公地點的不同,工作內容則相同。
2.4 運維人員的角色
運維工作主要是人的活動,運維人員的角色主要有兩類即管理人員和實施人員,在互聯網企業中這兩類角色的界限較為明顯,例如運維經理、應用運維、系統運維、運維研發、數據庫運維、運維安全等,但在企事業單位中這兩類角色的界限不是很明晰,運維人員多身兼數職,既是管理者又是實施者。
2.5 運維人員的技能要求
運維人員的技能要求主要有兩方面,即管理能力和專業技術,由于運維所接觸的知識面非常廣且雜,所以這兩類角色有其共同的特點,即要求運維人員具備很好全局思考能力,能夠對運維過程中各層面問題進行分析并提供解決方案,對于企業內部的業務、應用、架構全面了解并熟悉。在互聯網企業多側重于運維人員的專業技能,而傳統的企事業單位則側重于其管理方面的能力,但隨著近年來大數據、云計算、物聯網等信息化技術的發展,企事業單位中對于運維人員的要求也越來越注重其信息化方面的技術能力,并竭力培養其管理與技能兼有的復合型人才。
3 企事業單位數據中心運維現狀
3.1 硬件設施較差
目前我國眾多的企事業單位中,由于歷史原因和投資成本等諸多因素影響,造成其數據中心甚至連C級也達不到,又由于總體擁有成本的限制,不可能及時地對數據中心進行升級改造,基礎環境現狀跟不上越來越復雜的業務應用架構需求,設備、組網、網絡安全等設備和技術均老舊,無法適應新興技術對于硬件性能和資源的要求。
3.2 信息孤島
現階段企事業單位中各業務部門對于信息化的需求愈來愈高,自建應用系統越來越多,架構越來越復雜,很多企事業單位中出現有多少個部門就有多少個信息系統,每個信息系統都有自己的數據庫、操作系統、應用軟件、硬件設備,完全是獨立的體系,數據不共享,造成數據的重復建設,無法形成本單位統一的數據標準,造成人財物和數據資源的浪費,同時也不利于后期的大數據平臺建設。
3.3 運維管理體系不健全
企事業單位缺乏符合本企業所隸屬本行業的專業的信息化規劃,及運維管理體系相關標準,重業務輕信息,未把信息化放在引領業務的地位,這與運維部門在企事業單位中長期處于的地位不高有一定關系,企事業單位的決策層認為只要做好本職主業才是正道,對于信息化的重視程度遠遠不夠。
3.4 運維隊伍配置不合理
由于現階段我國很多企事業單位的信息化部門定位為服務性質的部門,角色方面屬于后臺支撐的角色,地位還很低,運維人員多充當救火員的角色,非專業人員對運維人員的看法一般屬于運維工作中的一個非常小的職責,例如解決辦公方面的小問題。但是從運維工作性質方面看,進行基礎設施運維工作的人員,按專業主要包含電氣、暖通、弱電、安防等;進行電子信息設備運維的工作人員,按專業主要包含服務器、網絡、信息安全、軟件工程等。另,數據中心配置人數應該根據數據中心的規模、本單位人才規劃及信息化發展規劃來確定,但在實際中信息化人員普遍偏少,人員偏少后自然會帶來專業配置的不合理。
4 應對策略
4.1 加強信息化基礎管理
在企事業單位的信息化基礎管理方面,首先按照標準化、流程化、平臺化、自動化、智能化的邏輯進行構思,完善制度體系,全面提升信息采集、處理、傳輸、利用、安全等能力。加強信息資源規劃、建設和管理,創新部門業務系統建設運營模式,提高資源利用水平。制度體系建設的內容方面,應包含運維服務制度、流程、組織、隊伍、技術和對象等方面的內容,整合運維服務資源,規范運維行為,確保服務質效,形成統一管理、集約高效的一體化運維體系。
4.2 運維工具的應用
工欲善其事必先利其器,在應用工具方面,企事業單位可以應用商用的或開源的運維管理平臺,通過引入各種ITSM系統、CMDB軟件系統、APM等專業工具進行運維支撐服務以及配置管理;通過引入ITIL這個基于行業最佳實踐的框架,將事件管理、問題管理、配置管理、變更管理、發布管理、服務級別管理、IT服務財務管理、IT服務持續性管理、能力管理、可用性管理等將本企業內部的“服務提供”流程組和“服務支持”流程組進行梳理并固化。
4.3 優化人才隊伍
高素質的運維團隊。運維不是一個人一個部門就能完成的事情,運維涉及電氣、暖通、弱電、安防、服務器、網絡、信息安全、軟件工程等眾多專業知識,這一項復雜的系統工程,具有高科技、跨部門、長期性的特點,所以要加強運維人員的綜合專業素質培養,同時提升其管理能力。在選人用人上企業一定要造就一批領軍人才、壯大專業人才隊伍、完善人才激勵機制。
4.4 數據中心升級改造
加大數據中心資金投入,在基礎管理、應用工具、人才隊伍等基礎穩固的前提下,企事業單位可根據本單位財力狀況適時進行數據中心升級改造,改造時要兼顧業務和新興技術的應用,盡早地將數據中心這個基礎瓶頸突破。
5 結語
綜上所述,本文對數據中心及其運維的概念進行分析研究,結合企事業單位在運維過程中存在的問題,提出了應對策略,企事業單位只有將信息化放在引領業務的突出位置,釋放信息資源紅利,加強基礎管理,加大資金投入,優化人才隊伍等方面做出努力,才能真正讓信息化引領業務,并在新一輪的市場競爭中取得一席之地。
參考文獻:
[1] GB50174—2017,數據中心設計規范[S].
[2] 陳明, 田健, 楊爽. ITIL在信息化運維中的應用分析與研究[J]. 城市建設理論研究(電子版),2018(11):186-187.
[3] 陶珮, 王懷宇. 基于ITIL的IDC服務運營體系的應用研究[J]. 科技與創新,2018(3):125-126.
[4] 張亞軍, 張金隆, 陳江濤. IT服務管理研究評述及未來展望[J]. 情報雜志,2013,32(6):95-99.
[5] 胡佳勝. 高等學校公共機房管理存在問題與對策[J]. 科學技術創新,2018(29):96-97.
[6] 張志慧. 芻議高校計算機實驗機房系統的維護策略[J]. 2016(36):113-115.
[7] 王健新. 形勢下高校公共計算機機房管理和維護探析[J]. 計算機產品與流通,2018(8):241.
[8] 費晰, 胡璋, 楊海. 關于提升衛星發射中心遠程數據機房運維保障水平的若干思路[J]. 中國航天,2018(6):31-33.
【通聯編輯:王力】