董江波
【摘 要】由于近年來國土資源信息化飛速發展,利用科學理論進行數據中心的建設與管理成為目前保障和支撐信息化系統安全運行的必要手段,本文依據數據中心全生命周期理論,回顧了河南省國土資源數據中心多年來在建設、運維、優化等方面的體會。
【關鍵字】數據中心;生命周期;七個階段;應用實例
中圖分類號: TP308;F426.61;F426.91 文獻標識碼: A 文章編號: 2095-2457(2018)27-0253-002
DOI:10.19694/j.cnki.issn2095-2457.2018.27.117
0 引言
依據《國家信息化發展戰略綱要》、《國土資源信息化“十三五”規劃》和《河南省國土資源信息化“十三五”規劃》的要求,我省國土資源信息化的發展要在十三五期間實現6個覆蓋,即國土云端全覆蓋、智能審批全覆蓋、監管決策全覆蓋、數據共享全覆蓋、智慧服務全覆蓋和安全保障全覆蓋,這就要求我們從技術和運維保障方面全時全域的支撐業務系統的發展及安全運行。我們已經步入了國土資源云時代,本地數據中心正從固化的服務器和應用系統的集合進化為彈性的智慧云計算數據中心,對于省級國土資源部門來說,作為全省國土資源信息系統安全運行的重要基礎之一,本地數據中心的改造與升級也日趨迫切,而數據中心的建設與維護是一個龐大而復雜的信息系統工程,我們可以依據數據中心全生命周期理論進行更高效的管理,本文就河南省國土資源數據中心的建設及運維現狀結合數據中心生命周期理論提出建設與管理方面的改進建議,詳細闡述了如何利用目前的主流技術解決當前建設及運維過程中出現的問題。
1 數據中心全生命周期理論簡述及實踐
數據中心全生命周期共分為七個階段,其中的閉環管理過程包括六個階段,通過這六個階段可以提升數據中心的持續可用性及性能。
(1)規劃階段:首先要確定容量、關鍵程度、功率密度、效率、發展規劃與預算等重要的項目參數,這些都是決定整個數據中心項目成敗與否的關鍵。2013年開始籌備建設的廳第二機房在規劃階段就對這些關鍵因素進行了詳細調研,一切從實際出發進行規劃,這些因素的第一項就是發展規劃,要滿足未來5年信息化建設對機房空間的需求,而這一要求也同《國家信息化發展戰略綱要》、《國土資源信息化“十三五”規劃》和《河南省國土資源信息化“十三五”規劃》是一致的,所以廳第二機房自建成至今完全滿足了實際使用需求,建成后沒有對基礎設施追加任何投資,達到了規劃目標。
(2)設計階段:這個階段的核心內容是將規劃結果轉化成圖表和施工文件。廳第二機房在規劃方面要求大容量,高機架功率密度,在關鍵程度方面要求高可用性等級,在效率與環保方面要求節能環保,這些規劃結果都需要在設計中來實現。廳第二機房面積為90平方米,而且房間內可使用空間不規則,如何實現大容量就成為一個亟待解決的設計問題,按照傳統的機房設計根本無法實現,因此采用了封閉冷通道系統,不僅解決了容量問題,還實現了節能要求;高機架功率密度主要是針對配電系統的要求,廳第二機房采用的是每機柜6KW的用電標準,主配電柜采用雙路供電,UPS采用雙機獨立運行的模式,每個機柜都有兩個獨立供電的PDU,這樣使單點故障的幾率降到50%,提高了整個系統的高可用性;在環保節能方面,主要是采用了環保的裝修材料,對精密空調的選擇提出采用ECC風機及使用綠色制冷劑的節能環保機型。
(3)建設階段:數據中心所有者及管理者必須關注項目進度、質量性能并進行風險分析,數據中心建設是一項復雜的系統工程,涉及基礎裝修、消防系統、承重、供配電系統、空調系統、布線系統、安防系統、防雷接地系統以及環境監控系統等方方面面的內容,要確保每項、每個具體細節施工工藝的高標準和科學規范性,是數據中心建設工程高質量的重要體現。一是充分發揮項目監理方的作用,通過合同明確目標責任、工程質量標準和規范施工程序及流程,細化量化其監理職責和范圍,督促其搞好建材質量、施工程序、設備質量等方面的施工過程監理。二是堅持單項工程完工檢驗制度,對單項工程完工檢驗,按工程設計和質量標準進行認真逐項審核和初步驗收,對初驗不合格工程按初驗意見進行整改,對初驗合格工程留待整個項目建設竣工后再一并進行整體驗收。三是擬定機房建設項目分項驗收表,細化工程質量驗收標準,做到有章可循,并采取三方檢查驗收及實行共同簽字制度。
(4)評估階段:機房電氣設備的檢測是數據中心建設中十分重要的一個環節,作為數據中心的首要要求就是數據中心的運營安全與高可用性。當數據中心新建成時,所有的電氣設備、暖通、制冷和備用電源,都是以單組件組合的方式建成。整體的運行檢驗,也僅僅是通電、啟動、關閉。作為空載機房,它的實際運行情況與空載差距甚遠,數據中心驗證測試的相關統計數據表明新建機房經第三方驗證測試質量問題可降低60%,在機房定期檢測評估后,風險率降低50%。由于數據中心必須滿足計算機等各種電子設備和工作人員對溫度、濕度、潔凈度、電磁場強度、噪音干擾、防漏水、電源質量、防雷和接地等條件的要求。所以一個合格的數據中心應該是一個安全可靠、節能高效和具有可擴充性的機房,因為一個承載關鍵負載的設備一旦投入運行就很難停下來進行維護。
(5)運行階段:運營及維護管理是數據中心的全生命周期中最長的一個階段,也是一個動態的過程,第一機房自2006年12月投入使用以來已經運行12年,第二機房自2015年3月投入使用以來已運行了3年。長時期的運行中出現的問題也最多,特別是精密空調和UPS這些關鍵設備,一般IT設備的使用年限為5年,而這些關鍵設備的使用年限是一般IT設備使用年限的2到3倍,所以如何在關鍵設備出現問題后及時發現并解決就顯得尤為重要,而這就需要運維階段嚴格按照設備的維護周期進行檢查并維護,同時通過機房環境監控軟件及時發現機房的異常情況以減少設備故障所帶來的損失。
(6)優化階段:隨著應用系統的不斷增加,對數據中心的需求也與日俱增,必須通過優化數據中心基礎架構來滿足性能的提升、設備密度的增加和高水準的服務。而這就需要優質的運維工具、完備的管理經驗及大量的基礎數據,確切的知道物理系統上正在運行著什么,分析出當前和未來的潛在需求,從而更好的主動分配系統資源,讓數據中心未來支撐更多的信息系統。
(7)老化階段:數據中心老化的標準是已經無法支撐不斷增長的需求、能源效率低、運營成本高,這就需要我們對數據中心重新規劃,并依據出現的新標準,采用新技術對數據中心進行重建或重塑,而如何有條不紊的讓新舊數據中心進行平滑的過渡將成為一項重要的工作。
2 河南省國土資源數據中心的建設及優化
河南省國土資源數據中心包括兩個機房,分別建于2006年和2015年(下文分別稱“第一機房”和“第二機房”),其運營也符合上述生命周期規律。
2.1 第一機房
第一機房是2006年建設的,規劃、設計、建設、評估都是按照當時的標準建設的,滿足了當時的使用需求,而在第五階段即運維階段出現了很多問題:一是不能滿足信息化發展的需求,不斷增加的應用也使設備數量猛增,而設備的增加導致強電系統無法滿足數據中心安全穩定運行的要求,機房內新增的大量設備又使溫濕度失控成為機房的突出問題;二是維護成本增加,由于目前關鍵設備廠商已停止了該型號設備的生產,所以后期維護成本不斷增加;三是環保節能問題,由于機房空間沒有按照節能的方式進行整體規劃設計,所以機房中50%以上的電力主要用于精密空調的運行,從而浪費了大量的能源。
為了解決這些問題,第一機房進入了優化階段:2009年進行了強電系統改造,滿足了設備的增加需求,并在原有的40KVA UPS的基礎上逐步增加了2臺5KVA UPS、2臺10KVA UPS和3臺20KVA UPS,這些UPS增加的另一個目的是為了實現電源的冗余;2012年增加一臺精密空調,由于第一機房建設之初采用下走線方式,線槽阻擋了送風的風道,所以老空調一直處于超負荷運行狀態,經常出現高壓報警,特別是在高溫天氣,機房內可達到40多度,新空調的使用使這一問題得到了緩解,但是用電量則不斷攀升。不斷出現的問題在解決后又帶來新的問題,所以第一機房已進入老化階段,從而進入新的生命周期,以滿足國土資源云建設的需要。
2.2 第二機房
在第二機房建設的規劃階段堅持科學性的同時,力求機房建設的先進性,適應綠色、節能、環保的數據中心機房建設理念,適應未來虛擬化建設的需要,兼顧當前與長遠,通過機柜系統和供配電系統的藕合對接,為我廳提供一個節能、高效和可靠的模塊化數據中心。相比第一機房,第二機房建設有以下幾個新特點。一是采用封閉冷通道架構,冷通道和熱通道分離,使得組織氣流井然有序,提高了空調的制冷效率,適應了當前倡導的綠色節能的機房建設要求。二是采用了可隨需擴展的全模塊化設計的UPS系統;我們在設計UPS時秉承標準化、模塊化、冗余化的設計理念,能夠在不影響業務的前提下在線擴容,采用兩臺最大配置200KVA模塊化UPS主機組成雙總線的供電架構,目前每臺UPS主機端配置4個40KVA功率模塊,形成3+1冗余,并可在低負載運行時模塊自動輪值休眠,保障可靠性的同時提升低載高效的性能。三是配置了兩臺高可用的精密空調,該空調具備紅外加濕功能,免去了頻繁清洗的維護工作,滿足簡單運維和高效管理的需求。四是采用遠程KVM技術,實現了服務器的遠程管理和操作。五是采用機柜頂部弱電布線方式,由核心交換機通過光纖與各個機柜的接入交換機相連,這樣既滿足了高密度的設備安裝,也大大減少了弱電線纜的數量,提高了設備安裝的靈活性。六是總控中心實現集中運維管理、機房環境和關鍵設施的集中監控。
第二機房在運行階段也不可避免的出現了一些問題:一是后備電源不足,可供電時間短,特別是在夏季用電高峰期間,如果出現意外停電,而供電時間又不確定的的條件下,就不可避免的會出現宕機現象;二是精密空調可更加節能,目前兩臺空調是聯機使用,但是采用的是回風口溫度控制,溫度設置在機房標準溫度的情況下,冷風道內的溫度一般低于機房標準溫度,這就增加了空調的壓縮機及風機的使用時間,如果采用送風口溫度控制,不僅能夠使機房溫濕度符合機房標準,也能夠減少能源消耗;三是沒有進行定期檢測評估,而第一機房也缺少這個管理環節,所以才會不斷的增加問題,而不是在問題出現之前消除隱患。
3 結語
河南省國土資源數據中心的建設與管理過程是數據中心生命周期理論的具體實踐,事實證明,數據中心的建設與管理不是一勞永逸的事情,需要與時俱進,不斷擴容、不斷增添新功能,以更好地支撐河南省國土資源信息化業務的發展。
【參考文獻】
[1]彭成.全生命周期概念與數據中心的模塊化機房設計,《智能建筑電氣技術》,2016.
[2]王建民,趙世萍.簡述新一代數據中心全生命周期建設,《信息與電腦(理論版)》,2014.
[3]陳亮.綠色數據中心,《智能建筑與智慧城市》,2011.