呂 磊 / 新疆維吾爾自治區重要信息系統災難備份中心
試析數據中心運行管理
呂 磊 / 新疆維吾爾自治區重要信息系統災難備份中心
進入21世紀以來,我國加快了國民經濟與社會信息化建設的步伐,將其作為提升政府執政能力、改善民生、推動社會與經濟發展的重要手段。數據中心作為信息化的重要基礎建設,是信息處理的樞紐,是信息交流的總匯。
數據中心;運行;管理
隨著數據中心建設與應用在國內的蓬勃發展,數據中心運維管理問題越來越得到業內的廣泛重視。數據顯示,2012年中國數據中心運維市場規模達62億元,2013年中國數據中心運維市場規模達到77億元,增長率為24.2%;2014年中國數據中心運維市場規模達到94億元,增長率為22.1%;預計后續幾年,數據中心運維服務的年增長率持續在22%以上。由于用戶對數據中心運維管理服務于業務價值的進一步解析,運維管理服務在企業發展生命周期中得到了前所未有的高度重視。為做好數據中心的運維管理工作,探索并奠定科學先進的運維管理理論和技術基礎,逐步建立完善高效、規范的數據中心運維管理制度體系,確保數據中心安全、可靠、持續與高效運行,為業務信息系統穩定運行和信息資源綜合利用提供堅實的基礎支持,本文就數據中心運維管理的主要內容進行了初步研究。
隨著互聯網基礎設施和技術的發展,特別是WEB技術的成熟和應用,應用軟件系統從文件/個人桌面體系結構和客戶/服務器體系結構發展為瀏覽器/服務器體系結構。只要網絡具有足夠的帶寬,桌面用戶就可以從不需要安裝任何前段軟件情況下,通過瀏覽器調用存放在任何地理位置上的服務器中的應用軟件系統,這就給應用服務器提供商(ASP)模式的出現奠定了技術基礎。
與此同時,互聯網時代的IT技術以前所未有的速度快速發展,使得最終用戶用于硬件設備、通信線路、操作軟件和人員培訓上的投資和成本不斷增加。各方開始尋求新的經營模式以減輕IT一次性投資壓力,降低一次性投資風險及運營成本,建立自己的核心價值,這就使得ASP模式的出現和廣泛應用成為必然。在某種程度上,這種模式是由第二個發展時期----Web Hosting時期演化而來。但在主機托管模式中,用戶只是將Web頁面交由ISP服務商托管,而在ASP模式中,各經濟組織則是將基于Web技術的應用交由ASP運營商托管,通常將這個時期稱為應用委托時期,這個時期,比較成熟的IDC模式正式出現。其中,1998年以主機托管為主營業務的美國Exodus通信公司的建立標志著IDC模式的正式出現。
而對于普通機構來說,隨著信息化應用的不斷拓展和深入,對應用系統數據集中的要求也越來越高。目前,數據集中技術已完全成熟,它已經成為應用系統必然的應用模式。伴隨著信息技術的不斷發展,數據中心的內涵也越發豐富。
新疆發展大數據產業,具有很多優勢。一是在國家“一帶一路”戰略中,新疆是絲綢之路經濟帶核心區,目前正在打造絲綢之路經濟帶重要的區域交通樞紐中心、商貿物流中心、金融中心、文化科教中心、醫療服務中心,以及國家大型油氣生產加工和儲備基地、大型煤炭煤電煤化工基地、大型風電和光伏發電基地,國家能源、交通、通信等綜合大通道。這些產業都是數據密集產業,同時也需要進行海量的數據交換,可以為大數據產業發展提供廣闊的馳聘空間。二是大數據服務器耗電量大,維護成本高,新疆的能源優勢能夠為大數據企業提供廉價、穩定的電力資源,降低企業運行成本。
在自治區第八次黨代會上,自治區黨委明確提出,“加快數據中心基地建設,推進云計算產業發展,加快國際通信建設,提高社會信息化水平,努力構筑向西開放的國際通信和信息傳輸大通道”。
2011年新疆啟動“天山云計劃”,計劃在未來10年把新疆打造成我國乃至中西南亞的云計算數據之都。通過前期培育、產業集群發展、產業價值升值3個階段,在2020年建成烏魯木齊、克拉瑪依兩個云計算產業基地,兩大數據基地投資規模將不少于500億元,實現云服務產值100億元以上。
要確保數據中心安全、可靠、持續、低耗與高效地運行,必須做好運行管理工作。要做好運行管理工作,必須盡快建立高效、規范的運維體系。只有將規范和流程引入到混亂的運行環境中,讓每個運維技術人員一絲不茍地按規范做,讓經常做的事情制度化,讓制度化的事情標準化,讓標準化的事情規范化,才能構建完善規范的運維體系,提升運維管理水平。在建立健全運維體系的過程中,要不斷引入運行管理的新理念、新技術與新方法,實現節能、高效、簡化管理的目的,改善系統的運維質量,保證數據中心安全穩定運行。
1.管理的目標、任務和內容。
運行管理的目標就是通過強化與規范運行管理工作,確保數據中心安全穩定運行,為數據中心的IT關鍵設備運營管理和數據信息安全,提供可持續的有利保障;為實現信息資源存儲、保護和應用,以及核心運行提供高可用性、持續可靠的服務支撐。
數據中心進入使用階段后,主要任務就是對數據中心進行管理和維護,包括對基礎設施、業務系統、數據庫及業務系統運行狀態的監視監測,及時發現與處理問題;對應用系統的運行進行實時控制,記錄其運行狀態,進行必要的修改與功能擴充,以便使應用系統真正符合管理決策的需要,為管理決策者服務,是數據中心真正發揮作用。
高效的數據中心,如果管理不規范,缺乏科學地組織與管理,數據中心的作用就不能充分發揮,本身也會陷入混亂。管理是多方面的,即包括數據中心日常的規章制度及規章制度的執行程度,還包括對數據中心中各系統運行的可靠管理。
(3)pH條件優化。進行不同pH值條件下(pH值分別為2、3、4、5、6)的小試實驗,控制雙氧水加藥量均為1.5%,反應時間均為1.5 h進行實驗,反應完全后調節pH至8~9靜置沉淀30 min后取上清液測COD。
在數據中心運維過程中,人員因素應該是首要考慮的因素。無論多么先進的設備和技術,如果沒有人進行管理是不能很好發揮作用的。因此數據中心在建設過程中必須考慮運維隊伍建設問題,如果等數據中心從“建設期”轉入“維護期”才考慮隊伍建設,那就不利于提高運行管理效率。
同時,加強應急管理、提高系統可用率。建立完善的運行管理專項應急預案,明確運維人員在技術、管理、業務、安全等方面的職責,把責任落實到崗、落實到人;定期進行預案演練,并根據演練結果及時更新預案;配備核心應用和關鍵設備的備品備件,以備出現突發事件時盡快更換,及時修復,縮小影響,減少停運事件,提高可用率。
2.數據中心管理制度的建立與實施。
完善的管理制度是數據中心運行管理的保障。數據中心的基本規章制度包括三方面:管理規范、技術規范、操作指南。
管理規范:是從規范管理人員及用戶行為出發的各種制度、規定、辦法與獎懲措施。
技術規范:是規范運維人員在運行維護過程中各種行為的規定、規范與工作流程,例如《應用服務管理規定》《機房管理規定》《信息系統運行管理規程》《數據備份策略》。
操作指南:指導運行管理人員及用戶管理使用各種網絡與信息系統的操作指南與用戶手冊,如《網站簡易維護指南》《信息門戶使用指南》《OA系統安裝使用手冊》《生產MIS作業指導書》《服務器安裝手冊》等。
可以看出,在信息化發展到一定階段,數據中心的建設重點應該要從系統實施轉向以應用運維提升為主,運維質量保障、安全機制變得重要起來,這時除了技術保障外,制度保障顯得越發重要。
作為數據中心主管人員,應首先是一位管理專家,其次才是技術專家。由此,建立完善的運維制度是最主要的工作內容??蓮囊韵聨讉€方面,使數據中心運行管理制度化。
①轉變運維觀念,樹立規范化意識。只有樹立制度化的IT運維意識,才能在日常繁雜瑣碎的工作中有效地區分任務的優先級,將有限的資源投入到最能滿足需求的工作中。
②建立事件處理流程,強化規范執行力度。流程是最重要的,因為流程是IT管理的基礎,在IT管理的過程中,針對同一問題的具體實施步驟可能不同,但流程是不會改變的。
③設立ITIL服務臺,引入優先處理原則。設立服務臺以確定服務要求和IT運維目標,ITIL指南要求數據中心管理者定義服務臺的關鍵流程,不僅僅定義流程是什么,還包括它們是如何運作的,并指出每個流程的影響和意義。
對于一個良好運營的數據中心,其生命周期經歷了從咨詢規劃、布局建設、使用維護、升級優化等多個階段。在這漫長的過程中,“運維”是其中最重要、也是最長久的環節。在運維工程中,安全、架構、自動化、預警、虛擬化、流程、工具、培訓等等無不貫穿于其中。因此,做好數據中心運行管理工作,對提高數據中心效率、節能降耗、安全穩定運行具有重要意義。