引言
根據IDC(Internet Data Center)提供的關于數據中心IT投入成本的調查分析報告,我們不難發現電能制冷花費和服務器管理成本已大大超過新建服務器的投入,占數據中心IT總投入成本的百分之80以上,因此構建高效節能的IT運營環境,降低IT運營管理成本,成為當前數據中心建設必須考慮的重要問題。
1、IT運營環境構建概述
通過對數據中心運行狀況的研究,我們發現一個現狀:數據中心運行一段時間后,其IT資產的配置與當初規劃的藍圖出現巨大偏差,管理人員無法知曉當前數據中心的IT資產的配備情況,甚至于無法找個某臺業務服務器,設備之間的連線與標識無符,制冷和UPS容量配備缺乏量化依據,導致數據中心的IT資產ROI(Return On Investment)大幅降低。因此,需要定期對數據中心IT資產進行梳理、整合和優化,以恢復IT資產所提供的應有的服務效能。
構建高效節能的IT運營環境有兩個必要的環節,一是IT設施資產的持續優化,二是集中IT運營的部署。IT資產持續優化的目的是根據業務的需要,持續保持和優化IT資產的配置組合,使得有限的IT資產發揮最大的支撐效能;而集中IT運營的部署的目的則是通過高效、可靠、安全的IT集中管理手段,提升IT設施管理的效率,從而節省IT運營管理成本。
2、IT資產整合與優化
要實現IT資產的整合和優化,首先需要了解IT資產的現狀,以及各種IT資產之間的邏輯關系,例如,業務服務器在什么位置,還有哪些空閑機架,每個機柜的用電情況等等。當擁有這些的信息后,要進行合理的IT資產優化,例如據中心由于業務需購入一臺新業務服務器時,除了要盡量利用原有空閑機架空間外,還要考慮UPS的容量、制冷情況等因素,選擇一個最佳的機位放置這臺新的業務服務器。如果單純依靠Excel、Visio等工具來完成IT資產的管理,由于缺乏信息的關聯性和動態性,實現IT資產的組合優化視乎變得十分的復雜。
為了達到IT資產持續優化的目的,需要引入新的管理邏輯,通過構建IT資產的物理配置數據庫,存儲IT資產的相關數據和數據之間的關系,并通過可視化界面將IT資產進行展現。同時通過IT物理配置數據庫提供的關聯和分析功能,實現容量分析,用不同標識區分當前機柜的電量、承重、空間、制冷等容量狀態,這些分析數據能協助我們調整當前數據中心的IT資產,達到最優的IT資產配置組合。
另一方面,隨著業務擴展、變化和調整,IT資產呈現不斷變化的態勢,IT資產的配置變更管理成為跟蹤IT資產變化的有效的方法,為了實現IT資產持續的變更管理,需要將IT資產的變更記錄與IT變更規劃相關聯,并采用分權管理的方式,把變更管理分為變更規劃、影響評估、變更執行和變更審計環節,確保IT資產變更的可規劃、可評估、可執行、可審計。
因此,為發揮IT資產的最大效能,需要引入IT資產的配置管理數據庫,并通過數據管理和發掘技術,實現IT資產相關信息的可視化,讓我們隨時了解IT資產的配置和容量情況,確保數據中心的IT資產配備一直處于一種最佳狀態。
3、IT集中運營管理
構建高效節能的IT運營環境另一必要環節就是IT集中運營管理的部署,這部分與IT管理的關系十分密切。當前采用的主要IT設備運營管理方式,大體分為是網絡管理和本地管理兩種,這兩種管理方式各有利弊,網絡管理方式的優勢在于能實現遠程管理,但弊端在于需要依賴于業務網絡、操作系統、遠程管理服務的健壯性;本地管理方式正好相反。是否存在一種管理方式能結合這兩種管理方式的優勢呢?這就是集中帶外管理的概念,通過over IP的技術,讓運維管理人員通過遠程的方式訪問IT設備的本地管理端口,從而達到構建專用通道完成IT集中運營管理的目的。
借助集中帶外管理技術引入集中IT運營管理系統的理念,通過單一控制臺,實現對數據中心所有類型的IT設施統一管理,引入集中IT運營系統就是通過集中帶外管理的方式實現IT設施的統一管控。集中IT運營系統既能夠對PC服務器、刀片服務器、小型機、網絡設備、安全設備、UPS設備、智能空調等實體設備進行遠程集中管控外,還能對VMWare等虛擬系統實現統一的管理。
集中IT運營管理系統大體分為兩個組成部分,集中IT運營系統平臺軟件和帶外管理接入層硬件設備。集中IT運營系統軟件是整個集中IT運營系統的核心,也是單一的訪問入口,存儲著所有IT管理員的帳號、及訪問權限和運維審計記錄。但單單依靠軟件的安全是不足夠的,集中IT運營系統的安全防范應該分為軟件級、系統級和硬件級三個級別,只有這樣做才能有效保障整個IT運營管理都在可控安全的環境進行。帶外管理接入層硬件設備,根據管理設備接口類型和設備數量分為不同的型號,現在最流行的是二合一接入層設備,其特性在于既能連接網絡設備又能接入服務器設備,同時,打開網絡設備的管理會話并不占用設備最大的并發會話數。
由于集中IT運營系統是數據中心整體IT運營管理的核心,因此應該具備如下特性和功能:
1.應能提供管理會話共享功能,滿足日常IT故障多方診斷聯調的需要,可以讓總部專家、IT運維人員、外部支持人員通過遠程方式同時訪問同一個故障設備,實現遠距離快速聯調,既能提高故障修復時間,又能實現遠程培訓。
2.集中管理平臺還應具備專業的安全防范機制,來確保IT運營管理的安全可靠。除了具備獨立的本地帳號認證外,還應支持外部增強認證(如RSA動態口令認證、證書認證、U-KEY等),具備細致的授權策略,能根據單個設備、單個用戶、用戶組或設備組來進行授權,確保每個運維人員只擁有所需的最小管理權限,另外系統還需提供精細的管理審計功能,并給出審計報告,反映運維管理人員對設備維護記錄。
3.由于所有的IT運營管理都是通過集中IT運營系統來完成,因此系統的健壯性尤為關鍵,系統應該采用多機構建群組的系統冗余技術,群組由多臺安裝集中IT運營系統軟件的服務器組成,各個服務器之間數據能夠自動實現同步,群中任意一臺服務器都可以對IT管理人員提供訪問的入口,保證僅當所有的服務器同時宕機,集中IT運營系統才出現不可用的情況。
4.為構建無人值守的數據中心管理,集中IT運營系統還應提供集中電源管理的功能。集中IT運營系統通過智能PDU,將未使用的插座設定為關閉狀態,當需要使用時,才遠程進行打開。另外智能PDU還有一項優越的功能,就是它能實時收集IT設備的電量信息,并配合一些外置的溫濕度傳感器,將耗電量、環境溫度和濕度信息匯總到集中IT運營系統上,并給出能耗對比分析,給出能耗的發展趨勢,以及能耗效率,回過頭來有助于我們對IT資產的持續優化。
4、結語
IT資產持續優化和集中IT運營管理兩項技術,都是從提升IT服務效能的角度出發,為我們構建高效節能的IT運營環境。雖然從技術上分析這兩項技術存在一定差異,前者主要是專注于對現有IT資產優化和整合,而后者更側重于提高IT管理的效率,但如果整合這兩項技術,在IT管理過程中引入IT資產的可視化將能發揮更大的應用效果,有助于在IT管理的過程中進行微觀判斷和宏觀決策。