文|國際商業(yè)機器(中國)有限公司 陳 亮
綠色數(shù)據(jù)中心是指在數(shù)據(jù)中心的全生命周期內(nèi),最大限度地節(jié)約資源(節(jié)能,節(jié)地,節(jié)水,節(jié)材),保護環(huán)境并減少污染,為人們提供可靠、安全、高效、適用的、與自然和諧共生的信息系統(tǒng)使用環(huán)境。
可持續(xù)發(fā)展是企業(yè)的命脈,許多數(shù)據(jù)中心客戶正在積極尋求各種方法節(jié)省能源,降低成本,保證企業(yè)不斷發(fā)展,因此,綠色數(shù)據(jù)中心漸漸成為企業(yè)在建設(shè)或改進數(shù)據(jù)中心時的一個重要方向。
全球化經(jīng)濟加劇了競爭,也促進了合作,企業(yè)為在不斷變化的環(huán)境下求得生存,必須做到可持續(xù)發(fā)展。綠色意識可以轉(zhuǎn)化為綠色措施。能效規(guī)劃和企業(yè)責(zé)任可以取得積極的結(jié)果。盡量采用綠色技術(shù),同時降低成本和風(fēng)險是企業(yè)的必經(jīng)之路。
面對數(shù)據(jù)中心用電量、制冷能力和空間已達到或接近極限,數(shù)據(jù)中心對環(huán)境的影響日益引起社會關(guān)注,從企業(yè)運營成本和可持續(xù)發(fā)展的角度考慮,建立綠色數(shù)據(jù)中心勢在必行,是企業(yè)減少風(fēng)險、樹立良好形象的必由之路。
傳統(tǒng)數(shù)據(jù)中心的欠缺,如圖1所示。
(1)管理不斷增長的能源成本
據(jù)國際正常運行時間協(xié)會Uptime Institute調(diào)查,目前服務(wù)器三年用電和冷卻的費用一般為服務(wù)器硬件采購成本的1.5倍。隨著經(jīng)濟型、功能更加強大的高性能計算機集群需求的增長,電力成本還將不斷上升,而且關(guān)系到預(yù)算能否承受電力和冷卻費用的問題。

圖1 在滿足 IT 需求方面關(guān)注的問題
(2)電力不夠
由于城市的高速發(fā)展,區(qū)域電力系統(tǒng)逐漸無法滿足日益增長的擴容需求。然而,新的服務(wù)器、存儲和網(wǎng)絡(luò)產(chǎn)品在性能提高、價格降低的同時,耗電量卻在不斷增大。因此,電力不夠成為企業(yè)面臨的棘手問題。
(3)冷卻能力不夠
目前,許多客戶的數(shù)據(jù)中心已用了10~15年,冷卻基礎(chǔ)設(shè)施難以滿足當(dāng)前需求。傳統(tǒng)冷卻方法可為每機架提供 2~3kW 制冷量,而目前每機架需要的制冷量卻達到了20~30kW。單機柜的功率密度比數(shù)據(jù)中心過去的設(shè)計指標(biāo)提高了許多倍。
(4)空間不夠
每當(dāng)新項目或應(yīng)用上線時,需要配置新的服務(wù)器或存儲子系統(tǒng),因此,隨著業(yè)務(wù)需求的增長,設(shè)備占地面積的激增,當(dāng)不能添加服務(wù)器和存儲時,只好再建一個數(shù)據(jù)中心,這種擴建的成本非常高。
上述問題的不斷出現(xiàn),表明建立綠色數(shù)據(jù)中心是企業(yè)的必然選擇。
傳統(tǒng)數(shù)據(jù)中心的能源使用情況,如圖2所示。每種構(gòu)成分為兩部分:
(1)IT 設(shè)備(服務(wù)器、存儲和網(wǎng)絡(luò))使用45%的能源;支持這種設(shè)計的基礎(chǔ)設(shè)施使用另外55%的能源,如制冷機組、加濕器、計算機房和空調(diào)(CRAC)、配電箱(PDU)、不間斷電源(UPS)、配電系統(tǒng)等。
(2)處理器僅使用30%的能源,而系統(tǒng)其余部分則使用了剩余的70%。
(3)服務(wù)器的利用率一般僅為20%,而剩余的80%都是閑置的。
由此可以看出,對于無效使用能耗的降低、高效硬件的使用和IT資源的高使用率對于降低企業(yè)運營成本、提升可持續(xù)發(fā)展來說十分重要。

圖2 典型數(shù)據(jù)中心能源使用組成及比例
Uptime Institute白皮書定義了四個確定數(shù)據(jù)中心相對“綠色”的要素。四個綠色指標(biāo)是IT系統(tǒng)設(shè)計和建筑、IT硬件資產(chǎn)利用、IT硬件效率和機房物理基礎(chǔ)設(shè)施。
針對綠色數(shù)據(jù)中心,目前尚沒有專用的評估體系,實踐中通常采用綠色建筑的評估體系來衡量綠色數(shù)據(jù)中心。
為了評估數(shù)據(jù)中心綠色環(huán)保水平,經(jīng)常使用以下兩個指標(biāo):
(1)數(shù)據(jù)中心基礎(chǔ)設(shè)施效率 (DCiE) ,DCiE = (IT 設(shè)備電量 / 基礎(chǔ)設(shè)施總電量) x 100%。
(2) 電源使用效率 (PUE), PUE = 基礎(chǔ)設(shè)施總電量 / IT 設(shè)備電量。
IT 設(shè)備用電量包括所有 IT 設(shè)備以及用于監(jiān)控或控制數(shù)據(jù)中心的輔助設(shè)備的負荷,前者如服務(wù)器、存儲和網(wǎng)絡(luò)設(shè)備;后者如鍵盤、視頻、鼠標(biāo)開關(guān)、監(jiān)視器、工作站或移動計算機。
基礎(chǔ)設(shè)施用電總量包括 IT 設(shè)備及支持 IT設(shè)備的系統(tǒng)負荷,如:
◆ 供電設(shè)備,如不間斷電源 (UPS)、開關(guān)柜、發(fā)電機、配電箱(PDU)、電池、IT 設(shè)備外部配電損耗;
◆ 冷卻系統(tǒng),如制冷機組、計算機房空調(diào) (CRAC)、直接膨脹空氣調(diào)節(jié)器 (DX)、泵及冷卻塔等;
◆ 計算機、網(wǎng)絡(luò)及存儲;
◆ 低負載條件下工作時,不間斷電源(UPS) 設(shè)備效率下降;
◆ 其他雜項器件的負載,如數(shù)據(jù)中心照明。
例如:DCiE 值為33% (PUE 等效值為3.0)時,表明IT 設(shè)備耗用數(shù)據(jù)中心電量的33%。因此,支付100元能源費,IT 設(shè)備實際只用了33元。
為實現(xiàn)綠色數(shù)據(jù)中心,需考慮三個因素:
(1)基礎(chǔ)設(shè)施
機房基礎(chǔ)設(shè)施方面需要考慮的問題包括:
◆ 如何以及在何處使用能源;
◆ 基礎(chǔ)設(shè)施目前可優(yōu)化的空間(從DCiE或 PUE 來衡量);
◆ 本數(shù)據(jù)中心是以電量和性能為主,還是僅以性能為主;
◆ 是投資建立新的數(shù)據(jù)中心,還是投資升級現(xiàn)有數(shù)據(jù)中心;
◆ 數(shù)據(jù)中心現(xiàn)場是否適應(yīng)變更;
◆ 數(shù)據(jù)中心所需要的可靠性水平是否增加了基礎(chǔ)設(shè)施能耗,現(xiàn)有備份或備用設(shè)備存在多少閑置,是否足夠,還是過多,能否撤銷部分設(shè)備;
◆ 應(yīng)選擇哪些支持設(shè)備(不間斷電源、飛輪發(fā)電機、發(fā)電機、配電柜、制冷機組、CRAC等),今后的發(fā)展趨勢如何,基礎(chǔ)設(shè)施能否滿足下一代硬件電力和冷卻要求,例如,更多的 IT 設(shè)備今后采用水冷;
◆ 基礎(chǔ)設(shè)施是否存在過熱問題,是否存在濕度問題;
◆ 是否可以采用免費制冷;
◆ 電力、冷卻或空間是否影響當(dāng)前運營,哪些因素影響今后業(yè)務(wù)發(fā)展,未來能否在現(xiàn)有能源范圍內(nèi)增加計算能力;
現(xiàn)場基礎(chǔ)設(shè)施在以下方面是否達到最佳水平:氣流與散熱、配電分配、冷卻、照明、監(jiān)控與管理;
◆ 必要時,是否需要采用水冷。
(2)IT 設(shè)備
IT 設(shè)備方面的問題如下,其中包括硬件設(shè)計以及機架現(xiàn)有冷卻、供電和監(jiān)控方式:
◆ 設(shè)備是否采用節(jié)能硬件,是否采用節(jié)電功能;
◆ 目前是按現(xiàn)場、基礎(chǔ)設(shè)施還是機架選擇供電和冷卻方法;
◆ 硬件是否具備電量、熱量、資源利用率監(jiān)控功能,是否可以監(jiān)控能耗;
◆ 用電量如何計費;
◆ 誰可以提供幫助。
(3)利用率
服務(wù)器和存儲利用率方面的問題如下:
◆ 基礎(chǔ)設(shè)施利用率是否達到最佳水平;
◆ 是否存在不必要的備份設(shè)備;
◆ 可以進行合并與虛擬化嗎;
◆ 如何將離散或孤島式計算轉(zhuǎn)變?yōu)楣蚕砟J剑?/p>
◆ 是否可以監(jiān)控資源利用率,當(dāng)前情況及未來趨勢如何;
◆ 如何對基礎(chǔ)設(shè)施提供的服務(wù)進行計費;
◆ 誰能提供幫助。
圖3所示為綠色數(shù)據(jù)中心演進戰(zhàn)略及建議步驟。從圖中可以看出,IT 基礎(chǔ)設(shè)施和人員參與流程的所有措施必須同時加以協(xié)調(diào)。
為實現(xiàn)環(huán)保,數(shù)據(jù)中心需要采用高能效基礎(chǔ)設(shè)施和最佳實踐措施。基礎(chǔ)設(shè)施壽命比大部分 IT 硬件長三到五倍,所需投資也更高。因此,了解基礎(chǔ)設(shè)施更新的時間安排很重要。本節(jié)還將提供采用最佳實踐措施提高基礎(chǔ)設(shè)施效率的技巧。
機房與設(shè)備基礎(chǔ)設(shè)施可分為以下幾部分,這幾個部分之間彼此相關(guān):
◆ 數(shù)據(jù)中心建筑結(jié)構(gòu);
◆ 數(shù)據(jù)中心綠色能源;
◆ 數(shù)據(jù)中心冷卻;
◆ 供暖、通風(fēng)與空調(diào)(HVAC);
◆ 不間斷電源(UPS);
◆ 電源;
◆ 備用發(fā)電機或替代電源。
2.2.1 建筑結(jié)構(gòu)綠色技術(shù)
綠色節(jié)能建筑結(jié)構(gòu)新體系是在木結(jié)構(gòu)、砌體結(jié)構(gòu)、框架結(jié)構(gòu)等通常結(jié)構(gòu)體系的基礎(chǔ)上產(chǎn)生和發(fā)展的,具有綠色節(jié)能房屋建筑結(jié)構(gòu)特點的新體系。所采用的墻體、樓板等主要建筑結(jié)構(gòu)材料具有綠色、節(jié)能性能,而主體建筑結(jié)構(gòu)和施工方式采取現(xiàn)場拼裝、現(xiàn)場澆筑使建筑物形成一體化,是一種將建筑材料、結(jié)構(gòu)形式和施工方式相結(jié)合的以體現(xiàn)綠色、節(jié)能為主的新的建筑結(jié)構(gòu)體系。
建筑結(jié)構(gòu)的節(jié)能技術(shù)有以下幾種:
(1) 優(yōu)化建筑外形,以最小的建筑外表面積創(chuàng)造出最大的建筑空間,減輕墻外表面積對散熱的影響。合理設(shè)計平面,將電梯、樓梯、管道井、機房等布置在建筑物的西側(cè),可以有效阻擋日射,降低夏季室內(nèi)的溫度。
(2) 采用保溫隔熱、傳熱系數(shù)小的墻體新材料。

圖3 綠色數(shù)據(jù)中心演進戰(zhàn)略及建議步驟
(3)外裝飾盡量做淺色處理,采用光滑飾面材料,以減少表面對輻射的吸收。
(4)利用綠色植被鋪地,將降低地面附近室外空氣的溫度,減少室內(nèi)外溫差,從而降低冷負荷。
(5)屋頂采用高保溫材料或在屋頂設(shè)置高效隔熱層,防止大量輻射熱侵入室內(nèi),減少空調(diào)等耗能。條件允許時可在屋頂上覆土,做植被屋面,不僅能用覆土隔熱還能利用植物遮陽。
2.2.2 綠色能源
新一代數(shù)據(jù)中心應(yīng)充分利用太陽能、風(fēng)能、水力能、生物能、海洋能和地?zé)崮艿染G色能源,實現(xiàn)一定程度上的資源自給自足,結(jié)合各地的自然條件及資源情況,因地制宜地開發(fā)綠色能源。如太陽能熱水技術(shù)、沼氣技術(shù)、地?zé)岚l(fā)電、地?zé)峁┡夹g(shù)、被動式太陽能利用技術(shù)、可再生技術(shù)等。
數(shù)據(jù)中心采用創(chuàng)新技術(shù)可以提高單位電耗計算能力。隨著技術(shù)的演進和創(chuàng)新,IT 設(shè)備能效不斷提高,采用新型設(shè)備更換原有設(shè)備能夠顯著降低數(shù)據(jù)中心的總電耗和制冷要求,節(jié)省寶貴的地面空間,通常會帶來較好的投資回報率。
例如刀片服務(wù)器的耗電量和制冷要求比1U [SG1]技術(shù)降低了25%~40%;最新型UPS 系統(tǒng)的耗電量比現(xiàn)有 UPS 系統(tǒng)低70%;新型制冷機組的系統(tǒng)效率提高了50%;新型制冷機組可以通過安裝變速驅(qū)動器,降低泵水系統(tǒng)的能耗,并且便于這種水冷系統(tǒng)與冷媒水基礎(chǔ)設(shè)施更好地集成;利用外部空氣直接對冷媒水進行降溫的水側(cè)節(jié)能裝置,可進一步降低冷卻數(shù)據(jù)中心使用的能耗;利用儲熱系統(tǒng)保存制冷機組通常夜間高效工作時產(chǎn)生的能量,然后在能源成本較高的白天釋放這種能量,可以降低水冷系統(tǒng)的運行成本。
2.2.3 改善冷卻方式
制定減少數(shù)據(jù)中心產(chǎn)生的熱量、提高電源和制冷效率的計劃時,應(yīng)考慮大量因素。
(1)改進機架和機房布局可以提高能效,且初期投資比較低。可考慮以下改進方法:
◆ IT 設(shè)備按熱通道和冷通道配置排列;
◆ 設(shè)備應(yīng)位于可以控制冷、熱通道之間氣流的位置,避免熱空氣回流到 IT 設(shè)備的冷風(fēng)進氣口;
◆ 采用輔助冷卻方式,如水冷或冷媒熱交換器。
采用后門熱量交換器提高機架制冷效率,或采用封閉式機架系統(tǒng)在進入機房之前驅(qū)散高密度計算機系統(tǒng)產(chǎn)生的熱量。同樣,相對簡單的氣流管理可以顯著提高能效。例如:清除地板下面的障礙,有效管理線纜以利于空氣流通;通過增加或減少設(shè)備進氣口的出風(fēng)口蓋板,保證地板孔與設(shè)備熱負荷相匹配;考慮增加回風(fēng)管。
應(yīng)考慮數(shù)據(jù)中心組成熱區(qū),將一組固定的 IT 設(shè)備和地面空間分配給指定的 HVAC 或CRAC 設(shè)備。這種空間和散熱計劃可以消除機房中對制冷系統(tǒng)形成壓力的熱區(qū)(熱點),提高系統(tǒng)穩(wěn)定性,避免由于熱引起硬件故障,同時,也可以避免冷點。
(2)管理氣流
在可能的情況下,應(yīng)避免冷、熱空氣相混。為提高氣流效率,冷空氣穿過高架地板下面進入負載區(qū)域的通道必須通暢。高架地板上面,應(yīng)有熱空氣返回 CRAC 設(shè)備的通道。以下方法可以改進氣流管理:
◆ 采用冷熱通道。采用冷、熱通道配置便于更好地管理高架地板氣流,包括熱空氣和冷空氣。這種配置有助于冷、熱氣流在各自獨立的通道中流動,減少空氣混合,提高效率;必要時可以隔離冷熱通道,以提高效率;
◆ 增加或減少出風(fēng)口蓋板。減少熱通道和開孔區(qū)域的出風(fēng)口蓋板;增加高熱負荷區(qū)的通風(fēng)口蓋板;調(diào)節(jié)通風(fēng)口蓋板下面的擋板,使少量空氣進入低熱區(qū),高熱區(qū)處擋板全部打開;開口未用的蓋板用整塊蓋板更換;
◆ 改善機架氣流。可能的情況下,避免冷、熱空氣相混。空置機架安裝隔板,機架間留大間距,使冷空氣避開服務(wù)器產(chǎn)生的熱負荷,并使冷空氣流回 CRAC [SG2]設(shè)備。空氣應(yīng)以最小的阻力穿過通道,這樣可以使機架中的熱空氣再次穿過服務(wù)器被帶走;BladeCenter(刀片中心) 機箱后部未使用的模塊托架安裝相應(yīng)的隔板、填充物;
◆ 密封線纜口和透孔。高架地板開口會影響氣流分布,降低地板下面的靜氣壓,用填充物、泡沫、枕墊封堵開口,這樣可以使更多的空氣進入需要的位置;
◆ 清除地板下的障礙。地板下障礙過多會導(dǎo)致靜壓上升,高靜壓對高架地板上、下的氣流產(chǎn)生負面影響。清除地板下面的障礙物,如:不使用的線纜和布線、不使用的地板下設(shè)備和通信盒。
(3)高架地板高度建議
目前,高架地板建模建議高度至少支持600mm(24 in)無障礙空間,為冷空氣提供通暢的流動通道。有些新的高架地板為 900 mm(36 in)高,以便增加空氣量,滿足極為嚴(yán)格的冷卻要求。
對于低高架地板,如300mm(12 in),設(shè)備不得靠近 CRAC 系統(tǒng),否則會造成出風(fēng)口蓋板出現(xiàn)低氣流或逆流。
地板下面部分可放置在高架地板下,使空氣進入所需的區(qū)域。[SG3]
(4)數(shù)據(jù)中心密封
考慮以下數(shù)據(jù)中心密封方案:
◆ 隔離數(shù)據(jù)中心墻壁與天花板;
◆ 密封數(shù)據(jù)中心四周的透孔;
◆ 用雙層玻璃窗更換窗戶;
◆ 安裝門口密封條。
這些簡單的方法有效地保持數(shù)據(jù)中心溫度和濕度設(shè)置點,提高熱效率。
(5)制冷設(shè)備定位方案
傳統(tǒng) IT 設(shè)備冷卻設(shè)計將多個 CRAC 系統(tǒng)放在數(shù)據(jù)中心四周,CRAC 設(shè)備提供的冷空氣從設(shè)備到服務(wù)器機架要經(jīng)過一段距離,然后再返回 CRAC 設(shè)備。
為解決數(shù)據(jù)中心高密度機架產(chǎn)生的熱點問題,制冷設(shè)備廠商開始提供另一種冷卻解決方案消除數(shù)據(jù)中心的熱點。其做法是在靠近出現(xiàn)問題的位置,放置熱交換器進行局部液冷,將熱交換器直接放在熱源處,不必使用 CRAC 系統(tǒng),這樣可以提高其余 CRAC 系統(tǒng)的效率,保證數(shù)據(jù)中內(nèi)部的冷卻能力。這些熱交換器均可以擴展。
為發(fā)揮局部冷卻的優(yōu)勢,數(shù)據(jù)中心需要配備冷媒水。數(shù)據(jù)中心內(nèi)部提供冷媒水不是新技術(shù),20世紀(jì)80年代已用于大型機。由于風(fēng)冷不能滿足高密度服務(wù)器的散熱需求,于是再次要求數(shù)據(jù)中心配備冷媒水。目前,已基于這一策略為機架開發(fā)出幾種可行方案:
◆ 前部或后部安裝鰭管熱交換器;
◆ 機架底部或側(cè)面安裝內(nèi)部鰭管熱交換器;
◆ 高架鰭管熱交換器;
◆ 服務(wù)器內(nèi)部制冷;
◆ 后門熱量交換器。
2.2.4 供暖通風(fēng)與空調(diào)(HVAC)
(1)自然冷卻免費制冷
節(jié)能裝置分為空氣側(cè)和水側(cè)兩種。
空氣側(cè)節(jié)能裝置可用作免費制冷系統(tǒng)。不過,根據(jù)所處位置,這些裝置在有持續(xù)鮮冷氣源的條件下效果最好。通過夜間對這些裝置進行調(diào)整可以保持一致性。外部空氣節(jié)能裝置可直接抽取外部空氣供數(shù)據(jù)中心使用。
水側(cè)節(jié)能裝置采用戶外冷空氣生成冷凝水,可用于部分或全部滿足設(shè)備冷卻的要求。當(dāng)外部氣溫足夠低時,水側(cè)節(jié)能裝置可部分或完全取代制冷機組,這樣可以延長每天免費制冷的時間。
(2)溫度設(shè)定
數(shù)據(jù)中心溫度設(shè)定點只要上調(diào)1度,就可顯著降低能源成本,因為,這樣可以降低CRAC 負荷,更多地采用免費制冷。
建立能源監(jiān)測與管理系統(tǒng),可監(jiān)控、管理各系統(tǒng)用電量和熱量,正確評估數(shù)據(jù)中心高溫和低溫設(shè)定點并可以提供趨勢分析,有助于控制能耗,提高能源利用率,節(jié)省能源費用。
2.2.5 電源
現(xiàn)場電源功率因校正(PFC)可以重新獲得部分損失的電量。通過 PFC,供電 1 kW,設(shè)備使用的電量可以達到 0.95kW。對于使用 2500~3000kW的現(xiàn)場,回報期為三到四年。
智能電源分配單元(iPDU)連接能源管理系統(tǒng),通過收集用電量信息,顯示服務(wù)器能耗的整體視圖。先進的能源管理系統(tǒng),可以實現(xiàn)對連接的服務(wù)器進行功率封頂,節(jié)省費用,有助于提高能效。
(1)DC 與 AC
隨著交流電源的發(fā)展和開關(guān)電源技術(shù)的進步,效率方面的提高達到空前水平。這種情況加大了 DC 電源與 AC 電源之間的差距,DC 效率的提高僅為5%~7%,而AC 產(chǎn)品則十分豐富,成本大大低于 DC。
(2)飛輪發(fā)電技術(shù)
隨著新的飛輪發(fā)電技術(shù)的出現(xiàn),過去的UPS 電池有被新的飛輪發(fā)電機取代的趨勢。受電池質(zhì)量和充電次數(shù)的影響,某些情況下,電池的使用壽命最多為10年,而與電池相比,飛輪發(fā)電機可以在更高的溫度下工作,效率高,占地面積比電池小,不必進行交流到直流,再到交流的轉(zhuǎn)換,但是它支持的時間卻有限,也不能調(diào)節(jié)電源。飛輪發(fā)電機的優(yōu)點是效率高、尺寸小;缺點是支持時間有限,不能調(diào)節(jié)電源。
(3) 發(fā)電機
電源保障是實現(xiàn)高可用性數(shù)據(jù)中心的關(guān)鍵,而備用發(fā)電機是高可用性數(shù)據(jù)中心現(xiàn)場基礎(chǔ)設(shè)施的關(guān)鍵部件。UPS 系統(tǒng)可以為數(shù)據(jù)中心供電幾分鐘,甚至幾個小時,但是沒有備用發(fā)電機,數(shù)據(jù)中心制冷的 HVAC 系統(tǒng)無法工作,從而有可能造成數(shù)據(jù)中心溫度過高。
目前,與老式發(fā)電機相比,備用發(fā)電機在設(shè)計上顯著提高了燃油效率,減少了對大氣的CO2排放,更加環(huán)保。同時,加快了啟動和送電速度(低于30秒)支持使用飛輪和燃料電池技術(shù)的備用發(fā)電機可以取代 UPS 電池。
備用發(fā)電機一般采用柴油或天然氣為燃料,這些設(shè)備的使用壽命為15~20年。電力供應(yīng)非常好的地區(qū),這些設(shè)備未必很長時間工作,因此保養(yǎng)和檢測是十分重要的。
確定這些設(shè)備的規(guī)格時,一定要考慮含數(shù)據(jù)中心在內(nèi)的全部基礎(chǔ)設(shè)施,包括制冷機組、冷卻泵、CRAC、UPS、AHU 及其他現(xiàn)場基礎(chǔ)設(shè)施。
除此之外,現(xiàn)場發(fā)電還在不斷發(fā)展的新技術(shù)有:燃料電池、核能、風(fēng)能和太陽能等。
優(yōu)化IT設(shè)備,從源頭減少用電量和產(chǎn)生的熱量,對提高基礎(chǔ)設(shè)施效率可以產(chǎn)生直接影響。
(1)如何用電
電進入數(shù)據(jù)中心現(xiàn)場后,配送給各種 IT組件,系統(tǒng)中的電力分配取決于其架構(gòu)和用途。供電總量和組件配電量隨處理的工作負載而變化,并且,每種系統(tǒng)都根據(jù)特定用途而構(gòu)建。
圖4中從左至右顯示的電力分配情況,依次為大型機系統(tǒng)、高端 UNIX服務(wù)器、高性能計算(HPC)服務(wù)器、入門級 UNIX 系統(tǒng) 和刀片系統(tǒng)。由于處理器能耗約占大型機的20%~30%,而刀片為50%以上,因此我們在優(yōu)化能效時,需要分別針對每種系統(tǒng)采用不同的策略。

圖4 一般典型系統(tǒng)中組件的相對能耗
柱狀圖底部紅色部分表示每種系統(tǒng)所需能量,即交流電轉(zhuǎn)換為直流電損失部分能量。變壓器(電源)效率取決于負載,是非線性的,最有效的負載為50%~75%。負載低于50%,效率顯著下降;因此盡管不能顯著提高效率,也要保持在一定的負載水平。
(2)創(chuàng)新解決IT硬件散熱問題
為防止計算機芯片損壞,芯片及整個系統(tǒng)必須進行散熱。
系統(tǒng)每節(jié)省1W電,熱負荷也可以節(jié)省約1W,這些節(jié)省還可對不間斷電源(UPS)和制冷系統(tǒng)產(chǎn)生同樣的效果。因此,降低系統(tǒng)能耗可以取得兩倍以上的回報,這是實現(xiàn)綠色數(shù)據(jù)中心的一大優(yōu)點。
空氣是一種效率極低的冷媒,因此液冷成為一種越來越流行的冷卻方法。水是目前最常用的冷卻液體,一升水吸收的熱量約比同樣體積的空氣高4000倍。隨著空間減小,熱量增加,水冷系統(tǒng)將很快成為一種必然趨勢。在規(guī)劃新的數(shù)據(jù)中心或改造現(xiàn)有中心時,應(yīng)考慮新 IT 設(shè)備需要采用水冷提高散熱效率的因素。
例如:目前已開發(fā)出在芯片背部直接水冷的解決方案,其基本原理是讓水流穿過芯片背部的細微通道。熱能被水吸收后,可以達到有效散熱的目的,典型的如支持高性能計算的 POWER 575 系統(tǒng)就配有水冷處理器。
選擇高效設(shè)備,采用更高效的系統(tǒng)可以提升數(shù)據(jù)中心資源利用率,典型的有合并和虛擬化技術(shù)。
(1)合并:提高能效的關(guān)鍵
合并的概念如圖5所示。假定我們有四個系統(tǒng),每個系統(tǒng)運行兩個應(yīng)用程序(APP)。同時,每個設(shè)備耗電量為2kW,總計8kW。而就小型x86服務(wù)器的情況看,利用率往往僅為10%。
如果我們將這8個應(yīng)用程序合并到一個更強大的服務(wù)器上運行,利用率可達70%,用電量為4kW,這種單一服務(wù)器的工作能效更高。此外,如果我們采用一種電源管理技術(shù)關(guān)閉前面的4個系統(tǒng),也可實現(xiàn)系統(tǒng)總能耗為4kW,利用率為70%的效果。

圖5 將應(yīng)用程序合并到更高效服務(wù)器
總能耗降低不是唯一要素。隨著電量下降,熱負荷及基礎(chǔ)設(shè)施其他插件的功耗也同步下降。正是由于這種雙重下降,使系統(tǒng)合并得以成為實現(xiàn)綠色數(shù)據(jù)中心的巨大杠桿。
但是在各自的應(yīng)用程序轉(zhuǎn)移到合并系統(tǒng)期間,系統(tǒng)1至4不能停機。因此,在遷移過程中,會臨時出現(xiàn)資源需求加大的問題。
(2)虛擬化:最環(huán)保的技術(shù)
虛擬化是一種系統(tǒng)抽象化的概念。這種技術(shù)可以顯著減少數(shù)據(jù)中心所需的 IT 設(shè)備。虛擬化消除了服務(wù)器、存儲或網(wǎng)絡(luò)設(shè)備對應(yīng)用程序的物理局限。每種應(yīng)用程序配置專用服務(wù)器,效率低下,造成利用率下降。虛擬化可使應(yīng)用“拼車”使用服務(wù)器,這種物理意義上的車(服務(wù)器)是固定的,但乘員(應(yīng)用程序)可以改變,而且變化多樣(尺寸和類型),資源自由增減,如圖6所示。
虛擬化一詞廣泛使用并有以下多種定義:
◆ 可以生成 CPU、存儲器和 I/O 功能組成的計算機系統(tǒng)邏輯實例;
◆ 可以是其他虛擬組件的組合;
◆ 可組成虛擬 CPU 或虛擬存儲器和磁盤;
◆ 可以是虛擬計算機與外部環(huán)境之間的虛擬網(wǎng)絡(luò)。
為完成處理工作,虛擬系統(tǒng)必須在實際系統(tǒng)上運行,顯然,這要求具有更高的智能水平。現(xiàn)在有純軟件解決方案,系統(tǒng)固件可以提供虛擬化功能,或?qū)⒋祟惞δ芙尤胂到y(tǒng)中。目前許多處理器架構(gòu)集成了虛擬功能,可供軟件解決方案使用。
虛擬化的其他優(yōu)點:
◆ 虛擬系統(tǒng)支持網(wǎng)絡(luò)虛擬化,利用虛擬化系統(tǒng)功能進行通信,能以極快的速度傳送內(nèi)存數(shù)據(jù),提高了性能和能效,同時,減少了現(xiàn)場和設(shè)備資源的需求;
◆ 虛擬系統(tǒng)可以彼此實現(xiàn)磁盤共享。從能效角度看,通過虛擬化存儲,虛擬化系統(tǒng)可將理想的磁盤容量提供給其他虛擬系統(tǒng)。

圖6 虛擬化可以按原樣合并系統(tǒng)
新的信息化系統(tǒng)都應(yīng)該內(nèi)置測量電耗的測量功能和熱敏傳感器。我們可利用這功能顯示當(dāng)前用電值,便于根據(jù)系統(tǒng)整體狀態(tài)采取措施。
智能電源分配單元 (iPDUs)用于未嵌入或無可管理板載測量儀的系統(tǒng)。iPDU 含有通用傳感器,可提供連接設(shè)備的電耗信息及環(huán)境信息,如溫度和濕度。iPDU 的串口和 LAN接口可供 Web 瀏覽器、任何基于 SNMP 的網(wǎng)管系統(tǒng)、Telnet 或串行線連接的控制臺進行遠程監(jiān)控和管理。事件通過 SNMP 陷阱或電子郵件發(fā)送通知,并可通過電子郵件發(fā)送日記錄報告,能源管理器也可以管理 iPDU,如圖7所示。
一般先進的處理器系統(tǒng)都應(yīng)具備能效管理技術(shù),以提供多種電源管理功能:
◆ 用電量趨勢:供計算機收集并在內(nèi)部保存用電量數(shù)據(jù),數(shù)據(jù)可通過能源管理器顯示;
◆ 節(jié)電模式:按預(yù)定比例降低處理器電壓和頻率。節(jié)電模式在保證正常安全運行的同時,有助于降低峰值能耗。例如,夜間CPU 利用率很低時,處理器可以采用節(jié)電模式(Power Saver Mode 模式);
◆ 功率封頂:強制執(zhí)行用電量標(biāo)定極限。這個功能適于通用電源極限條件下使用,如適用于一組系統(tǒng)的最大供電量。不過,這個功能不能作為節(jié)電功能使用,這樣會嚴(yán)重影響性能;
◆ 處理器內(nèi)核休眠:采用處理器低功率模式(稱為 Nap),可通過關(guān)閉內(nèi)核時鐘減少電耗。根據(jù)操作系統(tǒng)的信號,管理程序控制進入或退出 Nap 模式;
◆ EnergyScale forI/O:這一功能可使自動關(guān)閉PCI插拔適配器插槽的電源。如果插槽是空的,插槽電源自動關(guān)閉,不再為其分配分區(qū),或關(guān)閉已分配分區(qū)的電源。

圖7 系統(tǒng)基礎(chǔ)設(shè)施與能源管理系統(tǒng)的結(jié)構(gòu)圖
先進的系統(tǒng)也應(yīng)具備智能的能源管理平臺,提供通用系統(tǒng)管理環(huán)境。
◆ 測量和顯示被管理系統(tǒng)當(dāng)前電量和溫度數(shù)據(jù);
◆ 提供選定期間內(nèi)的趨勢數(shù)據(jù);
◆ 在固件支持的情況下,設(shè)置系統(tǒng)功率封頂,并管理處理器的節(jié)電模式。
圖8所示應(yīng)用場景展示了能源管理系統(tǒng)幫助優(yōu)化機架或 BladeCenter 布局方法:
(1)假定電量趨勢表明服務(wù)器實際電耗低于標(biāo)定量。查找某個服務(wù)器絕不可能超出用電量。
(2)采用能源管理系統(tǒng)對功率進行封頂。按觀測到的最大量級封頂系統(tǒng)功率(由于會嚴(yán)重影響性能,因此封頂功率設(shè)定的極限應(yīng)該是正常情況下不可能達到的)。以前過度分配給每一單個系統(tǒng)的電量,現(xiàn)在可在過度分配的機架層進行管理。
(3)在機架中增加系統(tǒng),以有效利用以前過度分配的電量。理想情況下,以能效更高的新系統(tǒng)取代低能效設(shè)備。
建立電源管理基礎(chǔ)設(shè)施后,可以采取其他步驟,例如,確定數(shù)據(jù)中心的熱點位置;將應(yīng)用軟件配置到冷服務(wù)器上,避免熱點;如果電力供應(yīng)商實行負荷費率或白天和夜間費率,可以根據(jù)基準(zhǔn)優(yōu)化配置,降低能耗。
對于整個系統(tǒng)管理環(huán)境,電源管理只是其中的一個方面。集成能源和系統(tǒng)管理系統(tǒng)可用于監(jiān)控操作系統(tǒng)、數(shù)據(jù)庫、服務(wù)器,直至通過靈活定制的門戶監(jiān)控分布式環(huán)境。
優(yōu)化能效的方式包括:
◆ 根據(jù)機器的環(huán)境溫度重新分配服務(wù)器,或?qū)⒄麄€機架的總能耗重新分配給數(shù)據(jù)中心溫度較低的另一機架。當(dāng)溫度報警時,可重新配置功能;
◆ 對存在溫度問題的服務(wù)器進行功率封頂,可能是由于氣流受阻造成的,直到現(xiàn)場問題得到解決為止;
◆ 將電量、溫度和 CPU 用量數(shù)據(jù)傳送到監(jiān)控倉庫。可按核算數(shù)據(jù)對這個數(shù)據(jù)進行修正。根據(jù) CPU 和相關(guān)用電量向 IT 用戶收費。
綠色數(shù)據(jù)中心的建設(shè)不是一勞永逸的項目,而是一個不斷推進的過程。從降低成本,到提高可持續(xù)發(fā)展能力,再到為企業(yè)樹立更好的公眾形象,整個綠色數(shù)據(jù)中心的建設(shè)過程實際是一個逐漸演進的過程。
未來,會有越來越多的公司采用EMC、能源合同管理的方式來管理數(shù)據(jù)中心的能耗,能源合同管理能幫助客戶確定基準(zhǔn),提高 IT能效水平,減少對環(huán)境的影響。同時也會出現(xiàn)由第三方能源評估機構(gòu)對消耗的能源降低進行認證,頒發(fā)證書,可供企業(yè)用來獲得降低能耗的認證測量結(jié)果。證書可在不斷擴大的能效證書市場上進行有價交易,也可以保存用來證明減少能源消耗及相關(guān)的CO2排放。

圖8 利用能源管理器優(yōu)化機架布局