張健浪
開發節能型產品已成為人類社會的共識,無論是摩天大樓、汽車、家用電器都朝著節能的方向前進,作為能源消耗大戶的計算機當然也躋身此列。我們日常所處的IT環境由掌上數字設備,PC/筆記本電腦、服務器、網絡設備共同構成,除了低耗能的掌上數字設備和網絡設備外,其它的幾種設備均是能耗大戶,在擁有密集計算環境的領域,電費支出往往相當可觀,這也使得相關企業越來越重視對節能技術的開發。
技術基礎:節能要從何入手
對PC設備來說,能耗最大的主要有四大部件:其是處理器,目前高端PC上用的四核處理器功耗水準普遍在120瓦以上,耗電量頗為可觀,其二是圖形系統,該領域的激烈競爭迫使NVIDIA-AMD都競相朝著高效能方向挺進,但也導致了顯卡功耗從最初的肘瓦飆升到現在的200-300瓦耗電量極為驚人,第三個耗電的部件就是顯示器,盡管LCD要比過去的CRT節能得多,但是大尺寸的LCD耗電普遍也在幾十瓦級別,至于大屏幕平板電視,能耗普遍都在300瓦以上,顯然這些設備是家庭中的耗電大戶,第四個能耗高的對象就是存儲系統,PC、筆記本電腦的硬盤僅消耗區區幾瓦的電能,但服務器和企業存儲系統中往往包含數量巨大的SAS硬盤,整體的能耗也頗為可觀。
要降低計算系統的整體能耗,最直觀的做法就是降低芯片的功耗指標,半導體廠商除了積極通過導人新工藝來降低能耗外,優化芯片的設計提高能效比以及發展節能技術也都是非常有效的途徑。最終實現能源的按需分配。而從宏觀的角度來看,將任務指派給能源效率最高的硬件是聰明的做法,從而實現整個系統的能源利用最佳化,其中的典型例子就是將高并行計算任務交給GPU完成。如果從更長遠的角度來看,云計算的普及可以讓用戶使用低能耗的瘦終端,從而有效降低整個IT環境的能源總消耗。而服務器本身則可以采取彈性的任務分派和靈活的能源配比來實現節能的目標。
微處理器的節能:制造工藝、邏輯優化與創新設計
處理器是PC系統耗能的關鍵部件,在總的方向上,提升效能與降低功耗永遠都是一對矛盾,但是設計者仍有相當多的手段可以優化能源效率,使得性能的提升大于功耗的增長,這些措施橫貫半導體工藝到芯片的架構設計等訐多方向。
引入新工藝是降低芯片功耗最直接的辦法,無論從90納米到65納米,還是65納米到45納米,每一次制造工藝的提升,總是令芯片功耗大幅度降低——在同等情況下,芯片能耗往往可以有20%-30%的可觀降幅。新工藝使得芯片內的連接線寬更小,諸如High-K材料,SOI工藝等新技術的導入又大大削減了漏電流的產生,使得芯片的能耗值顯著降低。現在,半導體工業開始朝著32納米進軍,英特爾公司將在2009年底推出32納米處理器,標志著新一代工藝的成熟。臺積電等代工企業也朝著40納米進軍,而IBM甚至開始向22納米工藝邁進。
通過改革芯片的邏輯架構,實現能效的提升,這也是降低能耗的有效手段。這個領域的典型案例當屬英特爾從Pentium 4到Core架構的改變,前者以能效低著稱,芯片功耗巨大,同時效能不盡理想,而Core架構通過4路并行解碼,宏指令融合與微指令融合等技術,大幅度提升了芯片的每瓦性能,最終在獲得性能大幅度提升的同時,顯著降低了處理器的功耗水準。類似的例子還有當年AMD從K7到K8的轉換。K8架構將內存控制器集成,降低了內存延遲,借此處理器可獲得20%左右的性能提升,而芯片的功耗并沒有因此提升。
這樣的節能思路在未來顯然將會繼續進行,作為一種先進的設計思想,協處理單元的納入、構建超多核處理器已成為微處理器工業界的新趨勢。所謂超多核處理器,即在當前雙核,四核處理器的基礎上,集成大量的協處理單元,這些協處理單元可以負責Java程序解釋、物理計算、Flash硬件加速等,專用的協處理單元效率更高,在完成同樣任務時消耗的能源更少,而主CPU單元只需負責任務的指派,通過這種主從協作模式,可以在顯著提升效能的情況下同時實現能耗的降低。
能源的按需分配是處理器節能的另一個思路,事實上當前的移動處理器已經充分具有按需分配能源的風采了,以AMD Puma平臺為例,其雙核Turion 64 x2處理器的內存控制器、高速緩存與CPU內核的供電分離,系統可以根據任務的需要來靈活決定能源的供應與否;同樣,英特爾的移動處理器也引人類似技術——早在Pentium M時代,處理器的高速緩存就采用能源配比制度,即通常只有1/32的二級緩存處于供電狀態,由于高速緩存一貫都是處理器的能耗大戶,此項技術為Pentium M的能耗降低立下汗馬功能。按需分配的另一個角度就是,根據任務需要來調整處理器的電壓和頻率,大家耳熟能詳的英特爾SpeedStep技術,AMD PowerNow!便屬此列。按需分配的思想未來將更為普遍,尤其是伴隨著多核,超多核處理器流行,能源按需分配被認為是降低能耗的法寶。比如在處理簡單的商務辦公應用時,CPU只需開一個核心,并降低頻率運作,如果需要完成多任務,或多線程程序,那么其它核心才被自動開啟,這種按需運行的模式能夠實現能源配置的最佳化。
圖形系統的節能:按任務彈性分配
圖形系統與微處理器系統非常相似,GPU是圖形系統的核心,高性能GPU則是電力資源的殺手。而除了GPU之外,圖形系統中的高速顯存同樣也是能源殺手。既然如此,節能技術就必須同時從GPU與顯存系統著眼。
與處理器類似,導入新工藝是降低GPU和顯存能耗的法寶,不過GPU與顯存的邏輯結構都比較固定,能效改進的結構相當有限,所以無論NVIDIA還是AMD,都很難通過革新設計獲得能源效率的提升,雙方的性能競賽更像是場流處理器數量的堆砌,在這樣的背景下,GPU能耗高是必然的,即便引入新的工藝,激烈市場競爭又會使得雙方推出能耗高的新一代產品。
導入能源按需指派是非常理想的做法,事實上這也是圖形工業一直努力的方向所在。我們知道,GPU內部除了負責3D渲染和通用計算的流處理器單元外,還具有2D顯示高清視頻引擎等不同的邏輯單元,假如用戶只是在處理辦公文檔,那么顯卡其實只要求提供2D顯示和能滿足操作系統3D視覺的簡單3D性能,此時GPU中的大多數流處理器都可以關閉,只需留下個位數的流處理單元和2D顯示單元即可。當然顯存系統的大部分供電也可以被關閉,假如用戶在觀賞視頻,那么同樣地,不需要使用的硬件單元可以暫時關閉。從技術上講,這樣的設計完全是可以實現的,NVIDIA在GPU中采用的PowerMizer技術,AMD的PowerPlay技術,都可以在一定程度上做到這點。
混合多顯卡模式的出現,也能夠有效降低整機的能耗。NVIDIA的Hybrid SLI技術體系中曾經支持項名為Hybrid
Power的節能技術,即當用戶在從事一些非3D的常規任務時,獨立顯卡可以被關閉、系統只依靠芯片組集成的GPU來完成顯示——由于集成GPU能耗要大大低于獨立顯卡,此舉可以顯著降低整機的能耗。不過,NVIDIA現在已經在桌面顯卡中取消了這技術,對此NVIDIA解釋說其獨立顯卡目前已能支持高效的節能技術,在常規任務下顯卡的能耗可以同集成GPU相差無幾,Hybrid Power就失去了價值。這一聲明的背后源自NVIDIA的另一舉措在2008年8月份,NVIDIA以2500萬美金的代價獲得全美達LongRun、LongRun2節能技術的授權,前者可以根據任務對芯片的頻率/電壓實施近乎動態的調整,后者則可以將芯片內部的漏電流削減到原先的1/70,相信這兩項技術已逐漸融入NVIDIA的新一代產品中,使之能夠獲得理想的節能表現。假如NVIDIA能夠在移動GPU中也快速導入這些技術的話,那么有望改變長久以來移動GPU能耗一直高于AMD的情況。
宏觀角度的節能:將任務分配給能效最高的部件
如果將注意力放在處理器、GPU局部,固然可以實現能源效率的提高,但未必能夠做到能源利用的最佳化。我們知道,CPU適合處理帶分支預測的轉向程序,而GPU適合3D渲染和高并行,不帶分支的計算程序,假如讓CPU來渲染3D圖形,那么后果可想而知,在提供與GPU相同渲染性能的條件下,CPU所耗費的能源也許是GPU的100倍以上;這個例子告訴我們任何一項計算任務,應該交給最適合處理該任務的計算芯片,這樣才能夠實現能源利用的最佳化。
但在現實應用中,違背此種情況的例子隨處可見,比如氣象模擬DNA排序之類的科學計算都涉及到大量的復雜浮點運算,通常需要大型計算機方可勝任,而大型計算機中負責運算的則是微處理器。事實上,如果采用GPU來處理這些任務,那么效率會高出10倍以上,這意味著系統只要消耗少得多的能源,就能夠完成同樣的任務。在這個領域,NVIDIA目前同樣居于領先地位,它所推出的CUDA平臺在通用計算領域占據事實上的壟斷,借助CUDA,開發者可以編寫出GPU加速的計算程序,從而實現能源效率的大幅提升。
值得一提的是,通用計算同樣可以用于普通的PC用戶比如說現在的圖像處理、Flash播放都是依靠CPU進行的,在執行這類任務時,CPU占用率正常都在100%,假如能夠支持GPU加速,那么任務可以完成得又快又好,所耗費的能源也要低得多。
隨著GPu通用計算的不斷成熟,GPU會承擔越來越多的浮點計算任務,包括物理計算、光線追蹤、圖像處理,3D桌面,Flash播放,PDF閱覽等許多應用領域。
存儲系統的節能:使用綠色產品
硬盤本身已經是一個功耗很低的部件,繼續在硬盤身上挖掘剩余能源顯然是不現實的,因為目前硬盤工業最緊要的問題是提升性能而非降低功耗。不過事事無絕對,隨著應用的個性化,硬盤產品也出現包括發燒性能、節能這樣的產品細分。
西部數據的GreenPower綠盤是節能硬盤的典范,這類節能型硬盤通常只有5400rpm的速度,而且在沒有尋道,讀寫動作時可以處于休眠狀態,因此它的讀寫性能要比常規硬盤慢一些,好處就是功耗只有常規硬盤的60%左右,每個硬盤平均可節省4-5瓦電能——對PC而言,區區4~5瓦功耗算不了什么,但對擁有成百上千個硬盤的數據倉庫來說,所節約的能源就非常可觀。因此對大型企業,數據中心等單位來說,改用節能型硬盤是降低運營成本的有效舉措。
另一項節能措施就是根據情況,及早更換新款、大容量的硬盤。硬盤的能耗主要取決于電機系統,而與容量沒有多大關系,一個1TB的硬盤,消耗的能源甚至可以比一個100GB硬盤還要低,那么用一個1TB硬盤來代替10個100GB硬盤,間接起到的效果就是將能耗值降低整整90%。因此對數據中心來說,雖然更換硬盤需耗費一定的成本,但從綜合角度來看也許仍然劃算。
LED助力顯示系統的節能
LCD顯示產品的功耗主要來自于背光系統,比如22英寸產品一般用2根CCFL燈管,24英寸以上就要使用4根,至于大尺寸液晶電視一般都具有8根燈管以上,否則無法滿足符合要求的亮度輸出。改用LED背光技術為LCD產品打開了節能的窗LED是一種半導體發光器件,屬于片狀光源,早期LED器件發光效率只有30im/w(流明佤)左右,而CCFL發光效率基本都在601m/W(流明/瓦)級別,在提供同樣亮度時LED背光耗費的電能要比cCFL燈管高一倍。但在日亞(Nichia)為首的工業界的努力下,LED器件的光效逐年快速提高,目前商品化LED的光效普遍超過1501m/W,節能特性已全面優于CCFL。
片狀光源的性質讓LED光源在配置上有更高的靈活性,從而為進一步節能打下基礎——夏普在自己的液晶電視產品中引入了一種區域點亮(Local Dimming)技術,該技術采用直下型LED背照燈,1個畫面被分割成多個區域,根據每個圖像顯示區域的亮度對LED進行點亮。夏普表示,該技術可以將液晶電視的即時耗電量減至原來的1/3,年耗電量減少一半,節能效果非常顯著。
OLED顯示器被視作LCD的接替者,從原理上講,OLED構件更為簡單,它就相當于一個可以在像素級別進行控制的LED器件,無需像LCD那樣需經過液晶板的遮擋,輸出的亮度直接抵達人眼。這種簡單的結構賦予OLED出色的低能耗特性。只是受限于壽命問題,OLED產品預計在2012年前都很難進人實質性的商用化階段,盡管如此,業界對這項革命性技術仍然高度期待。
云計算降低IT環境的整體能耗
無論是IBM,SUN還是Google,都將云計算視作計算工業的未來形態,IBM側重于構建云計算的基礎環境,SUN則實質性地推出硬件產品,而Google卻推行著Gmail,Google Apps在內的多種云服務。假如云計算模式能夠成為主導,計算能力變為像水、電一樣的基礎資源,那么整個社會的IT環境耗電開支將會大大下降——盡管云計算需要大量強有力的服務器作為后端,但用戶的終端設備可以實現“瘦身”和“低能耗”化,比如像智能手機這種級別的硬件就能夠通過云計算平臺暢玩大型3D游戲,高性能,高耗電,結構臃腫的PC機不再必要,由此可以節約出大量的能源。
從能效比的角度來看,云計算模式優于傳統的Pc應用,因為在云計算體系中,PC的能源浪費實際上被徹底杜絕,而服務器本身可以根據負載的需要進行部署,這意味著每一份電力都可以物盡其用,不會在閑置中白白浪費。
服務器的節能:低能耗平臺、嚴密的監控與專用途設計
大型數據中心每個月動輒需要花費數百萬的電費開支,如果能夠降低服務器的能耗,就意味著企業能夠出現可觀
的“額外利潤”,正因為如此,企業用戶對服務器的要求不再僅僅只是性能,低能耗的產品更受歡迎。
對擁有許多服務器的數據中心來說,如何從整體上保證能源使用的最佳化就成為個難題。在這個領域,IBM公司推出的EnergyScaIe技術堪稱典范,該技術應用于IBM Power 6服務器系統中,它可以不停地收集服務器的功耗數據,并將這些數據顯示在IBM的“Systems Director Active Enemv Manager”功耗管理軟件中。通過這些數據,管理員可以預測一天一周或個月內數據中心的電能消耗情況,并對負載進行管理調控。假如所使用的服務器系統支持power capping功能的話,管理員還可以直接設定一個合適的最高功耗水平、強迫服務器的整體功耗不超過這一設定值。此外,IBM服務器還支持Power Saver Mode省電模式,該模式允許管理員將CPU電壓和頻率下調一個固定的百分比,借此達到節能的目的。Power Saver Mode在實際應用中可以發揮不俗的效用,它可以將服務器平均功耗降低20%-30%之多。另外IBMPower 6處理器使用了一種名為“Nap”的低功耗模式,可以在無任務狀態下停止處理器的執行,以此來降低功耗。假如操作系統處于空閑狀態,Nap可以將整體能耗降低30%-35%而當操作系統繁忙時,Nap也可以實現10%的功耗降低。最后,Power 6也支持類似speedStep的節能技術,它可以動態地調整處理器的頻率和電壓,從而有效降低運作功耗。
服務器節能的另一個方向就是采用專用途的芯片,該領域的成功案例就是SUN的UltraSPARC T2(代號Niagara 2)平臺,UltraSPARC T2擁有8個內核和64個線程,它的浮點運算功能非常弱小+而重點強調多線程的事務處理能力,因此雖然擁有8內核,但處理器的能耗也不到95瓦。UItraSPARC T2的每個線程都可以獨立運行一個操作系統,因此理論上一枚UltraSPARC T2處理器可以最多支持64個系統并行,在Web服務器,郵件服務器,文件服務器在內的事務處理任務中,UltraSPARC T2的每瓦性能達到英特爾Xeon平臺的2.5倍,它也因此成為事務處理能效最高的服務器處理器。
專用化思想也蔓延到大型計算系統的構建,譬如在以浮點計算為主的集群系統中,GPU cell之類的協處理器被大量部署,這種設計比傳統的單純依靠處理器的模式更為科學。假如任務足夠單一,那么硬件系統可以更為專業化在很多時候,CPU反而可以成為配角,而依靠高效率的協處理器進行運算。與通用設計相比,這種專用設計雖然任務彈性很低,但在完成單一任務時可提供相當優秀的能源效率。
前瞻
以按需分配思想取代現有的粗放式設計,以云計算代替傳統的強PC模式,以專用設計取代通用設計,這三個思路將成為未來IT工業節能設計的主要方向。我們可以確信,未來的IT技術將對人類產生更為重要的影響,現有的商務交流,娛樂、消費等活動將對IT環境越來越依賴,IT設備也將無處不在;而通過企業,開發者與用戶的共同努力,我們將能看到,IT設備的能源消耗處于一種良性的范圍內,在保持現有能耗的條件下,我們能夠體驗到更多精彩的應用——譬如電影級的超逼真3D渲染無處不在的虛擬現實,高保真的遠程3D交互,當然還有更貼心的電子商務。