





出門在外的PC用戶要求很長的電池續航時間,但又不想犧牲性能。兼顧這些相互矛盾的需求是英特爾新的處理器架構(代號為Haswell)的核心,這種架構有望出現在2013年交付的平板電腦、超極本及其他電腦中。
沈建苗編譯
在本周早些時候舉行的2012年英特爾開發者論壇(IDF)上,英特爾比較深入地介紹了開發Haswell的由來。
也許“tock”(新架構)是一個更合適的字眼,因為Haswell代表了英特爾處理器發展計劃中的“新架構”。英特爾用“tick-tock”(工藝年-架構年)來表示其處理器發展戰略?!皌ick”(新工藝)表示現有的處理器設計只經過了小幅調整,但又享有新制造工藝的所有效率。Ivy Bridge代表新工藝,它對Sandy Bridge進行了逐步改進,但改用22nm工藝。與此同時,像Haswell這些新架構總是建立在成熟的制造工藝上,而英特爾的22nm制造工藝久經考驗,這歸功于該公司的Ivy Bridge系列。所以,Haswell代表“新架構。”
不過,Haswell不僅僅是另一款英特爾PC處理器。英特爾眼下在談論各種基于Haswell的處理器:有的是功耗不到10瓦的雙核芯片,因而適合用于平板電腦;有的是四核臺式機處理器,性能勝過速度最快的Ivy Bridge處理器。英特爾到底是如何實現將電源效率提高20倍這個宏偉目標的?深入剖析處理器本身之前,Haswell的電源管理技術值得關注。
活動閑置狀態
現代處理器的電源管理需要在必要時,根據你要求設備處理的任何任務,關閉供給處理器中大部分元件的電源。英特爾使用直接內置在主處理器中的一種特殊處理單元——英特爾稱之為電源控制單元(Power Control Unit),就能幾乎在晶體管這個層面管理電源。電源控制單元監測處理器的哪些部分沒有被使用,然后根據需要開啟或關閉那部分元件。
不過,問題不是讓處理器的某些部分處于睡眠狀態。問題是以足夠快的速度喚醒處理器,以便隨時可用。畢竟,如果每次筆記本電腦進入睡眠狀態都要等上一分鐘,那么你在沮喪之下,可能會將筆記本電腦一扔了之。英特爾處理器(直到Ivy Bridge)有兩個主狀態:活動狀態和睡眠狀態。(實際情況比這要復雜,不過原理大抵如此。)這些年來,英特爾穩步縮短了喚醒睡眠中處理器所用的時間。最新的Ivy Bridge處理器只需要幾秒鐘時間,就能從深度睡眠狀態喚醒過來。不過,幾秒鐘離“即時開機”仍有一點距離。
Haswell的解決方案是添加第三種電源狀態,英特爾的設計師們稱之為“活動閑置”(Active Idle)。活動閑置狀態又稱SOix,這是一種功耗極低的活動狀態,耗電量比Ivy Bridge少20倍。PC系統本身認為它醒著,但處理器仍然基本上處于睡眠狀態。這一技術意味著喚醒時間最長也只有幾百毫秒。從用戶的角度來看,最長半秒的喚醒時間遠勝過喚醒目前的處理器所需要的好幾秒。Haswell在運行時,幾乎總是處在這個“即時恢復”狀態。這項技術主要直接借鑒了英特爾的凌動處理器電源管理。
英特爾在制造Haswell時還運用了另外幾項技巧。前面我們談到了閑置狀態和睡眠狀態。睡眠狀態和活動閑置狀態實際上被細成了多個較小的狀態。每個小狀態(名為“C狀態”)定義了具體關閉處理器的哪個部分。Haswell增加了新的C狀態,實現更精細的電源管理。這提供了更長的電池續航時間,因為你的處理器不會為了喚醒處理器中的確需要喚醒的某部分而不斷喚醒不需要喚醒的那部分。
英特爾還關注了處理器耗電量與系統顯示屏有怎樣的聯系。的確,在如今的系統中花很長時間來喚醒的一個部件就是液晶面板,于是Haswell處理器將含有面板自我刷新機制。因此,舉例來說,如果你就坐在那里、盯著屏幕,Haswell處理器就會進入睡眠狀態,只有一小部分元件保持清醒狀態,刷新顯示器??。只要你移動鼠標或按一下鍵,處理器就被喚醒。你注意不到喚醒時間,因為顯示屏從來沒有進入睡眠狀態。
現在大家對英特爾如何獲得更高的電源效率應該有所了解,我們不妨談談處理器架構方面的改進。
更高的性能和更好的電源效率
在IDF的其中一場技術會議上,英特爾高級首席工程師Ronak Singhal屢次重復:要是會帶來電源開銷,不會為處理器添加任何新特性。即便如此,處理器設計師們還是擁有許多技巧,在兼顧電源要求的同時,提高性能。
一個技巧是分支預測,這讓處理器可以提前看一下哪些指令可能會在近期執行。如果處理器知道哪些指令會從管道上下來,那么分配處理器資源的效率有望大大提高,只開啟處理器中需要的那些部分元件。所以,英特爾調整了架構元件,以改進分支預測,包括加大內部緩沖存儲器和擴大亂序窗口。
此外,處理器在一個周期內處理的工作越多,它在耗電量一樣的情況下性能越高。因此,英特爾增添了每個時鐘周期處理兩個浮點乘加運算的功能,因而在耗電量一樣的情況下,性能比Ivy Bridge提高了一倍。一級和二級緩存吞吐量也得到了提高,縮短了處理器等待數據到達所花的時間。
當然,這一切好處不是免費就能得到的。雖然電源效率有所提高,但缺點是加大了芯片尺寸??紤]到Haswell仍將采用22nm制造,芯片本身的尺寸很可能大于Ivy Bridge處理器。
同樣由于另一個原因:圖形功能,芯片尺寸可能會增加。
平板電腦上玩高端PC游戲:Haswell圖形功能
Haswell基于Sandy Bridge中現有的英特爾高清圖形核心,主要添加了一些改善,并提高了電源效率。Haswell現在為英特爾處理器提供三種不同的集成顯卡選項,名為GT1、GT2和GT3,而不是Ivy Bridge的兩種選項(英特爾HD 2500和HD 4000)。
從性能的角度來看,GT3最值得關注。GT3僅僅把執行單元的數量增加了一倍,因而性能比之前的HD 4000 GPU提高了一倍。執行單元是GPU的核心計算引擎,處理圖形著色器和GPU計算任務。這些執行單元做入到共同的模塊化單元,英特爾稱之為“共用切片”(slice common)。
這塊共用切片還包含許多其他的關鍵部件,用于處理實時圖形,比如光柵引擎和高速緩存。為了將計算引擎數量比HD 4000增加一倍,英特爾只是為GT3添加了第二塊共用切片。這占用額外的芯片空間,但實際上省了電,因為GPU不需要進入加速模式,就能進一步提升性能。
還對GPU進行了其他調整,包括改進紋理采樣器、提高總體帶寬以及增加更多電路,處理目前由HD 4000的驅動程序來處理的任務。
這些功能都有助于在不增加耗電量的情況下提高性能。英特爾估計,8瓦的Haswell單元有望集成整個GT3 GPU,不過沒有給出產品版本方面的具體內容。英特爾展示了兩種不同應用的運行情況:Unigine Heaven,這是合成圖形基準測試,以及Bethesda’s Skyrim,這是對圖形要求頗高的一款PC角色扮演游戲。Haswell在運行這兩項測試時性能均比Ivy Bridge提高一倍,提供了流暢得多的視覺體驗。
以前,英特爾在為最新的編程接口添加軟件支持方面動作很晚。Haswell改變了這種局面,它實施了所有的最新標準:面向Windows 7和Windows 8的DirectX 11.1、面向GPU計算的OpenCL 1.2以及OpenGL 4.0。英特爾在驅動程序支持方面一向做得很好,提供了Windows驅動程序和Linux驅動程序。
雖然Haswell的3D圖形引擎比之前英特爾在這方面的工作大有改進,但是臺式機用戶可能仍想要高端的獨立顯卡,以獲得最佳的PC游戲性能。但是Haswell的圖形核心有望使極薄的超極本成為還不錯的游戲平臺,而新的GPU為用戶在基于Haswell的平板電腦上玩現代PC游戲提供了可能。
視頻引擎
Ivy Bridge推出了QuickSync視頻模塊,這種是內置在GPU中的功能固定的專用視頻單元。制造功能固定的視頻引擎能夠大大提升視頻編碼和解碼的性能。但缺點是,它不是可編程的,所以如果出現了某種熱門的新HD編解碼器,視頻引擎就處理不了??紤]到視頻編解碼器相當標準化,這不太可能。
不過,英特爾的確為Haswell視頻引擎添加了額外的編解碼器支持。運動JPEG(MJPEG)對視頻會議而言很重要。SVC即可擴展視頻編解碼器在移動環境下很有用;在這種環境下,視連接速度而定,視頻質量可能有所變化,所以視頻質量可以從容擴展。即使網絡帶寬下降,用戶們仍會看到良好的幀速率,而不會出現幀抖動或幀丟失。另外還增添了對4K視頻的支持,支持即將上市的新一代超高清面板。
結論:更大的芯片、更好的性能、更低的功耗
Haswell會比Ivy Bridge更占用芯片空間;換句話說,這對英特爾來說每個處理器的成本更高,因為它無法在一塊圓晶片上制造一樣多的Haswell處理器。不過,Haswell的模塊性多少緩解了這個問題;模塊性讓英特爾得以制造許多不同的Haswell產品,以尺寸較小的版本針對耗電量較低的小眾市場。更棒的是,Haswell為英特爾的下一代14nm制造工藝作好了充分準備。
與Ivy Bridge相比,對主處理器所作的性能方面的調整大多數是漸進的。在一樣的時鐘頻率下,用戶可能會看到性能提升幅度達到10%。電源效率和圖形性能有了大幅提升。電源效率的改進將使筆記本電腦終于有望像超極本那樣電池續航時間長達一整天,而GPU改進意味著移動用戶外出時也能享受相當爽的游戲體驗。
Haswell有望成為歷史上對英特爾的收入影響最大的一款處理器。新處理器的模塊性和電源效率能帶來一大批產品,市面上可能會出現外觀尺寸迥異的Haswell產品。用戶將成為受益者,因為在移動電腦和臺式機方面有更多的選擇,而性能有所提升,電池續航時間有所延長。