王丁 王旭



制作本期專題的內容時,我們和英特爾公司簽署的保密協議還沒有到期;當然,雜志印刷出來捧在讀者手中時,英特爾公司已經正式發布了Haswell——第四代酷睿智能處理器。全新的架構能帶來多大的性能提升,新平臺又有哪些技術進步,是否值得馬上升級你的PC?那就跟隨我們一起來領略第四代酷睿平臺的魅力吧。
Tick-Tock這個名稱源于鐘表上秒針行走時所發出的嘀嗒聲,英特爾公司在2007年正式提出了以此命名的發展戰略模式,為其芯片設計制造業務規劃出一個可持續的發展框架——將處理器微架構的更新和芯片制造工藝升級的時機錯開,Tick代表著制造工藝的進步,例如從32納米的Sandy Bridge到22納米的Ivy Bridge,架構沒有發生變化,性能提升不大,只是縮小了芯片面積、降低功耗和發熱量;而Tock則意味著微架構的變化,例如同樣32納米的Sandy Bridge就采用了與Westmere不同的架構,還有這次專題的主角——Haswell,它和同樣基于22納米制造工藝的Ivy Bridge也是兩種不同的架構。也就是說,英特爾公司以兩年為一個周期,在Tick年提升制造工藝,在Tock年改變處理器的微架構,從而讓自己的芯片設計制造業務有規劃、有效率地發展下去。
一般來說,普通家庭中一臺PC的使用壽命大約是四到五年,當然也有兩種例外,一種是堅持使用十年前的Windows XP系統、平時只上上網看看新聞,不玩PC游戲不看高清,甚至有可能還沒跨入酷睿的時代;另一種則是走另一個極端的發燒友用戶,電腦的配置始終要和最新一代的技術規格保持同步,按照英特爾的Tick-Tock戰略,他們幾乎一年就要升級一次PC。對于游戲發燒友來說,不需要別人去說服他升級或更換PC,只要他覺得自己的電腦在運行熱門游戲時已經顯得力不從心,就會主動萌生這個想法。而對于那些在PC的投資上特別保守的人來說,你很難用技術規格的進步、性能提升的比例來打動他;當然,這里還包括受購買能力的限制和對PC依賴程度很低(靠筆記本或平板電腦來實現娛樂功能)這兩種可能。所以,我們這篇文章的目標讀者是那些關注核心技術進步、日常生活中對PC有依賴性(縱然不熱衷于高負載的3D游戲,起碼也是以PC為常用的多媒體娛樂工具)的人群。如果你的電腦還停留在Sandy Bridge以前的規格,確實應該考慮考慮更新一下配置了。
介紹Haswell處理器之前,我們不妨先來回顧一下Tick-Tock戰略發布以來的英特爾處理器發展歷程。
2006年6月
Core架構的問世堪稱是英特爾X86處理器發展道路上的一個里程碑,在此之前NetBurst架構的發展已經明顯遭遇了瓶頸——盡管制造工藝從90納米進化到65納米,但是Pentium D處理器功耗過高的問題卻沒得到明顯的改善,4GHz基本已經成為NetBurst架構的頻率極限,10GHz的Nehalem計劃只能胎死腹中(老外也喜歡放衛星啊)。Core架構的誕生,徹底解決了英特爾處理器散熱量過高的問題,也標志著主頻至上的策略從此被“每瓦性能”的策略所取代。第一代Core架構的桌面級處理器核心代號為Conroe,這兩個單詞的發音對于不懂英語的人來說比較容易混淆,因此在電腦賣場里經常能聽到商家稱其為“扣肉”。而處理器的正式命名Core 2 Duo也讓人感到莫名其妙——明明是第一代Core架構的處理器,為什么卻叫Core 2 Duo?實際上,Core Duo處理器也確實存在,只不過沒有應用在臺式機上,而移動平臺又是主打迅馳的整體概念,因此不太受人關注。
2007年11月
英特爾將Core架構的制造工藝水平提高到45納米,以Penryn作為開發代號(實際上就取自這一代移動處理器的核心代號),桌面級雙核處理器的核心代號為Wolfdale、四核處理器的核心代號為Yorkfield。相對于前一代產品來說,只是增加了二級緩存的容量,性能有小幅提升,TDP(熱功耗)還維持在65W和95W不變。
2008年11月
英特爾推出了基于45納米工藝的新架構——Nehalem,是不是覺得這個代號有點熟?沒錯,就是之前提到過的那個胎死腹中的10GHz處理器,英特爾難以割舍這個名字,又把它用于新架構的命名了。從這一代產品開始,英特兒放棄了Core 2 Duo的命名方式,改為Core i7/5/3的商標,也就是第一代酷睿智能處理器。Nehalem處理器在接口規格方面比較混亂,既有LGA 1366的規格——對應Bloomfield核心的Core i7 9xx(姑且把它看作是Core 2 Extreme至尊版的延續也未嘗不可),也有LGA 1156的規格——對應Lynnfield核心的Core i7 8xx以及Core i5處理器。Nehalem架構的誕生也帶來了翻天覆地的變化,比如用QPI(Quick Path Interconnect)取代了使用多年的前端總線(FSB),將內存控制器集成到CPU中,支持三通道DDR3規格的內存,北橋芯片的傳統功能基本上已經被架空了。由于Bloomfield Core i7處理器 + X58芯片組主板 + 三通道DDR3內存的整體成本太高,不利于新平臺的推廣,于是英特爾公司才推出了“縮水版”的Lynnfield——集成雙通道DDR3內存控制器,搭配價格相對低廉的P55芯片組平臺,取代Core 2 Quad四核處理器的位置。
2010年1月
Nehalem架構邁入了32納米的制造工藝,英特爾稱其為Westmere。按照Tick-Tock戰略的規劃,這次Tick變化本應發生在2009這一奇數年,英特爾公司這次的動作略有些遲緩,在2010年1月才正式發布,從自然年來看好像是滯后了一年,實際上距離上一次Tock變化也就是13個月多一點。這一代產品的技術進步并不僅限于制造工藝方面,將顯示單元從北橋芯片中挪到處理器封裝內,也是一項創舉;只不過運算單元和圖形單元的工藝并不同步——前者已經跨入32納米時代,后者還停留在45納米階段,它們只是被一起封裝在處理器的散熱外殼下,彼此相對獨立。英特爾平臺的集成顯示方案從主板上的Graphics Media Accelerator變成了處理器內部的HD Graphics。
2011年1月
第二代酷睿智能處理器——Sandy Bridge問世,雖然這屬于一次架構的變化,但是其中也包含了圖形芯片的工藝改進,達到了與CPU運算單元同步的32納米工藝,同時還獲得了一個“核芯顯卡”的新稱謂。此外,Sandy Bridge架構中還引入了全新的AVX(Advanced Vector Extensions)指令集,英特爾公司宣稱在AVX指令集的幫助下,矩陣運算的速度遠遠高于SSE指令集,并且其SIMD(Single Instruction, Multiple Data)演算單元的位寬也從128bit提升為256bit,這對于縮減核心面積帶來了很大的幫助。在處理器的命名方式上,Sandy Bridge依然沿用Core i7/i5/i3的商標,只是將數字編號由三位數調整為2開頭的四位數,以表明其第二代酷睿智能處理器的身份。架構的變化,自然就意味著芯片組平臺的變遷,雖然只是從LGA 1156到LGA 1155這么“一pin之差”,但是Sandy Bridge處理器已經無法再兼容5系列芯片組平臺,英特爾推出了Z68、Q67、P67、H67、H61等一系列平臺與之匹配。
2012年4月
核心代號為Ivy Bridge的英特爾X86處理器邁入了22納米制造工藝的階段,也宣布了第三代酷睿智能處理器的問世。伴隨著制造工藝水平的提升,Ivy Bridge核心還引入了創新的3D晶體管技術,從二維到三維的演變無疑會顯著增加單位面積下的數據流通行效率,就好比修建了高架橋和隧道的道路,要比單一的地面道路通行效率更高。雖然第三代酷睿和第二代酷睿之間并沒有發生架構的變化,也可以兼容6系列的芯片組平臺;不過英特爾還是推出了涵蓋原生USB 3.0、SATA 6Gbps、PCI-E 3.0等先進規格的7系列芯片組,下文介紹8系列芯片組平臺時我們就以Z77和Z87作為比較對象。有一點需要單獨說明,在這個階段代表著英特爾桌面級處理器最高性能的產品并不是Ivy Bridge核心的Core i7-3770K,而是基于32納米工藝的Sandy Bridge-E處理器(相當于至尊版或者Bloomfield的延續),它采用LGA 2011的封裝方式,只能搭配Intel X79芯片組平臺來使用;而22納米的至尊版產品(Ivy Bridge-E)則是在Haswell的產品周期內才會上市。
2013年6月
英特爾發布Haswell架構的第四代酷睿智能處理器平臺,前面鋪墊了這么多,終于說到正題了,那就讓我們一起來看看它的新特性吧。
處理器部分
既然定義為第四代酷睿智能處理器,那在命名方式上也毫無懸念,一定是符合Core i7-4770、Core i5-4670/4570的規則。至于字母后綴的含義,K、M、S、T、U都是我們熟悉的規格,移動平臺中增加了H和Y兩種規格,其中H后綴可以看作是M后綴的顯示性能增強版(關于顯示核心的類別以及銳炬顯卡的細節,在下文會有詳細描述),而Y后綴則是比U后綴功耗更低的版本,專為可變形超極本而打造;在桌面平臺中增加了一個R后綴,實際上也只有Core i7-4770R這么一款產品,也是唯一一款集成了銳炬顯卡的桌面級處理器,據稱是特供蘋果iMac一體機的,不會在零售市場上銷售。
關于處理器的運算性能部分,并沒有太多可以訴之于筆墨的文字。簡單一句話,22納米工藝下更成熟的架構以及新指令(AVX2)的擴展,讓Haswell具備明顯優于Ivy Bridge的性能。所謂更成熟的架構,就是指環形總線的設計,它可以更容易地實現各個單元之間的連接;而升級到256位的AVX2指令集則是讓CPU的浮點運算性能提升了一倍。除了基本性能提升之外,第四代酷睿處理器在超頻方面也有得天獨厚的優勢,在以往的主板電路中,必須設計不同的VR(電壓調節器)來分別控制CPU、GPU、I/O等不同部件的電壓,用戶通過微調這些參數來獲得更好的穩定性或超頻性能。但是在Haswell架構中,這些調節器全部整合到了CPU之中,主板只需要設計一個VR,其他的微調交給CPU完成,大大降低了主板的供電設計難度,同時也大大簡化了超頻的操作。
與其細摳那些枯燥晦澀的專業詞匯,去探詢Haswell性能提升的理論依據,倒不如用事實說話,從下面三組數據的對比中就可以看出,無論是高端的Core i7-4770K、還是主流的Core i5-4670,運算性能都要比與之對應的Ivy Bridge處理器提高了10% 左右。
盡管Haswell的架構變化,給處理器的運算性能帶來了明顯的提升,不過這還不是最令人激動的環節,核芯顯卡的變化才是第四代酷睿智能處理器中的最大亮點。英特爾第一款集成圖形單元的處理器是32納米的Clarkdale Core i3,其中運算單元基于32納米的制造工藝,而圖形單元還停留在45納米工藝的階段,在一些第三方的硬件檢測工具中,它就被識別成HD Graphics 1000;從Sandy Bridge開始,英特爾正式提出了核芯顯卡的概念,包括代號為GT1和GT2的兩種規格,對應的正式名稱分別為HD Graphics 2000和HD Graphics 3000,前者包含6個執行單元,后者為12個執行單元;到了Ivy Bridge這一代,仍然是分為GT1和GT2兩種規格,只不過命名變成了HD Graphics 2500和HD Graphics 4000,前者的執行單元數量沒有變化還是6個,后者的執行單元數量提升到16個。具體到處理器型號與圖形核心的搭配上,規律性不是很強,尤其是桌面級處理器的規格更是略顯混亂——在第二代酷睿處理器家族中,只有以K結尾的不鎖頻型號以及以5結尾的型號會采用GT2核芯顯卡(即HD Graphics 3000),而其他產品則提供GT1核芯顯卡(HD Graphics 2000)。但是在第三代臺式機酷睿處理器家族中,這一政策并未完全延續下來。因為從目前英特爾已經公布的規格來看,所有酷睿i7產品,無論其是以K結尾的不鎖頻版本,還是以T或S結尾的低功耗版本,搭載的都是GT2核芯顯卡(即HD Graphics 4000);只有酷睿i5處理器保持了與二代酷睿相同的組合——不鎖頻版本搭載HD Graphics 4000,其它搭載HD Graphics 2500。在筆記本平臺上,與第二代一樣,所有第三代酷睿處理器搭配的都是GT2核芯顯卡(即HD Graphics 4000)。
上面這段話看起來夠繞的吧?到了Haswell這一代產品,圖形單元的分類就更加復雜且無規律可循了。Haswell的圖形單元包含GT1、GT2和GT3三種核心代號,其中GT3又分為15瓦、28瓦和GT3e這三個版本,GT3(15瓦)對應的正規命名為Intel HD Graphics 5000,而GT3(28瓦)和GT3e對應的正規命名為Intel Iris 5100和Intel Iris Pro 5200。Iris是英特爾公司為其圖形芯片注冊的一個新商標,其中文名叫銳炬(Iris Pro翻譯為銳炬Pro——居然還是中英文混搭)。從英特爾官方給出的對比數據來看,以3DMark11的Performance模式為測試腳本,銳炬5100顯卡(Core i7-4558U)相對于核芯顯卡4000(Core i7-3687U)的性能提升基本是翻了一番,已經超過了目前入門級獨立顯卡的水平,也就是說下一代超極本中部分產品的3D性能應該能達到GeForce GT 640的水平。對于臺式機用戶來說,目前已知的桌面級處理器絕大多數都采用GT2的核心,只有一款特供蘋果iMac的型號—Core i7-4770R集成了銳炬Pro的顯示核心,恐怕大部分消費者是無從體驗的(不過話又說回來了,有多少肯花兩千元買顆CPU的人,不搭配個中高端的獨立顯卡,只用它的核芯顯卡呢,所以說英特爾為Core i7/i5級別的桌面級處理器搭配GT2顯示核心也算是明智的;至于未來的Haswell架構Core i3處理器搭配哪種核顯,現在還不得而知)。至于GT1核心,我們只知道它的正規名稱叫Intel HD Graphics(沒有任何數字序號),其它細節目前還不得而知,據推測應該是應用于下一代的奔騰和賽揚處理器中。在移動平臺中,據說會增加一種H后綴的四核處理器,熱設計功耗為47瓦,就是采用了GT3e顯示核心、也就是核芯顯卡里的最高規格—銳炬Pro,至于這類處理器會被應用到什么樣的筆記本中,現在還難以判斷。從技術規格來說, Haswell核芯顯卡也有很多進步,例如支持DirectX 11.1、OpenGL 4.0、OpenCL 1.2的接口規范,支持4K×2K的分辨率,另外在三屏輸出的操作上也更加簡單——選擇任意三個視頻輸出接口即可實現,比起Ivy Bridge核芯顯卡必須要依靠兩個DisplayPort接口才能實現三屏輸出的解決方案,顯然是靠譜多了。
在第四代酷睿智能處理器問世之前,一體式電腦和超極本就已經成為桌面市場和移動計算領域中的生力軍。新的Haswell架構不僅在計算性能上相對新一代產品繼續攀升,而且還提供了前一代的圖形引擎,3D性能呈指數型提升,堪稱是核心計算領域內近十年來最偉大的創新。在它的推動下,超極本、一體機、以及NUC這類的迷你型產品都將迎來更大的發展空間,在運算性能大幅提升的同時,也會呈現出更豐富多樣的應用模式。
芯片組部分
既然第四代酷睿智能處理器已經發生了架構的變化,顯然也就意味著不再兼容上一代的芯片組平臺,因此與LGA 1150封裝的Haswell處理器相匹配的英特爾8系列芯片組也就一同誕生了。我們最早看到的產品是面向高端消費市場的Z87芯片組,它也是完全開放超頻功能的唯一平臺,如果要體驗不鎖倍頻(K后綴的處理器)的Core i7-4770K,必然要搭配Intel Z87芯片組平臺。我們在第一時間拿到了一款技嘉的Z87主板——GA-Z87X-UD3H,根據它的命名規則,我們可以看出這是一款采用二倍銅PCB和全固態電容的主流平臺,下面我們就結合著這款產品來介紹8系列芯片組的技術規格。
8系列芯片組最大的變化就是增加了原生高速接口的數量,此前Z77主板能夠提供4個原生USB 3.0接口、2個原生SATA 6Gbps接口以及1條PCI-E 3.0插槽的支持;而到了8系列芯片組,原生USB 3.0接口的數量會從4個變為6個、原生SATA 6Gbps接口數量會從2個變為6個,從而能夠更好地適應高速外置存儲設備的連接。
另外7系列主板中的Rapid Storage技術在8系列芯片組中也得到升級,除了大幅優化SSD硬盤的支持外,新的快速儲存技術還能提供三項重大的新技術:利用內存作緩存加速的“快速同步”,通過動態調整供電狀態為磁盤加速的動態磁盤加速器;基于UEFI技術的極速啟動支持。