斯特



自從發布面向中高端的Radeon R9 285顯卡之后,AMD在顯卡領域就進入了沉寂期。在這段沉寂期里,AMD一直在默默地研制自己的“秘密武器”—搭載“Fiji”核心的大殺器Radeon R9 Fury X。經過無數次的“曝光”與“泄漏”之后,AMD終于在2015年6月17日這一天正式發布了各位粉絲期待已久的新旗艦顯卡Radeon R9 Fury X,將這款搭載全新“Fiji”GPU的業內首款配備HBM顯存的頂級產品帶到了大家的面前。
高端之外還有更主流的游戲市場,AMD這次也同步推出了R300系列顯卡,包括Radeon R9 390X、R9 390、R9 380、R9 370及R7 360等多個型號,但是這次的升級有喜有憂——喜的是AMD這次升級的顯卡顯存容量進一步提升,R9 390系列顯存容量達到了8GB,最低的R9 370顯卡容量都有2GB,但是R300系列顯卡這次雖然使用了新的Grenada(格林納達島)、Antigua(安提瓜島)、Trinidad(特立尼達島)、Tobago(多巴哥)等新核心,但它們的架構與工藝與R200系列的顯卡基本沒什么變化。
與之前預期的不太一樣,AMD這次把新旗艦打造成了一個獨立品牌,一如NVIDIA的GTX Titan顯卡一樣,定位要比普通的Radeon R9顯卡要高一些。Fury這個名字早些年在ATI時代也用過,雖然不如NVIDIA選擇的Titan(泰坦)容易上口,目前也沒有正式的中文名,不過Fury跟之前ATI的Rage顯卡一樣都有“狂怒”之意。AMD這次確實有必要把Fury顯卡同其他R9系列顯卡區別開來,因為Fury不僅擁有AMD史上規模最大的GPU核心,還首次使用了HBM顯存,它不同于目前大量使用的GDDR5顯存,而HBM顯存不僅性能上領先GDDR5,而且是首次使用堆棧式設計,顯存不用再獨立于GPU核心了,GPU、顯存芯片首次集成在一塊集成電路內,
AMD Radeon R9 Fury X顯卡架構
AMD的Fury X顯卡使用的是新一代的Fiji核心,它還是GCN架構體系的,不過運算單元的規模繼續攀升,最初的Tahiti核心是32組CU單元,Hawaii提升到了44組,現在Fiji的CU單元數量一舉提升到了64組,總計4096個流處理器單元,256個紋理單元,64個ROP單元,核心面積達到了596mm2,晶體管數量則達到了89億個,比NVIDIA的GM200核心的80億個還要多。
自從進入DX10的統一架構以來,AMD的顯卡架構一直是SIMD體系的VLIW架構,從HD 2900系列一直沿用到HD 6800系列。隨著時間的推移,VLIW架構的弊端也日益明顯,而且GPU通用計算技術發展迅猛,為此AMD在2011年拿出了代號GCN(Graphic Core Next)的新一代GPU架構,開始向3D渲染以及GPU計算兩個方向同時發力。在公布GCN架構時,AMD喊出了“Graphic is Compute,Compute is Graphic”的新目標,表達了圖形就是計算,計算就是圖形的宏達理想,在保證GPU的圖形渲染能力的同時也在GPU通用計算上發力。從GCN的架構上來看,其多線程能力得以增強,每個CU單元可以執行4條線程,40條wave,而在緩存設計上,AMD也不再那么保守,每個CU單元都有自己的L1緩存、共享的L1指令緩存,所有CU也會共享768KB的L2緩存,后者還將聯通顯存以及CPU內存,做到數據實時同步與共享,因此GPU和CPU交換數據更容易。外部支持上,GCN也支持C/C++等高級編程語言,簡化開發者遷移平臺的難度,另外支持ECC糾錯也提高了數據運算的可靠性,這兩點改進對GPU計算來說都是關鍵性的提升。
相對于Hawaii/Grenada核心來說,Fiji前端單元沒有變化,同樣是8組ACE單元,4組幾何單元(曲面細分單元),4組渲染引擎(Shader Engine),但CU計算單元數量增加到了64組,每組渲染引擎單元包含了16組CU單元,之前的Hawaii是每組11個CU單元。另一個值得注意的變化是顯存控制器,Hawaii/Grenada是8組64bit GDDR5主控,總計512bit位寬,而Fiji核心增加了HBM顯存支持,所以有4組HBM顯存控制器。
總之,對Fiji核心來說,GPU核心方面的變化主要是增加HBM顯存支持,同時繼續擴展CU單元,64組CU單元已經是R9 290X的兩倍規模,不過核心面積只提高了36.7%,晶體管數量增加了43.5%。
Radeon R9 390&390X架構
Radeon R9 390X使用的是Grenada核心,也是44組CU單元,2816個流處理器核心,跟R9 290X顯卡是一樣的,不過最高核心頻率從1000MHz提升到了1050MHz,顯存頻率提升到了1500MHz顯存容量從4GB提升到了8GB。
Radeon R9 390擁有40組CU單元,2560個流處理器單元,跟R9 290顯卡規格是一樣的,不過其最高核心頻率也從之前的947MHz提升到了1000MHz,顯存頻率提升到了1500MHz,顯存容量也是8GB。
HBM顯存
AMD的Radeon R9 Fury X顯卡是近幾年來最讓小編期待的顯卡,因為它使用了不同于目前在用的GDDR5顯存的HBM技術。此前參加AMD的發布會時,AMD公司負責開發HBM技術的院士Bryan Black表示他們研發HBM技術已經有13年了(加入AMD之前就在研發3D堆棧技術了,2007年進入AMD公司),多年的研究終于在Fury X顯卡上開花結果,怎能不讓人興奮。
目前顯卡使用的GDDR5顯存是8年前問世的,它取代了過渡性質的GDDR4內存,它的技術基礎跟DDR3相似,不過GDDR5是雙并行總線的,是四倍速率的,而DDR3是雙倍速率的,所以數據頻率上GDDR5達到了DDR3的兩倍,目前顯卡上使用的GDDDR5顯存數據頻率已經達到了7Gbps(實際頻率1750MHz),SK Hynix去年底推出了8Gbps速率的GDDR5顯存,但并沒有顯卡使用呢。
隨著游戲技術的發展,高紋理高畫質對顯卡的帶寬要求更高,所需的顯存帶寬也更高,而提升帶寬要么提升頻率要么提升位寬,目前的GDDR5顯存再繼續提升頻率已經很困難,32bit的位寬又是固定的,所以廠商們需要另尋它法了。
HBM就是換一種思路的產物,它的真實頻率比GDDR5顯存低得多,但1024bit位寬則比GDDR5高得多,再加上DDR內存的倍速機制(數據頻率1Gbps),單個顯存芯片的帶寬可以從之前28GB/s(7Gbps*32/8)提升到128GB/s(1Gbps*1024/8),AMD的Fury X顯卡使用的是4組HBM芯片,總帶寬高達512GB/s,而目前R9 290X顯卡的帶寬只不過320GB/s,HBM顯存芯片的帶寬提升了60%以上。
GDDR5不能繼續大幅提升頻率的原因之一就是高頻率帶來的功耗將會抵消其優勢,目前GDDR5顯存的頻率已經是1.5V,而HBM只需要1.2V電壓,電子電路的動態功耗跟運行電壓的平方成正比,所以電壓降低到1.2V就可以大幅降低功耗了。根據AMD公布的數據,HBM內存每瓦帶寬可達35GB/s以上,而GDDR5每瓦帶寬只有10.66GB/s,能耗效率方面HBM完勝GDDR5顯存。
性能及功耗優勢之外,HBM還可以節省大量PCB空間,因為目前的顯卡大都需要使用4、8甚至16顆GDDR5芯片,1GB GDDR5就要占用672mm2的面積,1GB HBM顯存只要35mm2,同容量下芯片表面積只有GDDR5的1/19。
以R9 290X與Fury X顯卡為例,R9 290X占用的GPU和顯存面積超過9900mm2(90x110mm),而基于HBM技術的GPU+顯存占用的面積不到4900mm2,PCB面積可以減少50%以上。也正因為如此,我們才得以見到PCB只有7.5寸的Fury X顯卡,未來還會有更小的R9 Nano顯卡。
前面列舉了HBM技術的各種優點,說起來是很輕松的,但這么多年來很少有公司能實現,這是因為HBM顯存還需要復雜的制造工藝,AMD為此做了大量研究,最終HBM顯存自身使用了TSV穿透硅通孔工藝,而HBM與GPU之間的互聯則使用中介層技術,所以AMD的HBM方案實際上是2.5D堆棧,還不是傳統意義上的3D堆棧。
中介層技術說起來也很簡單,但實際情況不是在HBM與GPU之間加個中介層那么簡單,此前在北京發布會上聽過Bryan Black的解釋,實際操作起來要復雜多了,既要保證中間層有銅柱保持通電性,還要移除多余的WSS保護層,期間要經過UMC、Amkor(安可)、日月光等封測公司層層制造才能完成的。
看起來,HBM是一個近乎無敵的新技術了:功耗低、體積小、性能強,事實是這樣嗎?并非如此。目前通過已有的技術資料來看,HBM仍有一個隱患存在。量為2Gb(256MB),因此每顆容量為1GB。整體四顆,總的顯存容量就是4GB。當然了,8GB HBM也可以有,但那只能在Fiji VR雙芯顯卡上實現,每個核心還是4GB。如前所述,這只是第一代HBM的情況,明年的第二代就會翻一番。AMD計算域圖形事業群CTO Joe Macri確認了這一點。
也就是說,我們能看到的第一代使用HBM顯卡的產品最多只有4GB容量,并且這個局限性是第三方廠商也無法改變的,沒錯,就算華碩、藍寶石也不行,這遠遠超過了他們的能力范圍。可想而知,在交火或者高分辨率下,4GB顯存必然是一個隱患。當然,最終產品還未出爐,我們期待AMD可以盡可能的優化好這寶貴的4GB HBM顯存,能夠物盡其用。
當然,瑕不掩瑜,不可否認HBM是這幾年來我們在PC硬件領域看到的最大膽、最具想象力的創新技術,正如過去一樣,AMD一直走在技術最前沿的,用它難以捉摸的想象力實現各種引領業界前進。并且AMD一直堅持自由開放的理念,相信這個技術在未來將會推廣到各個領域。至于市場方面的業績,似乎AMD并不是把它放在第一位。無論如何,我們期待采用HBM的新產品出現。
FreeSync技術解析
游戲玩家需要一個穩定的環境,最怕見的情況就是卡頓,包括軟件、硬件等各種因素引起的延遲和畫面波動對游戲體驗有著致命的影響。造成不良游戲體驗的其中一個現象就是畫面撕裂和卡頓。在高速游戲環境中,幾十毫秒的頓挫都會帶來惡劣的影響。關鍵時刻的技能施放、位置移動,一旦錯過最佳時機后果不干設想。而畫面撕裂給玩家帶來極為惡劣的影響,最可怕的是,它并不是你的顯卡或顯示器不夠好造成的。而僅僅是因為他們倆的工作步調不一致。或者說,如果沒有好的方法來解決,你就算買再貴的硬件都沒法解決。
造成這一問題的原因就是顯示器與顯卡工作步調的不一致,比如,當你的顯示器刷新率是60Hz,而當顯卡每秒輸出幀數高于60時,由于輸出幀率高于顯示器頻率,在原本應該顯示一幀圖像的單位時間內,卻出現多余1幀的畫面,畫面就會出現撕裂。為了解決這個問題,過去的做法是使用傳統的 V-Sync技術,既限制顯卡工作的速率。但是,我們在3D游戲中的環境是時刻變化的,比如在一場游戲中平均幀率是60,有可能在游戲初期幀率達到了80,但是激烈交戰時幀數只有30,那么如果設置了垂直同步V-Sync,當顯卡輸出幀率在低于60的時候,顯示器依然處于等待完整一幀畫面的機制,就要等待兩倍的時間,那么這時畫面就會出現卡頓。
簡單的總結就是,當顯卡性能高于顯示器工作頻率時,游戲畫面會撕裂,低于的話會卡頓延遲。只有顯卡工作不掉與顯示器接近一致時,才能獲得最完美的游戲效果。這個矛盾在以前沒有太好的辦法解決。
為此,AMD推出了FreeSync技術,這項技術可以通知顯示器何時應該顯示出完整的一幀畫面,相當于讓顯示器的工作頻率隨著顯卡輸出的步調來進行,從而大大減少了卡頓和撕裂現象,給玩家盡可能流暢、穩定的游戲環境。
傳統垂直同步技術的運作方式:當某一幀輸出需要時間超過單位時間時,就需要等待兩倍的時間。比如,游戲整體上平均一幀如果需要20ms,但是如果某一幀需要22ms,那么這一幀并不會在22ms后立即顯示出來,而是需要40ms。而對于一般玩家來說,超過30ms的時間就已經可以明顯感受到了。而AMD的FreeSync技術,可以讓這原本渲染時間超過平均單位時間的一幀,以它真實完成渲染的時間刷新出來,讓顯示器跟隨顯卡的步調,從而完美解決撕裂的問題同時盡可能避免了卡頓。
AMD的FreeSync技術是一個開放標準,并且已經加入到DisplayPort的配置中,名為Adaptive Sync,AMD為其提供了開啟選項和一個名稱。使FreeSync成為一項更為更容易推廣、普及的技術。正如其名,Free不僅意味著自由改變顯示器工作頻率,還象征著免費。與此同時,你還需要一臺支持AMD FreeSync功能的顯示器設備,這一模塊成本極為低廉,支持這項技術的顯示器售價并不會比沒有的更高,等于完全是免費的福利。三星、LG、明基、優派、宏碁等廠商都已經推出了支持FreeSync的顯示器,支持設備的陣容仍在不斷擴張中。
AMD R9 Fury X顯卡外觀
此前已經在各方爆料中得知了Fury X顯卡的外觀,不過真正拿到手中時還是有些驚喜,這幾代的旗艦顯卡都是10-11英寸PCB的大卡,Fury X明顯短小了很多,而且AMD這次改用了全新的外觀設計,加入了很多迎合游戲玩家的設計,比如LED指示燈、logo燈等等。
Fury X顯卡自身長度為19.8厘米(7.5寸PCB),水管部分全長40厘米,用的是塑膠軟管,外面包裹了編織網,是酷冷至尊OEM的,而之前的R9 295X2顯卡的水冷是Asetek代工的。AMD的Fury X顯卡也是吸取了很多游戲玩家建議的,LED燈就是備受游戲玩家歡迎的設計,AMD現在也加入這個功能了。此外,信仰燈上面的小孔是雙BIOS切換鍵,這跟R9 290X上是一樣的,不過切換之后的兩個BIOS編號、頻率參數都是一樣的,風扇轉速最高都是66%,這跟R9 290X的兩個核心BIOS有所不同。
//圖:1、2、3、4
值得注意的是,Fury X的電源接口處還有8+1顆LED指示燈,處于ZeroCore待機時會亮綠燈,其他情況根據負載高低會呈現藍色或者紅色(旁邊有跳線可以切換顯示顏色)。Fury X在視頻接口還是很激進的,只提供了三個DisplayPort及1個HDMI接口,直接把DVI接口省掉了,畢竟這個顯卡主要為4K而生,DVI接口上不到這么高的分辨率。不過HDMI接口上,AMD還沒有支持HDMI 2.0,依然是HDMI 1.4標準。此外,Fury X顯卡通過DP 1.2 MST Hub最多可以支持6屏輸出。
AMD的Fury X顯卡使用了HBM顯存,除了性能之外其最大優勢就是高集成度,所以Fury X相比以往的旗艦卡有了完全不同的PCB設計,長度從之前的10.5寸降低到了7.5寸,真的是短小精悍,而且這跟當初NVIDIA在公版GTX 670上使用短PCB的感覺不同,后者因為功耗更低,電路不需要多復雜,所以PCB看上去有很空的感覺,而Fury X完全不同,AMD高端公版顯卡的做工一直都很贊的。
性能對比
AMD的R9 390X顯卡定位在3000元左右,這個價格卡在GTX 980與GTX 970之間,更接近GTX 980顯卡一些。HIS R9 390X IceQX2是非公版,頻率更高,雖然整體性能略低于GTX 980,不過差距比R9 290X與GTX 980已經縮小了,1080p下落后GTX 980顯卡大約10%,從之前測過的數據來看,其實GTX 980的性能要比R9 290X顯卡要高15-20%%,現在高頻版的HIS R9 390X 8GB版已經把差距縮小到了10%左右,10%的差距對游戲體驗來說并沒有明顯區別。
1080p下,Fury X與GTX 980顯卡互有勝負,在3DMark、古墓麗影、巫師3等項目中占優,不過總體上性能領先大約是5%左右。與NVIDIA最新的Maxwell架構相比,AMD這兩代的顯卡最為人詬病的地方就是功耗偏高了,那么Fury X顯卡的功耗又將如何呢?
待機時整機功耗67W跟R9 290X差不多,比GTX 980/980 Ti略高,不過Heaven 4.0中Fury X的整機功耗只有293W左右,比R9 290X的329W整機功耗低了很多,甚至比GTX 980 Ti的308W也要低。Furmark拷機時,Fury X顯卡整機功耗達到了427W,比R9 290X及GTX 980 Ti都要高得多。
在AMD發布的全新R300系列顯卡中,包括R9 390X在內的多數顯卡依然是新瓶裝舊酒,主打性價比,真正讓AMD揚刀立威的只有Fury系列,它才是新核心的,而且用上了黑科技HBM顯存。對于近兩年沒有新旗艦的AMD來說,用研發多年的HBM技術武裝Fury X顯卡,AMD這次是壓了相當大的籌碼的。
如何評價AMD新旗艦Fury X顯卡性能?超越GTX 980及自家的R9 290X已經沒什么懸念,對陣NVIDIA的GM200核心顯卡,Fury X在1080p分辨率依然要落后10-15%,但4K分辨率下幾乎追平了GTX 980 Ti,而整個Fury X顯卡都有這樣的表現——分辨率越高,性能優勢越明顯。看到這里,我們可以感慨下,如果Fury X配備的是8GB顯存,也許結果還有更多不一樣。
此外,R9 Fury X因為使用了水冷散熱器,所以在溫度及靜音方面的表現非常強,最高61°C及1300RPM的轉速保證了顯卡涼又靜,付出的代價只是安裝比普通風冷顯卡略麻煩一點。
至于功耗,R9 Fury X顯卡雖然拷機功耗依然高于R9 290X及GTX 980 Ti,但后兩者在Furmark中都大幅降頻了,而Hevean 4.0這樣的游戲負載中其整機功耗實際上比R9 290X和GTX 980 Ti要低一些的。
總之,R9 Fury X顯卡的問世結束了AMD在旗艦級顯卡上無力與NVIDIA顯卡競爭的狀態,雖然Fury X總體性能還是略輸GTX 980 Ti一籌,但這次的差距已不是質差,相信AMD在驅動優化方面還有很多工作可以做的。
我們更不應該忽視的其實是AMD這次使用HBM顯存在設計上帶來的革命性變化——HBM除了高帶寬,另一個優勢就是高集成度,2.5D堆棧時封裝節省了大量PCB面積,GPU+顯存占用的空間從之前的90x110mm急劇減少到了55x55mm,面積只有原來的1/3,所以Fury X只需要使用7.5寸的PCB即可。
這還只是開始,目前AMD上市的只是Fury X這一款顯卡,之后還會有Fury顯卡以及更小的R9 Nano,再往上則有雙芯的Fury X2,可以說雖然R300系列沒什么給力新品,但Fury X家族可以衍生出多款產品,幫助AMD完善高端顯卡的市場布局。□