為突破顯示存儲器的技術瓶頸,采用創新堆疊方案的高帶寬存儲器應運而生,它不僅擁有更寬的數據傳輸通道、比普通的圖形存儲器擁有更高的效率,而且更節能。
絕大部分電腦組件的技術都存在一定的技術限制,例如存儲器的大小、性能、容量受到存儲單元存儲電荷的技術和連接方式的限制。因而,為了在固態硬盤上存儲更多的數據,業界需要尋找突破這些技術瓶頸的方法。三星公司首家采用堆疊技術突破存儲單元存儲的技術限制,將閃存單元的存儲密度從每芯片32GB提高到256GB,并推出容量高達2TB的固態硬盤。而通過這種堆疊的方案,高帶寬存儲器(High Bandwidth Memory,簡稱HBM)不僅擁有更高的存儲密度,還可以提供更高的數據傳輸通道,擁有更快的傳輸速率,而且更節能。
AMD的R9 Fury X是第一個使用HBM顯存的顯示卡,它所使用的HBM顯存通過4層存儲芯片堆疊而成。因而,R9 Fury X比普通配備GDDR5顯存的顯示卡更節能,同時,擁有更快的傳輸速率。
除了AMD,韓國內存制造商SK Hynix也是HBM顯存技術的推動者,他們計劃在2016年推出第二代的HBM顯存,有望能夠進一步提高顯示卡的性能,而在同一時間,使用GDDR5顯存的顯示卡在性能上并沒有顯著的改進。
目前,顯存占據顯示卡的大部分空間,而且它們的能耗占顯示卡能耗的1/3。由于4K分辨率和虛擬現實技術的發展對顯示卡存儲器的需求不斷提高,所以在使用GDDR5顯存的顯示卡上,AMD公司為其高端顯示卡配備了8GB的顯存,16組存儲器芯片圍繞著GPU。由于每個存儲器芯片需要經由32條線路連接到GPU,16個芯片將需要512條連接線路,形成512位(最大)的接口,所以在顯示卡的印刷電路板中,已經無法容納更多的存儲芯片,無論是空間還是能耗都已經達到了極限。如果要進一步地增加顯存,那么只能縮小存儲芯片的尺寸或者增加存儲芯片的存儲密度。
高帶寬存儲器可以解決上述問題,并可以兩倍于普通GDDR5顯存的1024位接口與GPU連接。這里,硅通孔(Through Silicon Via,簡稱TSV)垂直互連技術和中介層(Interposer)兩項重要的技術創新是關鍵。HBM由多個存儲芯片堆疊而成,每一層包含多個存儲體,也就是多個存儲單元的分組。而TSV是一種用于堆疊芯片互連的技術,通過在硅晶圓上以蝕刻或激光的方式鉆出直徑約為10μm的小孔,再填充銅等金屬,TSV可以實現多層芯片的連接。1024 TSV將垂直通過HBM的4個層,最終通過小觸點利用微凸點(micro-bumps)技術與較低級別的邏輯控制系統連接,它們將組成每個具有128位帶寬的8個通道,負責存儲器堆棧與GPU或者顯示卡其他輸出端口(例如HDMI顯示器端口或者主板的PCI-E)之間的數據傳輸。
HBM與GPU之間的數據傳輸是無法通過普通的數據線來實現的,因為每個HBM與GPU的連接線多達1 024條,當4塊HBM環繞著GPU時,連接線將超過4 000條,再加上地址與控制命令的數據線,連接線約為5 000條。為此,一個被稱為中介層的新元件將負責HBM與GPU的連接:中介層位于HBM模塊與GPU的下方,原則上,中介層將會是一個不用于計算的芯片,只是負責簡單的連接和引導。數以千計的TSV被連接到中介層,通過小觸點連接,并由中介層導向GPU。
在HBM的架構中,中介層要求GPU和HBM彼此相鄰,確保它們盡可能地接近,方可獲得最佳的通信效果,TSV可以良好地散熱。接口方面,每一個HBM 1024位的連接是普通GDDR5顯存的兩倍,因而,可以以一個較低的時鐘頻率實現每秒512GB的數據吞吐量。對于顯存來說這是一個新的記錄,而在上述各種因素的影響下,使用HBM顯存的顯示卡可以擁有更低的功耗以及產生更少的熱量。不過,HBM也并不是沒有缺點的,對于第一代HBM來說,重要的缺點是最大容量只有4GB,對于游戲或者4K分辨率的內容來說,這樣的容量是足以應付的,但是一些特殊的圖形功能,例如一個精心設計的抗鋸齒系統,則需要更多的內存。為了滿足未來的需求,SK Hynix目前正在開發2.0版本的HBM顯存,2016年新一代的HBM將可能用于英偉達的下一個顯示卡平臺Pascal上。每個2.0版本HBM顯存模塊容量將可以達到8GB,并且與GPU的數據傳輸速率將翻一翻,達到1TB/s。