999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

擴展無極限 解析全新Imagination B 系列GPU

2020-01-25 16:19:54張平
微型計算機 2020年22期
關鍵詞:產品功能設計

張平

之前本刊介紹過Imagination的全新A系列GPU,并給予了高度評價。現在,跟隨著Imagination的發布時序,全新的B系列GPU也已經準備完畢。相比全面革新的A系列GPU,B系列GPU又帶來了那些激動人心的特性呢?

滿足市場需求通過多GPU擴展提高性能

Imagination目前在移動GPU市場中的艱難現狀幾乎是眾所周知的事情。作為ARM之外的唯一移動GPU提供方,Imagination的客戶數量在持續下降,主要原因就是ARM也可以提供具有競爭力的CPU和GPU知識產權,且需要高性能移動GPU的客戶數量其實并不多。諸如高通等廠商其內部的Aderno GPU在性能和功能設計上也居于領導地位,并且對其他供應商施加了巨大壓力,這導致其他供應商在很多情況下會直接選擇ARM的GPU產品,除了聯發科之外。聯發科是歷年來唯一一個在SoC產品中經常使用Imagination GPU產品的企業,但是最近的Helio又改回了ARM Mali GPU,并且短期內再度使用Imagination GPU的可能性應該也不大。

隨著蘋果使用Imagination的架構許可來設計定制GPU,三星和AMD合作計劃在Exynos中引入AMD的技術,華為海思在設計自主GPU架構以及前景不夠確定的情況下,Imagination面臨需求不足的問題。

這樣一來,Imagination需要將發展空間聚焦在移動之外的市場,比如高性能計算、汽車市場等。但是從傳統的移動設備轉移至高性能GPU是非常困難的,因為這將直接影響整個GPU架構的平衡和設計,畢竟移動GPU面向的是低功耗市場。這實際上是絕對性能、可擴展性和功耗效率之間的平衡問題,畢竟高性能GPU的能耗比肯定不會高,但是低功耗、高效率的移動GPU無法擴展性能。

因此在B系列GPU上,Imagination引入了一種新方式來解決這個問題,那就是使用多GPU。在看到多GPU的時候,大家首先想到的是臺式機的多GPU并聯技術,比如英偉達的SLI或者AMD的CrossFire,但是由于現代游戲API和多GPU技術存在一些沖突,因此這個技術已逐漸被廠商拋棄。

Imagination在多GPU的處理上和過去完全不同,其主要區別在于GPU處理工作負載的方式。B系列的工作模式將從傳統的“推送”模式轉變為新的“拉動”模式,其中前者表示GPU驅動程序將工作推送至GPU進行渲染,后者則表示GPU將拉入工作負載并進行處理,這是GPU在數據饋送工作方式的根本性轉變,Imagination稱之為“分散式”設計。

根據Imagination的介紹,在一組GPU中,其中一個充當“主”GPU,帶有一個額外的控制固件處理器,該處理器將一個工作負載(比如一個渲染幀)劃分為不同的工作塊,然后其他“從”GPU可以從這些工作塊中拉出不同的工作以進行處理。在這里,Imagination使用了“tile-based”用于形容這個工作方式,這里的“tile”實際上就是它的本意,指不同的工作區塊,也就是說GPU基于區塊的渲染方法是這個全新機制的核心,這里需要注意的是,區別之前AFR備用幀渲染或者SFR分割幀渲染。同樣的,由于使用區塊渲染的單個GPU可以針對給定的幀進行不同尺寸的區塊渲染處理,那么相應的B系列GPU也可以針對單一幀針在一組GPU中進行不同尺寸大小的分配,這將有助于提高整體的渲染效率。

最重要的是,Imagination推出的這個全新的多GPU系統對于高層的API和軟件工作負載來說是完全透明的,這意味著從軟件角度來看,運行多GPU配置的系統只需要面向一整個大型GPU,這和目前大多數使用多GPU的離散渲染系統形成了鮮明的對比,后者會在系統中顯示每一個離散GPU信號,這也是Imagination這項全新技術的特別之處所在。

從實現的角度來看,這項技術使得Imagination和其客戶在配置選擇方面有了更多的靈活性,Imagination不再需要設計一個巨大的GPU,并且這種大型GPU往往由于時序收斂或者微體系結構擴展方面需要做更多的工作。現在Imagination可以設計一個高效率的GPU核心,并且允許客戶對GPU核心根據需求進行規模上的縮放。另外,Imagination還聲稱自己將提高GPU的頻率,比如針對高端市場、云計算等方面計劃實現1.5GHz的產品頻率。

對于客戶而言,Imagination這樣的設計給予了客戶極大的靈活配置空間,客戶不需要等待Imagination為其設計實行目標相匹配的GPU,而是利用現有GPU進行“縮放”,就可以獲得目標性能,并且能夠自主配置和擴展,尤其是客戶需要為多個目標設計多個SoC的時候,那么只需要使用一種GPU模塊就可以輕松實現多個性能目標。

本文將在后續段落詳細介紹Imagination的縮放功能。目前B系列GPU最多可以支持擴展至4個GPU,和一個較大的GPU相比,在SoC上放置多個B系列GPU時并不要求GPU必須相鄰甚至可以完全不相鄰。這是因為每個GPU都是獨立的設計模塊,設計人員甚至可以在滿足設計要求的前提下,SoC的四周放置4個GPU。

對SoC設計人員而言,要使用Imagination的B系列GPU的唯一要求是他們必須使用標準的AXI互聯總線并將多個GPU連接到內存,對于GPU之間的連接則沒有那么麻煩,因為GPU之間只需要一些比較簡單的連接用于實現不同的GPU核心之間的中斷即可,這種連接并不傳輸具體的數據。因此,這種設計特別適合現在比較流行的Chiplet或者多硅片芯片設計,盡管當前單個GPU設計很難使用和CPU群組相同的方式分解為多個小芯片,但是Imagination的分散式多GPU在橫跨多個小芯片時應該不會出現特別的問題,同時在軟件端和系統層面,看起來依1日是一個整體的GPU。

總的來看,Imagination正在使用這種新的多GPU方法來實現之前無法提供的更高性能的設計。Imagination宣稱,通過多GPU擴展,他們基于移動設備、更高效的GPU lP可以與英偉達和AMD當前提供的其他產品相競爭(Imagination將其最大配置擴展到6TFLOP),并提供PCle的外在設計,還帶來了高達70%的計算密度提升,這個數據是Imagination定義的,其單位是TFLOPs/mm2。盡管該指標在性能方面相對沒有意義,原因是集群GPU的性能上限依舊受到架構和當前B系列GPU所能實現的最高MC4擴展所限制,但是在小尺寸芯片上,這個數據能夠帶來極高的成本收益,因此也呈現出非常出色的市場競爭力。

目前,Imagination的新B系列GPU目前包含了很多不同的等級的產品,并且該公司繼續將其劃分為不同的性能等級-BXT系列是旗艦GPU設計,BXM系列是更加平衡的中端GPU,BXE系列是該公司的最小、最高效的兼容Vulkan的GPU。

從BXT開始4個GPU如何達到6TFLOPS性能

在本部分,本文將繼續討論B系列GPU的擴展性和架構內容。從架構角度來看,新的B系列GPU和之前公布的A系列GPU在微架構上非常接近,不過Imagination提出新的B系列大約可以帶來性能或者效率15%的提升。另外,B系列GPU還帶來了一些新加入的功能比如IMGIC( ImaginationImage Compression,Imagination圖像壓縮技術),這個技術后文還有介紹。

更進一步來看的話,BXT系列GPU采用了新的SPU設計,包含了新的、功能更強大的TPU(紋理處理單元)以及新的128寬度的ALU,這些新的功能加入了被稱為USC( (UnifiedShading Clusters統一像素計算簇)的單元。

BXT系列中最大規模的單元被稱為BTX 32-1024,將其中4個集成在一起,可以創建被稱為BXT 32-1024 MC4的GPU,這個GPU在高達1.5GHz的主頻下能夠提供6TFLOPS的FP32計算能力,雖然這個性能還不足以和AMD以及英偉達的頂級顯卡相提并論(RTX 3090的FP32性能約35TFLOPS),但是考慮到Imagination是一個移動領域GPU架構的提供商,這樣的性能也還是相當不錯了。

在BXT之外就是BXM系列GPU。相比BXT,BXM的定位要低一些,因此沒有加入XT系列的超寬ALU設計。在這個系列的GPU中,如何實現最高的面積效能需要仔細地衡量。以BXM-4-64為例,這個系列如果使用8XT系列的32寬的ALU,并將4個同樣型號的GPU組合在一起實現BXM-4-64 MC4的GPU的話,那么其面積效率和性能相比單一的、規模更大的BXM-8-256GPU可能要更高一些。

在更注重性價比、更小的BXE上,集群使用就變得更有趣了。因為BXM系列的設計目的極為注重面積效率,但絕對性能不高,因此BXT和BXM往往作為主要GPU提供,BXE既可以作為主要的GPU,也可以作為輔助GPU形式存在,當BXE作為輔助GPU存在的時候,將不加入固件處理模塊或者幾何圖形模塊,這部分計算將完全依賴于主GPU的幾何計算單元。Imagination表示,這種特殊的設計能夠在極其微小的區域面積占用的情況下提供相當高的計算能力和紋理填充率。

根據Imagination提供的規格并組織成表后,我們看到了Imagination只需要8鐘不同的硬件設計就可以創建RTL并進行物理設計、確定時鐘頻率等,面向低端領域的GPU設計在這里也可以擴展到高端移動SoC中,設計非常巧妙。對客戶來說,如此靈活的設計方案能夠為其帶來最大的便利,客戶可以通過不同的GPU組合來實現自己需要的性能。

值得注意的是,雖然在入門級產品的計算能力組合搭配上出現了一些重疊,但是不同的區域效率和不同的填充率可能會影響產品傾向和用戶選擇。高端市場則可以通過最大的MC4 GPU配置使得高端性能提高4倍。Imagination特別指出,未來他們將不再設計比BXT-32-1024更大的單-GPU方案,因為用戶可以通過BXT-32-1024的多核擴展,這樣做投資回報率更高,并且不涉及更復雜的大核心芯片設計工作。

引入IMGIC實現更好的幀緩沖壓縮

除了多GPU擴展的特性外,新的B系列GPU的另一個特點是帶來了全新的圖像壓縮算法,簡稱為IMGIC。

從現代GPU的發展來看,數據壓縮是非常重要的一環,否則GPU將面臨帶寬不足的窘境。迄今為止,Imagination-直在使用PVRIC進行數據壓縮,PVRIC的問題在于其數據壓縮率相對幾個競爭對手而言都顯得比較低。比如ARM使用的AFBC (ARMFrame-Buffer Compression,ARM幀緩沖壓縮)就能夠實現更高的壓縮率。這導致Imagination的GPU在日常使用中需要更高的帶寬才能發揮出更好的性能。

IMGIC則是Imagination提出的全新一代、重新設計的壓縮算法,Imagination稱其為現在最先進的圖像壓縮技術。和之前的PVRIC相比,新的IMGIC能夠節約大量帶寬并具有極高的靈活性,尤其是IMGIC不光能對圖像、較小的圖塊或者像素組進行壓縮,還能夠直接處理單個像素。另外,有消息稱IMGIC的算法也要比PVRIC算法簡單大約8倍,這意味著硬件方面也可以大大簡化,并且在面積上有比較明顯的降低。

IMGIC的靈活性還體現在它能夠根據不同的場合,提供不同的壓縮比選擇。比如在最大限度節省帶寬的情況下,壓縮比可以達到有損的25%,或者是在平衡模式下選擇50%壓縮比同時獲得視覺無損質量,或者選擇75%壓縮比獲得節約帶寬的無損壓縮模式等。但無論如何,整個B系列GPU在內部數據傳輸和處理上都做出了改進,節約了大約35%的帶寬。考慮到內存帶寬在移動處理器中是一個非常昂貴的資源,因此B系列GPU在帶寬方面的改進是非常有益的。

BXS系列安全性優先

除了針對更高性能的設計外,Imagination還將重點放在了汽車和工業市場上,并針對這些市場的需求推出了BXS系列GPU,其中S代表的是“safety”。從規格來看,新的BXS系列產品基本和BXT、BXM和BXE系列配置相同,但是增加了對IS0 26262/ASIL-B安全功能的支持。

Imagination推出了__項名為“區塊區域保護(Tile Region Protection,簡稱為TRP)”的新功能,該功能可將渲染幀上可配置的渲染區塊標記為關鍵安全區塊,GPU可以檢查其執行和渲染的結果,使其符合IS0 26262認證的需求。這個功能最小需要等效BXE的BXS GPU才能支持。此外,Imagination還允許通過CRC來檢查進出GPU的所有數據,實現端到端的數據完整性保護,進一步幫助特殊用戶實現安全要求。

繼續說TRP。由于TRP需要單個GPU來反復檢查和校驗,因此往往會帶來性能損失,在這里,用戶可能需要配置多GPU來滿足性能的同時啟用TRP功能。不僅如此,在汽車設計中,多GPU配置還可以達到將GPU劃分為多個獨立工作的負載區域,來實現不同的功能并確保整個系統工作的有效性和安全性。比如有4個GPU,可以分為3個分區,其中2個GPU協同工作為諸如信息娛樂系統等提供計算支持,另外2個GPU則用于汽車其他部分的數據處理甚至監控等。

在虛擬化功能方面,Imagination為B系列GPU配置了支持最多8個“來賓”通道的硬件虛擬化技術,擁有這個技術,GPU用戶可以將2個GPU虛擬化為3個分區,實現不同的功能,當然這種虛擬化不會帶來性能的提升。

BXS系列除了增加安全功能外,還針對汽車這種使用場合,對GPU的架構進行了一些特定的增強,從而可以為汽車領域更獨特的工作負載實現更好的性能擴展。其中之_是對幾何形狀處理能力的加強,因為汽車供應商傾向于使用更多的三角形。Imagination表示,他們已經對設計進行了調整以涵蓋這些更苛刻的使用場景,并且與一些MSAA特定的優化措施相結合,與常規的非汽車GPU產品相比,這些支持汽車應用的GPU在邊緣處理應用場景下的性能可提高60%。

性能、效率和即將來臨的光線追蹤支持

總的來說,B系列產品在GPU設計擁有非常顯著的創新。雖然相比A系列產品,B系列產品在GPU架構上進步不大,但是在多GPU方面具有顯著的創新,并且和之前的多GPU方案都有巨大差異和優勢。新的多GPU設計帶來了很大的靈活性,能夠在很多場合提供更出色的性能。不過在某些極端情況下,這種多GPU設計還是會帶來性能瓶頸,這也是不可避免的。Imagination希望在大部分場景下能夠擁有比較良好的效果。

在GPU性能方面,Imagination宣稱B系列GPU相比A系列GPU在相同的功耗目標下帶來了大約30%的性能提升,其中15%通過微體系架構和物理設計實現,其余的部分則是通過選擇多核心GPU配置的PPA優勢來實現的。

在實際產品方面,Imagination宣布B系列GPU現在已經有實際客戶和產品了。一家名為Innosilicon的廠商基于Imagination推出的B系列GPU設計并推出了名為“風華”的顯卡產品。在之前,Innosilicon專門設計各類ASIC知識產權產品,比如英偉達的GDDR6存儲控制器,但是這次借助Imagination的B系列的特性,在英偉達和AMD之外推出了類似獨立顯卡的產品,面向云計算和高端數據中心等。當然,作為首款產品,Innosilicon的努力還值得觀察,但是相比之前從未見過的A系列GPU、8XT、9XT等產品而言,B系列初戰告捷。

除了B系列GPU外,Imagination還預告了即將到來的C系列GPU,并宣稱C系列GPU將帶來原生光線追蹤支持。實際上,Imagination在十年前就已經擁有有關光線追蹤的專利和相關lP設計,但是直到英偉達和AMD紛紛加入光線追蹤技術、整個市場環境逐步成熟后,Imagination才提出在C系列中加入光線追蹤計算以適應市場變化。不僅如此,Imagination還確認自家的光線追蹤技術將擁有全面而完整的功能,包括BVH以及硬件相干排序等,這些功能被Imagination稱之為“第四級”,相比之下,Imagination定義現有的英偉達和AMD的光線追蹤為“第三級”。

小結

總的來看,Imagination推出的全新B系列GPU帶來了前所未有的擴展性,再加上其在數據壓縮、安全性方面的努力,使得Imagination的GPU產品能夠有機會擴展至移動GPU之外的其他領域,包括汽車、高性能計算、數據中心等。從這一點來看,如果Imagination堅持這樣的發展方向的話,那么未來幾年業界應該會發生一些有趣的變化,尤其是新的分布式多GPU的設計,可能會帶來一些意想不到的結果。

猜你喜歡
產品功能設計
也談詩的“功能”
中華詩詞(2022年6期)2022-12-31 06:41:24
瞞天過海——仿生設計萌到家
藝術啟蒙(2018年7期)2018-08-23 09:14:18
設計秀
海峽姐妹(2017年7期)2017-07-31 19:08:17
關于非首都功能疏解的幾點思考
有種設計叫而專
Coco薇(2017年5期)2017-06-05 08:53:16
2015產品LOOKBOOK直擊
Coco薇(2015年1期)2015-08-13 02:23:50
中西醫結合治療甲狀腺功能亢進癥31例
辨證施護在輕度認知功能損害中的應用
新產品
玩具(2009年10期)2009-11-04 02:33:14
產品
個人電腦(2009年9期)2009-09-14 03:18:46
主站蜘蛛池模板: 91福利免费视频| 国产成人免费| 免费不卡视频| 99久久人妻精品免费二区| 国产麻豆永久视频| 精品国产电影久久九九| 一本综合久久| 在线国产91| 亚洲欧美日韩动漫| 国产爽爽视频| 久久夜色撩人精品国产| 67194亚洲无码| a天堂视频| 国禁国产you女视频网站| a天堂视频| 亚洲人成人无码www| 国产精品视频白浆免费视频| 日本免费a视频| 国产不卡国语在线| 国产精品美女免费视频大全| 永久免费精品视频| 国产二级毛片| 成年网址网站在线观看| 国产一区二区网站| 国产精品尤物铁牛tv| 人妻中文久热无码丝袜| 亚洲欧洲日韩综合色天使| h网址在线观看| 久久黄色免费电影| 四虎成人精品| 国产SUV精品一区二区6| 99视频在线免费| 久久综合丝袜长腿丝袜| 欧美亚洲国产精品久久蜜芽| 国产乱子伦视频在线播放 | 色噜噜在线观看| 国产一区二区三区视频| 无码一区中文字幕| 欧美一级专区免费大片| 色哟哟国产精品一区二区| 99免费视频观看| 午夜a级毛片| 国产成人无码AV在线播放动漫| a亚洲视频| 婷婷激情五月网| 久久a级片| 国产国语一级毛片| 亚洲欧洲一区二区三区| 视频二区中文无码| 米奇精品一区二区三区| 亚洲精品不卡午夜精品| 日本三级欧美三级| 国产亚洲精品在天天在线麻豆| 亚洲av无码人妻| 中文字幕乱妇无码AV在线| 欧美爱爱网| A级毛片高清免费视频就| 国产精品99在线观看| 91无码人妻精品一区二区蜜桃| 亚洲成AV人手机在线观看网站| 国产乱人伦偷精品视频AAA| 国产一区二区三区精品久久呦| 欧美日韩精品一区二区在线线| 中文字幕永久视频| 午夜日本永久乱码免费播放片| 久久精品娱乐亚洲领先| 青青操视频免费观看| 不卡午夜视频| 亚洲精品国偷自产在线91正片| 一区二区三区精品视频在线观看| 久久人午夜亚洲精品无码区| 在线国产你懂的| 国产亚洲视频免费播放| 亚洲精品国产精品乱码不卞| 人妻91无码色偷偷色噜噜噜| 99在线小视频| 国产经典三级在线| 国产精品制服| 又爽又大又黄a级毛片在线视频| 欧美19综合中文字幕| 日韩黄色在线| 国产国语一级毛片|