999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

走近GP100

2016-05-14 15:56:06
個人電腦 2016年7期
關鍵詞:工藝游戲

作為16nm工藝的新一代旗艦,NVIDIA的GP100核心到底有多強呢?或者說它與目前的顯卡架構有什么質的不同?接下來,我們就詳細分析一下GP100核心的特色,同時,回顧它與Kepler和Maxwell架構有哪些不同。

在NVIDIA推出了16nm工藝Pascal架構的GTX 1080顯卡之前,這半年來的顯卡市場上基本上沒什么新品,無論是AMD還是NVIDIA主推的還是上一代架構的顯卡,恍恍惚惚之間28nm工藝的顯卡竟然支撐了4年時間,這在以往的GPU升級歷史上可并不多見。之所以雙方沉寂這么久,毋庸置疑,兩者一定在醞釀著什么,AMD的新一代顯卡架構為14nm工藝的Polaris(北極星),NVIDIA準備的則是16nm工藝的Pascal(帕斯卡),后者在GTC 2016大會上首次揭開了面紗,NVIDIA發布的Tesla P100專業卡就使用了旗艦GP100核心。

也許是許久未見到新工藝、新架構的顯卡,現在看到GP100這樣的龐然大物竟有了一種莫名的興奮感。從Kepler到Maxwell架構,NVIDIA前兩次都是選擇首發面向主流游戲市場的核心GK104、GM204(Maxwell首發的其實是GM107這樣的低端核心),GK110、GM200大核心產品通常要晚半年時間,但這次的Pascal顯卡就跟當年的GF100費米架構一樣選擇了大核心首發,歷史終于又一次輪回了。

作為16nm工藝的新一代旗艦,NVIDIA的GP100核心到底有多強呢?或者說它與目前的顯卡架構有什么質的不同?接下來,我們就詳細分析一下GP100核心的特色,同時,回顧它與Kepler和Maxwell架構有哪些不同。

Pascal與Kepler、Maxwell規格對比

切入正題之前,我們先來了解看看GP100核心與Kepler、Maxwell架構的規格,此前NVIDIA官方也公布了GP100核心與GK110、GM200核心的一些對比,這里我們做了一份更詳細的表格,并加入了GM204及GK104這兩款游戲顯卡的核心規格。

這份規格表的內容非常多,粗粗看來會覺得手足無措,對此,我們有針對性的把需要重點關注的地方標記為紅色。簡單來說,就是GP100核心的晶體管密度再次攀升、CUDA核心大幅增加、雙精度性能逆天增長、緩存/寄存器容量翻倍、HBM 2顯存及NVLink總線,這幾點基本上能概括GP100核心的特色。

Pascal架構看點之一:計算性能是關鍵,雙精度性能逆市回歸

GP100的性能一經公布,給我們最直接的感覺就是,NVIDIA這次回歸了GK110大核心時代注重雙精度運算的設計,而且比之前更加“變態”——GK110架構中FP64雙精度與FP32單精度的比例不過1:3,每組SMX單元中有192個FP32單元,64個FP64單元;但GP100核心中每組SM單元中有64個FP32單元,但有32個FP64單元,FP64與FP32比例是1:2。

要知道,Maxwell架構中單雙精度比砍到了1/32,GK104核心中單雙精度比是1/24,這都遠遠低于Pascal核心,唯一能與之媲美的就是當年Fermi核心的Tesla加速卡了。

因此,在雙精度性能上,GP100核心可以說是突破天際了,FP64浮點性能可達5.3TFLOPS,而GK110核心不過1.68TFLOPS,GM200核心更是只有可憐的0.21TFLOPS,GP100雙精度性能達到了GK110核心的3倍多,是GM200核心的20多倍。

事實上,HPC的很多應用都需要雙精度性能,不過深度計算(deep learning)這樣的應用并不需要高精度運算,因為它天生自帶糾錯能力。而GP100的FP32 CUDA核心可以同時執行2個FP16半精度運算,因此FP16浮點性能高達21.6TFLOPS。NVIDIA在Tesla P100之外還推出了基于GP100核心的DGX-1深度學習超級計算機,它由8顆GP100核心及2顆16核Xeon E5處理器組成,深度計算性能達到了170TFLOPS,號稱比250臺X86服務器還要強大。

GP100為了提升計算性能,增強的不僅僅是雙精度單元,其L2緩存、寄存器容量也大幅提升,總計擁有4MB L2緩存、14MB寄存器空間。

總之,NVIDIA的GP100核心為了計算性能可謂煞費苦心,雙精度性能簡直逆天。值得注意的是,NVIDIA針對高性能運算所做的設計固然討好了HPC市場,但對游戲市場來說,雙精度是沒多少用處的,反而浪費了大量晶體管單元,提高了成本及功耗。

Pascal架構看點之二:升級16nm工藝,密度、能效提升

從AMD的HD 7970顯卡率先使用28nm工藝開始算起,TSMC的28nm工藝已經陪伴我們四年時間了。期間,AMD、NVIDIA數次升級過的新核心都沒有工藝升級,依然堅持28nm工藝,雙方都跳過了20nm工藝、直接進入了性能更好的FinFET工藝節點,只不過AMD選擇了三星/GF的14nm FinFET LPP工藝,NVIDIA則堅持沿用老朋友TSMC的16nm FinFET Plus工藝。

對半導體芯片來說,升級工藝通常意味著晶體管性能提升、功耗下降,同時晶體管密度大幅提升。具體到TSMC的16nm工藝,該公司此前表示其16nm工藝的晶體管密度是28nm HPM工藝的2倍左右,同樣的功耗下性能提升38%,同樣的速度下功耗降低54%,對比20nm工藝則是20%速度提升、35%功耗下降。

我們再來看看GP100核心的相關數據:

我們簡單地把幾款GPU的晶體管密度換算(晶體管數量除以核心面積,由于GPU核心的電路復雜,這種算法不一定精確,僅供參考)了一下,16nm工藝的GP100核心晶體管密度大約是2510萬每平方毫米,算起來晶體管密度比之前28nm工藝的Maxwell、Kepler恰好多了一倍。

至于每瓦性能比,這里使用的是FP32浮點性能與TDP功耗的比值,考慮到上述核心面向的市場不同,在此要說明的是,側重高性能的GP100與游戲市場的GM204、GK104對比TDP是不公平的,不過最終的結果依然顯示出16nm工藝的GP100在每瓦性能比上有明顯優勢。

從這一點也可以猜測,未來針對游戲市場的Pascal核心(比如GP104、GP106)問世之后,它們勢必要“閹割”掉GP100核心上很多不必要的功能,優化功耗,所以其每瓦性能比無疑會更出色。

Pascal架構看點之三:HBM 2顯存登場,16GB很好很強大

早在2年前的GTC大會上,NVIDIA就公布了Pascal顯卡的2大特色——一個是NVLink總線,一個就是3D Memory,號稱容量、帶寬是目前顯卡的2-4倍,帶寬可達1TB/s,這個顯存實際上就是HBM 2顯存。有意思的是,NVIDIA此舉也意味著盡管AMD Fury顯卡搶先使用HBM顯存,但NVIDIA還是在新一代HBM顯存上搶了先機。

對于HBM 2顯存,我們之前也多次做過介紹,HBM 2顯存現在已經被JEDEC吸納為標準。相比第一代HBM顯存,HBM 2顯存IO位寬不變,但核心容量從2Gb提升到了8Gb,支持4Hi、8Hi堆棧,頻率從1Gbps提升到了2Gbps,帶寬從512GB/s提升到了1024GB/s,這也是TB/s帶寬的由來。

目前三星、SK Hynix已經或者正在量產HBM 2顯存,單顆容量是4GB的,NVIDIA的GTC大會上展示了SK Hynix的HBM 2顯存,GP100核心使用的應該也是Hynix的產品,每個GP100核心周圍堆棧了4顆HBM 2顯存,總容量是16GB,要比AMD的Fury顯卡的4GB HBM顯存容量高得多。

支持HBM顯存對NVIDIA來說還有個好處,那就是ECC校驗。此前的架構中,NVIDIA Tesla顯卡的ECC校驗需要占用6.25%的顯存空間,這意味著有相當部分的顯存要被“浪費”,Tesla K40加速卡的12GB顯存中有750MB預留給ECC校驗,可用的內存容量就剩下11.25GB,而且這還會影響內存帶寬。

相比之下,HBM 2顯存原生支持ECC校驗,不需要額外的內存占用,這不僅提高了顯存利用率,帶寬也不會受到影響。

16GB HBM2顯存總量在Tesla及Quadro專業卡中不算第一,但HBM 2顯存超高的帶寬是GDDR5顯存望塵莫及的。值得注意的是,在GTC大會上展示的HBM 2顯存頻率標明是2Gbps的,但NVIDIA的GP100核心目前帶寬只有720GB/s,并沒有達到之前宣稱的TB/s帶寬,算下來頻率應該只有1.4Gbps左右,這說明GP100核心的HBM 2顯存并沒有全速運行,暫不清楚NVIDIA為何留了一手。

Pascal架構看點之四:NVLink可支持8路顯卡并行

如果說3D顯存是NVIDIA公布的Pascal的第一個關鍵特性,那么NV Link總線就是另外一項關鍵特性了,它同樣是NVIDIA針對高性能運算所開發的技術,號稱速度是PCI-E總線的5-12倍,前面提到的DGX-1深度計算超級計算機就使用了NV Link技術。

NV Link的優點就是帶寬超高,目前PCI-E 3.0 x16的帶寬不過16GB/s,用在游戲顯卡上是足夠的,但在超級計算中就顯得捉襟見肘了,而新一代的PCI-E 4.0規范又延期,這就得靠NV Link總線了。NV Link實際上是NVIDIA與IBM合作開發的產物,其每個通道的帶寬是40GB/s,GP100核心支持4個NV Link,雙向帶寬高達160GB/s,而且帶寬效率高達94%,這些都要比PCI-E總線更有優勢。

NV Link技術主要是為高性能運算而生的,IBM會在他們的Power 9處理器中使用該技術,Intel就不太可能使用NVIDIA的技術了,他們有自己的并行總線技術。對于普通消費者來說,NV Link的意義不大,不過,超高的帶寬、更低的延遲使得NV Link技術可以支持8路顯卡并行,對“高玩”來說有一定吸引力,不過多卡互聯的關鍵在于,目前恐怕沒有哪些應用或者游戲能夠完美支持8卡運行。

Pascal顯卡最關鍵的問題:消費級顯卡如何“閹割”

以上四點只是NVIDIA Pascal顯卡的部分特色,由于官方公布的細節還不夠多,我們對Pascal顯卡的了解還需要進一步深入。毫無疑問的是GP100大核心在高性能計算市場大有用武之地,不論是超高的雙精度性能、超高的每瓦性能比,還是超高的顯存帶寬、超高的NV Link總線,GP100大核心都擁有極強的競爭力。想來也并不意外,就在該卡剛剛發布,歐洲最強的超級計算機就準備使用Tesla P100專業卡進行升級了。

不過,非專業用戶對GP100最大的擔心也來源于此,因為它身上集成了太多的專業技術,雙精度運算對游戲應用沒多少用處,16GB HBM 2顯存雖然夠強悍,但成本控制讓人擔心。而NV Link總線對游戲顯卡來說更是屠龍之技,只有16nm工藝的高能效對游戲玩家來說絕對是有價值的。隨著NVIDIA正式發布針對游戲市場的GP104顯卡,AMD很快也會發布Polaris 11顯卡,雙方新一代顯卡大戰很快就要揭幕了。

猜你喜歡
工藝游戲
轉爐高效復合吹煉工藝的開發與應用
山東冶金(2019年6期)2020-01-06 07:45:54
5-氯-1-茚酮合成工藝改進
世界農藥(2019年2期)2019-07-13 05:55:12
游戲
數獨游戲
瘋狂的游戲
飛碟探索(2016年11期)2016-11-14 19:34:47
爆笑游戲
一段鋅氧壓浸出與焙燒浸出工藝的比較
銅業工程(2015年4期)2015-12-29 02:48:39
FINEX工藝與高爐工藝的比較
新疆鋼鐵(2015年3期)2015-11-08 01:59:52
第八章直接逃出游戲
小學科學(2015年7期)2015-07-29 22:29:00
第八章 直接逃出游戲
小學科學(2015年6期)2015-07-01 14:30:14
主站蜘蛛池模板: 高清无码手机在线观看| 国产福利微拍精品一区二区| 久久黄色一级视频| 在线观看免费黄色网址| www.99精品视频在线播放| 国产精品99在线观看| 免费高清毛片| 91小视频在线观看| 日本国产精品| 国产v精品成人免费视频71pao | 国产精品第一区在线观看| 视频在线观看一区二区| 亚洲va在线观看| 在线中文字幕网| www.99在线观看| 国产精品福利导航| AV在线天堂进入| 国产免费精彩视频| 亚洲无码视频一区二区三区| 国产麻豆aⅴ精品无码| 夜夜操国产| 国产成年女人特黄特色毛片免| 久无码久无码av无码| 国产在线精品人成导航| 伊人成人在线视频| 欧美一区二区人人喊爽| 免费人成网站在线观看欧美| 91成人精品视频| 91久久天天躁狠狠躁夜夜| 日韩精品毛片人妻AV不卡| 亚洲精品在线91| 成人在线欧美| 2021国产乱人伦在线播放| 国产精品亚欧美一区二区三区| 亚洲国产综合自在线另类| 白浆免费视频国产精品视频| 国产精品页| 中文字幕亚洲电影| 成人午夜免费视频| 999精品视频在线| 日本免费新一区视频| 国产精品永久久久久| 欧美自慰一级看片免费| 日韩 欧美 国产 精品 综合| 老司机久久99久久精品播放| 99re经典视频在线| 成人日韩欧美| 五月综合色婷婷| 久久综合伊人77777| 久久国产精品嫖妓| 99精品福利视频| a级毛片免费看| 亚洲乱强伦| 99尹人香蕉国产免费天天拍| 国产91丝袜在线播放动漫 | 欧美精品另类| 六月婷婷激情综合| 中文成人在线| 秋霞一区二区三区| AⅤ色综合久久天堂AV色综合| 四虎成人免费毛片| 国内精品伊人久久久久7777人| 97色伦色在线综合视频| 日本免费a视频| 国产精品久久久久久久久| 亚洲精品中文字幕无乱码| julia中文字幕久久亚洲| 欧洲精品视频在线观看| 日本人真淫视频一区二区三区| 亚洲人成人无码www| 操美女免费网站| 精品一区二区三区视频免费观看| 成年免费在线观看| 欧美福利在线| 22sihu国产精品视频影视资讯| 亚洲成人黄色在线| 国产精品午夜福利麻豆| 国产欧美精品专区一区二区| 美女毛片在线| 久久国产精品麻豆系列| www中文字幕在线观看| 亚洲一区二区黄色|