張祖強
今年下半年,NVIDIA和AMD在高端顯卡市場相繼發力,推出RTX30系列和RX6000系列顯卡。性能上的躍遷不僅給游戲玩家們帶來更流暢的游戲體驗,同時也可讓創意人士的工作效率得到大幅提升。此前MC為大家分享了RTX 30系列和RX 6000系列顯卡在游戲性能上的眾多對比評測文章,今天我們就將關注的焦點集中到它們的內容創作效率上,看看對于創意人士來說,什么顯卡才是他們盡情揮灑創意的工作利器。
理論知識復習
理論與實踐相結合才是學習的正確姿勢,所以在進入測試環節之前,我們不妨先來復習一下NVIDIA GeForce RTX 30系列和AMD Radeon RX 6000系列顯卡的一些關鍵理論知識。考慮到本文的重點是顯卡的內容創作性能,所以復習的理論知識就主要集中在這方面,對上述兩大系列顯卡的詳細技術內容感興趣的玩家們不妨參閱MC往期的文章。
NVIDIA GeForce RTX 30系列顯卡重點技術解析
NVIDIA于2019年提出RTX Studio計劃,旨在憑借其傳統的GPU加速技術和效能,以及其基于圖靈架構的GPU在光線追蹤和AI計算方面的優勢,為大量創意應用提供顯著的性能提升,并幫助創作者盡情揮灑創意。在過去一年左右的時間里,NVIDIA傾力打造其RTX Studio生態圈,不僅推出可加速創作應用性能的GPU驅動,同時還與Adobe、Blackmagic Design、CHAOSGROUP等軟件廠商合作,使目前市面上的眾多創作工具能夠充分利用RTX GPU的特性。那么隨著GeForce RTX 30系列顯卡上市,它們在內容創作領域又能帶來怎樣的技術革新呢?
從NVIDIA Ampere架構的技術特點來看,相比上一代顯卡,GeForce RTX 30系列顯卡在多個方面均有大幅升級和更新,例如第二代光追核心(RTCore)的性能進行了增強。NVIDIA的數據表明,在Blender Cycles、Chaos V-Ray和Autodesk Arnold等諸多頂級渲染器中,第二代光追核心的性能達到圖靈架構的兩倍左右,同時其運動模糊渲染效率更是達到圖靈架構的8倍。
升級DLSS技術也是GeForce RTX 30系列顯卡在創作性能上的一大亮點。對于NVIDIA DLSS技術,相信時常關注MC評測的朋友們應該不會陌生,這種基于AI的超分辨率及游戲加速實現技術,能夠在很大程度上提高實時光線追蹤可視化應用程序中的幀速率。具體到應用層面,NVIDIA DLSS能在游戲中提供優秀畫質表現,有效遏制幀率下降,同時還能在支持實時光線追蹤渲染的創意軟件中讓渲染輸出的效率得到極大加強。值得一提的是,除了用于AI超分辨率的NVIDIA DLSS,全新第三代Tensor Core加速AI功能還可以用于AI增強的聲畫處理技術NVIDIA Broadcast應用。NVIDIA Broadcast是NVIDIA近期推出的一個非常有趣的應用程序,我們在本文中也會和大家分享這款軟件的使用體驗。
除了核心方面的升級,GeForce RTX 30系列的部分顯卡還搭載性能更加強勁的GDDR6X顯存。目前得知RTX 30系列GPU最多可提供24GB的GDDR6X顯存(已知的顯卡型號為GeForceRTX3090),在海量顯存的輔助下,對于那些需要處理復雜的3D項目和多應用程序的工作流而言,有著巨大的性能提升幅度。支持AV1編解碼器和PCIe4.0也是NVIDIA Ampere架構的兩大亮點。GeForce RTX 30系列顯卡搭載首款支持新AV1編解碼器的獨立GPU核心,它將使創作者能夠以高達8K HDR的速度播放視頻,同時使用的帶寬減少50%,并極大地減輕CPU的負擔。相比PCIe 3.0,PCIe 4.0的整體帶寬有了跨越式的激增,這使得GPU與PC其余部分之間的通信連接速度呈翻倍式增長,這無疑對大型超高分辨率HDR和RAW視頻的剪輯、回放或編碼輸出的GPU加速過程有著重要的正向意義。
AMD Radeon RX 6000系列顯卡重點技術解析
AMD Radeon RX 6000系列顯卡采用了全新的RDNA2架構,它帶來了三個方面的技術優勢,一是較其上一代產品更為出色的能耗比和更高的頻率,二是全新設計的無限緩存,三是大量高級技術包括硬件光線追蹤技術的支持。AMD宣稱在RDNA 2上對CU單元內2個SIMD 32計算負荷平衡方面進行了優化,以提高計算效能,同時還為RDNA2架構的CU單元加入大量電源管理方面的內容,以盡可能提升GPU的性能功耗比。無限緩存方面,RDNA 2擁有L0、L1、L2和無限緩存(Infinity Cache)、顯存控制單元5個層級,其中無限緩存是全新加入的大容量緩存,容量高達128MB。其優勢在于可提升GPU的整體能耗比,同時還可提高GPU的數據命中率。硬件光線追蹤技術方面,RDNA2架構的每個CU單元配備了1個光線追蹤單元,從而在硬件層面支持光線追蹤技術。不過由于AMD在硬件光線追蹤技術方面的起步較晚,所以從MC的測試成績來看,RadeonRX6000系列顯卡在光線追蹤性能上的表現明顯不及GeForce RTX 30系列顯卡。
性能實測
和大家一起復習了這么多理論知識,下面我們正式進入性能測試環節。本次測試我們主要想探究來自NVIDIA的GeForce RTX 3080和GeForce RTX 3070(下文簡稱RTX 3080和RTX 3070),以及來自AMD的Radeon RX 6800XT和Radeon RX 6800(下文簡稱RX6800XT和RX6800)在內容創作性能上的表現。測試軟件方面,我們選擇了BlenderCycles、Blackmagic Design DaVinci Resolve和D5渲染器這三款時下非常流行的創作設計軟件,以及V-Ray5 Benchmark這款基準測試軟件進行考核。那么4款參測顯卡的創作性能究竟如何呢?我們一起來看看。
Blackmagic Design DaVinci Resolve
DaVinci Resolve是目前世界上唯一結合8KRedcode RAW源視頻生產和編輯創作解決方案的創作軟件工具。在本次測試中,我們使用的是DaVinci Resolve 16,并選擇了5段不同碼率的4K R3D源視頻進行從4KRAW視頻轉為1080p網絡視頻格式的編碼輸出測試。對視頻剪輯工作者來說,編碼輸出是最耗時的環節,誰更有效率,誰就能占據先機。
DaVinci Resolve 16的測試成績顯示,RTX 3080完成編碼輸出的耗時為44秒,而其競品RX 6800XT則耗時53秒完成編碼輸出任務。此外,在RTX 3070和RX6800這兩款競品的對比上,RTX 3070的渲染效率也明顯更高。
Blender Cycles
Blender Cycles是行業內使用頻率非常高,同時也是廣受設計師青睞的3D渲染器,并且它還能對RTXGPU提供加速。我們在本次測試中首先使用其官網提供的基準測試—Blender Open Data,在不同模型場景下考察了參測顯卡的創作性能,同時我們還分別在“璀璨星系”“classroom”“pavillon_barcelone_v1.2”這3個測試場景中對比了參測顯卡的表現。
值得一提的是,在Blender Cycles中,RTX 3080和RTX 3070可以使用“CUDA”和“OptiX”這兩種工作模式來完成渲染任務。相信時常關注MC顯卡評測的朋友已經對CUDA比較熟悉了,那什么是OptiX呢,MC在這里簡單科普一下。OptiX可同時調用CUDA核心、RT Core和TensorCore,從而提供更快且準確的光線追蹤處理效率,同時還可以提高渲染模型的質量。因此,在Blender Cycles中,我們將在部分測試中使用“CUDA”和“Opti X”這兩種工作模式,考察RTX 3080和RTX 3070的創作性能。
我們首先來看看Blender Open Data的測試成績。這個基準測試程序中包含多個渲染場景,我們不妨直接對比其總耗時??梢钥吹剑谑褂肙ptiX進行渲染之后,RTX 3080和RTX 3070的性能表現非常亮眼,它們完成所有渲染任務的耗時均不到各自競品的一半。不僅如此,在我們單獨測試的3個場景中,RTX 3080和RTX 3070也分別比它們的競品RX 6800X T和RX 6800更快完成渲染任務。特別是在“璀璨星系”這個測試場景中,RTX 3080和RTX 3070的渲染耗時基本在7分鐘以內,而RX 6800XT則耗時17分47秒,RX 6800的渲染耗時更是多達22分04秒。從Blender Cycles的測試成績來看,RTX 3080的渲染效率大概是RX 6800X T的3倍以上,而RTX 3070的渲染效率也達到了RX6800的3倍以上??梢哉f,在這一環節的測試中,NVIDIA GeForce RTX 30系顯卡展現出了絕對領先的姿態。
D5渲染器
D5是一款國產3D設計渲染器,它使用了大量RTX GPU的核心創作加速技術,包括RTX實時光線追蹤、RTX全局光照和NVIDIA DLSS等。我們使用的是一段長約6秒的CG動畫模型做了渲染輸出耗時對比測試,視頻輸出分辨率為1920×1080,考慮到RTX 3080和RTX 3070支持DLSS技術,該技術可大幅縮減視頻輸出的耗時,所以我們將會特別測試D5渲染器開啟DLSS功能之后,RTX 3080和RTX 3070輸出視頻的耗時。
在D5渲染器中,兩款NVIDIA GeForce RTX 30系列顯卡的優勢仍然非常明顯。在關閉DLSS時,RTX 3080的視頻輸出耗時比RX6800XT少5分鐘,RTX 3070完成視頻輸出任務的耗時更是比RX 6800少6分24秒。整體來看,在D5渲染器的渲染輸出測試中,RTX 3080和RTX 3070的渲染效率分別是RX6800XT和RX 6800的兩倍左右,優勢非常明顯。值得注意的是,相比關閉DLSS時,RTX 3080和RTX 3070在開啟“黑科技”DLSS之后的視頻輸出耗時直接減半,同時進一步擴大對競品的性能優勢。從測試結果可以明顯看出,開啟DLSS之后,RTX 3080及RTX 3070相對于RX 6800XT/RX 6800的領先優勢擴大到了4倍左右,十分驚人。
V-Ray 5 Benchmark
V-Ray是由CHAOSGROUP開發的一款業界非常受歡迎的渲染插件軟件,它為建筑、汽車設計等多個領域的3D建模軟件提供了高質量的圖片和動畫渲染,同時V-Ray還提供了單獨的渲染程序,方便使用者渲染各種圖片。在評測的最后,我們使用了CHAOSGROUP推出的一款工具軟件—V-Ray 5 Benchmark想來測試四款顯卡在這一渲染插件中的應用情況。不過遺憾的是,RX 6800X T和RX 6800并不支持這款渲染軟件Benchmark的GPU加速,所以這部分測試中我們將主要對比參測CPU(AMD銳龍95950X)、RTX 3080和RTX 3070之間的渲染性能。
為了保證測試成績的可對比性,我們在V-Ray 5 Benchmark中選擇的測試場景是“GPU CUDA”。從測試成績來看,RTX 3070的渲染性能是AMD銳龍9 5950X的2.1倍,RTX 3080的性能則更強,達到AMD銳龍95950X的2.5倍之多。由此可見,NVIDIA GeForce RTX 30系列顯卡比AMD銳龍95950X處理器更適合在V-Ray中進行渲染任務。而對于AMD顯卡來說,由于目前不被V-Ray5支持,也就意味著與這款應用廣泛的渲染插件失之交臂。
直播輔助功能對比
前文中我們提到,第三代Tensor Core加速AI功能還可以用于AI增強的聲畫處理技術NVIDIA Broadcast應用。它是一款通用插件,可用于大多數熱門直播、語音聊天和視頻會議應用程序。所有NVIDIA GeForce RTX、TITAN RTX或Quadro RTX GPU均支持此插件,并使用其專用AI處理器Tensor Core AI網絡與玩家的游戲一起實時運行。目前這款軟件提供了易于使用的音頻和視頻效果,例如“降噪”“虛擬背景”和“自動構圖”等。NVIDIA Broadcast能讓游戲主播、游戲分享、多人連線、視頻會議等多種應用場景衍生出更強大、更好玩的功能。相比AMD在Radeon Software中的直播輔助功能,NVIDIA Broadcast的功能更加豐富,可玩性和實用性也更高。
GeForce RTX 30系列顯卡,助你盡情揮灑創意
得益于強大的NVIDIAAmpere架構、第二代RTCore、第三代TensorCore等諸多技術特性的支持,RTX 3080在我們本次的內容創作效率測試中全面碾壓RX6800XT,特別是在V-Ray、D5渲染器和Blender的部分渲染測試中,RTX 3080的性能甚至高達RX6800XT的兩倍或更多。不僅如此,我們的測試成績也顯示,RTX 3070的綜合表現也領先RX 6800。此外從我們的測試成績也可以看到,本次測試平臺搭載的AMD銳龍95950X處理器,在V-Ray中的渲染性能也同樣不及RTX 3080和RTX 3070。因此我們認為,相比RX6800XT、RX6800和AMD銳龍95950X,來自NVIDIA的RTX 3080和RTX 3070顯卡明顯更加適合想要提升工作效率的創作創意者們。在創作創意的工作能力上,NVIDIA
GeForce RTX 30系顯卡已經遠遠地將AMD Radeon RX 6000系列顯卡甩在了身后,它理應成為創作創意者的最佳選擇。
與此同時我們也不難發現,NVIDIAGeForce RTX 30系列顯卡為創作者們提供了更強的CUDA核心配置、更高的光線追蹤性能、進化的DLSS功能,再搭配上特別適配的Studio驅動程序,以及越來越多針對RTX顯卡適配的創作軟件,NVIDIA Studio生態圈已經日益龐大,這對于創作者來說無疑是一個福音,同時也將把整個設計創作行業推向一個新的高度。而GeForce RTX 30系顯卡的面世,設計創作行業也必然會迎來再一次的革新,走向一個全新、自由、高效的創作時代。