NVIDIA更新Ampere架構，全面提升GPU應用性能

2020-11-26 19:28:10齊健

智能制造 2020年12期

關鍵詞：用戶

文|齊健

隨著數字技術的飛速發展，越來越多的行業對于專業可視化應用的需求加速上漲。例如，在制造業應用中，CAD設計階段對產品的整機建模，零部件復雜的大型裝配體設計等，CAE仿真過程中對材料的模擬、拓撲優化以及多物理場仿真實驗等，再到后期銷售和推廣階段的效果展示，都對圖形渲染效率和GPU運算能力提出了嚴苛的要求。

在過去的20年中，專業圖形顯示技術的更新迭代日趨加快。NVIDIA在圖形顯卡領域，針對不同行業的用戶推出了眾多專業GPU產品與應用解決方案，領域覆蓋了電視、娛樂、傳媒、現場直播、汽車制造、設計、大數據運算、科學運算、專業電影制作以及AI等。

近年來，NVIDIA推出的GPU架構，從Kepler到Maxwel、Pascal、Turing，再到最近發布的Ampere架構，NVIDIA最近發布的五代GPU架構都在AEC、BIM、CADCAM以及仿真等領域推出了大量重要更新，以期提升NVIDIA GPU在更多專業應用領域的性能表現。

Ampere架構全面提升GPU應用性能

2020年秋季推出的基于全新Ampere架構的NVIDIA RTX A6000和NVIDIA A40，采用了全新的RT Core、Tensor Core和CUDA Core加速圖形、渲染、計算和AI。NVIDIA RTX A6000和NVIDIA A40通過突破性的技術向用戶提供更強大的性能，其中最重要的更新就是RTX GPU的升級，作為第二代RTX GPU，Ampere架構與前代RTX GPU的Turing架構相比，主要有三方面優勢：首先，新一代的SM（新一代流式多處理器）架構最高可以提供39TFLOPS的FP32算力。第二代RT Core相對于第一代Turing架構里的RT Core最高可以提供76 TFLOPS光線追蹤算力。

RT Core是NVIDIA在Turing架構中首次引入的專門針對光線追蹤的運算單元，采用BVX算法，使用一個專門的電路運算光線軌跡及當前畫面里3D建模之間的鏡面反射、慢反射或者半折射等類似的復雜光線互動，使每一個畫面渲染精度更高，更加逼真。

Ampere架構采用了第二代的RT Core，最高可提供2倍于上一代的吞吐量，以及并行光線追蹤、著色和計算功能。Ampere架構針對BVX算法做了大量優化，例如Motion flow、陰影功能等。可以把很多需要分開處理的步驟，或需要由不同核心處理的任務，整合在一起，利用GPU的不同使用周期處理運算，提高工作負載。

除了SM之外，Ampere架構還加入了針對AI應用提供高性能的張量運算核心Tensor Core，提供最多310個Tensor TFLOPS的算力，結合稀疏運算特性，可以在圖形計算和圖形渲染過程中支持基于“深度學習”的超采樣抗鋸齒，以及基于AI的降噪等，比之上一代產品提供10倍的加速性能。

張量運算核心的總體性能是固定的，運算精度提高的同時運算輸出量就會相應降低，無論是FP16半精度，FP32單精度或者FP64以及更高的算法，都會帶來性能的相應降低。第三代Tensor Core，采用FP32單精度運算，并支持全新TF32和BF16數據格式，最高可提供5倍于上一代的吞吐量，2倍于上一代Turing架構的運算性能。NVIDIA中國區高級技術市場經理施澄秋介紹說：“在今天的4K、8K顯示中，單個像素只是整個圖形中非常小的一個點，對于一個每秒有30幀、60幀、甚至120幀的3D動畫來說，單個像素點出錯對于對于整個圖形無傷大雅，所以我們沒有必要用FP64或者更高的精度來進行整個圖形運算，用單精度浮點就足以應付大部分情況下的圖形或者物理模擬運算。在CAD、CAE或者其它比較復雜的3D設計圖形或者仿真工作流程里，采用FP32的精度進行運算可以有效提高性能功耗比。”

此外，全新Ampere架構支持DDR6顯存，NVIDIA RTX A6000具備48GB GPU內存，單個GPU可提供的最大內存，通過NVLink連接兩個GPU可以擴展到96GB；支持所有常規ISV應用程序。通過ISV認證，無論是工作站還是服務器，都更易于部署。虛擬化，通過添加NVIDIA虛擬工作站等NVIDIA虛擬GPU軟件，為遠程用戶提供針對圖形工作負載和強大虛擬工作站實例的大規模支持，賦力高端設計、AI和計算工作負載的更大規模工作流程；PCIe Gen 4，提供2倍于上一代的帶寬，可以加速Lenovo ThinkStation P620等PCIe Gen 4服務器和工作站中數據密集型工作負載（如數據科學、混合渲染和視頻流）的GPU數據傳輸。

基于Ampere架構推出了另一款GPU產品NVIDIA A40，與NVIDIA RTX A6000在產品性能和硬件配置方面相差不多，與NVIDIA RTX A6000采用的主動式散熱方案不同，NVIDIA A40采用被動式散熱方案，可以更好地節省空間，提升性能和功耗比，更適合于需要通過管理風道，組建機架式服務器控制功耗、降低噪音，提高管理便利的數據中心場景中。

跨軟件、跨應用程序的在線協作平臺NVIDIA Omniverse

在NVIDIA的GTC 2020秋季發布會上，NVIDIA還宣布了NVIDIA Omniverse平臺進入公測階段，并在2020年秋季開放下載。數千萬設計師、建筑師和其他領域的創作者將能通過該平臺實現本地或遠程實時協作。NVIDIA Omniverse是首個基于NVIDIA RTX的3D仿真模擬和協作平臺。該平臺融合了物理和虛擬世界，能夠實時模擬出細節逼真的現實世界。

作為一個跨軟件、跨應用程序的在線合作式/分享式總體解決方案平臺，用戶僅需利用NVIDIA Omniverse單一平臺就可以完成多個設計師/多個科學家/多個工作人員之間的協同式分布合作。

NVIDIA Omniverse整合了NVIDIA在圖形、仿真和AI領域的眾多技術，例如光線追蹤、毛發、粒子、物理模擬和VR/AR等。可以利用NVIDIA各式各樣的軟件堆疊，包括NVIDIA最重要的物理加速、材質描述庫、MDL語言以及NVIDIA和PhysX合作的USD通用場景描述語言。用戶可以利用平臺存取數據資產讓各式各樣的第三方ISV、軟件專業工具程序進行調用。一切工作都能在NVIDIA Omniverse平臺上實時一鍵分享、合作以及實現協同分布式遠程辦公。

NVIDIA Omniverse還獲得了許多主要的軟件領導者支持，例如 Adobe、Autodesk、Bentley Systems、Robert McNeel & Associates和SideFX等。Blender正在與NVIDIA合作，通過加入USD功能實現Omniverse與其軟件的集成。NVIDIA還與其他領先的軟件供應商合作，讓所有藝術家和設計師都可以在自己選擇的應用上通過Omniverse開展協作。

借助NVIDIA Omniverse平臺，無論用戶使用何種軟件、工具和平臺，都能以NVIDIA Omniverse為入口，完成分發協調工作，并整合工作流程，讓所有用戶、設計師、科學家和工程人員都在同一個NVIDIA Omniverse平臺上完成分工和協作。遠程團隊可以通過該平臺同時開展項目協作，例如負責3D建筑設計迭代的建筑師、修改3D場景的動畫師以及協作開發自動駕駛汽車的工程師，整個協作就像是在線上共同編輯文檔一樣簡單。

NVIDIA在為期一年的搶先體驗計劃之后發布了公測版Omniverse。搶先體驗項目期間，愛立信、Foster +Partners、工業光魔（ILM）和其他40多家公司以及多達400位個人創作者和開發者對該平臺進行了評估并向NVIDIA工程團隊提供了反饋。