英偉達正在利用人工智能讓設計師、游戲開發等人員在短時間內用3D對象進行創作。創作者們能夠使用其提出的英偉達3D MoMa方法對內容進行快速導入、修改和更改材質等工作。
“逆渲染是一種將一系列靜態照片重建為物體或場景3D模型的技術。該技術長期以來對統一計算機視覺和計算機圖形學至關重要。”英偉達圖形研究副總裁大衛·呂布克說,“通過將逆渲染問題的每一部分表述為GPU加速的可微分組件,英偉達3D MoMa渲染管道使用現代人工智能的機制和莫偉達GPU的原始計算能力來快速生成3D對象,創作者可以在現有工具中不受限制地導入、編輯和擴展。”
傳統上,人們創建3D對象會使用攝影測量技術,這涉及的是一個多階段、相當耗時的過程。創作者需要通過大量的軟件工具和手動調整來達到最終期望的3D模型效果。
目前的神經輻射場等技術在生成對象或場景的3D表示方面取得一定優勢,并提供了高質量的新視圖合成。
然而,這些方法通常會產生將幾何圖形、材料和照明糾纏到神經網絡中的表示形式,不能以三角形網格格式生成,因此很難支持場景編輯操作。“三角形網格是用于在3D圖形和建模中定義形狀的基礎框架,是此類3D工具使用的通用語言。”研究者在莫偉達官網博文中寫到。
另外,為了更為實用,3D對象應該適配眾多常用工具,比如,游戲引擎、3D建模器和電影渲染器等。而要在傳統的圖形引擎中使用它們,需要使用諸如標記立方體等方法從網絡中提取幾何圖形,這可能會導致較差的表面質量,特別是在低三角形計數時。神經網絡編碼的材料不能輕易地編輯或提取與傳統游戲引擎兼容的形式。

由靜態圖片制作的虛擬樂隊

從一組多視圖圖像中重建具有未知拓撲結構、空間變化材料和照明的三角形網格
相比之下,本次研究重建了與傳統圖形引擎兼容的3D內容,支持重啟和場景編輯。由此產生的3D模型不需要轉換就可以在任何支持三角形渲染的設備上進行部署,手機和網頁瀏覽器同樣適用。它可以在標準的游戲引擎中不經修改地使用,并對所有階段進行基于梯度的優化。

研究方法概述
該三維重建方法英偉達3D MoMa的相關論文,近日在2022年計算機視覺和模式識別會議上發表,并以《從圖像中提取三角形三維模型、材質和照明》為題提交在arxiv上。

與NeRF、NeRD的對比
研究人員針對各種應用程序來評估他們的系統,對已有對象進行重新編輯和模擬,以展示他們的方法顯式分解為三角形網格和材料,并與神經輻射場、神經反射分解等方法做了比較。
值得一提的是,研究人員還做了一個虛擬樂隊視頻演示,以體現英偉達3D MoMa的強大功能。
首先,他們從不同角度拍攝了約100張樂器圖像,并用新提出的研究方法將這些靜態圖像分別重建為3D表示和三角形網格。
然后,將對象從原始場景中分離出,再導入英偉達 Omniverse 3D平臺編輯。在廣泛使用的圖形引擎中,可輕易地將產生的形狀材料替換為黃金、木材等不同材質,就好像把網格裝扮成不同的裝飾一樣,也能將其放在任意虛擬場景(比如康奈爾盒,一種經典圖形測試)中。

最后證明,不同的虛擬樂器對光有不同反應,跟在現實中幾乎相同。新生成的對象能夠用作復雜畫場景的構建塊。
值得注意的是,研究人員在論文中還表示:“為了加速優化,選擇了簡化的著色模型,也沒有考慮全局照明或陰影。這種選擇是材料提取和回收的限制因素。在未來的工作中,隨著目前在可微路徑跟蹤方面的進展,這一限制有望得到解除。”
總的來說,本研究展示了一種與最先進的視圖合成等技術相媲美的方法,同時還有著優化的三角形網格、兼容傳統圖形引擎和建模工具等優勢,并由渲染模型的外觀驅動來執行端到端優化。
這簡化了進行3D內容創作人員的大量工作流程,極大節省他們的時間和提升效率。該研究方法還可以作為外觀感知轉換器,補充了許多最近的技術。