翟紫伶
摘要:基于圖像的三維建模占建模領域很大的比重,如果可以全面地掌握基于圖像建模的特點及其關鍵技術,則可幫助該領域的技術人員更高效準確地尋找到技術改進點。對該領域專利分析課題的研究,可為基于圖像的三維建模提供關鍵技術和理論支撐,推動基于圖像建模相關技術的商業應用和推廣,具有重要的學術意義和應用價值。
關鍵詞:圖像;三維建模;特征點;標定;專利申請
1.引言
對于計算機而言,其所能夠直接獲取到的數據源僅為二維平面圖像,相對于真實的三維景物無疑會存在著一定程度的信息丟失,因此利用二維圖像來重建三維物體便不可避免的成為一個重點問題。在實際工作中采用對同一物體從不同的角度分別成像,進而對這些數據進行分析、綜合來恢復出被攝物體的三維信息。
基于圖像的建模分為主動法和被動法兩種。其中,利用主動式重建算法中可以通過硬件實時獲取場景深度的優勢。被動式單目重建算法雖然流程復雜、運行時間長,但其擴展性高、成本低、不易受環境光的干擾、應用場景多,因此深受研究人員的青睞。
2.圖像三維建模技術
2.1 基于輪廓法的三維建模技術
基于輪廓的三維建模主要是通過分析物體多視角下的輪廓圖像或者物體的側影輪廓線,從而得到物體的三維模型。輪廓線法是Keppel提出的采用三角面片覆蓋物體表面,且這些三角面片所圍成的體積為最大的方法。之后又出現了諸如基于最小周長、最小對角線等各種改進的輪廓線法。總體的思路就是將每層圖像的輪廓提取出來,然后采用以輪廓線點為頂點的三角面片進行連接。
通過檢索現有專利分析可知,基于輪廓的三維建模技術主要發展在于輪廓的獲取。輪廓作為三維模型的一個重要特征,一直是公司、學校等相關人員的研究重點,其主要發展方向為:直接基于點云數據進行輪廓提取、基于圖像的特征點進行輪廓提取以及手動輸入輪廓信息。
由于輪廓信息相對圖像中其他線索信息而言,是一種明確、不含二義性的信息形式,這使得輪廓法具有建模速度快、魯棒性高的優勢。并且,由于其數據的取值范圍只有2種(屬于前景區域或背景區域),因此,計算復雜性較低。輪廓法是所有建模方法中效率最高的,也是唯一能夠滿足實時需求的建模方法。由于幾乎所有物體在圖像中都包含明確、清楚的輪廓信息,使得輪廓法可以應用于透明、特征點較少、紋理欠缺等其他方法難以處理的物體的建模,具有較高的通用性。輪廓法的缺點是其需要的輸入數據源較苛刻、建模精度較低。
2.2 基于亮度法的三維建模技術
基于亮度的建模是通過分析物體多個視角下圖像中亮度特征的一致性關系,恢復出其表面的深度信息,并得到其三維幾何模型。基于亮度的三維建模可分為正向法和逆向法,正向法對物體所在的三維空間進行均勻采樣,將各采樣點投影到所有二維圖像中,如果其滿足亮度一致性,則說明該三維點屬于物體表面,將其保留,否則,將其剔除,而逆向法則是搜索滿足亮度一致性的匹配點,使用立體視覺的三角測量原理,由這些特征點反算其對應的三維點位置。
亮度法的優勢是可以幾乎全自動地得到較高的建模精度。由于亮度信息是圖像中最豐富、包含數據量最大的信息形式,這使得可以通過計算亮度在不同圖像之間的匹配性,精確地計算物體表面每個點的深度值,這使得其可以更好地表現出物體表面的幾何細節。對于一些滿足亮度法假設的物體,現有的方法已可達到與三維掃描儀相近的建模精度。并且,亮度法沒有嚴格的光照條件要求,也沒有圖像分割、改變焦距等手工交互,這使得該方法能滿足全自動的要求。
亮度法要求物體基本滿足朗伯表面的假設,這使得其無法應用于重建透明、金屬、瓷器等包含大量高光、反射信息的物體。缺少表面紋理變化、重復的表面紋理會增加亮度匹配的誤匹配率,使得該方法的魯棒性與靈活性較低。由于在亮度匹配的計算過程中,需要使用數值優化算法,使得該方法計算復雜性較高,無法滿足實時需求.而且精確的相機定標要求使其應用受限。但由于亮度法能夠得到很高的建模精度,使得這種方法廣泛應用于文物數字化、人臉自動建模等對精度要求較高的場合。
2.3 基于運動法的三維建模技術
基于運動的建模通過在2幅或多幅未定標圖像中檢測匹配的特征點集,使用數值方法,同時恢復出相機運動參數與場景幾何,并得到物體三維模型。運動法首先在圖像中尋找匹配特征點,以恢復出相鄰圖像間相機的位姿關系。首先獲取匹配特征點檢測算子,這些算子能從圖像中得到大量的候選匹配點,由于其中存在大量的誤匹配,可以對這些匹配點進行精化,得到少量精確的匹配點,并從中恢復出相機的運動參數與特征點的三維坐標。
運動法的優勢是不需預先標定相機的參數,從而降低了對圖像采集過程的限制,這使得該方法的輸入源并不局限在為建模而專門采集的圖像序列,還可使用已有的隨意拍攝的圖像序列,甚至視頻序列進行三維建模。同時,由于運動法的基礎是特征點匹配技術,而該技術是計算機視覺領域的重要熱點技術,隨著魯棒的特征點匹配算子的出現。使得運動法對于光照條件、圖像噪聲等也具有了極強的魯棒性。并且,運動法獨有的分層次重建特性可以分開獨立進行,可控性較高。
然而,由于運動法計算的僅是所有匹配特征點的三維坐標,而特征點信息在圖像中含量通常較少,只是對物體表面三維幾何的稀疏逼近,因此運動法的建模精度較低,通常應用于對物體結構的感知,因此被較多應用于室外場景、自然景觀、建筑物等的三維建模。
通過上述專利分析可知,基于運動的三維建模技術主要發展在于輪廓的特征點的匹配。特征點的匹配三維建模的一個重要過程,一直是學校等相關人員的研究重點。
3. 小結
基于如上的分析過程可以看出,無論從圖像三維建模的任一技術分支來看,在經歷了從20世紀90年代末到21世紀初之間的從無到有、從萌芽到飛速發展的階段之后,這些技術都逐漸走向成熟,而協同機器學習技術將是未來圖像三維建模的重點發展方向。與此對應,國內的相關專利申請隨著近幾年相關技術的快速發展而呈現勢頭較猛的追趕趨勢,越來越多的企業及高校和研究所在基于圖像的三維建模的研究上投入了大量的精力,也獲得了豐碩的研究成果,國內的專利申請數量有了較大幅度的提升,但是國內專利申請的質量方面仍有很大提升空間。
參考文獻
[1]鄧春新,基于圖形圖像的三維建模技術研究,工業設計[J],2017.11.20
[2]董鵬輝 等,基于圖像的三維重建技術綜述,無線電通信技術[J],2019.02.28