摘要:將基于視圖描述的形狀特征和3D Zernike矩兩種特征應用于三維模型檢索,并且根據用戶反饋在輸出層進行融合。實驗表明,采用混合形狀特征在提高檢索準確率的同時,也能保證檢索效率。
關鍵詞:三維模型檢索; 用戶反饋; 混合形狀特征
中圖分類號:TP391.41文獻標志碼:A
文章編號:1001—3695(2007)03—0221—02
三維模型作為一種新的媒體,其應用越來越廣泛。因此,怎樣有效管理三維模型以及檢索三維模型就成為現實的迫切需求。雖然基于文本的檢索技術非常成熟,應用也很廣泛,但其不適合于三維模型檢索[1]。因此,三維模型檢索技術的研究工作主要集中在基于內容的檢索技術上。基于內容的三維模型檢索技術的研究重點是三維模型的特征提取、特征描述和特征比較。
形狀特征主要包括基于幾何結構分析的形狀特征、基于拓撲關系的形狀特征、基于函數投影的形狀特征和基于統計特性的形狀特征。任何一種形狀特征都有其優點,但同時又有其缺點。迄今為止,還沒有任何一種表示方式可以完全符合人類對形狀的識別和理解能力[2]。所以采用單一特征很難保證檢索系統對于任意模型都有很好的檢索準確率。集成不同的形狀特征可以使它們優勢互補,能夠更好地描述三維模型特征。因此采用混合特征是提高檢索準確率的有效方法。
把多特征描述應用于多媒體信息檢索,已有的文獻主要集中在圖像檢索。對于一幅圖像,這種多特征描述算法的一個共同特點是把提取的顏色、形狀等特征進行歸一化后合成一個向量描述,即在特征層進行融合。在模式識別領域,研究人員發現輸出層融合往往可以得到更好的識別結果[3]。在這種融合方式中,首先單獨采用每一類特征進行檢索,然后對檢索結果進行綜合。Hsieh等人[4]借鑒了模式識別中多分類器集成的思想[5],采用不同的集成規則,如和、乘積以及最大值用于圖像和商標檢索。但是作者并沒有考慮到不同特征對輸入模型所具有的檢索性能是不一樣的。
1基于混合形狀特征的三維模型檢索技術
恰當選擇多個不同的形狀特征形成混合特征,然后在三維模型檢索中使用混合特征。本章使用二維的視圖特征和三維的Zernike矩。
1.1視圖特征
二維視圖(或側影輪廓)包含了豐富的信息,可以用于三維模型形狀描述。視圖(View)描述從不同視點得到三維模型的二維視圖,從而把三維模型的匹配轉換成一系列二維形狀的匹配。這種分析方法,可以把很多二維形狀描述符直接應用于三維形狀內容的理解。并且,這種方法可以創建二維草圖用于三維模型查詢[6]。為了盡可能避免三維空間信息的丟失,通常對一個三維模型從多視點進行投影,得到多個二維視圖來描述三維形狀信息。MPEG—7中的視圖描述就從三個主方向提取視圖特征,如圖1所示。
對于視圖特征提取,首先對三維模型采用PCA進行姿態調整,然后得到三個主方向上的視圖,視圖分辨率為64×64。對每個視圖提取30個二維Zernike矩特征,形成90維視圖特征。
1.23D Zernike矩
Canterakis的工作[7]是在三維空間中定義Zernike矩。Novotni把3D Zernike矩應用于模型檢索[8],具體特征提取步驟如下:
1.3基于用戶反饋的多特征集成
在采用多特征進行模型檢索時,對用戶給定的輸入查詢,不同特征所表現出來的檢索性能是有差異的。需要對不同特征描述所得到的相似度分配不同的權重用于度量其檢索性能。設采用多特征描述的總相似度Simi可以采用加權和來表示:
這里pj表示對當前用戶提交的查詢實例每一種特征所具有的權重。在動態聯合中,數據庫中每個模型所具有的權值是決定最終檢索性能的一個關鍵因素。對于初始化權值,可以采用一個訓練數據庫來得到。但是在實際的檢索系統中,數據庫中的模型會不斷增加。采用訓練數據庫難以設定一個合理的權值。對于檢索系統,其主要特點是交互式。用戶可以對系統返回的檢索結果進行評價。而系統通過用戶的評價可以對檢索結果進行優化。這也是信息檢索中一個非常重要的概念:反饋。而用戶對檢索結果的評價,就類似于一個小型的訓練數據庫。因此,可以通過用戶評價分析不同特征對當前輸入模型所表現出來的檢索性能,從而完成權值的實時更新。權值更新采用Rui[9]提出的算法。
把歸一化后得到的權值寫入數據庫,從而完成權值的更新。這些權值將在下一次檢索中被使用。對于用戶反饋,它有一個收斂的過程。也就是說,當檢索準確率達到一定精度時,即使用戶再執行反饋操作,由于特征描述本身的特性,檢索性能將不再發生變化。
2系統實現和實驗結果
2.1系統實現
結合提出的檢索技術,本文開發了C/S結構的三維模型檢索系統,分為用戶接口、形狀特征提取和查詢匹配等模塊。其中用戶接口使用了文本、草圖以及查詢例子;其次,用戶可以對查詢結果進行評價,而系統根據用戶評價反饋對結果進行優化;形狀特征采用了第1.3節的混合特征,在輸出層進行融合。系統界面如圖2所示。
2.2實驗結果
對于用戶反饋,隨著反饋次數的增加,對于不同特征的權值設置慢慢趨于合理。到達一定程度時,權值會趨于一個穩定分布,其表現出來的特點是檢索性能也將收斂。在初始化過程中,每種特征的權值設置為相同,都等于0.5。這相當于采用基本的和規則進行多特征集成。實驗發現,通過四到五次迭代,其檢索性能將不再發生變化。
在圖3中給出了檢索實例。每行的第一個模型為用戶提交的查詢模型。第一行代表采用視圖特征得到的檢索結果;第二行代表采用三維Zernike矩得到的檢索結果;而第三行是采用多特征描述并經反饋收斂得到的檢索結果。實驗得到的查全率和查準率曲線如圖4所示。
可以發現,基于用戶反饋的權值更新方案可以保證得到的檢索性能要優于單一特征描述。
3小結
隨著三維模型的廣泛應用和網絡發展,基于內容的三維模型檢索技術具有很大的研究價值和應用前景。在本文中討論了如何采用混合特征來提高檢索性能,提出采用用戶反饋得到最優參數設置。實驗表明,集成多種特征是提高檢索準確率的有效方法。但是,目前筆者的研究只是針對形狀特征的集成。對于三維檢索的一些具體應用領域,如CAD模型檢索,這些模型不僅需要形狀特征來判斷其相似性,同時用戶也關心一些高層語義特征,如產品功能以及其他CAD模型所特有的知識信息。如何把這些知識信息進行量化,集成到檢索系統中,是混合特征描述下一步要解決的重點研究問題。
本文中所涉及到的圖表、注解、公式等內容請以PDF格式閱讀原文。