摘要:提出了對稀疏紋理表面特征的新描述方法,并進行了紋理分類的研究。以往對紋理的研究大多是對2D紋理的研究,一般是通過大量的訓練樣本來完成紋理特征的提取。通過RANSAC估計兩幅紋理的單應約束,提取兩幅紋理的對應點,不僅可以提取一般紋理的特征,而且可以提取包含立體信息的紋理特征(如因為光照和視點的變化引起立體紋理的陰影變化等),通過對應點的提取使得不再需要大量的訓練樣本來進行紋理的特征提取。實驗表明該算法可以較準確和快速地進行紋理特征提取和分類,使得紋理分類工作變得有較強的可行性和實用性。
關鍵詞:紋理分類;特征提??;稀疏紋理
中圖分類號:TP181;TP391.41文獻標志碼:A
文章編號:1001—3695(2007)03—0306—03
關于紋理分類的研究已有四十多年的歷史了,可以追溯到1962年Julesz對紋理的研究。關于紋理研究存在的技術有:聯合統計的方法[1]、運用濾波器庫的方法[1,2]和自由域的方法[3]。但是這些方法對研究的紋理都有限制,如對紋理的觀測視角、光照條件和旋轉情況都有限制。以往的方法一般都是對2D紋理的研究,只有很少的方法是基于3D紋理考慮的[4,5]。這些基于3D紋理考慮的方法用的是提取同種紋理不同視角的共同部分作為紋理的3D表示和運用立體視覺重構紋理的深度來對3D紋理進行研究。但是,這些方法均有它自身的局限性,也不能廣泛地應用于大多數紋理。對于不同視角的2D紋理來提取3D的情況,隨著視角的復雜使得計算量增大,以致不能實現[1]。本文基于上面對紋理的研究所出現的問題,結合文獻[2]中的對紋理特征的提取,建立了良好的紋理特征描述和分類系統。該方法由下面幾個部分組成:①通過Harris角點檢測器獲得兩幅紋理各自的興趣點;②用RANSAC自動估計兩幅圖像之間的單應;③紋理的相似性度量,并進行紋理分類。
1紋理特征的提取
紋理特征是一種不依賴于顏色或亮度且反映相同紋理現象的視覺特征。常用的紋理特征主要有Tamura紋理特征、自回歸紋理模型、方向性特征、小波變換和共生矩陣等形式。本文應用的是基于同類紋理的單應來考慮紋理的特征。
本章描述兩幅圖像之間的單應算法。算法的輸入就是圖像,不需要其他先驗信息;而輸出是單應的估計以及有興趣的對應點集。
首先計算每一圖像中有興趣的點,實驗中興趣點用Harris角點檢測器獲得。該算法歸納在算法1中,并在圖1和圖2給出應用的例子。
算法1用RANSCA自動估計兩幅圖像之間的單應
(1)有興趣點。在每一幅圖像中計算有興趣點,實驗用的是Harris角點。
(2)假設對應。根據有興趣點灰度鄰域的接近和相似計算它們的匹配集。
(3)RANSAC魯棒估計。重復N次采樣,這里N按算法2用自適應性方法確定:
①選擇四組對應組成的一個隨機樣本并計算單應H;
②對每一假設的對應,計算距離d⊥;
③根據d⊥ 選擇具有最大內點數的H。在數目相等時選擇內點的標準方差最低的H。 (4)最優估計。由劃定為內點的所有對應重新估計H,其中用Levenberg-Marquardt算法來最小化ML代價函數。 (5)引導匹配。用估計的H去定義變換點位置附近的搜索區域,進一步確定有興趣點的對應。 最后兩步可以重復直到對應的數目穩定為止。 1.1確定假設對應 算法的目標是在不知道單應條件下提供初始的點對應集。這些對應的大部分應該是正確的,但算法的目標并不是完全匹配,此后用RANSCA可消除錯配。這些假設對應由在每一幅圖像中獨立地檢測興趣點獲得,然后用鄰域灰度的近似度和相似度的組合來匹配這些有趣 1.2用RANSAC求單應 把RANSAC算法應用于假設對應集,以求得估計單應和與此估計相一致的(內點)對應。樣本大小是四,因為四組對應確定一個單應。采樣次數由每個一致集中閾值所占比例而適應性地設置,如算法2所描述。 (2)樣本選擇。這里有兩個議題:①退化的樣本應該丟棄,例如,如果四點中的三點共線那么單應就得不到。②組成樣本的點應該在整個圖像上有合理的空間分布。這是由于外插問題的緣故——在計算點所跨越的區域內被估計的單應將準確地映射,但一般地,準確性將隨著該區域距離加大而變壞(想象四點位于圖像四個拐角的情形)。空間分布的采樣可以這樣來實施:劃分圖像并通過隨機采樣的適當加權來保證屬于不同小區的點比同屬于一個小區的點有較大可能性進入樣本。 1.3魯棒ML估計與引導匹配 這一步的目標是雙重的:①通過使用所有估計得到的內點(而不僅僅用樣本的四點)來改進對單應的估計。②由假設對應集獲得更多的內點匹配,因為有了更準確的單應;通過最小化ML代價函數從內點中計算進一步改進的單應估計。它可以用兩種方法來實現:一種方法是在內點上執行一個ML估計,然后用新的估計H重計算內點,并且重復這一循環直到內點數目收斂;另一種方法是采用魯棒ML代價函數同時估計單應和內點。估計單應和內點的方法的缺點是在最小化代價函數的計算方面要花很大功夫(單應算法文獻[6]中有更詳細的介紹)。 2兩幅紋理圖片的相似性度量 關于紋理的典型說法是紋理是小塊圖案的空間排列(如棋盤是小方塊的一種排列,而草場的紋理是細條的一種排列),即紋理是重復地按一定的規則排列的圖像。尋找這些子圖案的通常策略是對圖像應用線性濾波器[2],這種濾波器的核看上去很像圖案的基本元素。從濾波器理論看,濾波器的強烈響應說明這里有特定的圖案呈現??梢詰貌煌N類的濾波器,根據在不同位置的響應統計把圖像分解成斑點區域和條形區域等。首先可能想到的紋理描述是濾波器響應的直方圖,這種機制十分成功地應用于伯克利Calphotos集合中(http://elib.cs.berkeley.edu/photos)。但這種方法分類精度不是太高,如果用于本文的分類算法中,不能顯示出配準后的圖像對分類的貢獻非常大。而信號譜描述方法比直方圖有更好的魯棒性和可描述性,特別是在高維的情況下信號譜描述有顯著優勢。本文采用如圖3中單應的局部小區域的信號譜的相似性來進行紋理分類。 2.1旋轉不變量的描述 旋轉不變量的描述是旋轉不變量的特征變換(RIFT)描述,它是由Lowe的基于刻度不變量的特征變換(SIFT)發展過來的。原來的SIFT很好地應用在恢復紋理窗口中,但并不能把它直接應用在這里,為了獲得對于單應的局部小區域的完整描述,添加了RIFT。RIFT的構成如下:將局部小區域分成同圓心、相同寬度的幾個圓環,然后對于每一個圓環計算其梯度方向的直方圖(圖4)。每一點觀測的方向是依賴于從圓心指向該點的方向。實驗中使用了四個圓環、八個方向直方圖的32維的描述。注意上面所講的RIFT描述實際上顛倒了在方向直方圖中的方向次序,但在工作中并不用關心這些情況,因為實際給出的圖像條件并不包括顛倒紋理表面的方向的圖像。 3實驗結果評價 實驗使用的是筆者制作的紋理集,每一類紋理在不同的視角和光照條件下有50幅圖片,紋理共有10類。圖5(a)—(j)為這10類的分類準確度的結果。 4結束語 本文提出的對于稀疏紋理描述的3D研究可以很好地對紋理特征進行描述,使得對稀疏紋理的分類精度很高,并且不再需要大量的訓練集,也使得算法的速度比以往的相關算法速度高很多,使得紋理的分類工作可行性大大提高。 本文中所涉及到的圖表、注解、公式等內容請以PDF格式閱讀原文。