張文倩
(中北大學(xué) 信息與通信工程學(xué)院, 太原 030051)
隨著計(jì)算機(jī)技術(shù)的迅猛發(fā)展以及機(jī)器學(xué)習(xí)在軍事、工業(yè)、農(nóng)業(yè)等各方面的應(yīng)用,機(jī)器視覺(jué)成為重要的熱點(diǎn)研究課題之一。紋理作為反應(yīng)物體表面粗糙度、方向性和規(guī)則性的一種重要手段,是構(gòu)建機(jī)器視覺(jué)中非常重要的一環(huán),也是其研究的意義所在。目前對(duì)紋理的分析研究已經(jīng)有40多年的歷史,并且在紋理分割、紋理分類(lèi)、紋理合成等領(lǐng)域取得了一定的成果。但因?yàn)榧y理種類(lèi)繁多,其中沒(méi)有一種算法能夠普遍適用于各種不同紋理種類(lèi)的分類(lèi),還需要做進(jìn)一步的工作提高紋理分類(lèi)算法的魯棒性和適用性。本文由圖像的幾何拓?fù)鋵傩猿霭l(fā)研究了統(tǒng)計(jì)幾何特征提取方法,結(jié)合支持向量機(jī)的多分類(lèi)方法在紋理分類(lèi)中取得了較好的成效。
本文對(duì)統(tǒng)計(jì)幾何特征提取方法進(jìn)行了研究,利用圖像函數(shù)圖來(lái)進(jìn)行紋理描述,使用一個(gè)可變的閾值把一幅灰度紋理圖像切割成一系列二進(jìn)制圖像,由二進(jìn)制圖像的連通域、幾何拓?fù)鋵傩酝茖?dǎo)紋理描述特征。實(shí)驗(yàn)結(jié)果表明,統(tǒng)計(jì)幾何特征具有非常強(qiáng)的紋理描述能力,同時(shí)能夠克服圖像的旋轉(zhuǎn),其紋理識(shí)別能力高于常用的灰度共生矩陣、離散小波變換等方法。
統(tǒng)計(jì)幾何特征將一幅大小為nx×ny具有nl灰度級(jí)的圖像表示成一個(gè)二維函數(shù)f(x,y),其中,(x,y) ∈ {0 ,1,… ,nx-1} {0 ,1,… ,nx-1},f(x,y)∈ { 0 ,1,… ,nl-1},f(x,y)是像素點(diǎn)在(x,y)處的灰度值。當(dāng)一幅圖像f(x,y)由一個(gè)閾值α,α∈{1 , … ,nl-1}截取時(shí),便得到一個(gè)二值圖像,即:

其中,fb(x,y,α)是由閾值α得到的二值圖像。
對(duì)于一幅待分割的紋理圖像,可以用不同的α分割,α取值沒(méi)必要是連續(xù)的,可以是間隔幾個(gè)灰度值進(jìn)行取值,這樣由α分割得到的一系列二值圖像的集合稱(chēng)為二進(jìn)制圖像棧。對(duì)于給定大小和灰度級(jí)的一組圖像,如果α的分割是從灰度的最小值到最大值,則構(gòu)成了從圖像空間到二進(jìn)制圖像空間的完全映射如公式(2)所表示,這個(gè)變換沒(méi)有信息損失。在實(shí)際中,為了減少運(yùn)算量,同時(shí)有跨度的α分割亦能包含圖像幾乎全部的信息內(nèi)容,所以采用有選擇的α分割。

在對(duì)二值圖像進(jìn)行連通區(qū)域時(shí),分為對(duì)二值圖像中的1值像素組成的連通區(qū)域的統(tǒng)計(jì)和對(duì)0值像素組成的連通區(qū)域的統(tǒng)計(jì),保證了信息的完整性。在二值圖像fb(x,y,α)中的所有1值像素形成的連通區(qū)域的個(gè)數(shù)和0值像素形成連通區(qū)域的個(gè)數(shù)分別記為NOC1(α)和NOC0(α),連通區(qū)域的標(biāo)記方法如圖(1)所示。顯然,NOC1(α)和NOC0(α)均為α的函數(shù),其中α∈{1 , … ,nl-1}。對(duì)于每個(gè)連通區(qū)域(1值像素或0值像素)該方法提出了一種不規(guī)則的度量方法:

每一幅圖像將對(duì)應(yīng)于一系列的二值圖像(數(shù)量的多少取決于α的取值),每幅二值圖像又對(duì)應(yīng)1值像素構(gòu)成的連通區(qū)域和0值像素構(gòu)成的連通區(qū)域。定義二值圖像fb(x,y,α)的第i個(gè)1值像素(0值像素)形成的連通區(qū)域的不規(guī)則度為IRGL1(i,α) (IRGL0(i,α) )。二值圖像fb(x,y,α)中所有1值像素的連通區(qū)域的不規(guī)則度均值如下定義,0值像素的連通區(qū)域類(lèi)似。

NOP1(i,α)代表二值圖像fb(x,y,α)中第 i個(gè)1值像素大小的連通區(qū)域內(nèi)的像素個(gè)數(shù)。可類(lèi)似定義。
目前共定義4個(gè)α函數(shù),NOC1(α)、NOC0(α)、,每個(gè)函數(shù)可以提取下述4個(gè)統(tǒng)計(jì)量特征:


其中g(shù)(α)分別是這4個(gè)函數(shù)之一。
目前為止,每一個(gè)紋理圖像共得到特征值16個(gè),分別從NOC1(α)、NOC0(α)、這4個(gè)α函數(shù)里面各提取4個(gè)特征值得到。

圖1 連通區(qū)域標(biāo)記法
圖像紋理識(shí)別系統(tǒng)由兩大部分組成,一是有效的紋理特征提取方法,二是高精度的特征分類(lèi)器。實(shí)驗(yàn)紋理庫(kù)中通常包括多種紋理類(lèi)別,以二分類(lèi)為前提的支持向量機(jī)需要進(jìn)行多分類(lèi)算法的研究,才應(yīng)用到本文的分類(lèi)系統(tǒng)中。本文采用RBF函數(shù)作為核函數(shù),采用基于"one-againstone”的“閾值投票法”進(jìn)行多類(lèi)分類(lèi)向量器。一對(duì)一的方法對(duì)N類(lèi)樣本分類(lèi)問(wèn)題的分析需構(gòu)造N(N-1)/2個(gè)分類(lèi)器,即樣本種類(lèi)兩兩都要訓(xùn)練一個(gè)分類(lèi)器。在訓(xùn)練第i類(lèi)樣本和第j類(lèi)樣本之間的二分類(lèi)器時(shí),分別取i類(lèi)和j類(lèi)樣本作為正樣本和負(fù)樣本,它們的向量器表示為(i,j)向量器。以這種方式組合起來(lái)的多分類(lèi)向量器在測(cè)試時(shí),需要將測(cè)試樣本分別輸入到這N(N-1)/2個(gè)向量器中,采用“投票法”決定測(cè)試樣本的最終分類(lèi)結(jié)果。本文將分類(lèi)過(guò)程分為粗分類(lèi)和細(xì)分類(lèi),粗分類(lèi)設(shè)置一個(gè)得票數(shù)閾值,將得票數(shù)大于這個(gè)閾值的樣本類(lèi)別作為細(xì)分類(lèi)的選擇范圍,在細(xì)分類(lèi)中采用二次投票法對(duì)粗分類(lèi)的結(jié)果做精確的判別。二次投票法是利用粗分類(lèi)得到的n個(gè)待選類(lèi)別號(hào),再對(duì)測(cè)試紋理子圖做一次投票選擇,選擇這n個(gè)類(lèi)別得票最多的一個(gè)做為最終的判別結(jié)果。在此過(guò)程中有可能出現(xiàn)n個(gè)類(lèi)別得票數(shù)一樣多的情況,為避免程序陷于循環(huán),我們引入二分類(lèi)器的權(quán)值,當(dāng)出現(xiàn)得票數(shù)一樣的情況時(shí),由待測(cè)子圖在投票中的二分類(lèi)向量器的權(quán)值大小作為判別標(biāo)準(zhǔn)。
根據(jù)公式(1)~(8)計(jì)算每幅圖分別基于4連通和8連通的統(tǒng)計(jì)幾何特征提取方法,獲得特征向量f1和f2。對(duì)于brodatz紋理庫(kù)和rotate紋理庫(kù)基于統(tǒng)計(jì)幾何特征提取方法分類(lèi)結(jié)果如表1所示。其中brodatz紋理置投票法閾值設(shè)為72, rotate紋理庫(kù)投票法閾值設(shè)為16。

表1
分析表1中數(shù)據(jù)可以得到如下結(jié)論:
(a) 在brodatz和rotate紋理庫(kù)中,統(tǒng)計(jì)幾何特征提取方法識(shí)別率較高,表明統(tǒng)計(jì)幾何特征提取方法能夠很好地描述紋理的結(jié)構(gòu)和紋理變化。
(b) rotate紋理庫(kù)和brodatz紋理庫(kù)的四連通統(tǒng)計(jì)幾何特征分類(lèi)性能都高于8連通SGF,說(shuō)明4連通方法能夠更全面的包含紋理圖像的信息。
(c) 統(tǒng)計(jì)幾何特征提取方法在rotate紋理庫(kù)中正確率高達(dá)97.1453%,說(shuō)明統(tǒng)計(jì)幾何特征提取方法本身能克服圖像所旋轉(zhuǎn)帶來(lái)的影響。
統(tǒng)計(jì)幾何特征提取方法在對(duì)brodatz和rotate紋理庫(kù)測(cè)試中,都能夠得到較高的識(shí)別率,可作為其它紋理庫(kù)分析的首選方法。本文的研究工作取得了初步進(jìn)展,提供了一定理論基礎(chǔ)。然而,限于時(shí)間和能力,還有很多方面需要進(jìn)一步研究。設(shè)計(jì)和研究更高效率、更具有推廣能力的支持向量機(jī)是今后工作的重點(diǎn),尤其在降低訓(xùn)練時(shí)間和減少向量機(jī)復(fù)雜度和多分類(lèi)算法的研究上需要更多的努力。
[1]德偉,蒲曉蓉,章毅.基于Max-tree的連通區(qū)域標(biāo)記新算法[J].計(jì)算機(jī)應(yīng)用研究,2006.
[2]劉賢喜,李邦明,蘇慶堂,等.一種新的二值圖像連通區(qū)域準(zhǔn)確標(biāo)記算法[J].計(jì)算機(jī)工程與應(yīng)用,2007,43(22).
[3]李伯宇.圖像紋理分析及分類(lèi)方法研究[D].上海:復(fù)旦大學(xué),2007:17-27.
[4]A. Mathur ,G. M. Foody. Multiclass and Binary SVM Classification:Implications for Training and Classification Users[J].IEEE GEOSCIENCE AND REMOTESENSING LETTERS,2008,5(2).
[5]Fabio Aio1li,Alessandro Sperduti. Multiclass Classification with Multi-Prototype Support Vector Machines[J].Journal of Machine Learning Research,2005:817-850.
[6]Xiaojing Yuan,Zhenyu Yang,Nizar Mullani. SVM-based Texture Classification and Application to Early Melanoma Detection[J].Proceedings of the 28th IEEE EMBS Annual international Conference.Aug 30-Sept 3,2006.
[7]A.Mathur,GM.Foody.Multiclass and Binary SVM Classification:Implications for Training and Classification Users[J].IEEE Geoscience and Remote Sensing Lettters,2008,5(2).
[8]劉浩一,劉明霞,孟祥.自然紋理分類(lèi)與識(shí)別方法初探[J].微電子學(xué)與計(jì)算機(jī),2006,23(8):153-155.
[9]謝菲.圖像紋理特征的提取和圖像分類(lèi)系統(tǒng)研究及實(shí)現(xiàn)[J].CNKI: CDMD:2.2009.