摘要:針對圖像紋理分類問題,提出了一種將二元樹復(fù)小波變換與支持向量機相結(jié)合的分類方法,通過二元樹復(fù)小波變換對紋理圖像進行四層分解,提取各子頻帶小波系數(shù)模的均值和標(biāo)準(zhǔn)方差組成特征向量,利用支持向量機作為分類器實現(xiàn)紋理圖像分類。對20類Brodatz紋理圖像的分類實驗表明,提出的方法具有較高的分類精度,在有限訓(xùn)練樣本的情況下比傳統(tǒng)的分類算法平均正確率有10% 左右的提高,體現(xiàn)了該方法的有效性和良好的泛化能力。
關(guān)鍵詞:小波變換;二元樹復(fù)小波變換;特征提取;支持向量機;紋理分類
中圖分類號:TP391文獻標(biāo)志碼:A
文章編號:1001-3695(2008)05-1573-03
紋理是表現(xiàn)圖像內(nèi)容的基本視覺特征之一,描述了圖像或圖像區(qū)域所對應(yīng)景物的表面性質(zhì),包含了物體表面結(jié)構(gòu)組織排列的重要信息以及它們與周圍環(huán)境的聯(lián)系[1]。紋理特征在模式識別和計算機視覺研究中具有十分重要的意義,出現(xiàn)了一大批卓有成效的紋理特征提取方法。Tuceryan等人[2]將這些方法分為四類,即統(tǒng)計法[1]、模型法[3,4]、頻譜法[5,6]和結(jié)構(gòu)法[7]。1999年Randen等人[8]對常用的紋理特征提取方法進行了相對系統(tǒng)和全面的分析比較,結(jié)論是沒有哪種方法在所有測試圖像中均優(yōu)于其他方法,但發(fā)現(xiàn)頻譜法在大多數(shù)圖像中取得了最高的準(zhǔn)確性,顯示了頻譜法技術(shù)的實用性和巨大的應(yīng)用潛力。
20世紀(jì)90年代初隨著小波變換的引入以及其理論框架的建立,許多研究者開始將小波變換用于紋理特征表達。目前普遍使用的基于小波分析的紋理特征提取方法中,Gabor濾波器法取得了不錯的應(yīng)用效果,但存在計算復(fù)雜度高、特征提取時間長的缺點。傳統(tǒng)的離散小波變換主要存在缺少平移不變性和濾波器方向選擇性有限兩個缺點。而Kingsbury[9]提出的二元樹復(fù)小波變換(dual-tree complex wavelets transform,DT-CWT)是一種具有近似的平移不變性、良好的方向選擇性、有限的數(shù)據(jù)冗余和高效的計算效率的小波變換形式,比傳統(tǒng)的小波變換更好地描述了圖像的方向信息,從而能夠有效地提取圖像各個方向上的紋理特征。在圖像的紋理分類和分割中,選擇合適的紋理分類器是一個十分關(guān)鍵的環(huán)節(jié)。目前有很多分類器在不同的領(lǐng)域得到成功應(yīng)用,常用的主要有最近鄰分類器[10]、Fisher線性判別分類器[11]、神經(jīng)網(wǎng)絡(luò)[12]、貝葉斯分類器[13]、支持向量機[14,15]等。而綜合SVM和頻譜法提取圖像特征的紋理分類研究還相對較少,研究的深度和廣度都需要進一步加強。在類似的研究成果中,Kim等人[16]繞過了紋理特征提取步驟,利用圖像灰度信息通過SVM實現(xiàn)圖像紋理分類,實驗中大部分圖像的分類錯誤率達15%~20%。Li等人[17]利用離散小波框架變換(DWFT)和多類SVM對30種單紋理圖像進行了分類實驗,平均分類正確率達到96.34%,但是DWFT的計算復(fù)雜度較高,并且沒有考慮圖像的平移、旋轉(zhuǎn)和多紋理圖像對SVM分類精度的影響等問題。
1二元樹復(fù)小波變換
二元樹復(fù)小波變換(DT-CWT)在保留了復(fù)小波變換諸多優(yōu)良特性的同時, 通過采用二元樹濾波的形式, 保證了完全重構(gòu)性[18]。如果僅僅從完全重構(gòu)這個角度來看, 二元樹復(fù)小波變換與常規(guī)的復(fù)小波變換完全不同, 但是, 如果將兩棵小波樹的輸出分別解釋為經(jīng)由復(fù)小波變換而得到的實部和虛部的系數(shù)時, 這種變換就可以被看做是復(fù)小波變換了。如果二元樹復(fù)小波變換中的濾波器取自于能夠保證完全重構(gòu)性的、線性相位的雙正交濾波器組, 并且保證奇數(shù)長的高通濾波器關(guān)于其采樣序列的中點偶對稱, 而偶數(shù)長的高通濾波器關(guān)于其采樣序列的中點奇對稱, 那么, 由二元樹復(fù)小波變換得到的沖激響應(yīng)將與復(fù)小波變換得到的實部和虛部看起來十分近似[19]。DT-CWT不僅保持了傳統(tǒng)小波變換良好的時頻局部化的分析能力, 而且還具有近似的平移不變性、良好的方向分析能力,因為它可以區(qū)分頻域空間的各個不同部分, 將產(chǎn)生6個方向的復(fù)系數(shù)帶通子圖, 它們分別明確地指向±15°、±45°和±75°方向, 如圖1(a)和1(b)所示。
3算法實現(xiàn)
本文的分類算法主要包括數(shù)據(jù)準(zhǔn)備、特征提取和分類器設(shè)計三個步驟,特征提取算法通過MATLAB實現(xiàn),分類器采用臺灣大學(xué)林智仁等開發(fā)的支持多類分類的BSVM 軟件[20]。
3.1實驗數(shù)據(jù)
在實驗中,從Brodatz 圖像數(shù)據(jù)庫中選擇了20 幅自然紋理圖像作為實驗數(shù)據(jù),如圖 3所示。每幅原始紋理圖像為640×640大小的256級灰度圖像,按5×5將每幅圖像不重疊分割為25塊128×128 像素大小的圖像塊,并認為來自于同一幅原圖像的圖像塊為同一類別。這樣就生成了包含20個類別共有500 幅紋理圖像塊組成的實驗數(shù)據(jù)集。
3.2特征提取
本文采用Manjunath等人[21]的方法,以復(fù)小波系模的一階統(tǒng)計矩(均值和標(biāo)準(zhǔn)方差) 作為提取的紋理特征。利用二元樹復(fù)小波變換對每幅128×128 像素大小的圖像塊進行四層小波分解,然后分別提取每層高頻通道和低頻通道小波變換系數(shù)模的一階統(tǒng)計矩特征參數(shù),由這些參數(shù)組成紋理特征向量。這樣,通過計算分解后的每層低頻通道小波系數(shù)的均值和標(biāo)準(zhǔn)方差,得到8個特征值,生成8維特征向量(μ1,σ1,μ2,σ2,μ3,σ3,μ4,σ4);對于每層高頻通道分別計算6個方向小波系數(shù)模的均值和標(biāo)準(zhǔn)方差,組成48維特征向量(μ11,σ11,…,μ46,σ46)。
3.3SVM分類器
SVM軟件BSVM 2.06支持多種核函數(shù)及參數(shù)設(shè)置的分類模式。不同核函數(shù)及其參數(shù)選擇對SVM的分類精度有一定的影響,本實驗首先對線性、多項式、徑向基和Sigmoid核函數(shù)進行了分類精度測試,結(jié)果發(fā)現(xiàn)徑向基核函數(shù)的分類準(zhǔn)確度最高,Sigmoid核函數(shù)效果最差,所以,本文后面實驗均采用徑向基核函數(shù)進行分類測試。然后對徑向基核函數(shù)的懲罰參數(shù)C和σ也進行了精度測試,在利用低頻通道的特征向量分類時,發(fā)現(xiàn)懲罰參數(shù)C=1 000,σ=0.01時達到最高的平均分類準(zhǔn)確度68.60%;而利用高頻通道的特征向量分類時,在懲罰參數(shù)C=1 000,σ=0.02時最高平均準(zhǔn)確度達到89.80%,本文所有實驗結(jié)果全部采用上述參數(shù)設(shè)置得到。
4實驗結(jié)果
利用MATLAB實現(xiàn)了DT-CWT的子頻帶分解和特征提取,分別生成表示高低頻帶的特征向量。實驗分別利用低頻通道特征向量和高頻通道特征向量進行了分類實驗。支持向量機分類器采用徑向基核函數(shù)。利用低頻通道特征向量分類時的懲罰參數(shù)C=1 000,σ=0.01,高頻通道的懲罰參數(shù)C=1 000,σ=0.02。每類紋理圖像的訓(xùn)練樣本數(shù)等于3,測試樣本數(shù)為25,并對每類圖像的分類精度和平均精度進行了統(tǒng)計,并與文獻[24]中的Gabor小波變換、金字塔結(jié)構(gòu)小波變換(PWT)、樹結(jié)構(gòu)小波變換(TWT)、多通道自回歸紋理模型方法(MASAR)對同類圖像的分類結(jié)果進行了比較,結(jié)果如表1所示。圖 4給出了Gabor、TWT和本文的DT-CWT對20類紋理圖像的分類正確率比較結(jié)果。
從表1可以看出,采用本文的DT-CWT的高頻特征進行分類的準(zhǔn)確率要高于其他方法10%~20%,但利用其低頻特征向量分類結(jié)果最差,只有68%左右,說明DT-CWT的高頻子帶包含了豐富的邊緣、方向和細節(jié)信息。而低頻子帶只含有圖像的近似信息,利用這些信息很難區(qū)分一些內(nèi)容非常相似的紋理圖像。但是,從中也發(fā)現(xiàn)DT-CWT對一些方向性不明顯的圖像的分類精度也非常低,特別是對D5和D23的正確率只有48%、32%,明顯低于其他方法。原因是D5和D23的圖像內(nèi)容非常雜亂,D5和D28、D29的內(nèi)容特征十分相似,都沒有明顯的方向性和邊緣信息,D5大部分被錯分為D28和D29,導(dǎo)致過高的分類錯誤率。D23和D22從圖像內(nèi)容看,好像不是很相似,但是兩者的紋理結(jié)構(gòu)和紋理方向極其相似,D23主要被錯分為D22,因為訓(xùn)練樣本是隨機選擇,實驗發(fā)現(xiàn)通過選擇不同的訓(xùn)練樣本可一定程度地提高D23和D22的區(qū)分能力。本實驗每類圖像只使用了3個訓(xùn)練樣本,對不同數(shù)量的訓(xùn)練樣本對分類精度的影響,本文也作了初步測試,發(fā)現(xiàn)隨著訓(xùn)練樣本數(shù)量的增加,SVM的分類精度有明顯地提高,當(dāng)使用5個訓(xùn)練樣本時,分類精度可達到96.68%左右,可見,SVM具有非常強的學(xué)習(xí)和推廣能力。
5結(jié)束語
通過前面的理論分析和綜合二元樹復(fù)小波變換與SVM對紋理圖像的分類實驗得出,集成小波變換特征提取和SVM分類器的方法,不僅對紋理圖像分類有效,對基于形狀的圖像分類、基于內(nèi)容的圖像檢索、目標(biāo)識別等領(lǐng)域也是一條可借鑒的有效途徑。本文只對二元樹復(fù)小波變換的四層分解小波系數(shù)進行了特征提取,分別利用高頻和低頻通道的特征向量實施了分類實驗,并沒有對綜合上述兩種特征的分類進行測試。本文對20類紋理圖像進行了分類,得到的測試結(jié)果有必要在大數(shù)據(jù)量、多類別紋理圖像環(huán)境進行進一步的驗證。下一步的工作將對二元樹復(fù)小波變換不同層數(shù)分解提取的特征向量對SVM分類精度的影響進行驗證,同時,將綜合利用高頻和低頻通道特征向量,通過支持向量機進行分類實驗。
參考文獻:
[1]HARALICK R, SHANMUGAM K, DINSTEIN I. Texture features for image classification[J]. IEEE TransSystems Man Cybernet,1973,3(6):610-621.
[2]TUCERYAN M, JAIN A K. Texture analysis[C]//CHEN C H,PAU L F,WANG P S P.Proc of Handbook Pattern Recognition and Compu-ter Vision.Singapore:World Scientic, 1993:235-276.
[3]CROSS G C, JAIN A K. Markov random field texture models[J].IEEE Trans Pattern Recogniton and Machine Intelligent,1983,5(1):25-39.
[4]KELLER J M, CHEN S. Texture description and segmentation through fractal geometry[J].Computer Vision, Graphics and Ima-ge Processing,1989,45(2):150-166.
[5]JAIN A K, FARROKHNIA F. Unsupervised texture segmentation using Gabor filters[J]. Pattern Recognition,1991,24(12):1167-1186.
[6]MALLAT S G. A theory for multiresolution signal decomposition: the wavelet representation[J].IEEE Trans on Pattern Anal Mach Intell,1989,11(7): 674-693.
[7]TUCERYAN M, JAIN A K. Texture segmentation using Voronoi polygons[J].IEEE Trans on Pattern Anal Mach Intell,1990,12(2):211-216.
[8]RANDEN T, HUSHY J H. Filtering for texture classification: a comparative study[J].IEEE
Trans on Pattern Anal Mach Intell,1999,21(4):291-310.
[9]KINGSBURY N G. The dual-tree complex wavelet transform: a new efficient tool for image restoration and enhancement[C]//Proc of EUSIPCO’98.Rhodes:[s.n.],1998:319-322.
[10]CHITRE Y, DHAWAN A P. M-band wavelet discrimination of natural textures[J].Pattern Recognition,1999,32(5):773-789.
[11]CLAUSI D A, JERNIGAN M E. Designing Gabor filters for optimal texture separability[J]. Pattern Recognition,2000,33(11):1835-1849.
[12]ANDREW L,JIAN F.Texture classification by wavelet packet signatures[J].IEEE
Trans on Pattern Anal and Mach Intell,1993,15(11): 1186-1191.
[13]UNSER M. Texture classification and segmentation using wavelet frames[J].IEEE Trans on Image Process,1995,4(11):1549-1560.
[14]VAPNIK V.The nature of statistical learning theory[M].New York:Springer,1995.
[15]VAPNIK V.Statistical learning theory[M].New York:Wiley,1998.
[16]KIM K I,JUNG K,PARK S H,et al.Support vector machines for texture classification[J].IEEE Trons on Pattern Anal and Mach Intell,2002,24(11):1542-1550.
[17]LI S,KWOK J T,ZHU H,et al.Texture classification using the support vector machines[J].Pattern Recognition,2003,36(12): 2883-2893.
[18]尚趙偉,張明新,趙平,等.基于不同復(fù)小波變換方法的紋理檢索和相似計算[J].計算機研究與發(fā)展,2005,42(10):1746-1751.
[19]肖志云, 彭思龍, 韓華.二元樹復(fù)小波域的局部高斯混合模型圖像降噪[J].計算機輔助設(shè)計與圖形學(xué)學(xué)報,2005,17(7): 1536-1543.
[20]CHANG C C,LIN C J.LIBSVM:a library for support vector machines[EB/OL].(2001).http://www.csie.ntu.edu.tw/~cjlin/libsvm.
[21]MANJUNATH B S, MA W Y. Texture features for browsing and retrieval of image data[J].IEEE Trans on Pattern Anal and Mach Intell,1996,18(8):837-842.
“本文中所涉及到的圖表、注解、公式等內(nèi)容請以PDF格式閱讀原文”