耿艷萍+高紅斌+任智穎



摘 要:文章結合顏色特征和紋理特征,利用歐氏距離計算兩幅圖像的相似度進行圖像檢索。首先,在HSV空間下,提取顏色特征并進行歸一化處理。然后,提取GLCM的特征值,并結合Tamura特征形成更加豐富的紋理特征。最后,分別計算待檢索圖像和圖像庫中圖像的顏色和紋理相似度,在不同權重下融合顏色和紋理特征得出最終相似度。Matlab實驗表明,不同種類的圖像,分配顏色和紋理的不同權重時,有不同的查準率。調整圖像的特征權重可以提高查準率。
關鍵詞:圖像檢索;GLCM;Tamura;多特征融合
隨著數字圖像技術的發展,人們面臨著豐富多樣的圖像,根據需求從大量圖像中檢索出匹配的圖像,是值得探究的問題。圖像檢索技術分為基于文本和基于內容的檢索。基于內容的圖像檢索(Content Based Image Retrieval,CBIR)是提取圖像庫中圖像和待檢索圖像的特征進行相似度比較,從而得出結論。基于內容的圖像檢索特征包括兩個方面:一類是底層視覺特征,如顏色、紋理、形狀等[1];一類是高層語義特征,即圖像內容的語義描述與各類物理特征之間的邏輯關系[2]。本文提取第一類特征,在不同種類的圖像組成的圖像庫中,檢索出與待檢索圖像相似的圖片。
單一的基于顏色的相似度計算[3]不能完全表達圖像內容,故這種檢索算法的查準率很低。另外,常見的基于內容的圖像檢索特征還有紋理特征,用于捕捉圖像表面的粒度與重復出現的模式[4]。常用的紋理特征有基于灰度共生矩陣(Gray Level Co-occurrence Matrix,GLCM)的特征,文獻[5]用廣義圖像灰度共生矩陣做圖像檢索,但查準率和查全率的提升效果不顯著。另一常用的紋理特征是Tamura特征,文獻[6]用改進的Tamura紋理特征提高圖像檢索性能,相對于Tamura特征有了一定的提升,但提高有限。本文結合顏色特征和融合后的紋理特征(GLCM和Tamura特征融合)進行圖像檢索,并給出了顏色特征和紋理特征在最佳查準率下的權重系數,提高了查準率。
1 HSV顏色空間量化及特征提取
顏色特征與其他視覺特征相比,它對圖像尺寸、方向、視角等變化不敏感,同時,顏色特征對圖像質量的變化,噪聲有很好的魯棒性。故圖像檢索中,顏色特征的成功提取起著重要的作用[7]。
相對于RGB空間,HSV(色調,飽和度,亮度)空間對顏色的表達和人們的視覺習慣一致。故把RGB空間轉化為HSV空間,為了提高檢索的效率和準確率,對HSV空間的值進行非均勻量化。本文中,H量化為16級,S量化為4級,V量化為4級。
對HSV空間量化以后,把H,S,V 3個分量構造成一維的顏色特征向量:HSV=H*16+4*S*4+V。
2 紋理特征的提取和融合
2.1 灰度共生矩陣
本文計算GLCM的統計量作為紋理信息的一部分,GLCM能反映灰度圖像的灰度在空間位置上的分布情況,用來描述灰度空間的相關性。其定義為:圖像I(i,j)中距離為d,方向為θ的任意兩個灰度像素同時出現的聯合概率分布,記作p(i, j,d,θ),由這些概率值形成灰度共生矩陣P=[p(i, j,d,θ)]L×L,其中,θ一般取0°,45°,90°,135°;L為灰度級數。通常情況下,在計算GLCM前由于灰度級過大會導致計算量大、費時長,所以要先壓縮灰度級。
灰度共生矩陣不能直接表示圖像的紋理特征。在GLCM的基礎上,用一些統計量描述紋理特征,本實驗中,使用了對比度、相關性、熵、平穩度、能量這5個統計量。
(1)對比度。
其中P,Q是待檢索圖像和圖像庫中圖像,s1和s2是顏色特征和紋理特征的權重,C,T分別代表顏色特征和紋理特征,本算法中紋理特征是融合GLCM特征和Tamura特征的8維特征向量。
顏色重點描述圖像整體特征,而紋理重點描述圖像局部特征,單一的任何一種特征對圖像信息提取不全,本文在顏色特征的基礎上,提取了GLCM和Tumura紋理特征,使紋理特征信息更加全面,比以往論文中采用顏色特征和單一紋理特征進行圖像檢索準確率更高。過程如圖1所示。
4 實驗結果分析
4.1 實驗設置
本實驗硬件配置為:Core(TM)i5-4300CPU@1.90GHz 2.50 GHz和RAM為4 GB;軟件配置為64位的Windows7操作系統,MATLAB R2014a。為了測試算法性能,實驗隨機抽取Corel圖像庫中的一部分圖像(五大類:恐龍、車、大象、花、馬,各40張)作為圖像庫。
4.2 實驗分析
根據上文提出的算法,在一個庫中對相似度距離排序,在40張圖像(即目標類圖像總數目)中篩選與目標圖像(待檢索圖像)同類的圖像數目,計算同類中所有圖像的查準率并求出平均查準率。
5類圖像的例圖如圖2所示,實驗結果如表1所示。
由表1得出,當顏色和紋理特征權重不同時,查準率也不同,但每一種圖像的查準率都基本符合正態分布,根據實驗結果,恐龍和車在顏色和紋理權重比為0.6∶0.4時查準率最高,大象在顏色和紋理權重比為0.5∶0.5時查準率最高,花朵和馬在顏色和紋理權重比為0.4∶0.6時查準率最高。
由于恐龍圖像顏色較為單一,顏色特征明顯,所以顏色權重比較大(0.6∶0.4)時,查準率就相對較高(92.813%)。車圖像顏色特征也比較明顯且本身紋理與其他種類圖像不同,所以查準率也比較高(92.00%)。花朵和馬背景顏色雖然相似,但紋理特征顯著不同,所以當增大紋理所占權重為0.4∶0.6時,查準率提高。大象的背景顏色為綠色,與馬和花朵的背景顏色相似,且紋理傾向不是很明顯,所以大象在顏色特征和紋理特征權重為0.5∶0.5時,查準率達到最高,即對大象圖像而言,所提取的顏色和紋理特征在圖像檢索時所起作用相當。但相對于其他4種圖像,大象的平均的查準率為64.42%,相對較低。endprint
5 結語
通過顏色特征和紋理特征的融合,本文提出的算法能夠較好地進行同類圖片及相似圖片的檢索。實驗發現,查準率與顏色和紋理的權重s1,s2密切相關。同一種圖像的顏色特征與紋理特征的權重不同導致查準率有很大差異。通過多次實驗得到了不同種類圖像檢索時,顏色特征和紋理特征的最佳權重比,在一定程度上提高了檢索的準確率。將來,為了提高查準率,可以進一步獲取GLCM特征和Taumra特征融合時的最佳權重比。
[參考文獻]
[1]劉瑞軍,顧嘉偉,陳誼. 一種多低層特征結合的CBIR檢索方法[J].小型微型計算機系統,2015(6):1336-1340.
[2]李有鋒.基于顏色和紋理特征的圖像檢索相關算法研究[D].成都:電子科技大學,2009.
[3]李長勇,曹其新,郭峰.基于主色直方圖特征匹配的蔬果分類方法[J].上海交通大學學報,2009(12):1898-1903.
[4]高程程,惠曉威.基于灰度共生矩陣的紋理特征提取[J].計算機系統應用,2010(6):195-198.
[5]姚宏宇,李弼程.基于廣義圖像灰度共生矩陣的圖像檢索方法[J].計算機工程與應用,2005(34):98-100.
[6]郝玉保,王仁禮.改進Tamura紋理特征的圖像檢索方法[J].測繪科學,2010(4):136-138.
[7]CHEN J,SHAN S G,HE C,et al.WLD:a robust local image descriptor[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2010(9):1705-1720.
Abstract:Combining color features and texture features, this paper uses Euclidean distance to calculate the similarity of two images, and then retrieves the image. Firstly, the color feature is extracted and normalized in HSV space. Then, the feature values of gray level co-occurrence matrix(GLCM)are calculated and combined with Tamura features to form more abundant texture features. Finally, the final similarity is obtained by fusing color and texture features under different weights. Matlab experiments show that different kinds of images have different precision when assigning different weights of color features and texture features. Adjusting the feature weight of image can improve the precision ratio.
Key words:image retrieval; GLCM; Tamura; multi-feature fusionendprint