(河南理工大學(xué) a.計算機科學(xué)與技術(shù)學(xué)院;b.萬方科技學(xué)院, 河南 焦作 454000)
摘 要:針對紋理統(tǒng)計法和結(jié)構(gòu)法各自存在的問題,提出了一種基于紋理基元空間分布特征的圖像檢索算法。首先借鑒方塊編碼的思想來定義圖像的紋理基元,然后在對紋理基元的統(tǒng)計分布研究的基礎(chǔ)上,針對每一種紋理基元構(gòu)造紋理基元空間分布圖,提出采用紋理基元空間分布特征矢量對圖像內(nèi)容進(jìn)行描述。實驗結(jié)果表明,該算法既有效利用了圖像的紋理信息,又考慮了紋理的空間分布信息,具有較好的檢索效果。
關(guān)鍵詞:基于內(nèi)容的圖像檢索;方塊編碼;紋理基元;空間分布圖
中圖分類號:TP3913 文獻(xiàn)標(biāo)志碼:A
文章編號:10013695(2009)01037802
Image retrieval based on spatial feature of texture primitive
ZHAO Shana,ZHAI Haixiab
(a.College of Computer Science Technology,b.Wanfang Institute of Science Technology, Henan Polytechnic University,Jiaozuo Henan 454000, China)
Abstract:This paper proposed an image retrieval based on texture primitive.Firstly constructed the texture primive according to the priciple of the block truncation code (BTC). Meantime, based on the analysis of the statistical distribution of the texture primitive,developed the spatial distribution map ofeach texture primitive.Then,presented the spatial distribution feature to describe the image texture information. Experimental results show that the proposed method has sound and robust retrieval performance by integrating spatial information and texture information into image descriptors.
Key words:contentbased image retrieval; block truncation coding (BTC); texture primitive; spatial distribution map
紋理特征是基于內(nèi)容的圖像檢索(CBIR)技術(shù)中一種重要的視覺特征。目前,紋理特征的描述中常用的有統(tǒng)計法、頻譜法、結(jié)構(gòu)法和模型法四種。灰度共生矩陣作為一種重要的基于統(tǒng)計的分析方法[1],具有特征提取和相似度計算簡便的優(yōu)點,但由于其本身具有的方向性使其不能很好地表達(dá)圖像全局信息,無法體現(xiàn)圖像中各紋理所處的空間位置關(guān)系,檢索精度并不理想。Vassili等人[2]首先將圖像的顏色進(jìn)行量化,然后采用量化后的顏色值作為像素點的灰度值,并以此來計算圖像的紋理特征。Takahashi等人[3]首先將彩色圖像轉(zhuǎn)換成灰度圖像進(jìn)行分塊和壓縮,然后提取各個分塊的共生矩陣來表示紋理特征。Gagaudakis等人[4]構(gòu)造了具有旋轉(zhuǎn)不變性的循環(huán)共生矩陣(circular cooccurrence matrix),產(chǎn)生圖像的紋理直方圖,來輔助進(jìn)行基于顏色及其空間分布的檢索。這些方法雖然在一定程度上有效地提取了圖像的局部紋理分布特性,但存在著計算量大、缺乏空間分布信息、不能很好表達(dá)圖像全局信息等問題。趙珊等人[5]借鑒方塊編碼的思想來定義圖像的紋理基元,構(gòu)造了一種紋理基元共生矩陣用于紋理圖像的檢索,引入了紋理的空間分布信息,檢索精度雖然有所提高,但特征提取復(fù)雜度偏高制約了其應(yīng)用。
1 基于紋理基元的圖像檢索算法
圖像的紋理一般理解為圖像灰度和顏色在空間上的變化和重復(fù),或圖像中反復(fù)出現(xiàn)的局部模式(紋理單元)和它們的排列規(guī)則。它反映了物體本身的基本屬性,依靠紋理特征有助于將不同類型的物體區(qū)分開。結(jié)構(gòu)分析法的基本思想是假定紋理模式由紋理基元以一定的、有規(guī)律的形式重復(fù)排列組合而成,特征提取就可以理解為確定這些基元并定量地分析它們的排列規(guī)則。另外,圖像的特征提取實際是尋求一種盡可能緊湊的特征碼值來描述圖像最本質(zhì)的內(nèi)容,而圖像壓縮編碼的目的也是要盡可能地減少或消除圖像中的冗余信息,從而以盡可能緊湊的代碼表征原圖像。因此,圖像的某種壓縮編碼就可以看成是抽取得到的圖像特征。
每幅圖像的不同區(qū)域均有著不同的結(jié)構(gòu)特征,有的區(qū)域灰度比較均勻,沒有很明顯的明暗對比,而有的區(qū)域卻有著很復(fù)雜的灰度差,明暗對比明顯。而且,人眼對灰度變化的敏感程度與背景有關(guān),它隨平均灰度的變化而變化,即人眼對圖像細(xì)節(jié)的分辨力與圖像的灰度階差有關(guān)。當(dāng)圖像本身的灰度階差較小時,人眼的分辨力會降低;反之亦然。因此,可以將圖像按照灰度階差分成不同形狀的塊來表示圖像中的紋理信息。由此,以方塊編碼的思想為基礎(chǔ),根據(jù)圖像塊的灰度差來進(jìn)行紋理基元的提取。
11 紋理基元的提取
假設(shè)I是一幅大小為M×N的圖像。首先將I劃分為m×m大小的互不重疊的子塊,對于每個子塊,計算塊內(nèi)像素的灰度均值μ和平均灰度差σ。按照方塊編碼的思想,在每個子塊中,對每個像素點,灰度值大于均值μ的賦值為1;反之為0,這樣就得到了一系列m×m的二進(jìn)制塊。這些二進(jìn)制塊不僅體現(xiàn)了圖像塊內(nèi)的紋理特征,而且在一定程度上反映了圖像中的形狀分布。相似的紋理結(jié)構(gòu)會產(chǎn)生相同的紋理值,定義這些二進(jìn)制塊為圖像的紋理基元。用與這些二進(jìn)制塊等值的十進(jìn)制值來表示這些紋理基元的值。提取過程如圖1所示(這里m=2)[5,6]。
在提取圖像的紋理基元時,會出現(xiàn)如圖1(d)(e)所示的情況,不同的塊可能會產(chǎn)生相同的紋理值。因此,在算法中,需設(shè)定一個閾值β,當(dāng)圖像塊的平均灰度差小于這個閾值時,就將這個塊看做是均勻塊,紋理基元值設(shè)為0;大于這個閾值時,就按上述方法計算它的紋理基元值。在實驗中,筆者采用了統(tǒng)計的方法,經(jīng)過多次實驗,發(fā)現(xiàn)當(dāng)這個閾值為整個圖像平均灰度差的0.002 5時將其看做均勻塊,不影響算法的精度,可以取得滿意的效果。在下述實驗中,取β=0.002 5σ。其中σ是圖像的平均灰度差。在提取了圖像的紋理基元后,可使用紋理基元值作為整幅圖像紋理特征的描述。如圖2所示,(a)(c)為示例圖像,(b)(d)是兩幅用紋理基元表示的示例圖像。從圖2可以看出,紋理基元在一定程度上可很好地反映示例圖像中的紋理特征。
12 紋理基元空間分布特征的提取
定義了圖像的紋理基元后,一幅M×N的圖像I就對應(yīng)著一個[M/m]×[N/m]的矩陣P0。其中:P(x,y)的值為位于(x,y)處的紋理基元索引值。為了提取紋理基元的空間分布信息,針對P(x,y)中的某一類索引值,保留該索引值位置上的值,將其他位置0,構(gòu)成一個該類的空間分布圖,在此基礎(chǔ)上提取空間分布特征。
設(shè)Ai={(x,y)|(x,y)∈P,P(x,y)=i;0≤i≤2m×m-1}表示P索引值為i的所有點的集合。設(shè)|Ai|表示集合Ai中點的數(shù)目,Ci=(xi,yi)為P中索引值為i的所有點的質(zhì)心。xi和yi定義如下:
xi=1/|Ai|(x,y)∈Aix;yi=1/|Ai|(x,y)∈Aiy(1)
設(shè)ri表示P中(x,y)處索引值為i的點同其質(zhì)心的距離,其定義如下:
ri=(x-xi)2+(y-yi)2(2)
則P中所有屬于i的點到質(zhì)心的距離和
Ri=ri=(x,y)∈Ai(x-xi)2+(y-yi)2(3)
算法中,將每一種紋理基元構(gòu)成的空間分布圖中所有點到其質(zhì)心的距離和作為表征其空間分布的特征,從而構(gòu)造了整個圖像的空間分布特征(R0,R1,R2,…,R2m×n-1)。具體提取過程如圖3所示。
13 相似性度量
設(shè)Q=(R0,R1,R2,…,R2m×m-1)及I=(R′0,R′1,R′2,…,R′2m×m-1)為兩幅圖像所提取的空間分布特征,兩圖像間的相似性定義為
d(Q,I)=(R0-R′0)2+(R1-R′1)2+(R2-R′2)2+…+(R2m×m-1-R′2m×m-1)2
2 實驗結(jié)果與討論
為了驗證本文算法的有效性,在包含2 500幅圖像的通用圖像庫中對其進(jìn)行了針對不同圖像種類的檢索實驗。圖像庫中包括了種類豐富的動物、建筑、自然景物、花卉、山脈等在內(nèi)的RGB彩色圖像,以JPEG文件格式存取。還將本文算法與傳統(tǒng)的灰度共生矩陣方法(GLCM)、Vassila等人提出的顏色共生矩陣方法(CCM)以及趙珊等人提出的紋理基元共生矩陣進(jìn)行了對比實驗。在利用本文算法對彩色圖像處理時首先采用式(4)將其轉(zhuǎn)換為灰度圖像。實驗中,圖像分塊大小m=2。
I=0.3R+0.59G+0.11B(4)
在圖像庫中選取五類圖像組成檢索集,采用精確度(precision)和檢索率(recall)作為相似檢索的評價準(zhǔn)則,來檢驗該算法的檢索效果。從每類圖像中選取8幅圖像,共組成40次查詢,取這40次檢索結(jié)果精確度和檢索率的平均值作為算法的平均檢索結(jié)果。圖4給出了四種算法在精確度和檢索率上的對比曲線。由實驗結(jié)果可以看出,本文提出的算法效果明顯優(yōu)于其他三種算法。
為了進(jìn)一步檢驗本文算法的性能,本文采用更客觀的方法ANMRR(average normalized modified retrieval rank)進(jìn)行評測[7]。設(shè)T(Qi)(i=1,2,…,u)表示圖像Qi庫中與圖像相似的所有圖像數(shù)目,t=max{T(Q1),T(Q2),…,T(Qu)},l=min{4T(Qi),2t},設(shè)與例子圖像相似的圖像在檢索結(jié)果序列中所處位置為
rank(k)=k,k≤l
l+1,k>l(5)
從而,ANMRR定義如下
ANMRR=1/uui=1[(T(Qi)k=1rank(k)/T(Qi))-0.5-0.5×T(Qi)]/(l+0.5-0.5×T(Qi))(6)
表1給出了不同算法ANMRR的計算結(jié)果。由該表也可以看出本文方法優(yōu)于其他三種方法。
3 結(jié)束語
針對紋理分析法中存在的問題,本文提出了一種基于紋理基元空間分布特征的圖像檢索算法。該算法將空間分布信息引入紋理特征描述符,大大提高了圖像的檢索效率。實驗表明該算法具有較好的檢索效果。
參考文獻(xiàn):
[1]
HARALICK R M, SHANMUGAM K, DINSTEIN I.Texture features for image classification[J].IEEE Trans on System Management and Cybertics,1973,3(6):768780.
[2]VASSILI K,STEPHAN V. Color cooccurrence descriptors for queryingbyexample[C]//Proc of International Conference on Multimedia Modeling.1998:3237.
[3]TAKAHASHI N, IWASAKI M, KUNIEDA T,et al.Image retrieval using spatial intensity features[J].Signal Processing: Image Communication,2000,16(1):4557.
[4]GAGAUDAKIS G,ROSIN P.Incorporaring shape into histograms for CBIR[J].Pattern Recognition,2002,35(1):8191.
[5]趙珊,孫君頂,周利華.基于方塊編碼的圖像紋理特征提取及檢索算法[J].光電子激光,2006,17(8):10141017.
[6]SAHA S K,DAS A K,CHANDA B.CBIR using perception based texture and color measures[C]//Proc of the 17th International Conference on Pattern Recognition.2004:4549.
[7]趙珊,崔江濤,周利華.基于位平面分布熵的圖像檢索算法[J].電子與信息學(xué)報,2007,29(4):795799.