郭曉娟,成繼福
(1.河南科技學院 信息工程學院,河南 新鄉 453003;2.河南科技學院 圖書館,河南 新鄉 453003)
在某一給定的顏色空間中,如何用特定的方法描述圖像的顏色特征是圖像檢索中一個重要的問題,而如何有效地描述圖像的特征是CBIR中最為關鍵的環節。有效的特征應該意義直觀,區分能力強,計算相對簡單,具有平移、尺度不變性[1]。
顏色特征是在基于內容的圖像檢索中最早被使用也是被最廣泛使用的視覺特征,主要原因在于顏色特征的定義比較明確,特征提取方法比較簡單,而且顏色特征能較好地體現圖像中所包含的物體或場景。此外,與其他視覺特征相比,顏色特征對圖像本身的尺寸、方向、視角的依賴性較小,從而具有較高的魯棒性。
目前常用的顏色特征提取方法,有顏色直方圖、顏色矩以及模糊顏色直方圖等。下面對所提到的幾種顏色特征提取方法進行詳細的介紹。
圖像內容的一種直觀的表示方式是統計圖像的各種顏色的出現次數,進而得到圖像的顏色直方圖。它反映的是圖像中顏色的組成,即各種顏色在圖像中出現的頻率。顏色直方圖描述如下[2]:
設一幅彩色圖像包含M個像素,圖像的顏色空間被量化為N個不同的顏色,則顏色直方圖H定義為
從上述定義可以看出,顏色直方圖表現的是圖像的一種全局特征,每一幅圖像具有唯一的顏色直方圖。并且顏色直方圖對圖像的旋轉、平移以及縮放具有很好的不變性。
顏色直方圖具有明顯的優點,也存在一些缺點。優點在于:它能簡單描述一幅圖像中顏色的全局分布,即不同色彩在整幅圖像中所占的比例,特別適用于描述那些難以自動分割的圖像和不需要考慮物體空間位置的圖像。其缺點在于:它無法描述圖像中顏色的局部分布及每種色彩所處的空間位置,即無法描述圖像中的某一具體的對象或物體。所以,在利用傳統的顏色直方圖進行檢索時容易產生不一致的情況。
在此基礎上,又形成了一些改進直方圖的方法,如累積顏色直方圖等。累積顏色直方圖被證明是比顏色直方圖更健壯的一種方法[3]。給定一幅圖像I的顏色直方圖H,對應的累積直方圖數學表示如下:

其中 hi=∑Cj≤Cihj,這里 Cj,Ci分別代表顏色直方圖第j個和i個索引的顏色值。實驗證明,累積顏色直方圖比顏色直方圖具有更好的檢索性能。
Stricker和Orengo基于概率論提出顏色矩(Color Moments)[4],數學基礎是圖像顏色分布可以由圖像像素的各階中心矩來描述。由于顏色信息集中在圖像顏色的低階矩中,因此只需要對每種顏色分量的一階(Mean)、二階(Variance)和三階矩(Skewness)進行統計。所以,圖像的顏色矩一共只需要九個分量,與其他的顏色特征相比較簡潔。計算公式如下:

上式中,Pij是第j個像素的i個顏色分量,i∈{1,2,3},在 RGB 顏色空間中分別表示 R、G、B 顏色分量;N是圖像中像素數量。其中,一階矩定義了每個顏色分量的平均強度,二階矩定義了每個顏色分量的方差,三階矩定義了每個顏色分量的偏斜度。
在實際應用中,為避免低階矩較弱的區分能力,顏色矩常和其他特征結合使用,并且起到在使用其他特征前縮小范圍的作用。
近年來,將模糊直方圖用于圖像檢索中的方法日益受到關注。韋娜等[5]將模糊C均值聚類方法引入基于顏色特征的圖像檢索,建立了模糊顏色直方圖(Fuzzy Color Histogram,FCH)的方法。實驗證明,該方法較傳統直方圖方法(Conversional Color Histogram,CCH)更具有魯棒性和高效性。
給定一個包含n個顏色索引的顏色空間,圖像I包含N個像素,則模糊顏色直方圖的定義如下:
圖像 I的模糊顏色直方圖 F(I)=[f1,f2,…,fn],

Pj表示從圖像I中任選一像素為像素j的概率,μij代表第j個像素對于第i個顏色索引的隸屬度函數。
設在量化的顏色空間中有n'個顏色索引,使用模糊C均值算法將其分為n類,n 矩陣中每一個元素mij代表第j個顏色索引被重新分配到第i個顏色索引的顏色隸屬度值。這樣,以上定義的FCH就可以通過CCH得到。對于給定的 n'維 Hn'×1,對應的 n 維的 FCH,Fn×1可這樣計算得到[6]: 這里,隸屬度矩陣M只需要計算一次,就可以用來計算數據庫中所有圖像的模糊顏色直方圖。 距離相似性度量方法就是利用相關距離計算函數,計算被檢對象和目標對象的特征序列之間的結果,用該計算值來判別對象之間的相似性程度。一般情況下圖像都是多維特征矢量表示的,通過計算特征矢量在特征空間的距離,可以得到兩個圖像的相似度。以下主要針對本次實驗中所用到的歐式距離度量算法[7]進行分析。 設 x,y 為圖像特征向量,分量分別為 xi,yi,(1≤i≤n)。 這是若干種距離公式的通式表示,當r=1時,為Manhattan距離(又稱街區距離): 當r=2時,為歐幾里德距離: 歐幾里德距離是簡單的距離公式,也是在CBIR中應用較廣的距離公式。它可以單獨用于顏色直方圖和紋理特性的匹配。然而歐幾里德公式完全不考慮向量各維之間的關系,而且各維必須是同等重要的,這就大大影響了其使用范圍和有效性。為解決此問題又引入了加權歐幾里德距離。 加權歐幾里德距離: 其中wi是各分量的加權系數。加權歐幾里德距離考慮不同維之間的不同重要性。由于CBIR系統通常抽取了大量的特征,不同特征的重要性都是不同的,因此加權歐幾里德距離在CBIR系統中應用很廣,可單獨用于顏色直方圖、紋理、形狀或它們的聯合向量。 本實驗主要目的是比較不同的顏色特征提取方法,包括顏色直方圖、累積直方圖、顏色矩和模糊顏色直方圖,所采用的相似性度量方法為歐氏距離。實驗中,采用的數據為UIUC的數據庫中的蝴蝶類,共包含536幅圖像,分為5類。所采用的示例圖為peacock類(包含134幅圖像)中的pea001.jpg。四種方法的實驗比較見表1。部分檢索結果如圖1-圖4所示。 表1 不同顏色特征提取方法的檢索結果的比較 圖1 顏色直方圖 圖2 累積顏色直方圖 圖3 顏色矩 圖4 模糊顏色直方圖 在表1中,相關圖像數是測試圖庫中與示例圖像相關的圖像數。檢索結果總數是執行各種顏色檢索方法得到的數目,其中檢索的閾值默認為0.4,最大檢索值為100,本次實驗中設置的閾值為0.3,最大檢索值為150。對顏色矩中的三個參數,均值、方差、斜度的權值分別設置為0.1,0.9,0.9;對于模糊顏色直方圖,最初的聚類數默認為10,實驗中所設置的聚類數目為5。用戶可以自己設置這些參數。檢索結果相關圖像數,是在檢索結果集中與示例圖像相關的圖像數,它同時影響著查準率和查全率;本實驗中,隨著所選取的顏色檢索方法不同、參數不同而得到不同的結果數目;查準率和查全率是一組相互影響的評價標準,兩者共同決定了檢索效果。 從表1中的數據可以看出,在同樣條件下,四種顏色特征提取方法的檢索效果有所不同。綜合查準率與查全率,顏色矩方法可以得到稍好的效果;在直方圖方法中模糊顏色直方圖的方法稍好于其他兩種方法,累積顏色直方圖方法次之。 當然,上述各個方法有各自不同的適用情況。上述的結果也會因示例圖像與測試圖庫的變化而變化。顏色矩的分辨能力較弱,所以適用于圖像間有較大差別的圖像庫;顏色直方圖適用于含有較多顏色信息的圖像庫;累積顏色直方圖可以有效地提高計算精度,對圖像質量不是很好的圖像有較好的檢索效果;模糊顏色直方圖對圖像檢索的魯棒性與有效性有一定的提高。 本文在研究分析了一些顏色特征提取算法(如顏色直方圖,累積顏色直方圖,顏色矩和模糊顏色直方圖等)的基礎上,采用歐式距離相似度量算法,利用UIUC圖像數據庫中的peacock蝴蝶類分別驗證,并比較了上述所提到的顏色特征提取算法的有效性,從比較的結果可以看出,采用模糊顏色直方圖的檢索方法相對其他幾種特征提取方法可以得到較好的效果。 [1]J.Barros,et.al.Indexing multispectral images for contentbasedretrieval[J].SPIE,1994,2368:25-36. [2]龔聲蓉.基于內容的圖像檢索方法研究[D].北京:北京航空航天大學,2001. [3]Pass G,Zabih R,Miller J.Comparing images using color coherence vectors[C]//Proc of ACM Intern Conf Multimedia.Boston:MA,1996. [4]M.A.Stricker,M.Orengo.Similarity of color images[C]//Proc of SPIE:Storage and retrieval for Images and Video databasesⅢ.SanJose:CA,1995,2420:381-392. [5]韋娜,耿國華,周明全.一種新的文物圖像檢索方法[J].計算機應用,2005.25(8):1789-1791. [6]J.Han,K.-K.Ma.Fuzzy Color Histogram and Its Use in Color Image Retrieval[J].IEEE Transactions on Image Processing,2002,11(8):944-952. [7]李瑜,李磊.基于內容的圖像檢索的方法研究[J].計算機科學,1999,26:8.

2 相似性度量算法




3 基于顏色特征檢索的實驗結果與分析





4 結束語