鄒青青,何靜濤,朱 程
一種特征加權融合的圖像檢索方法
鄒青青,何靜濤,朱程
(蚌埠學院計算機科學與技術系,安徽蚌埠233030)
提出了一種多特征加權融合的圖像檢索方法。應用累積直方圖建立圖像的顏色特征,采用邊緣檢測的方法提取圖像中的形狀特征,基于空間頻率的估計自相關函數刻畫紋理的粒度。圖像檢索系統的實現由查詢圖例與圖像特征庫的各底層特征分量分別采取各自適用的距離度量方式,按動態系數加權比對。實驗表明,較之單一圖像特征,多特征融合的查準情況更優,各特征分量權值的動態可調整使檢索算法具有靈活的表現。
特征表示;加權融合;相似性度量;圖像檢索系統
DOI:10.13420/j.cnki.jczu.2015.06.009
伴隨網絡互聯環境下信息持續爆炸式的增長,大數據時代已然到來。在海量數據資料里,圖像數據集合作為一類直觀的存在,其本身具有內容涉及范圍廣、細節豐富等特點。圖像數據是各種事物的信息組合,同一個事物在不同圖像中可能表達事物的不同面,同時存在主觀視覺上的較大差異。在圖像檢索過程中,不論采用的方法是TBIR還是CBIR,在圖像內容標注、特征提取、圖像模型表示等方面的技術有待完善,在不同的應用領域,檢索技術表現不一,檢索精確度有待提高。
圖像特征主要包括底層視覺特征和高層語義特征兩方面,底層視覺特征包括圖像的顏色、形狀、紋理等,屬定量特征,語義特征則是定性的,可借助相關反饋手段,動態地學習相似度量,以推斷與用戶主觀概念吻合的抽象描述,到達圖像檢索效果。
1.1顏色特征
顏色是人類認知事物的直觀特點,顏色特征是圖像檢索中應用最為廣泛的特征,其穩定性好且技術簡單,對大小、方向、空間等均具有不變性,因此可以通過顏色特征對圖像進行檢索。顏色的特征表示有多種方式,其中,累積直方圖在計算速度上具有優勢,且在對圖像幾何變換時趨于穩定。
圖像特征的統計直方圖實則一個1-D的離散函數,即有

累積直方圖為

式中k代表圖像的特征取值,l是特征可取值的個數,nk表示圖像中具有特征值為k的像素個數,N是圖像像素的總和。
1.2形狀特征
形狀是刻畫物體的本質特征,該特征一般在圖像分割完成后進行提取,目前用于圖像檢索的形狀描述方法中邊緣檢測是用于獲取圖像內物體輪廓的分割方法,這種算法有較好的效果,在圖像分析中應用廣泛。
圖像先用高斯函數進行平滑,然后再用拉普拉斯算子,它使用一個墨西哥草帽函數作為濾波器[1]。

采用以下5×5的LOG算子作為模板:

將Sobel算子與LOG算子結合進行修正,取較小閾值的Sobel算子作為邊緣檢測的前提條件,然后進行LOG的邊緣檢測。
1.3紋理特征
如Tuceryan定義的,紋理是“由一些具有相同特性的微小區域組成”,它的結構由一些復雜出現的基元模式構成,基元的數目和類型及基元之間的空間位置關系描述紋理特征[2]。在測量空間頻率的基礎上,由小基元組成的細紋理有較高的空間頻率,粗紋理的空間頻率低。基于空間頻率的紋理估計自相關函數為:

僅僅使用一種特征的方法只能表達圖像的部分屬性,缺乏足夠的信息,在圖像變換比較大的情況下不能取得理想的檢索效果。將兩個或兩個以上的圖像特征結合,綜合考慮共同檢索,圖像特征融合通過生成新的特征向量來表示綜合要點。新特征增加數據的維數,實現對來自不同信息源的所有屬性的整合,從而產生一個統一的特征空間,并采用標準的計算方法對其進行處理。
2.1融合方式
組合特征既可以將不同的特征兩兩結合,也可以將兩個以上特征結合在一起。設Q為查詢圖像的特征向量,T為待查詢圖形庫中的圖像特征向量,根據式(1)至(4)對圖像顏色、形狀、紋理特征的描述,圖像特征加權融合的計算定義為下式:

其中,Tc、Tc、Tc表示于顏色、形狀、紋理分量,wc、ws、wt分別是三者的權值根據用戶檢索的不同要求,權值在確定閾值范圍內取值不一,在具體檢索算法實現過程中,分層次計算不同的特征分量時,計算圖例與圖像的相似度Q/ T,并分別賦予權值初值,統計該權值對查詢結果相似度的判別以及對查全率與查準率的影響,在相同樣本集合基礎上根據計算結果進行修正確立權值的調整與分配。這種調整過程在特征匹配策略的實施中更為合理,能夠提高圖像檢索的效果。查詢圖例的特征向量Q同樣需要計算,它與T具有相同的特征信息表示空間,計算方法一致。
2.2圖像相似性度量
相似性度量函數對圖像查詢結果是否匹配至關重要,理想的圖像相似性度量結果應與人眼的觀察一致。特征空間點與點之間的距離度量是較典型采用的方法,在圖像檢索過程中,每幅圖像由特征點的集合表示,所以特征空間點的比較,實際為兩個向量的比較。對于查詢圖像q和目標圖像t,其特征向量分別為(fq1,fq2,fq3)和(ft1,ft2,ft3)而言,兩者的距離定義為:


圖1 圖像檢索系統過程圖
特征融合的圖像檢索是核心級的處理過程[3],其算法本質是圖例特征與圖像庫特征的相似度對
其中,i不同其特征取值在顏色、形狀、紋理特征之間變化,w為式(5)在特征融合過程中經統計并修正后的權重,即各底層特征表示在圖像融合中的權值決定其在相似度量算法中的作用程度。令T、TQ分別表示融合后的待查圖像與圖例的特征向量,亦以||T-TQ計算圖像特征之間的距離,采用式(6)的優點在于:基于不同的特征分別采取不同的距離度量方式更為準確,如顏色分量計算采用直方圖相交距或Minkowski(明氏)距離,紋理分量比較粗糙度、方向度、平滑度等;形狀分量對比幾何屬性(球狀性)、區域密度等。相似性度量依托于認知科學,特征表示方法不同導致相似性度量的結果可能不一致。
2.3檢索算法比,通過對圖像顏色直方圖的計算,加權圖像經平滑處理后的形狀特征,以及有一定魯棒性的紋理信息表示,隨后得出檢索結果。圖1給出了檢索系統的過程模型。檢索過程概括為:查詢圖像→特征表示→加權融合→相似性度量←統一特征分量←特征表示←圖像庫。
圖像特征分量計算與比對的程序設計流程如下:
Step1:圖像預處理,去除圖像噪聲。
Step2:將預處理后的查詢圖像進行特征提取,計算得到查詢圖例的顏色特征,賦顏色特征加權初值wc,記入圖例的特征向量集,檢索圖像庫,得出初步顏色特征的匹配結果集R1。
Step3:計算圖例形狀特征與紋理特征,分別賦予兩者的加權初值ws、wt,在顏色結果R1中檢索形狀、紋理匹配的項。
Step4:與用戶交互并記錄檢索結果,計算并記錄本次檢索的查準率,返回執行Step2,Step3,調整wc、ws、wt,重新計算并檢索得Ri,取查準率為最高值的結果Ri。
以Visual Studio 2010為開發工具,采用C#語言實現上述特征提取過程與檢索算法,圖像數據庫采用科雷爾(Corel)公司收集整理的1000幅圖片,其中涵蓋了多個主題,另增加同等規格的主題圖片作為數據庫檢索對象。實驗中隨機抽取某一類主題圖像的10幅圖像為檢索圖例,動態調整各底層分量權值,計算每幅圖像的查全率和查準率,求其均值,實驗結果如表1所示,修正各底層特征在查詢依據中的比重,可使查詢效果向理想值逼近。

表1 顏色、形狀、紋理特征按不同權值融合的檢索結果對比

圖2 提取圖例的顏色特征為依據的檢索結果
隨機選取一幅綠色樹葉圖像,對比單特征(顏色)與多特征的檢索結果。顏色特征采用累積直方圖的方法,即公式(2),多特征采用上述特征分量加權融合方式,抽取形狀及紋理特征的同時,允許對之進行平移、翻轉及旋轉處理,檢索結果如圖2、3所示,查詢結果按相似度從大到小排列。

圖3 融合圖例多特征的檢索結果
從檢索結果可以看出,圖2檢索結果中的20幅圖片均符合顏色特征,但在相似性范圍內的圖片僅有3張,查準率較低。融合圖例特征的檢索結果表現出良好的排除無關圖像能力,得出了查準率優于圖2的圖像集;單特征方法的查全率為3%,多特征方法的查全率為13%;兩者的檢索時間相差無幾[4]。分析兩者的檢索效果,在權重上以某一特征為主體,輔以其它圖像特征,能夠有效彌補被檢索對象信息表示的缺失,從而提高檢索效率。
從圖像的顏色、形狀、紋理特征的特點可以看出,僅基于一種特征的方法較為片面,只能表達圖像的部分屬性,在圖像尺度大或非正面表達圖像信息時,不能取得理想效果。綜上實驗結果及數據表明,融合圖像的多種特征,可達到圖像不同信息源之間互補效果,提高檢索的靈活性以及CBIR系統的精確度。
[1]孫燮華.圖像處理C#.NET編程與實驗[M].北京:機械工業出版社,2010.
[2]Tuceryan M,Jain A K.Texture Analysis in the Handbook of Pattern Recognition and Computer Vision[M].2nd ed.Singapore:World Scientific Publishing Corporation,1998:207-248.
[3]朱遠毅,董道國,金城.一種基于多特征簽名的圖像檢索系統[J].計算機應用與軟件,2011,28(7):82-85.
[4]茹立云,彭瀟,蘇中,等.基于內容圖像檢索中的特征性能評價[J].計算機研究與發展,2003,40(11):1566-1570.
[責任編輯:桂傳友]
TP391
A
1674-1102(2015)06-0027-03
2015-05-13
蚌埠學院自然科學研究項目(2013ZR15),蚌埠學院自然科學研究重點項目(2013ZR04zd)。
鄒青青(1981-),女,江西撫州人,蚌埠學院計算機科學與技術系講師,碩士,研究方向為虛擬現實及仿真技術,數字圖像處理;何靜濤(1978-),男,安徽蚌埠人,蚌埠學院計算機科學與技術系講師,碩士,研究方向為多媒體信息處理;朱程(1984-),女,安徽蚌埠人,蚌埠學院計算機科學與技術系講師,碩士,研究方向為網絡技術,多媒體信息處理。