劉 晙, 茹慶云
(河南機電高等專科學校計算機科學與技術系,河南 新鄉 453000)
基于快速小波變換的高適應性圖像檢索技術研究
劉 晙, 茹慶云
(河南機電高等專科學校計算機科學與技術系,河南 新鄉 453000)
在目前已有的研究工作中,基于自適應小波的圖像特征在基于內容的圖像檢索領域獲得了廣泛的應用。但這些方法存在一個共同問題,即采用相同的小波基描述不同的查詢圖像。為了提高圖像檢索技術的自適應能力,本文對不同的查詢圖像設計不同的小波基表示,從而實現用可調整的距離測度表征不同類別圖像的特征改變。為了進一步降低表征圖和表征導數圖的求取時間,該文使用了近似泰勒展開。實驗結果表明,這種新的圖像檢索技術具有高度的自適應能力,檢索性能也大幅度提高。
圖像檢索;小波變換;小波基;自適應
自適應小波已經在基于內容的圖像檢索中取得了廣泛的應用,這在計算機科學領域已經成為一個熱點研究[1]。基于內容的圖像檢索使用圖像特征來捕捉兩幅圖像的相似性,并依據查詢圖像的特征在參考數據集中實現自動的檢索[2]。
早期的圖像檢索系統,主要依賴機器語言和用戶感知來建立低級圖像特征[3]。小波變換應用于圖像檢索技術后,圖像特征的建立手段更加豐富了[4]。另外,小波變換在圖像檢索中還具有一個明顯的優勢,那就是它可以靈活地調整表征圖像特征的小波基,從而使得圖像檢索方法的適用性更加靈活[5]。
但從目前的使用情況看,對于一個圖像檢索系統,查詢圖像的小波基構建方法基本固定,當檢索開始后再無更改的可能,從而沒有把小波變換的靈活性最大限度地發揮出來[6-7]。實際上,對不同查詢圖像的圖像特征采用統一的小波基構建方法,勢必會降低整個圖像檢索系統的性能[8-9]。
為此,要進一步提高基于小波變換的圖像檢索技術的適應性和整個圖像檢索系統的性能,就應該為每一幅不同的查詢圖像量身定制小波濾波器。本文所作的研究工作,正是在這樣的出發點下展開的。

根據定義,I在任意位置 (i, j)、任意分析范圍s∈ Ν*的小波變換的系數,可用下面的公式計算:

利用公式(1),對公式(2)進行改造,可以得到下面的公式:

我們可以用標準矩描述小波系數(xi,j,s)i=0,…,M-1,j=0,…,N-1的分布特征。在紋理圖像的特定情況下,可以使用非傾斜均值廣義高斯函數來模仿任意尺度的小波系數分布模型。這個廣義高斯函數有兩個參數:α和β,它們即分別為規模和形狀參數。則標準矩 (μ ,σ ,ν,κ)與α和β相關,并且可以按照公式(4)~(6)計算。

這里Γ是伽瑪函數,σ 、κ 分別與 α、β 密切相關。根據標準偏差σs,K,L(I )及其峰值κs,K,L(I ),我們可以描述任意小波系數的特征分布。當I、 K 、 L為已知時, σs,K,L(I )和 κs,K,L(I )可以分別簡記為σs和 κs,其具體計算如下:

這里 ms,d是 I的小波變換的一個多項式函數,其具體表達如下:

如果 IS和 JS分別表示集合和那么上述公式所反映出圖像特征的復雜性應為O(MNKL/s2)。
2.1 小波濾波器空間
讓 WK,L表示所有支持 (2 k+ 1)×(2L+1)的小波濾波器的空間,讓D表示它的維數。因為根據式(1)各濾波器 w ∈ WK,L中心系數被限制,
2.2 表征圖和表征導數圖
根據小波自適應的構建目的,我們對于一個給定的分析規模 s∈ N*和每個過濾器 w ∈WK,L計算I的表征 (σs,κs),由此產生的一系列特征被稱為I的表征圖,它也用于計算表征的一階導數。由此產生的表征導數稱為I的表征導數圖。
據前所述,用小波濾波器提取圖像特征具有O(MNKL/s2)的復雜度,因此需要大量的時間。為此,我們使用近似表征圖和表征導數圖。
2.3 近似表征圖
本文使用泰勒展開的近似表征圖和表征導數圖,這是一種全新的應用。通過一個有限集的小波濾波器計算表征和表征導數,這被稱為關鍵小波濾波器,其余每個圖使用泰勒展開近似。一套關鍵小波濾波器用來表示,假設是關鍵小波濾波器。在 w處,函數f(無論是還是的泰勒展開如下所示。

這里 nT表示順序泰勒展開的階數,表示二階。

2.4 表征圖及其導數的不變性
首先,如果小波濾波器 w ∈ WK,L乘以一個正實數 λ∈ R+,根據公式(3)和式(9),有δs,d(k ,l )和ms,d乘以 λd,? s, k和l。因此,如果w乘以λ,然后σs乘以λ, ks不變。至于導數,如果w乘以λ, (? σs/?wk,l)不變和 (? ks/?wk,l)除以λ。這個不變性分析意味著,我們只需要在單位球面內對小波濾波器計算表征圖及其導數。
其次,如果w乘以-1,有δs,d(k ,l )和ms,d乘以(- 1)d,? s , k和l。因此,如果w乘以-1,那么σs和 ks不變, (? σs/?wk,l)和 (? ks/?wk,l)乘以-1。這個不變性分析意味著,我們只需要在單位半球面內對小波濾波器計算表征圖及其導數。
2.5 表征圖像的建立步驟
整個表征圖的構建過程如圖1所示。圖1中,橫軸代表第一個無約束的小波濾波器系數的值,實心弧代表表征圖的泰勒展開。
第三步,是計算特征和特征導數在 WK,L集出的差,如圖1(c)所示。讓λ在集合處被二階w過濾器過濾。讓是一個變量顯示,( w /λ)屬于( δ=1)或( δ=-1)半個單位球體。

圖1 表征圖構建過程
如果用 Iq代表查詢圖像,R代表參考圖像數據集。在圖像檢索過程中,表征圖是用來計算I∈ R 的圖像相似度排名,將形成 I1(Iq),I2(Iq),…IK(Iq)的檢索結果,其中 K∈ N*。
我們建議將每個圖像用S(I)=(σs,K,L(I ),κs,K,L(I))s∈N*,K∈N,L∈N標 注 , 在 標 注 S (I), 特 征σs,K(,LI ) 和κs,K,L(I)在分析規模s處提取分析表,使用支持 (2 K + 1)×(2L+1)的濾波器 ws,K,L。基于這些明顯特征, Iq和另一幅圖像 I∈ R之間的距離定義如下:

假設 dH(Iq,I)表示 Iq和I之間強度直方圖的二階距離, dH(Iq,I)是用 Iq和I的低頻成分。每一部分的距離測度被實數加權:假設和則或
從已有的圖像檢索方案來看,一般都是使用單一的距離參數來評價查詢圖像和各幅參考圖像之間的相似性。而本文利用公式(12)所示的距離定義函數,根據前面所述的不同表征圖和表征導數圖,可以根據不同查詢圖像的特征,有針對性地調整距離測度,從而極大地提高圖像檢索過程的自適應性。
在這種高度自適應的圖像檢索方法中,不同的距離參數集用于每個查詢圖像。確切地說,距離參數(小波濾波器系數權重)可以在不同的特征空間使用。
為了驗證本文提出的基于快速小波變換的高自適應圖像檢索方法的有效性,實驗使用的測試圖像是以從http://www.wang.st.psu.edu/IMAGE下載的包含10000 幅測試圖像的圖像庫,這個數據平臺共有分辨率大小為 126×85 或85×126兩種規格。圖像內容涉及了山水、花草、昆蟲、動物、建筑。實驗過程采用了主頻為2.6GHz的酷睿雙核CPU,存儲空間為8G的內存,顯存為2G的獨立顯卡的計算機。軟件編譯平臺為 Visual C++.net 2005平臺。為便于比較,在相同的軟硬件平臺上進行二組實驗,分別實現了文獻[5]、文獻[8]中的檢索方法和本文提出的檢索方法,采用檢索結果的檢索時間、查全率、查準率作為檢索的評價準則。
4.1 牡丹圖像的檢索實驗
為了形象地說明本文算法的實現流程,首先采用了兩幅牡丹圖像作為查詢圖像,進行了表征圖提取,其結果如圖2所示。

圖2 不同“牡丹”查詢圖像的表征圖提取過程
圖2中,我們利用小波變換技術,對兩幅不同的“牡丹”查詢圖像進行了表征圖求解。其中分別展示了 H2、H4、V2、V4等小波分解級次在σ、 K計算尺度下的表征圖。從圖2中明顯可以看出,不同的查詢圖像所對應的表征圖并不相同,如果用相同的小波基表征形式進行后續查詢和檢索,會降低檢索性能。進一步用本文所提的方法進行圖像檢索性能測試實驗,檢索結果如圖3所示。從圖2以及圖3可以看出,通過本文方法的設計,可以為不同查詢圖像設計不同的表征圖,從而使整個檢索過程的自適應性大大提高。

圖3 牡丹圖像查詢結果
表1是實驗一中3種方法檢索時間以及查全率的比較,可以看出由于本文算法和文獻[8]中的檢索方法都是建立在圖像特征庫的基礎上,使得查詢不相關圖像大為減少,從而使檢索時間較文獻[5]檢索大大縮短。另外,本文算法從查詢時間上看,從10000幅圖像構成的圖像庫中進行“牡丹”圖像的查詢,僅花費 0.28s,并沒有因為表征圖的計算導致檢索時間的增加。并且隨著數據庫規模增大,檢索速度提高的更加顯著。在查全率、查準率方面也比上面兩種方法更具優勢。

表1 3種算法查全率、查準率、檢索時間統計對比
4.2 日出圖像的檢索實驗
為了測試本文算法的魯棒性,本文還采用了兩幅日出圖像作為查詢圖像,進行了表征圖提取,其結果如圖4所示。

圖4 不同“日出”圖像的表征圖提取過程
我們仍然采用和第一組實驗一樣的方法,先來求解兩幅不同的“日出”圖像的表征圖像。這里 , 也 分 別 計 算 了 在 σ、 K下 的H2、H4、V2、V4小波分解級次圖像。從圖4中可以看出,和“牡丹”圖像的結果一樣,不同的“日出”圖像所對應的表征圖也有很大差異。利用本文方法,對“日出”圖像執行的最終檢索結果如圖5所示。

圖5 日出圖像查詢結果
表 2是第二組實驗 3種方法檢索時間的比較,可以看出同樣本文算法和文獻[8]檢索時間較文獻[5]檢索大大縮短。另外利用本文方法執行“日出”圖像的查詢,耗時為 0.34s,也表現出較快的檢索速度。從以上分析可以看出,應用本文的小波分解思路,在一定程度上可以提高檢索的適應性能和精確性,同時在時間消耗沒有明顯的增加。

表2 3種算法查全率、查準率、檢索時間統計對比
為了說明本文方法的查全率、查準率,分別用本文方法的查全率、查準率與文獻[5],[8]的兩種方法進行了比較。比較結果的曲線圖如圖5所示。
圖6中,橫坐標為要檢索出圖像數目占圖像總數的百分比,縱坐標為檢索精度,三條曲線分別代表了本文方法、文獻[5]、文獻[8]的方法。從這個結果可以看出,本文方法的檢索精度要遠遠高于文獻中兩種方法。

圖6 3種圖像檢索方法的對比
對于不同查詢圖像,使用同一小波分解策略并執行統一的相似性比較,顯然會降低圖像檢索的性能。本文針對此問題,對不同查詢圖像進行了不同表征圖像的提取,并通過對小波分解過程的泰勒函數近似展開,來有效降低這種處理過程的時間消耗。實驗結果表明,本文所設計的圖像檢索方法,具有高度的自適應能力,可以提高針對不同查詢圖像的檢索性能,而時間上的消耗也沒有明顯的增加。
[1] 李向陽, 莊越挺, 潘云鶴. 基于內容的圖像檢索技術與系統[J]. 計算機研究與發展, 2001, 38(3): 344-354.
[2] 齊 恒. 基于內容圖像檢索的關鍵技術研究[D]. 大連: 大連理工大學, 2012.
[3] 莊 凌, 莊越挺, 吳江琴, 葉振超, 吳 飛. 一種基于稀疏典型性相關分析的圖像檢索方法[J]. 軟件學報, 2012, 23(5):1295-1304.
[4] Bian Wei, Tao Dacheng. Biased discriminant Euclidean embedding for content-based image retrieval [J]. IEEE Transactions on Image Process, 2010, 19(2): 545-554.
[5] 傅啟明, 劉 全, 王曉燕, 張 樂. 遺傳反饋的多特征圖像檢索[J].中國圖象圖形學報, 2011, 16(10): 1858-1865.
[6] 溫 超, 耿國華, 李 展. 基于 K均值聚類和多示例學習的圖像檢索方法[J]. 計算機應用, 2011, 31(6): 1546-1549, 1568.
[7] Ferecatu M, Geman D. A statistical framework for image category search from a mental picture [J]. IEEE Trans. Pattern Anal. Mach. Intell, 2009, 31(6): 1087-1101.
[8] 史習云, 薛安榮, 劉艷紅. 改進k-means聚類算法在圖像檢索中的應用研究[J]. 計算機工程與應用, 2011, 47(10): 193-197, 248.
[9] 李宗民, 唐志輝. 九宮格空間框架的圖書圖像檢索[J].中國圖象圖形學報, 2013, 18(3): 325-329.
Highly Adaptive Image Retrieval Technology Based on Fast Wavelet Transform
Liu Jun, Ru Qingyun
(Department of Computer Science and Technology, Henan Mechanical and Electrical Engineering College, Xinxiang Henan 453000, China)
In the existing research in the field of content-based image retrieval, image features obtained by adaptive wavelet transform have a wide range of applications. There is a common problem in these methods that different query images are described with the same wavelet basis. In order to improve the adaptive capacity of image retrieval techniques, different wavelet bases are designed for different query images. Different wavelet bases can be used in adjusting retrieval performance for different query images, and the extraction time does not significantly increase. The experimental results show that this new image retrieval technology has a high adaptive capacity and its retrieval performance is also greatly improved.
image retrieval; wavelet transform; wavelet basis; adaptive
TP 393
A
2095-302X (2014)02-0262-06
2013-05-21;定稿日期:2013-07-21
河南省基礎與前沿技術研究計劃基金資助項目(082300410390);河南省高等學校教學工程項目——教學團隊(豫教高2012[1099]號)、精品資源共享課程(豫教高2012[1185]號)
劉 晙(1981-),男,湖北天門人,講師,碩士。主要研究方向為圖形圖像、軟件技術及數據庫。E-mail:liujun20100@163.com
茹慶云(1958-),男,河南新鄉人,副教授,碩士。主要研究方向為小波及圖像方面的應用。E-mail:ddnt@163.com