宋衛(wèi)華 (黃山學院機電與信息工程學院,安徽 黃山 245021)
基于特征融合和相關反饋技術的圖像檢索研究
宋衛(wèi)華 (黃山學院機電與信息工程學院,安徽 黃山 245021)
為提高圖像檢索精度,在研究單一特征檢索算法基礎上,提出了基于底層-底層和底層-高層2種級別的特征融合檢索方法,利用相關反饋技術逐步求精以提高檢索性能,并用VC#和SQL server2005實現(xiàn)了一個圖像檢索原型系統(tǒng)。研究表明,利用該研究方法能夠提高圖像檢索精度,因而具有可行性。
圖像檢索;特征融合;相關反饋
基于內容的圖像檢索在對圖像進行描述時,一般首先提取圖像自身的顏色、紋理、形狀、空間關系等特征,再進行基于向量空間模型的匹配[1]。但僅僅利用單一特征是不夠的,因而如何有效集成圖像的多種特征是目前的研究熱點[2]。為此,筆者了基于特征融合算法和相關反饋技術對圖像檢索進行了研究。
1.1基于模糊C均值聚類的顏色相關圖特征提取
在模糊C均值聚類基礎上提取顏色相關圖特征,通過對目標函數(shù)的迭代優(yōu)化以實現(xiàn)集合的模糊劃分[3],將n個數(shù)據(jù)點分為c個模糊組,對每個數(shù)據(jù)點用值在[0,1]來確定其屬于各個組的程度,并求每組的聚類中心,最終使得非相似性指標的價值函數(shù)達到最小。隸屬矩陣U如下:
(1)
模糊C均值聚類時的價值函數(shù)J如下:
(2)
式中,uij∈[0,1];ci為模糊組i的聚類中心;dij為第i個聚類中心與第j個數(shù)據(jù)點的歐式距離;m∈[1,∞]是一個加權指數(shù)。
構造以下新的目標函數(shù),使得式(2)達到最小值的必要條件為:

(3)
式中,λj(j=1,…,n)是約束式的拉格朗日乘子。
對所有輸入?yún)⒘壳髮?,使?3)達到最小值的必要條件為:

(4)
進行FCM聚類的具體步驟如下[4]:①設定N個聚類中心的初始值;②求每個像素值與所有聚類中心的Dhsv距離,并確定隸屬函數(shù)矩陣,在此基礎上,計算總的價值函數(shù)和確定聚類中心。③根據(jù)確定的聚類中心計算總價值函數(shù)并與②中的總價值函數(shù)相比,若趨于穩(wěn)定(價值函數(shù)值相對比較小)則停止迭代,否則返回②繼續(xù)進行。
1.2紋理特征的分析與提取
小波變換提供了一種將能量有限信號分解成一系列對數(shù)帶寬相同的頻道的方法,通過將圖像信息分解到尺度與空間域的聯(lián)合分布之中,形成對圖像信號的聯(lián)合表征。紋理分析常采用2種結構的小波變換:金字塔結構的小波變換和樹結構小波變換。就性能來說,不同的小波變換在對紋理分析方面沒有很顯著的差別。筆者采用了金字塔結構的哈爾小波變換[5],通過對基函數(shù)分解來表示圖像信號,其中基函數(shù)ψmn(x)由母函數(shù)ψ(x)伸縮和平移得到:

(5)
ψmn(x)=2-m/2ψ(2-m/2x-n)
(6)
式中,m表示伸縮因子;n表示平移因子。
則圖像經過小波變換后的變換系數(shù)f(x)可表示為:
(7)
式中,cmn為圖像相鄰像素的均值和方差組成的系數(shù)。
整個小波變換化的過程需要遞歸的過濾和采樣,為此將圖像進行3層分解,得到圖像信息的簡單分層理論框架。在每個層次上,信號被分解為4個波段,用每個分解層次上的每個波段的能量分布均值(ENG)和方差(DEV)來表示圖像的紋理特征:
(8)
(9)
式中,M×N是小波子帶大?。沪?x)是小波系數(shù)均值。
1.3圖像檢索過程
首先對多個特征設置不同的權重,然后將其進行線性組合來實現(xiàn)特征融合算法。由于不同特征間相似度不具可比性,為此進行特征間歸一化[6]:
(1)計算查詢圖像q與庫中每幅圖像的基于單一顏色相關圖特征的相似距離d(1,q),d(2,q),…,d(n,q),(n為庫圖像總數(shù)),并計算其均值md和方差σd。
(2)對d(1,q),d(2,q),…,d(n,q)按下式進行高斯歸一化,使相似度的值落在區(qū)間[0,1]上:

(10)
(3)重復步驟(1)、(2),可得到歸一化后的基于單一紋理的相似距離。
(4)為單一特征分配權重wi,進行特征融合,則基于特征融合的相似距離Dfus可表示為:
(11)
相關反饋技術主要是通過修正系統(tǒng)的檢索策略,進行多次檢索,得到與用戶實際需求盡可能相符合的檢索結果[1]。對于采用向量空間模型的系統(tǒng),相關反饋技術一般采取如下2種策略,即移動查詢向量和調整距離測度策略。其中移動查詢向量的過程如下:按照最初的查詢條件(向量),查詢系統(tǒng)返回查詢結果,然后人為介入(或自動)來選擇幾個最符合查詢意圖的返回結果(正反饋集合),也可以選擇最不符合查詢意圖的幾個返回結果(負反饋集合)。上述反饋信息被送入系統(tǒng)用來更新查詢條件,以便重新進行查詢,從而讓隨后的搜索更符合查詢者的真實意圖。筆者采用Rocchio算法[7]來移動查詢點,該過程是一個迭代過程:
(12)
式中,Qi+1和Qi分別對應第i+1次和第i次的查詢向量;DR′和DN′分別為正反饋集合和負反饋集合;NR′和NN′分別為正反饋集合和負反饋集合的數(shù)目,α、β、γ分別為加權常數(shù)。因此,通過移動小波變換后各波段能量分布的特征向量的查詢點和調整顏色相關圖特征與紋理特征的權重,可實現(xiàn)檢索時的相關反饋。
針對采集的內窺鏡圖像1361幅(其中169幅為有癌圖像,其余為無癌圖像),基于上述分析,運用VC#和SQL Server2005實現(xiàn)一個圖像檢索原型系統(tǒng),在此基礎上設計如下試驗:①基于模糊C均值聚類的顏色相關圖特征檢索;②基于小波變換的紋理特征的檢索;③在試驗①的基礎上融入基于小波變換的紋理特征,進行特征融合檢索;④在試驗③的基礎上加入相關反饋進行多次檢索。判斷2幅圖像相似(相關)的依據(jù)是它們是否具有相同的病理特征。
對于檢索性能的評價,采用了基于排序值的Rank方法[8],一般地,排序值越靠前(小),說明圖像間相似度越高。除此之外,還應計算查準率,查準率定義為檢索到的相關圖像數(shù)占檢索到的圖像數(shù)的比例,查準率越高,表明該檢索算法檢索精度越高。為此,隨機選取10幅圖像并計算其檢索的平均排序值和平均查準率(見表1)。

表1 基于不同檢索算法的檢索結果比較表
從表1可以看出,基于特征融合和相關反饋技術的檢索算法獲得的檢索結果,其平均排序值最低,而平均查準率最高,因而利用該算法可以獲得很好的檢索精度。
在分析單一特征檢索算法的基礎上,提出了基于特征融合和相關反饋的圖像檢索算法。實例分析表明,該算法具有較高的查準率和較小的排序值,說明其檢索性能較好,可用應用在精度要求較高的圖像(如內窺鏡圖像)檢索中。
[1]錢晶瑩,高月松.圖像檢索系統(tǒng)中的CBIR技術研究[J].電腦知識與技術,2011,7(2):415-417.
[2]陸麗珍,劉仁義,劉南.一種融合顏色和紋理特征的遙感圖像檢索方法[J].中國圖象圖形學報,2004,9(3):328-332.
[3]Song Weihua,Tai Xiaoying.Medical image retrieval based on FCM using feature fusion[J].Journal of Computational Information System,2007,3(4):1635-1642.
[4]Brecheisen S,Kriegel H P,Pfeifle M. Multi-step density-based clustering[J].Knowledge and Information Systems April,2006,9(3):284-308.
[5]韋娜.基于內容圖像檢索關鍵技術研究[D].西安:西北大學,2006.
[6]邰曉英,北研二.信息檢索技術導論[M].北京:科學出版社,2006.
[7]芳野純潔, 濱田.內鏡診斷與鑒別診斷圖譜[M].沈陽:遼寧科學技術出版社,2003.
2013-05-22
宋衛(wèi)華(1982-),女,碩士,助教,現(xiàn)主要從事圖形圖像和數(shù)據(jù)庫方面的教學和研究工作。。
TP391
A
1673-1409(2013)28-0026-03
[編輯] 李啟棟