宋衛華
(黃山學院機電與信息工程學院,安徽黃山 245021)
隨著計算機技術和醫學成像技術的發展,基于內容的圖像檢索(Contend-Based Image Retrieval,CBIR)在生物醫學領域的應用成為研究熱點。CBIR在描述圖像時,大多提取圖像自身的顏色、紋理、形狀、空間關系等底層特征,形成特征庫,然后將待查圖像與特征庫進行基于向量空間模型的匹配[1-2],尋找相似圖像,以輔助醫生的判斷和診療。
紋理特征是一種重要的圖像底層特征,并被廣泛應用[3-4]。文中研究的胸部CT圖像,其圖像間相似度高,空間分辨率高,鑒于其紋理信息豐富,從統計法中的灰度共現矩陣和頻譜法中的小波變換來提取紋理特征,對兩種方法進行了比較和分析,實驗表明,基于小波變換的紋理特征提取方法可以有效描述圖像紋理并取得較好檢索結果。
灰度共現矩陣(Gray Level Co-occurrence Matrix,GLCM)建立在估計圖像的二階組合條件概率密度函數基礎之上,描述在θ方向上距離為d的一對像素,分別具有灰度值i和j的出現概率,其元素可記為p(i,j|d,θ)。由此可得灰度共現矩陣是距離和方向的函數。定義如下:

式中:Lr,Lc——分別為水平空間域和垂直空間域。
同理可得到距離為d,方向為θ=45°,90°,135°的公式。其中,分子表示具有某種特定空間關系,灰度層分別為i,j的像素對的個數,分母為像素對的總個數(#代表數量)。這樣所得的p是歸一化的,文中距離d取1。由空間灰度共現矩陣可以計算出一組參數,用來定量描述紋理特性。文中根據胸部CT圖像灰度分辨率高等特點,提取以下6種參數[5]:
1)二階矩:

2)熵:

3)對比度:

4)最大概率:

5)相關性:

式中:μx,μy,σx,σy——分別為px,py的均值和標準差;


6)最大運行長度概率:

針對所研究的胸部CT圖像,文中提取0°,45°,90°,135°的4個方向上的灰度共生矩陣(d取1)。最后以各分量的均值和標準差作為紋理特征向量中的各個分量(總共12個分量)。因12個特征分量的物理意義和取值范圍不同,運用高斯方法對其進行內部歸一化。由于胸部CT圖像的病理特征主要反映在肺葉區域,在進行特征提取時為了突出圖像中部區域的重要性,將原始圖像的二維空間進行8×8的劃分,每個區間賦予一定的權值,權值矩陣如下:

再針對每個分塊提取紋理特征,其相似度計算如下(其中k表示分塊):


小波變換(Wavelet Transform)算法是由法國科學家Mallat在1988年提出的,常用于紋理分析和分類[6]。小波變換是將圖像信息分解到尺度與空間域的聯合分布之中,形成對圖像信號的聯合表征。紋理分析常采用兩種結構的小波變換:金字塔結構的小波變換和樹結構小波變換[7]。就性能來說,不同的小波變換在對紋理分析方面沒有很顯著的差別。文中采用了金字塔結構的哈爾小波變換,通過對基函數分解表示圖像信號,其中,基函數ψmn(x)是由母函數ψ(x)伸縮和平移得到:

其中m,n是整數,圖像經過小波變換后的變換系數f(x)可表示為:

cmn為圖像相鄰像素的均值和方差組成的系數,整個小波變換的過程需要遞歸的過濾和采樣。首先,利用哈爾小波變換將圖像進行3級分解,得到一個多分辨率表示,獲取圖像信息的一種簡單的分層理論框架。文中對胸部CT圖像3層小波分解,如圖1所示。

圖1 胸部CT圖像3層小波分解圖
小波分解通道的輸出具有較大的能量時即體現了圖像在當前頻率或方向下的紋理特征。為此,可以用每個波段的每個分解層次上能量分布的均值和方差來表示圖像的紋理特征。公式如下:

式中:M×N——小波子帶的大小;
μ(x)——小波系數的均值。
經上述分解后提取20維的紋理特征向量。
針對采集的胸部CT掃描圖片(共215幅,其中肺癌患者圖像45幅,其余為正常圖像),基于上述分析,在Windows XP系統下,應用VC#和SQL Server 2005實現了一個圖像檢索的原型系統,在此基礎上進行了以下實驗:
1)基于灰度共現矩陣的紋理特征檢索;
2)基于小波變換的紋理特征檢索。
實驗規定:判斷兩幅圖像相似(相關)的依據是它們是否具有相同的病理特征。
采用查準率評價算法的檢索性能,查準率越高,表明檢索到的圖像越相似,檢索算法、檢索精度也就越高。查準率precision定義為:

式中:a——系統返回的圖像中與查詢圖像相關的圖像數目;
b——不相關的圖像數。
為了定量地評價文中算法,隨機選取10幅圖像進行上述實驗,分別計算10幅圖像檢索的查準率,結果如圖2所示。

圖2 檢索結果比較
由圖2可見,基于小波變換的紋理特征檢索方法要比基于灰度共現矩陣的紋理特征檢索效果好。由于醫學圖像一般都具有豐富的紋理信息,而多數的病灶部位也都是通過圖像上的紋理分布才可獲得,經過小波變換的多分辨率分解,將粗紋理的空間能量集中在低頻部分,而細紋理對應的頻率分量主要在高頻部分,為此通過提取高頻和低頻部分的紋理,可有效描述圖像的底層紋理特征,從而獲得了相對較好的檢索效果。
從統計法中的灰度共現矩陣和頻譜法中的小波變換來提取紋理特征,對兩種方法進行了比較和分析,實驗表明,基于小波變換的紋理特征提取方法可以有效描述圖像紋理信息,取得了較好的檢索結果,這對研究CBIR技術在醫學領域(如胸部CT圖像)的應用具有一定的參考價值。文中的特征檢索技術僅涉及到圖像的底層紋理特征,為此,如何融合高層語義本體特征,彌補底層-高層特征間的“語義鴻溝”[8-10],進一步提高檢索的效果,將是我們下一步的研究工作。
[1] 錢晶瑩,高月松.圖像檢索系統中的CBIR技術研究[J].電腦知識與技術,2011,7(2):415-417.
[2] 王洋.多模態圖像檢索技術[D]:[博士學位論文].合肥:中國科學技術大學,2013.
[3] 章毓晉.基于內容的視覺信息檢索[M].北京:科學出版社,2003.
[4] Wang J Z,Li J,Wiederhold G.SIMPLIcity:Semantics-sensitive integrated matching for picture libraries[J].IEEE Trans on Pattern Analysis and Machine Intelligence,2001,23(9):947-963.
[5] Haralick R M.Statistical and structural approaches to texture[J].Proceedings of IEEE,1979,67(5):786-804.
[6] 李瑋琳.平移不變小波醫學圖像融合方法[J].長春工業大學學報:自然科學版,2013,34(6):653-655..
[7] 邰曉英,北研二.信息檢索技術導論[M].北京:科學出版社,2006.
[8] 何超,張玉峰.融合領域本體的中文文本語義特征提取算法[J].研究情報理論與實踐,2013,36(9):96-99.
[9] Timothy N R.Statistical topic models for multi-label document classification[J].Machine Learning,2012,88(1/2):157-208.
[10] 張國棟,張化祥.基于語義的文本特征加權分類算法[J].計算機應用研究,2012,29(12):4476-4478.