陸 光,滿慶麗
(東北林業(yè)大學信息與計算機工程學院,哈爾濱 150040)
天牛是林木的毀滅性害蟲,例如2004年,哈爾濱7萬株糖槭樹被光肩星天牛蛀蝕的千瘡百孔,對哈爾濱的樹木產(chǎn)生毀滅性的危害,由于天牛的危害致使樹木干枯而死,因此目前對天牛的防治研究已成為急需解決的重要課題。用計算機視覺技術(shù)及早的發(fā)現(xiàn)、判斷和采取相關(guān)的措施,可減少生產(chǎn)損失,目前基于內(nèi)容的圖像檢索技術(shù)還未被應用到天牛防治工作中。
基于內(nèi)容的圖像檢索技術(shù) (CBIR)是在20世紀90年代初提出的,基于內(nèi)容的圖像檢索根據(jù)圖像,圖像的語義以及上下文聯(lián)系進行查找,以圖像語義特征為線索從圖像數(shù)據(jù)庫中檢索出具有相似特征的其他圖像。但是圖像的規(guī)模一般要大于純粹的文本信息,因此基于內(nèi)容的圖像檢索在速度和效率上要求更高。隨著CBIR的提出,也出現(xiàn)了許多商業(yè)系統(tǒng)和研究原型系統(tǒng),例如QBIC[1](Qurey By Image Content)由IBM最早商業(yè)化的基于內(nèi)容的圖像檢索系統(tǒng),以及由哥倫比亞大學研發(fā)的WebSeek系統(tǒng),麻省理工學院研發(fā)的Photobook[2]用于瀏覽和搜索圖像的一套交互式工具。基于內(nèi)容的圖像檢索系統(tǒng)一般包括圖像處理模塊、查詢模塊、對象庫和特征庫和知識庫,因此一個好的CBIR系統(tǒng),首先要進行圖像的特征提取與表達,特征選取的好壞對整個檢索系統(tǒng)有著重要的影響,直接關(guān)系到整個系統(tǒng)的檢索準確度、檢索效果和檢索效率。文中提出了利用顏色特征和紋理特征作為特征向量,并采用主成分分析法 (PCA)對特征向量降維處理,提高了檢索的圖像的效率。
顏色特征是圖像的基本特征之一,同時也是圖像檢索中應用最為廣泛的視覺特征[3-4],與其它視覺特征相比,顏色特征對圖像本身的尺寸、方向和視角的依賴性較小,并且提取也相對容易,因而基于顏色圖像特征的圖像檢索受到了人們廣泛的重視和研究。圖像的顏色特征主要有顏色直方圖,顏色各個分量的統(tǒng)計特征,或者是采用加權(quán)的方法,將所有的分量合成一個量,構(gòu)建出來對顏色的統(tǒng)計信息;顏色矩,也是顏色離散數(shù)據(jù)的統(tǒng)計特征,不包含空間信息,并且可以是全局的,也可以是局部的,一個純統(tǒng)計的特征;顏色聚合向量,一種對顏色直方圖的一種比較聰明的改進;顏色相關(guān)圖,它比顏色直方圖和顏色聚合向量具有更高的檢索效率;還有就是顏色集,顏色集表達為二進制的特征向量,這個在數(shù)據(jù)結(jié)構(gòu)中構(gòu)造二分查找來加快檢索速度,對于海量數(shù)據(jù)和數(shù)據(jù)倉庫這樣的圖像集合將會起到非常有效的作用。
顏色特征的提取首先是對顏色模型的選擇,面向視覺感知的應用,如動畫中的彩色圖形,各種圖像處理算法等[5]都采用HSV模型。HSV空間是比較常用的統(tǒng)計顏色特征的空間,它比RGB系統(tǒng)更接近人們的經(jīng)驗對彩色的感知,并且從RGB到HSV的轉(zhuǎn)換簡單、快速,因此在提取顏色特征之前將圖像從RGB轉(zhuǎn)換到HSV空間。
顏色矩是一種非常簡單且有效的顏色特征描述方法,與顏色直方圖相比,該方法的一個好處在于無需對顏色進行量化,同時降低了顏色特征維數(shù)。由于顏色分布信息主要集中在低階矩中,因此采用顏色的一階矩 (Mean)、二階中心矩 (Variance)和三階中心矩 (Skewness)表達圖像的顏色分布。顏色的三個低階矩在數(shù)學上的表達如下:


但是顏色矩丟失了顏色的空間分布的信息,為了提取的顏色特征包含空間分布信息,提出了矩形重疊式的分塊策略,一方面考慮了空間信息,另一方面又考慮了各個分塊之間的聯(lián)系。分塊效果如圖1所示。

圖1 矩形重疊式分塊Fig.1 The effect of rectangular overlapped sub-regions method
顏色特征提取算法的實現(xiàn)步驟:
(1)將圖像庫中的圖像讀出來,對圖像進行分塊,分為k(k=1,2,3,4,5)塊,得到分塊的圖像。
(2)對于圖像的第k塊,分別計算其在三個顏色軸上的顏色矩,得到第k塊的顏色特征向量:

(3)綜合個分塊的特征向量,獲得整幅圖像的顏色特征向量:

(4)考慮到人的視覺對圖像中心區(qū)域的事物更加敏感,為五個分塊分配權(quán)重φ,確定第k個分塊的加權(quán)向量:

(5)綜合各分塊的加權(quán)特征向量,最后可獲得整幅圖像的加權(quán)顏色特征向量:

(6)顏色特征內(nèi)部歸一化。
內(nèi)部歸一化的目的是使特征向量內(nèi)部各分量在相似度量時地位相同,用I1,I2,I3,…,IM代表圖像庫中的M幅圖像,則對圖像數(shù)據(jù)庫中的M幅圖像,就可以得到一個M×N的特征矩陣F,N為特征向量的維數(shù),特征矩陣F的每一列是維數(shù)為M的特征序列Fj=[f1,j,f2,j…,fM,j],它代表圖像數(shù)據(jù)庫中所有圖像的特征向量的第j個特征分量。則歸一化的基本步驟如下:
假設(shè)每一個特征分量Fj=[f1,j,f2,j,…,fM,j]都符合高斯分布,計算出其均值mj和標準差σj,利用公式 (4)將fi,j歸一化至 [-1,1]區(qū)間,

紋理特征是基于內(nèi)容的圖像檢索系統(tǒng)中常用的特征,其提取方法包括統(tǒng)計紋理分析和結(jié)構(gòu)紋理分析兩種方法,進行定量分析和描述,經(jīng)過很多學者的不懈努力,目前已經(jīng)提出了許多有關(guān)紋理特征表達方法,例如 Tamura紋理特征[6]、灰度共生矩陣[7]、小波變換和自回歸紋理模型等。由于紋理是由灰度分布在空間位置上反復出現(xiàn)而形成的,因而圖像控件中間隔某距離的兩像素之間會存在一定的灰度關(guān)系,即圖像中灰度的空間相關(guān)特性。灰度共生矩陣就是一種通過研究灰度的空間相關(guān)性來描述紋理的常用方法,灰度直方圖是對圖像上單個像素具有某個灰度進行統(tǒng)計的結(jié)果,而灰度共生矩陣是對圖像上保持某距離的兩像素分別具有某灰度的狀況進行統(tǒng)計得到的。通過灰度共生矩陣,可以計算對比度、理的一致性、素對灰度的相關(guān)性、熵和能量等,最后,可以用一個向量將以上特征綜合在一起作為圖像的紋理特征,進一步用來分類,識別,檢索。
紋理特征提取算法的實現(xiàn)步驟:
(1)將RGB圖像轉(zhuǎn)化為灰度圖像,灰度級數(shù)目為256,生成一個256×256的共生矩陣,但是人眼只能區(qū)分一些較粗的紋理而不能區(qū)分一些較細的紋理,過細的紋理還增加了計算量,所以為了計算的時間復雜度,計算灰度共生矩陣前都要進行灰度級量化,文中采用量化為16級,即0~15級。
(2)計算共生矩陣,分別計算距離d為1,θ為0°、45°、90°、135°的共生矩陣元素p(i,j|d,θ),其中i,j為灰度級數(shù),計算公式如下:


式中:W,H是圖像的水平空間域和垂直空間域,k,m,l,n表示所選窗口中的變動。分別用公式(9~12)計算4個共生矩陣的熵、慣性矩、能量和相關(guān)這4個參數(shù)。

式中:μx,μy,σx,σy分別表示px,py的均值和標準差。用 μE,σE,μH,σH,μA,σA,μC,σC作為紋理特征向量中的各個分量。由此形成了紋理特征的特征向量f(i),f(i)=(μE,σE,μH,σH,μA,σA,μC,σC)。
(3)紋理特征內(nèi)部歸一化。根據(jù)顏色特征內(nèi)部歸一化的方法,對提取的紋理特征進行內(nèi)部歸一化處理,得到歸一化后的紋理特征向量。
根據(jù)顏色特征內(nèi)部歸一化的方法,對提取的紋理特征進行內(nèi)部歸一化處理,得到歸一化后的紋理特征向量。
多特征融合是現(xiàn)在圖像檢索中最常用的檢索方法,但是在將顏色特征和紋理特征進行融合后,顏色特征FF=(F(1),F(xiàn)(2),F(xiàn)(3),F(xiàn)(4),F(xiàn)(5))是45 維的特征向量,紋理特征是一個f(i)=(μE,σE,μH,σH,μA,σA,μC,σC)8 維的特征向量,融合在一起是 53維的特征向量,維數(shù)高,增加了檢索的復雜度,進而增加了檢索的時間,文中采用了主成分分析法(PCA)實現(xiàn)了特征向量的降維。假設(shè)有n個圖像,每個圖像有p個變量,構(gòu)成了n×p階的特征矩陣,

主成分分析法的步驟:
(1)計算相關(guān)系數(shù)矩陣R,大小為53×53的矩陣,rij為綜合特征向量中兩個特征分量的相關(guān)系數(shù),并且rij=rj,i,計算相關(guān)系數(shù)的公式為:

(2)計算特征值和特征向量,將特征值按大小順序排列λ1≥λ2≥…,λp≥0,λi對應的特征向量ei;
(3)計算主成分貢獻率和累計貢獻率:

取累計貢獻率達85%~95%的特征值所對應的m(m≤p)個主成分。
(4)計算主成分載荷:

(5)計算各主成分的得分,找到每個主成分中與特征向量有較大正相關(guān)的變量,最終分析得到降維后的低維特征向量來代替原來的高維特征向量。
相似性的度量方法很多,有的用于專門的領(lǐng)域,也有的適用于特定類型的數(shù)據(jù),如何選擇相似性的度量方法是一個相當復雜的問題。但是通常采用的方法都是計算樣本間的“距離”,常用的有歐式距離、曼哈頓距離、切比雪夫距離、閔可夫斯基距離、標準化歐式距離和馬氏距離等。目前在圖像檢索中常用到的主要相似性度量方法都是基于向量空間模型的,采用集合距離作為相似性度量。文中采用最常用的歐式距離進行相似性度量,其公式如下:

圖像檢索的效果容易受主觀因素的影響,不太好客觀判定一個圖像檢索算法的好壞,文中采用了查全率和查準率對檢索算法性能進行評價,給定一幅查詢圖像P,其查全率和查準率為:

式中:n為自動輸出的相關(guān)圖像數(shù);T為自動輸出的總的圖像數(shù)。

式中:N為人眼主觀地從檢索庫中找到的與示例圖像相似的圖像數(shù)。
文中采用了主成分分析法實現(xiàn)特征降維,因此又采用了響應時間來評價檢索的性能。
為了與文中提出的算法相比較,采用了三種方案,第一種是用顏色特征向量進行檢索,第二種是用紋理特征進行檢索,第三種是兩者結(jié)合的方法進行檢索。實驗采用的數(shù)據(jù)為100幅圖像構(gòu)成的圖像庫,圖像包括天牛蟲、小蠡、吉丁蟲和金花甲4類對林木危害性比較大的害蟲,另外還有20幅圖像為干擾圖像,使得實驗結(jié)果能夠更加準確的驗證算法的有效性。分別選擇天牛蟲和金花蟲兩類圖像的第一幅圖像作為示例圖像,用3種方案分別進行檢索[8-10],檢索結(jié)果如圖2 所示。
圖2中的 (a)、(b)為采用方案一對天牛蟲和金花甲進行檢索的結(jié)果,(c)、(d)為方案二的檢索結(jié)果,(e)、(f)為方案三的檢索結(jié)果。

表1 天牛蟲的檢索結(jié)果分析Tab.1 The results of image retrieval for longicorn

圖2 圖像檢索結(jié)果分析Fig.2 The retrieval results of the three programs

表2 金花甲的檢索結(jié)果分析Tab.2 The results of image retrieval for chrysomelidae
從表1和表2中可發(fā)現(xiàn),綜合顏色特征和紋理特征的圖像檢索的查全率和查準率高于其它兩種,并且經(jīng)實驗驗證查詢時間也比其它兩種快,所以文中的算法是行之有效的。
圖像檢索技術(shù)的研究是一個涉及到多個領(lǐng)域的綜合性課題,其實現(xiàn)算法也涉及到方方面面,但是各種圖像的特征是不同的,如何選取合適的算法提取圖像的特征,用低維的向量代替高維的特征向量來實現(xiàn)檢索也是一個重要的研究方面,雖然文中采用了PCA實現(xiàn)了降維,但是效果不是最優(yōu)的,如何解決這個問題也是研究課題之一。文中提取的是圖像的低層視覺特征,還不能有效地獲取用戶給出的高層語義信息,如何實現(xiàn)低層視覺特征與圖像的語義信息的溝通,是圖像檢索中一個極富挑戰(zhàn)性的課題。最后,把圖像檢索的相關(guān)技術(shù)進行推廣,應用到各行各業(yè)也是作為研究者必須面對和解決的問題,正如文中提到的天牛災害,通過圖像的快速檢索,盡早處理有可能發(fā)生的災害,為資源的保護和利用做出貢獻。
【參 考 文 獻】
[1]Flicker M,Sawhney H,Niblack W,et al.Query by image and video content:The QBIC system[J].IEEE Computers,1995,28:23-32.
[2]Pentland A,Picard R W,Selaroff S.Photobook:Content-based manipulation of image database[J].Int.Journal of Computer Vision,1996,18(3):233-254.
[3]Pentland A,Picard R W,Selaroff S.Photobook:Content-based manipulation of image database[J].Int.Journal of Computer Vision,1996
[4]Huang J,Kumar S R Mitra M,et al.Image indexing using color correlograms[C].IEEE Conference on Computer Vision and Pattern Recognition,1997:762-768.
[5]Stricker M,Orengo M.Similarity of Color images[J].SPIE Storage and Retrieval for Image and Video Databases,1995,2185:337-349.
[6]Tamura H,Mori S,Yamawaki T.Textual features corresponding to visual perception[J].Systems,Man and Cybernetics,1978,8(6):460-473.
[7]Haralick R M,Shanmugam K,Dinstein I.Textural features for image classification[J].Systems,Man and Cybernetics,1973,3(6):610-621.
[8]于潤偉.Matlab基礎(chǔ)及其應用[M].北京:機械工業(yè)出版社,2003.
[9]劉則毅.科學計算技術(shù)與Matlab[M].北京:科學出版社,2001.
[10]徐安英.天然鱗云杉枯死現(xiàn)狀調(diào)查及防治對策[J].森林工程,2011,27(2):35 -36.