丁兵兵
【摘 要】本文描述了基于直方圖的圖像檢索的一種方法。由于進行基于內容的圖像搜索時,研究對象具有多樣性和復雜性的特征,文中介紹的方法都有一定的局限性。本文只是著眼于圖像分層和直方圖的特征對圖像進行檢索,提高檢索精度和速度。
【關鍵詞】圖像檢索 直方圖 分層方法 顏色模型 閾值
多媒體數據庫是指存儲和管理大量多媒體對象的數據庫,如音頻數據,圖像數據,視頻數據,序列數據以及超文本數據(包含文本,文本標記和鏈接)。由于音頻視頻設備,CD-ROM和因特網的流行和普及,多媒體數據庫系統變得日益普遍。典型的多媒體數據庫系統包括NASA的EOS,各種圖像和音頻視頻數據庫,人類基因數據庫和因特網數據庫。本文主要考慮的是圖像數據的相似性搜索。
圖像的產生,從最古老的人工繪制,印刷復制,照相攝影,制版沖洗,到現代的計算機合成,其中的發展變化,使圖像的產生方式,存儲形式和傳輸方式,日益簡單方便。尤其是數字技術,計算機及網絡技術的發展和普及,使圖像成為大眾化數字信息的一種形式。強大的數字處理能力,使人們可以利用相應的軟件,隨心所欲的對數字信息進行編輯,復制和發行。數字圖像強大的優越性,使對圖像信息的使用滲入到社會各行各業和人們生活的每個角落。
如今,對數字圖像的使用包括國防軍事,工業制造,醫療衛生,新聞媒體,大眾娛樂和家庭生活等的各個方面。在如此廣闊的應用背景下,產生了大量的各式各樣的圖像數據庫。對圖像數據庫的查詢和管理成了一個迫在眉睫的研究課題。圖像數據庫檢索查詢研究的目的就是實現自動地、智能化地檢索,查詢和管理圖像。使查詢者可以實現方便,快速,準確地查找。使管理者可以從大量單調地人工管理工作中解放出來,實現管理工作地無人干預。
對圖像數據庫相似搜索,主要考慮兩種圖像多媒體標引和檢索系統:(1)基于描述地檢索系統,主要是在圖像描述之上建立標引和執行對象檢索,如關鍵字,標題,尺寸和創建時間等,這種方式若手工完成是很費力的,若自動完成,檢索結果質量通常較差很難滿足日益復雜的圖像數據庫形式。(2)基于內容地檢索是現在最為流行地方法,它支持基于圖像內容地檢索,如顏色構成,紋理,形狀,對象和小波變換等。這種檢索方式使用視覺地特征標引圖像并基于特征相似檢索對象,在實際應用中比較需要。
人們已經提出了幾種在圖像數據庫中基于圖像特征標識地相似檢索方法:基于顏色特征檢索;基于形狀特征檢索;基于紋理特征檢索。其中,基于顏色特征檢索地方法中,顏色特征包括了圖像顏色構成地顏色直方圖,直方圖具有天然地旋轉不變性且包含較多信息,但是單純使用顏色直方圖方法來檢索往往起不到理想效果,原因是由于直方圖中不包含任何有關形狀,位置和紋理地信息,因此具有相似顏色構成地兩幅圖像可以包含極為不同的形狀或紋理,這樣在語義上是完全不相關的,這樣就使得一個直方圖可對應多幅圖像的現象;如何簡單度量兩個直方圖之間的相似程度方法不一,影響檢索效果;圖像數據庫檢索所要求的尺度,旋轉,平移不變性一直是各種匹配方法的基本要求。本文提出了一個新的基于直方圖的圖像數據庫檢索方法。
一、分層直方圖
表達圖像顏色的方式有很多,常見的顏色模型有RGB,HIS,CMYK,CMY等。RGB屬于基本模型,是數字圖像處理的主要表達方法。CMY和CMYK常見于印刷業。HIS較適合人眼習慣描述物體。本文中采用RGB模型并進行歸一化處理。
1.分層
由于直方圖較難反映圖像的空間信息,不同圖像可能對應同一直方圖(如圖1)現有解決方法有將一副圖像分成多個子塊或將顏色信息與紋理,形狀信息聯系起來。本文提出了一個按照圖像比特平面分層計算其直方圖的模型。假設圖像由8個比特平面組成,其范圍從最低有效位的位平面0到最高有效位的位平面7,在8比特字節中,平面0包含圖像中象素的最低位,而平面7包含了最高位,圖2說明了這些概念。在較高階位(特別是前四位)包含了大多數在視覺上很重要的數據,其他位平面對圖像中更多的微小細節有作用,把數字圖像分解成位平面后,可以看到每一位在圖像中的相對重要性,對于圖像的位平面而言,只需抽取其最高兩位和最低一位既可以描述改圖像了,然后在分別計算其對應的直方圖即可。本文中,抽取位平面是利用灰度閾值變換函數進行處理的,最高位平面是把圖像中0到127中的所有灰度映射到一個灰度級0,把129到255間的灰度映射為另一個灰度級255,第二個位平面即第6個平面按照這種方法,把圖像中0到63的所有灰度映射到一個灰度級127,其他灰度映射到一個灰度級0上,第0個位平面一樣,把0到7的灰度級映射到一個灰度級15,其他映射到0上,然后分別計算所得位平面圖的直方圖,當然也可以取更多位平面,不過這樣計算量也會增大,三個位平面圖已經足夠了。對于彩色圖像,R,G,B各灰度圖分三個位平面直方圖,再加上原圖像的直方圖,共要10個直方圖,這樣足以檢索到希望的圖像了。(如圖3)


2.歸一化處理
(1)顏色模型。我們可以認為任何顏色都可以由R,G,B三種顏色按一定比例調和而成,由于光強變化引起的物體表面顏色變化可以通過RGB顏色模型的歸一化解決。
(2)直方圖。圖像f(x,y)是一個離散函數,設Sk為f(x,y)的第k(k=0,1,2……N-1)級灰度值,Nk為具有Sk的象素個數,N為圖像象素的總數。對于同一幅圖像,若尺寸變更或壓縮前圖像象素數和灰度級各為N1,S1,尺寸變更或壓縮后圖像象素數和灰度級為N2,S2。一般地,因為N1=CN2,Nk1=CNk2(C為常數),經歸一化后P(Sk)=NK/N后,直方圖相對灰度變化范圍為0-1,圖像變化前后地歸一化直方圖一致,解決了尺度變化造成地影響。
3.特征向量
直方圖包含地信息多,變化范圍廣,本文采用慣性比方法來簡明表達它。由1知,僅用10個直方圖表示一個圖像,則用10個參數即可完整表達1幅圖像。直方圖地極慣性矩In與改圖形地最小包絡矩形地極慣性矩Im之比,即u=In/Im稱為慣性比。慣性比無量綱且0
4.相似性判斷
判斷兩個直方圖是否相等有很多方法。有Swain和Ballad提出的直方圖相交,歐幾里德距離,海明距離等,本文采用海明距離來度量兩個直方圖的相似程度。假設要查詢圖像為Q,儲存圖像為I,則海明距離為
Dqi=Qv-Iv該值越小,則兩圖越接近,否則相差就越大。
5.閾值
因為圖像數據庫中圖像數量多,圖像之間的差異很大,若每幅圖像都進行以上判斷較浪費時間,因此先求出R,G,B三個相對灰度直方圖的平均值AvgR,AvgB,AvgG,并使Avg=(AvgR,AvgB,AvgG)/3,如果Q_Avg和I_Avg相差太多,則不必進行特征向量判斷即可認為兩圖不同。
二、結論
本文利用了位平面對圖像進行分層求直方圖,并通過將直方圖歸一化處理解決尺度變化問題,還使用慣性比使標識圖像變得簡單,分層求直方圖解決了將圖像顏色和空間信息結合起來,避免了單一使用直方圖時的問題。
參考文獻:
[1]岡薩雷斯.數字圖像處理.
[2]郭嗣倧,陳剛.信息科學中的軟計算方法.
[3]王文惠,周良柱,萬建偉.基于內容的圖像檢索技術的研究和發展.2001計算機工程與應用.
[4]范明,孟小峰等譯.數據挖掘.概念與技術.
[5]歐宗英,王亮申.矩常量―幾何形狀標識的新方法.機械科學與技術,2002.