黨長青
(唐山學院電子信息系,河北唐山063020)
圖像作為一種重要的信息載體,是組成多媒體信息的重要內容。隨著計算機技術、現代通信技術以及信息多媒體技術的快速發展,人們在工作和生活中越來越多地接觸到各種各樣的圖像信息。面對日益龐大的信息海洋,如何有效地組織管理和檢索大規模的圖像數據,并且從大量的數字圖像中快速準確地檢索出用戶需要的圖像,成為一個迫切需要解決的問題。
20世紀70年代,數據庫專家就開始研究如何對圖像資源進行有效的管理和查詢,最早使用的方法是基于文本的圖像檢索(TBIR),即首先用文本對圖像進行標注,并用基于文本的數據庫管理系統DBMS來建立起標注和圖像之間的關聯,從而實現圖像檢索功能。但是基于文本的圖像檢索技術在圖像信息飛速增長的今天存在很大的缺陷:首先,手工對圖像進行注解所需的工作量太大;其次,由于個人感知的差異,不同的人對相同的圖像可能有不同的理解,圖像注解的主觀性和不準確性可能導致檢索過程產生誤差。所以利用圖像本身的內容來進行圖像檢索勢在必行,從而產生了基于內容的圖像檢索技術(CBIR)。
基于內容的圖像檢索不同于以往的基于文本的圖像檢索方法,它是指直接根據描述圖像對象內容的各種特征進行檢索,根據用戶提出的反映圖像內容特征的查詢要求,能夠從圖像數據庫中檢索出具有指定特征或含有特征內容的圖像(包括視頻片斷),并且融合了計算機圖像處理、模式識別、數據庫等關鍵技術。由于基于內容的圖像檢索技術固有的優越性,使得其正逐漸成為目前研究的熱點,并廣泛地應用于眾多領域。
圖像特征包括3個方面:①顏色特征。②形狀特征。③紋理特征。
顏色是物體表面的一種最直觀、最明顯的視覺特征,每種物體都有其特有的顏色特征,同一類事物往往有著相似或相同的顏色特征,因此可以利用顏色特征來區分不同物體。而且顏色特征計算起來比較方便,因此利用顏色特征進行圖像檢索已經成為基于內容檢索技術中最重要的方法之一。目前顏色特征的描述方法主要有顏色直方圖法、顏色相關圖法、顏色矩法、顏色聚合矢量法等。
形狀是圖像表達和圖像檢索中的一個非常重要的特征內容。在二維圖像空間中,形狀是一個非常直觀的特征,因此具備良好的可區分性,但是不同于顏色和紋理等特征,形狀特征的提取必須以建立在對圖像中物體或區域的邊緣提取和分割基礎上。形狀一般指被一條封閉的輪廓曲線所包圍的區域,對形狀特征的描述,既可以描述其邊界特征,也可以描述其所包圍的區域。所以,目前常用的形狀特征描述方法主要分為以下兩種:基于邊界的形狀描述和基于區域的形狀描述。
紋理特征是一種不依賴于顏色或亮度的反映圖像中同質現象的視覺特征。紋理是圖像的重要低層物理表征,廣泛存在于各種自然物體表面。例如云彩、水波、織物等都有各自的紋理特征。紋理特征包含了物體表面結構組織排列的重要信息以及它們與周圍環境的聯系,反映了圖像或物體本身的屬性。正因為如此,紋理特征在基于內容的圖像檢索中得到了廣泛的應用。目前,紋理的描述和分析方法很多,人們可以從圖像中具有結構規律的特性加以分析得到紋理特征,或者可以對圖像中顏色強度的空間分布信息進行統計得到紋理信息。紋理特征的描述方法主要有:統計分析方法、頻譜分析方法和結構分析方法。
圖像檢索就是將檢索圖像和圖像庫(即:數據庫中的圖像,假設1 000幅,進行相似度計算,就是將檢索圖像和圖像庫中的1 000幅圖像依次比較,然后按某種相似度計算方法進行相似度計算(比如歐式距離),然后對他們進行排序(如對1 000個計算結果使用冒泡排序進行排序,大的在前,小的在后,我們返回前面的20幅作為我們的檢索結果)。
對于圖像檢索而言,相關反饋就是為了進一步提高檢索精度而采用的方法,其實不采用相關反饋也是一個完整的檢索系統。但是為了提高檢索性能,我們在對圖像進行相似度計算后,對返回的結果進行評價,標出相關圖像(就是檢索相似的圖像,比如我們檢索花,返回的結果中有花的圖像就是相關圖像,而沒有花的圖像就是無關圖像)和無關圖像。然后按照相關反饋算法進行反饋。重新對圖像庫進行檢索,如此反復,直到得到滿意的結果。
作為傳統數據庫檢索技術的拓展,基于內容的圖像檢索系統主要是根據圖像的內容特征進行檢索的,同傳統的關系數據庫檢索系統相比,基于內容的圖像檢索系統存在很大的不同。在傳統數據庫中,檢索匹配是精確匹配的,而基于內容的圖像檢索系統檢索匹配過程是一個近似匹配的過程。基于內容的圖像檢索系統的檢索流程,歸納為以下幾個步驟:
首先,對用戶選擇的圖像數據庫中所有圖像,按照指定的特征提取方法,提取其相應的圖像特征,并且以多維特征向量的形式存儲到數據庫中,從而形成圖像的特征庫。
其次,當用戶提交圖例作為查詢圖像時,系統通過對查對查詢圖像進行特征提取,把用戶提交的查詢圖像轉換成其內部的表示形式即特征向量。圖像特征提取是把圖像的內容以特征向量表達出來,因為我們在計算相似度的時候,都是計算特征向量的相似度。
計算圖像庫中所有圖像和查詢圖像之間的相似度,并且進行相似度排序。當遍歷完整個圖像特征庫時,系統會根據相似度排序結果,把與查詢圖像最相似的前K幅圖像作為檢索結果返回給用戶,這樣就完成了一次圖像檢索過程。