李磊
湖北工程學院
基于數字圖像的檢索技術研究
李磊
湖北工程學院
近年來,網絡和多媒體技術越來越發達,網絡上的各類資源日以豐富,人們越來越青睞于直觀生動的多媒體技術,數字圖像的存在感越來越強,但它們并沒有被綜合整理分類,這樣想快速充分的利用這些有用信息,就需要用到圖像檢索技術。目前,網絡資源的日益豐富以及圖像檢索技術日益發展成熟,使得不斷擴大圖像檢索技術的應用領域,這就需要我們繼續研究完善圖像檢索技術。與此同時,網絡傳送速度與計算機信息處理速度不斷提高,網頁中越來越普遍的使用多媒體信息,特別是圖像信息,成為了網頁內容的重要組成部分。如何為用戶同時提供文本信息和圖像信息,是信息檢索中一個重要研究方向。于是各種基于Web的圖像檢索系統應運而生,極大地方便了用戶對網上圖像進行檢索。本文將重點介紹各種圖像檢索技術的原理、現狀、發展趨勢。
圖像檢索 文本內容 圖像內容
圖像檢索引擎的檢索途徑主要有三種:
但是因為受控詞匯本身的局限,易歧義,更新慢,所以不太容易應對網絡上日新月異的各類圖像,傳統的圖像檢索技術是通過精確匹配關鍵字檢索,用關鍵字標識系統內的圖像,標識相一致的關鍵字就是檢索線索,即輸入是關鍵字,輸出是圖像。它又包括兩種途徑:①基于圖像外部信息進行檢索。在找出圖像文件后,圖像檢索引擎通過查看文件名或路徑名確定文件內容。②基于手工標注的檢索。手工描述并分類圖像的內容,將其標注為關鍵字,并建立索引。這種查詢方式的有點是比較準確,有較好的查準率,但勞動強度大,圖像的標注也缺乏統一標準。
通過圖像分析軟件自動抽取圖像的顏色、形狀、紋理等特征進行檢索,并建立特征索引庫,輸入要查找的圖像的特征描述,通過檢索規則,輸出有著相近特征的圖像內容,按相似規則排列,這種檢索方法的優點是把在傳統圖像檢索技術中用戶描述或識別的圖像特征,交由系統去解決。這種檢索主要是基于圖像本身特征層次來完成的,適用于有明確的查詢要求的檢索目標,但目前這種檢索技術在圖像檢索引擎中應用還有一定困難。盡管圖像檢索已經出現了多種表征圖像特征的方法諸如直方圖、顏色矩、顏色集等,但是要實現更高語義上的檢索,實現難度大,進展慢。
二者雖側重不同但卻互相補充,集合兩者的優勢,促進高效、簡單的圖像檢索方式。
這三種圖像引擎的檢索方式都是相互影響和相互促進的,任何一種方法進步,都會促進圖像檢索技術的發展。
顏色特征提取。在傳統的圖像檢索算法中,最簡單基本的一種計算方法是直方圖,該算法用于表達不同顏色所占的比例構成數字圖像。一般用(Red-Green-Blue)顏色空間來描述在數字圖像中的一幅圖像,然而人們對(Red-Green-Blue)空間結構不熟悉,以及人們對顏色相似性的認識存誤差,尤其是在量化過程中。因此我們需要將(Red-Green-Blue)空間轉化成HSV空間,再來通過量化的方法來獲取我們需要的圖像顏色直方圖,顏色特征是一種全局特征,通過它我們能夠描述圖像或圖像區域的景物表面性質,一般顏色特征是基于像素點的特征。由于顏色對圖像或圖像區域的方向、大小等變化不敏感,所以顏色特征不能很好地捕捉圖像中對象的局部特征。如果僅使用顏色特征查詢,當數據庫很大時,常會檢索出許多不需要的圖像。但是在圖像檢索中應用最為廣泛的視覺特征是顏色特征,主要是因為圖像中所包含的物體或場景和顏色往往十分相關。此外,相比其他視覺特征,顏色特征對圖像本身的尺寸、方向、視角的依賴性較小,從而具有較高的穩定性。
檢索中,為了正確地使用顏色,我們需要建立顏色模型。顏色特征是圖像最直觀而明顯的特征,一般采用直方圖來描述。顏色直方圖是表示圖像中顏色分布的一種方法,它的橫軸表示顏色等級,縱軸表示在某一個顏色等級上具有該顏色的像素在整幅圖像中所占的比例,直方圖顏色空間中的每一個刻度表示了顏色空間中的一種顏色。在顏色布局描述符中,對分割好的8×8的圖像取每一塊圖像的顏色平均值,形成一個顏色平均值矩陣,然后對其用二維離散余弦進行變換,取低頻分量作為顏色特征。
紋理特征提取。紋理是一種反映圖像中同質現象的視覺特征,它體現的是物體表面的具有緩慢變化或者周期性變化的表面結構組織排列屬性。紋理和灰度、顏色等圖像特征不同,它的原理是通過像素及其周圍空間鄰域的灰度分布來表現,即:局部紋理信息。而圖像可以看成是不同紋理區域的組合。紋理特征可用來對圖像中的空間信息進行一定程度的定量描述,這彌補了顏色特征的缺陷。邊緣直方圖是基于圖像邊緣的統計特征,目標的邊緣和紋理特征能較好地被反映,且運算速度較高。
本文分析了圖像檢索技術的幾種類型,并分析研究了其中幾個算法,以及顏色、紋理特征提取。但隨著計算機網絡技術的飛速發展檢索效率和精度需要不斷提高,這就需要我們在現有圖像檢索技術的基礎上加強對基于內容的圖像檢索技術進行研究,最終實現更高語義上的精準檢索。