【摘 要】 基于內容的圖像檢索是圖像檢索研究領域的核心內容。與傳統的依賴文字檢索圖像的方式不同,基于內容的圖像檢索是通過提取圖像的特征信息并利用各種分析算法,學習算法將這些特征映射成反映圖像本質的語義特征。本課題首先介紹了傳統的圖像處理技術和一些底層特征的提取方法,然后依據近似匹配的相關算法對底層特征進行分類,提出了根據用戶選擇滿意樣本來優化分類結果的思路。
【關鍵詞】 圖像檢索 底層特征提取 近似匹配
一、需求分析
本文是通過提取圖像底層特征,利用近似匹配算法建立分類模型,并由用戶反饋優化分類樣本已達到基于內容的圖像檢索。本系統要滿足以下功能:加載目標圖像,并可提取其基本特征信息;建立被用于檢索的圖像庫和其對應的底層特征庫;反饋給用戶近似的檢索結果及優化選項;能夠對檢索結果作出數字化評估。該系統在建立特征庫后,通過算法的計算和用戶的優化,找到語義程度上最滿意的結果,以達到滿足本課題的要求。
二、詳細設計
本文在規劃圖像檢索的過程中時,不僅需要提取出圖像底層的多方面重要特征,還需要將這些特征轉化成向量或數值,一方面方便記錄特征信息以對其建立索引,使之便于處理和存儲,另一方面使其適應近似匹配算法.以便利用這些特征為圖像分類。在檢索算法的設計中,如何利用用戶的反饋,動態地優化特征的選擇和分類的方法是本課題設計的核心。本部分分三個部分,分別介紹了底層特征的具體提取算法,近似匹配算法和反饋優化檢索的設計過程。
2.1 圖像顏色特征
顏色空間對于相關顏色以數字形式表示是一個很重要的成分,是數字化顏色理論的重要組成部分。RGB顏色空間是圖像處理中最常用的顏色空間,它通過互相垂直的坐標軸表示一幅圖像在紅、綠、藍三個色度上的分布情況。
2.2 圖像紋理特征
方塊編碼(Block Truncation Coding),是一種快速有損圖像壓縮技術。其原理是將圖像劃分成若干子圖像塊,然后統計子圖像塊的平均值,將塊中低于平均值的像素點置為0,高于平均值的點置為1,這樣就將圖像二值化,可以作為二電平輸出,不但傳輸速度快,且重建時可保持均值。
2.3 近似匹配算法
在將圖像的顏色、形狀、紋理等底層特征提取出來并記錄后,這些特征就變成向量的形式供近似匹配算法使用以達到比較圖像間相似度的目的。不同的近似匹配算法計算出的相似結果也不同,對于不同的特征和相似性需求,需要采用多種近似匹配算法,再對結果評估后確定合適的一種。
三、系統測試
對于本軟件的檢索方式,分為綜合檢索和基于單一特征檢索兩種。其中單一特征檢索是根據目標圖像所提取出的一種特征向量(如灰度顏色直方圖)與特征庫中其他圖像的同一特征向量做比較,找尋最近的圖片,以此來反映該特征的檢索能力;而綜合檢索則是將所有7個主要的底層特征按流程逐一檢索,每一步采納用戶反饋的信息,最后綜合所有特征向量,在反饋信息修正下進行檢索,以此來融入用戶反饋的內容達到精確檢索的目的。對于檢索的結果,本軟件也提供了數值化的評估方式,通過多種數據具體地反映檢索效果。
在CBIR的測試中,查全率(recall)和查準率(precision)是評價檢索效果的主流方法。其中查全率表示檢索到有效的圖像占圖像庫中所有有效圖像的比例,而查準率表示有效圖像占所有返回結果的比例。定義如下
S檢索到的有效圖數目,u為檢索結果中無效圖的數目,v為在圖像庫中有效但未被檢索到的圖像數目。
四、結論
本課題設計并實現了基于用戶反饋優化算法的圖像檢索系統,該系統能夠將用戶對檢索結果的評價轉化為檢索方法的改進參數,使系統在交互過程中動態地達到圖像精準檢索的目的。在設計過程中,圖像底層特征信息的提取和檢索優化的算法是主要解決的問題。在實現的過程中既遇到了棘手的問題和難點,也學到了圖像處理和分類的許多方法技巧。
【參考文獻】
[1] 孫君頂.圖像特征提取與檢索技術[M].北京:電子工業出版社,2015.
[2] 王永明,王貴錦.圖像局部不變性特征與描述[M].北京:國防工業出版社,2010.
作者簡介:張宇(1993—),女,漢族,山東青島人,管理學學士,單位:天津師范大學管理學院企業管理系,研究方向:企業管理。