汪宇雷 畢樹生 孫明磊 蔡月日
(北京航空航天大學 機械工程及自動化學院,北京100191)
圖像作為最基本、最重要的多媒體信息形式之一,憑借其表象直觀、內容豐富的優勢,已廣泛地應用在眾多領域,而快速準確搜索到所需相關圖像已成為國內外信息檢索領域的研究熱點.
目前,已經存在的圖像檢索方法主要分為基于文本的方法和基于內容的方法[1].基于文本的方法首先對圖像進行文本標注,然后將文本數據存入數據庫,用戶檢索時是通過查詢數據庫中存儲的文本信息來實現圖像檢索.基于內容的方法又可分為基于顏色[2]、紋理[3]、形狀[4]、空間[5]等特征的方法,雖然提取特征不一樣,但基本過程類似,均通過比較圖像間的相同特征來判斷是否相似,從而給出符合要求的搜索結果.由于局部視覺特征擁有優秀的緊湊性與魯棒性,更多的系統采用基于興趣點的局部特征進行圖像檢索[6-11].文獻[7-8]中分別使用近似K-Means算法和對局部空間進行網格結構均分得到視覺詞匯表,但這兩種做法會忽略圖像的語義部分.文獻[9]提出使用隱馬爾可夫模型(HMM,Hidden Markov Model)將圖像語義和視覺特征整合以構建詞匯表.文獻[10]提出結合各類局部特征的顏色矩陣和Gabor特征進行檢索.文獻[11]提出通過比較各興趣點局部澤尼克矩的歐氏距離來提取最優匹配點,然后以興趣點的空間離散度計算圖像匹配性.
以上這些研究成果更多地考慮在匹配過程中采用不同的算法比較興趣……