摘要:本文比較了圖像檢索方法,提出利用支持向量機分類精度高、泛化能力好的特點應用于基于內容的圖像檢索方法。同時針對圖像分類問題是個多分類問題,應用二叉樹作為分類決策樹形式,將支持向量機的兩分類擴展為多分類來構建分類器。
關鍵詞:支持向量機 圖像檢索 二叉樹
引言
隨著計算機網絡技術的不斷發展,各種醫學信息系統、數字圖書館、衛星遙感圖像系統等得到較大的發展和應用。這些系統中儲存了越來越多的圖像、視頻資料,從數量龐大的圖像數據庫中檢索圖像是件非常困難的事情。目前的圖像檢索主要有兩種方法,一種是預先對圖像進行文本標注,然后根據標注的文本索引進行檢索。這種方法工作量大,效率低。另一種方法是基于內容的圖像檢索,即利用圖像的顏色、紋理、形狀、空間位置等圖像特征來匹配圖像,從而達到圖像檢索的目的。這種方式檢索效率高,是當前的主要發展技術。但是受技術的限制,基于內容的圖像檢索方法在匹配特征、判斷圖像間的相似性時存在一定問題,當圖像相似限制過高時,一些相關圖像檢索不出來;當相似限制過低時,又檢索出不相關的圖像。造成這種現象的原因是圖像數據量大而訓練樣本較少,存在樣本訓練時間長和圖像分類精度低的問題。
本文將支持向量機(SVM)引入到基于內容的圖像檢索中,利用SVM能夠在訓練小樣本而取得較好的分類效果和推廣能力,適用于高維、非線性的分類的特點,提高基于內容的圖像檢索中圖像相似匹配的準確度。
1. 支持向量機(SVM)
支持向量機(Support Vector Machine,SVM)[1]是一種基于統計學習理論新的機器學習方法。它將最優分類超平面和核函數方法結合起來,充分利用當前的所有樣本來求得一個最優的學習結果,具有很好的泛化能力,適合于解決高維、非線性的分類問題,現主要應用于模式識別、函數逼近和概率密度估計等。
支持向量機方法的優點在于沒有必要知道映射T的具體形式,而只需定義高維空間中的內積運算K(xi,xj)即可,即使變換后空間維數增加很多,計算的復雜度沒有太大的變化。
2. 基于內容的圖像檢索系統模式
基于內容的圖像檢索系統沒有固定的模式,一般都采用如下的處理方式:首先從大量的圖像中提取顏色、紋理、形狀等圖像特征構建圖像特征庫;然后將特征庫中的圖像特征作為訓練樣本進行訓練,訓練后得到圖像的最優分類函數;檢索圖像時輸入查詢要求,根據圖像分類函數,進而從圖像庫中檢索出滿足查詢要求的圖像。根據分類檢索得到的結果應該與用戶的查詢請求進行相似判斷,提交相關反饋,以更好地與用戶請求匹配。圖2-1所示為基于內容查詢檢索系統模式。

3. SVM在基于內容的圖像檢索中的應用
在基于內容地圖像檢索中應用SVM,主要是利用SVM在高維、小樣本情況下分類泛化能力強、分類精度高的特點。但是傳統的SVM只能進行兩類分類,并且圖像信息非常豐富,顏色、紋理等特征的提取比較困難和關鍵。特征提取的好壞直接關系到圖像分類的結果。因此在圖像檢索中應用SVM要解決圖像特征提取和構造多分類SVM分類器的問題。
3.1 圖像特征提取
圖像的特征主要從圖像的顏色、紋理、形狀等特征中提取,并且將它們作為SVM的特征向量進行學習訓練。往往用單一的顏色特征或紋理特征不能得到比較好的分類檢索效果,故可以選取顏色、紋理、形狀等聯合特征作為SVM的輸入向量。經實驗證實,采用聯合圖像特征向量的檢索效果比采用單一圖像特征向量的效果好。
3.2 構造SVM多分類器
支持向量機原本是針對二類分類問題的。多類支持向量機是二類支持向量機的擴展。目前有兩種類型的多類支持向量機。一種是多個二類分類器的組合合并,另一種是直接在一個優化問題中求解得出分類模型(single machine)[2]。其中多分類器組合方法又分為兩種類型:“一對一”和“一對其它” [3]?!耙粚σ弧倍囝愔С窒蛄繖C是構造k(k-1)/2個二類支持向量機,k是類別的數目?!耙粚ζ渌倍囝愔С窒蛄繖C是構造k個二類支持向量機,k是類別的數目。由于“一對其它”容易導致模糊概念,所以本文采用“一對一”的多分類組合方法。同時許多實際問題可以以二叉樹易于在計算機中實現的數據結構來表示,故本文采用二叉樹形式的“一對一”組合方法構建SVM多分類器。分類過程中兩類相比較,依次從二叉樹的最底層向上進行兩類的比較,選中比較中獲勝的那一類,直到比較到最終的樹頂,從而確定出圖像最終的分類類別,使之能夠檢索到合適的圖像。
結束語
本文利用SVM泛化能力強、小樣本分類精度高,適用于高維、非線性的分類特點,將SVM及其擴展的多分類器算法用于基于內容的圖像檢索方法中,大大提高了圖像檢索的進度。它具有文本標注等圖像檢索方法不可比擬的優點,具有較高的實用價值。
參考文獻:
[1] 鄧乃揚,田英杰.數據挖掘中的新方法——支持向量機[M].北京:科學出版社,2004:34-37.
[2] R. Rifkin,A. Klautau. In Defense of One-Vs-All Classification. Journal of Machine Learning Research,2004,5:101~141.
[3] Z. G. Fan,B. L. Lu. Fast Recognition of Multi-view Faces with Feature Selection. Submitted to ICCV05,Beijing,2005.
[4] 胡懋智,古紅英.各種不同類型的支持向量機及其性能比較分析[J]. 計算機工程與應用. 2005年第12期: 37-40.
注:本文中所涉及到的圖表、注解、公式等內容請以PDF格式閱讀原文。