阮旭良等
摘要針對基于邊緣檢測的圖像檢索中邊緣點容易受到噪聲干擾的問題,提出一種基于LoG邊緣算子的棉花圖像檢索算法。首先在求取邊緣檢測前進行濾除噪聲處理,然后根據歐式距離衡量圖像間的相似性。棉花圖像數據集的試驗結果表明,算法能夠有效去除邊緣噪聲,提高了圖像檢索的查全率和查準率,尤其適用于高噪聲環境下的棉花圖像檢索。
關鍵詞圖像檢索;LoG算子;邊緣檢測;歐氏距離
中圖分類號S126;TP391文獻標識碼
A文章編號0517-6611(2014)28-10007-02
Research of Cotton Image Retrieval Algorithm Based on LoG Operator
RUAN Xuliang, XIA Bin, SANG Xiaotian et al(Zhengzhou Cotton & Jute Engineering Technology and Design Research Institute, China COOP, Zhengzhou, Henan 450004)
Abstract For the problem of image edge noise in the cotton image retrieval based on edge detection, a new algorithm using LoG edge operator was proposed. Firstly, the LoG operator was used to filter out noise before edge detection, then the similarity among images were measured according to Euclidean distance. Under the cotton image data sets, experimental results showed that the algorithm can remove edge noise and improve the image retrieval recall and precision effectively, especially for image retrieval of high noise environments.
Key words Image retrieval; LoG operator; Edge detection; Euclidean distance
隨著計算機視覺的飛速發展,以及數字圖像的大量應用,人們迫切需要一種方法檢索近似圖像,因此,圖像檢索技術應運而生。圖像檢索是一個與計算機視覺、圖像處理、數據庫等學科緊密聯系的綜合性研究領域,它是以圖像本身的物理屬性或者描述關鍵詞在圖像數據庫中尋找與示例圖像相關或者相似的圖像[1]。在圖像檢索領域中,基于內容的圖像檢索 (Content-Based Image Retrieval,CBIR)[2]是根據圖像的色彩(Color)、形狀(Shape)、紋理(Texture)等物理屬性檢索相似圖像,現已成為圖像檢索的有效方法。
在眾多圖像特征中,形狀是較為顯著的特征之一,而形狀的提取是以邊緣檢測[3]為前提,因此,邊緣檢測的結果直接影響到檢索的效果[4-6]。為了提高基于邊緣檢測的圖像檢索系統性能,國內外研究人員針對邊緣檢測和圖像相似度衡量進行了大量研究。王植等提出使用對灰度梯度的幅值和方向進行非極大值抑制,然后采用雙閾值方法從候選邊緣點中檢測和連接邊緣[7];李牧等提出采用類內方差最小化和梯度幅度直方圖動態地確定上下閾值的方法,來提高Canny 算子的動態適應性[8];Sarangi等提出采用模糊推理改進對圖像邊緣的檢測,并且結合Canny 算子檢測邊緣[9];趙宏中等提出使用Manhanttan距離衡量圖像間的相似性[10]。
在上述研究的基礎上,筆者提出一種基于LoG算子的棉花圖像檢索算法,在降噪處理的基礎上獲取圖像邊緣,根據歐氏距離衡量圖像間的相似性,并在棉花數據集上進行了試驗驗證。
1LoG算子
LoG算子(Laplacian of Gaussian,LoG),也稱作拉普拉斯高斯算法[11-12],它是將拉普拉斯邊緣檢測結合高斯濾波形成的[13-16]。算法的特點是圖像先與高斯濾波器g(x,y)進行卷積,用于平滑圖像、降低噪聲,同時濾除孤立的噪聲點和較小的疵點,然后采用無方向性的拉普拉斯算子D2進行邊緣檢測[17-19]。假設原圖像為f(x,y),通過卷積和拉普拉斯算子處理,得到輸出圖像h(x,y):
稱為高斯拉普拉斯算子,對于離散數字圖像,高斯拉普拉斯算子通常可以用一個離散的模板近似。通常的高斯拉普拉斯算子是一個5×5的模板,如圖1所示。
01/801/801/81/211/21/801-7101/81/211/21/801/801/80
圖1高斯拉普拉斯模板
此模板水平和垂直的4個方向上都設置為1,對角的4個方向上都設置為1/2,其他8個方向上都設置為1/8,這樣就會造成水平和垂直的4個方向邊緣檢測精度高,而其他12個方向的邊緣檢測精度低。
2圖像間相似性度量
圖像間的相似性度量[20]是基于內容的圖像檢索中的關鍵環節,它是在圖像內容的基礎上,由其內容的相似度而得到圖像相似性的一種度量方法。其中,圖像低層次上的特征主要包括圖像本身的顏色特征、紋理特征、形狀特征以及空間關系特征,具有相對直觀的特點,而語義信息是圖像深層次上的特征,具有相對抽象的特點。
目前對于圖像間相似性度量的研究主要集中在圖像的顏色特征、紋理特征、形狀特征以及空間關系特征,圖像的特征通過向量的形式表示。在此基礎上,通常采用向量空間模型來衡量圖像間相似度,根據計算向量間兩點之間的遠近程度來衡量圖像間的相似程度。
在模式識別領域中,特征的相似度量多采用距離方法,也即是特征之間的相似程度用向量的空間距離表示,距離越大,圖像間的差別就越大,反之,就越相似。
3基于LoG算子的棉花圖像檢索算法
3.1圖像特征的表達
由于傅里葉描述子具有旋轉不變性、轉置不變性、與起始點無關的特點,因此,采用傅里葉描述子來描述邊緣向量,并以此作為圖像的形狀特征。
3.2相似圖像判定
圖像的相似性可以使用滿足測度空間條件的空間距離來衡量,距離函數需要滿足測度空間的3個測度公理。