王心一 劉智
【摘要】 針對單色并且無紋理的二值商標圖像檢索,本文采用基于勢函數的高斯描繪子和邊界方向直方圖算法描述形狀,通過采用加權融合兩種不同算法的形狀特征后,實現基于形狀商標圖像檢索;最后本文選取查全率-查準率對比圖作為本文檢索的性能評判指標,實驗數據表明,文中采用的算法能夠精確有效實現商標圖像檢索。
【關鍵詞】 高斯描繪子 商標圖像 檢索 邊界直方圖
一、引言
隨著經濟快速的發展,商標注冊需求越來越大,檢索成為一個突出問題,為防止仿冒注冊商標事件,建立數據庫管理系統十分必要。本文研究方向著重于小尺度范圍內觀測到的局部特性,采用高斯描繪子及邊界方向直方圖的算法提取出圖像形狀特征,通過加權融合的方法把兩種算法提取出的形狀特征作為商標圖像底層特征,使用歐式距離公式計算出特征向量間的相似距離進行相似度的匹配,從而建立基于兩種形狀特征融合的商標圖像檢索方法。
二、商標形狀特征提取
2.1 基于高斯描繪子的形狀特征提取
高斯描繪子的特點有:適用的范圍很廣;對于圖像旋轉、平移、反射具有不變性;計算難度低,識別的精度很高;可以承受一定噪聲干擾及邊緣的變動等[2]。假設曲線 為檢測物 的輪廓曲線。曲線 可以表示為:
■ (1)
曲線C的質心坐標為
■ (2)
方差σ2表示曲線上所有點的分散度
■
(3)
參數r表示曲線L上面所有點與質心間距離:
■ (4)
對于任意的λ∈(0,∞),落在圓心為(x,y)半徑為rλ的圓內部分的物體輪廓曲線如下式所示:
■■ (5)
對于任意的θ∈[0,2π], λ∈(0,∞),設P=(x+ λrcosθ,y+λrsinθ)定義如下函數:
■
(6)
(xk,yk)∈L(λ),Δsk表示曲線相鄰像素之間的距離。f(θ,λ)表示高斯勢函數[4]。
θ∈[0,2π]分成N等分,高斯描繪子pe(λ)可表示為:
■ (7)
2.2 基于邊界方向直方圖的形狀特征提取
對邊界圖像中各點計算出切線的方向,得到物體的邊界輪廓上每個點的邊界方向角,建立起直方圖,統計出邊界直方圖每級個數最終表征物體的形狀。
對邊界切線方向進行劃分,以5度為范圍劃分形成一個72級方向直方圖H[i]。i表示劃分后的每級數,范圍是0~71;相對應H[i]的值代表在這一級數下點的個數。為保證尺度不變性,將邊界直方圖歸一化:
H[i]=H[i]/S (8)
其中H[i]為邊界方向直方圖,S為圖像的面積。
為避免圖像旋轉影響到邊界直方圖,對直方圖進行平滑處理,使其具有一定旋轉特性。
■ (9)
Dr是A[i,j]與B[i,j]的距離
■ (10)
三、圖像特征的融合
商標圖像的相似性度量表示的是圖像特征之間的相似性,一般使用特征向量間的距離函數來度量[5]。對提取到的特征向量進行歸一化計算,特征內部的歸一化:
V的均值和方差分別為mV和σV, V為歸一化處理結果:
V=■ (11)
計算示例圖像與圖像庫中圖像的相似度步驟如下:
(1)將輸入商標圖像庫的圖像進行預先處理,距離dGauss,dHistogram。
d(x,y)=■X■-Y■■■ (12)
Euclidean距離表示兩個點之間真實的距離,與參考系旋轉不變量相關,是一個常用的度量距離的方法。
(2)計算(1)中距離相對應的均值μGauss,μHistogram及標準差σGauss,σHistogram。
(3)按照上文高斯描繪子及邊界直方圖算法提取被檢商標的特征向量,將每一組特征向量利用(13)式進行歸一化處理。
(4)將(3)中計算得出的歸一化特征向量與數據庫中相應商標的特征向量分別計算出歐式距離dGauss(x,y),dHistogram(x,y)。
(5)將(4)中每組特征向量的相似距離進行距離歸一化,公式如下
d'=■1+■ (13)
(6)將歸一化后的距離進行加權融合,得到商標間最終相似度的距離
d=w1d'Gauss+w2d'Histogram (14)
其中w1+w2=1,d'Gauss,d'Histogram分別為采用二種特征提取得到的相似距離進行歸一化后的結果。
根據多次實驗情況下比較設定兩個權值分別為w1= 0.65,w2=0.35。實驗證明,在該權值下可得到較精確的結果。
四、實驗結果
在二值商標圖像庫中進行實驗,采用查全率-查準率為性能評判指標。查全率Pk指的是檢索的結果中達標圖像數目和圖像數據庫中全部符合要求的圖像數目之比。查準率Rk表示檢索的結果里達標圖像數目和檢索返回圖像總數的比值。公式如下:
Pk=Nk/M (15)
Rk=Nk/Tk (16)
Nk表示達標圖像數目, Tk表示檢索返回圖像總數,M 表示符合要求圖像總數。
實驗1比較了本文算法與單獨采用不變距、傅里葉描繪子算法的檢索性能,其結果如圖1所示。
由仿真結果可見,本文的特征提取方法能夠在圖像庫高效檢索到與待檢測圖像相似圖像。相同的檢索查全率下,多特征融合算法比單一特征提取算法精度要高。由此可得研究更為精確的形狀描述特征,采用多種特征融合的方式就能夠提高檢索的精度,或者加入紋理、顏色、關鍵字詞分類檢索等特征也可以達到提高精確度的目的。
五、結論
本文研究內容為基于形狀的二值商標圖像的檢索,采用的圖像特征檢索方法使用了高斯描繪子及邊界直方圖算法,分別提取出商標的形狀特征,再把兩種特征進行加權融合,從而得到商標圖像最終的檢索特征。實驗的結果表明該方法能夠達到較高的查全率-查準率。