俞昊,林川,譚光興,楊敘
(廣西科技大學電氣與信息工程學院,廣西柳州545006)
視覺注意機制與Canny算子結合的目標輪廓檢測方法
俞昊,林川*,譚光興,楊敘
(廣西科技大學電氣與信息工程學院,廣西柳州545006)
在視覺注意機制理論基礎上,建立一類自底向上的數據驅動模型,提出一種基于視覺注意機制與Canny算子結合的目標輪廓檢測方法.該方法通過對目標的快速定位發現視覺上感興趣的區域,獲得視覺顯著區域,對視覺顯著區域和非顯著區域分別進行細尺度與粗尺度的Canny邊緣檢測,顯著區域的輪廓更加突出.實驗結果表明:目標輪廓信息查全率可達90.1%,較傳統的輪廓檢測方法在定位速度方面有顯著提高,且對目標輪廓的識別性更好.
視覺注意;Canny;邊緣提取;輪廓檢測
圖像處理在科學研究中受到了持續關注,實際應用廣泛.文獻[1-4]提及的圖像壓縮、縮放、分割、識別,都是圖像處理在現代科技中的實際應用,處理后的圖像突出重點,易于辨識.輪廓是圖像的基礎特征,表現形式簡單直觀,通過輪廓可以定位快速物體位置,在空間上識別物體的構造,在模式識別中有著重要的應用,為圖像的進一步分析奠定了重要基礎.長期以來,輪廓提取技術的研究逐漸深入,Canny邊緣檢測器是應用最為廣泛的邊緣檢測方法.文獻[5]中紅外線油罐圖像的輪廓提取,采用自適應控制的思想,取油罐液面圖像的直方圖信息自適應計算Canny算子的閾值,檢測出的油位輪廓清晰準確,是邊緣檢測在監測領域的實際應用.Canny算子僅能對圖像邊緣進行提取,單一化的Canny邊緣檢測器對圖像有效輪廓的識別效率不高,對噪聲的抑制性較弱,根據具體任務的要求,需要探尋新的輪廓提取方法.隨著信息技術的發展,仿生學已成為拓展創造力的有效途徑.人眼是從外界獲取信息的最重要通道,具有得天獨厚的感知性能,不僅可以通過接受到的圖像信息加工數據,還可以通過對比機制,感知物體的位置和狀態,確定顏色、形態、相對大小等信息.仿生視覺對圖像處理有十分重要的促進作用,通過視覺的注意,可以準確獲得視覺顯著的部分,迅速定位目標.文獻[6]探討了生物視覺在圖像處理實際應用中的實例,汽車車身焊點是車身重要的連接點之一,精細程度高,不易檢測.采用基于生物視覺的Gabor濾波方法對焊點圖像進行多方向和跨尺度的濾波,結合特征綜合分析,提高了檢測精度.文獻[7]提出的視覺注意機制方法對處理圖像具有特別的意義,利用仿生學的方法,模擬人眼的注意機制,循跡人眼的注意方式和轉移模式,模擬雙目視覺,通過視覺注意設計算法,圖像內容的選擇性能更好,準確性更好,所選取的目標更合乎人眼視覺的要求,處理問題的效率顯著提高,易于分析.
隨著圖像處理技術的發展,圖像處理技術應用于越來越多的領域.例如對交通路況中采集的圖像,快速準確的進行既定目標輪廓檢測對交通違章、事故勘察等方面有著重大意義.如何改進思路使圖像處理的結果更有效,更準確,更符合人眼視覺是圖像處理的新課題.相較于傳統的圖像處理方法,本文通過視覺注意的方法,討論了視覺注意機制的基本模型,提出利用視覺顯著區域來分割圖像既定目標和無關區域的方法.在應用中,分割圖像為視覺顯著和不顯著的區域,同時采用多個尺度表述Canny邊緣檢測方法,將全局運算轉化為多個尺度運算的疊加,層次清晰,運算速度快,可有效突出目標的輪廓.
通過視覺注意模型獲取輸入圖像中的顯著性特性,分別計算各個區域中的視覺顯著程度,并合成視覺顯著圖,對人眼的視覺注意機制進行模擬.
與傳統的目標識別方法類似,視覺注意方法的特征提取包括了顏色、亮度、方向等特征,同時為了得到在不同視覺顯著度下的特征,采用基于高斯差分函數的濾波器.將輸入圖像逐層采樣濾波8次,得到9階(含輸入圖像本身)的金字塔數據結構.用t表示不同階數,其中t的取值范圍為離散集合{1,2,3,4,5,6,7,8,9}中的值,對應于高斯差分函數的金字塔結構的不同階尺度下的各個圖像[8].提取顏色、亮度、方向等基本特征信息,分別得到自身的顯著區域.輸入圖像中紅、綠、藍分量記為r(t),g(t),b(t),可以得到亮度特征的表達式:

視覺注意機制的特性表現為對目標中心的關注總是大于邊緣的關注,利用這一特性,建立中央周邊差模型,獲得圖像的對比度差異.通過歸一化處理,將各種特征圖的值域歸一到允許的灰度值范圍,縮小非目標性區域的顯著性范圍.在實際的應用中,對比度的強弱可以用不用尺度下特征的差值來表示.尺度c∈{2,3,4}為中央視覺區域,尺度s=c+σ,σ∈{3,4}為周邊視覺區域.用符號Θ表示中央周邊差的運算,可以計算不同尺度圖像中的差異部分[9].亮度特征圖I(c,s)可由下面的方程式算出:

在顏色特征的提取方面,利用輸入圖像中的紅r,綠g和藍b三分量構建出R,G,B,Y來定義4個廣義的顏色分量:

對不同顏色尺度下的分量R(t),G(t),B(t),Y(t),顏色度特征圖可由下面的方程式算出:

Gabor濾波器廣泛用于圖像在不同角度上的特征提取,對于亮度圖像I(c),計算圖像上不同角度θ∈{0。,45。,90。,135。}方向作為Gabor濾波的方向[10],Gabor濾波的數學表達為:

方向特征圖可由下面的方程式算出:

將顏色、亮度、方向顯著圖跨尺度融合得到最終的總顯著圖,總顯著圖全面反映了在視覺注意機制下針對所需特征的全部信息,揭示出圖像中視覺上最顯著的部分.

Canny邊緣檢測算法是用一類泛函函數求導的方法求出,高斯函數可作為最擬合邊緣的一個最佳近似,有著容錯率低、邊緣區域容易定位以及返回值單一等特點.核心思想是通過對于信噪比和圖像坐標乘積來測度,得到最優化的逼近算子,這個算子叫做Canny[11],屬于平滑圖像求導的方法.待檢測的圖像邊緣應具備圖像的邊緣對噪聲的抑制性強,邊緣的位置盡量明顯等特征.本文利用視覺注意的顯著區域分割圖像,建立分層策略的思想,采用不同于傳統Canny邊緣檢測方法進行測算,利用顯著區域和非顯著區域的分割得到多個圖像塊,在分割出來的各個圖像塊上定義尺度不同的Canny算子,根據目標顯著性的要求分層處理,匯總合并,提高了邊緣檢測的效率,突出了目標主體.
Canny邊緣檢測器通過建立高斯濾波器來平滑輸入圖像,f(x,y)代表輸入圖像,G(x,y)代表高斯函數:

隨后對G和f做卷積運算,可以得到平滑度較好的圖像:

σ為Canny邊緣檢測器中高斯濾波函數的的標準差,標準形式下σ的默認值為濾波器的大小系統根據σ的大小自動計算出,σ的取值決定整個邊緣檢測效果的優良.
使用一階有限差分法計算偏導數,得到矩陣P和Q:

計算P和Q的幅值和方位角:

通過非極大抑制(NMS)策略,只保留幅值在給定范圍內差值最大的點.將角度的變化縮小到1/4圓周,方向角和梯度的幅值分別為:

通過非極大值抑制細化M[x,y]的梯度變化,計算出邊緣與非邊緣的臨界值,將低于臨界值的點賦值0,可求得代表輸入圖像邊緣的坐標,這是系統自動計算閾值θ的方式.閾值θ的取值決定邊緣檢測的精細程度,是邊緣檢測中最重要的參數,在實際應用中,根據具體任務的要求,通過自定義閾值θ的大小,獲取不同尺度要求下圖像的邊緣輪廓.
根據不同灰度圖像的灰度值不同,在灰度值像素突變的區域顯現出邊緣.視覺注意的結果給既定目標指明了顯著區域,利用視覺注意的結果來分割圖像,結合視覺注意給定的區域,采用Canny邊緣檢測的方式提取所需輪廓.
不同于傳統的Canny邊緣檢測方法都是利用單一算子去對全圖進行全局處理,利用圖像分割的梯度信息進行迭代優化.考慮到顯著區域已經進行了圖像分割,圖像被分割為包含必要信息的目標部分和包含冗余信息的無關部分,所以可利用分離的結果,在具體實現的過程中,分別對圖像分割后的目標區域(顯著部分)和無關區域(非顯著部分)定義不同的尺度Canny算子.在目標區域內應獲得關于圖像細節方面的信息,例如葉子上葉脈的紋理,衣服上的配飾等,使目標區域進行細尺度的增強;在無關區域應削弱不利于圖像目標突出的無關部分,例如天空背景,道路旁的建筑等,進行粗尺度的削弱.兩者疊加運算能夠有效地突出既定目標部分,使主體目標的輪廓更加清晰.
定義不同的尺度Canny算子,通過分別設定不同的閾值參數θ1,θ2,…,θk疊加計算,其中k為視覺注意區域所分割的圖像塊數,k≥2,即至少存在1個目標區域(視覺顯著部分)和1個無關區域(視覺不顯著部分).對于單一目標的分割,k=2,根據任務的要求,實驗中θ的取值范圍可取離散集合{0.1,0.2,0.3,0.4,0.5,0.6,0.7,0.8}中的值,θ的值從0.1~0.8逐漸增大的過程中,對應于輪廓的精細程度逐漸降低,其中θ趨近0.1時尺度越細,θ趨近0.8時尺度越粗.對于分割后的不同區域,分別進行不同尺度的Canny計算,對各個輪廓子圖的像素值進行疊加,得到總輪廓圖,使目標區域的輪廓更為細致,無關區域的輪廓更為模糊.對于單一目標的分割,目標區域θ1和無關區域θ2的取值分別有8組,θ1和θ2的取值組合有64組,設立與目標輪廓圖相似度對比的循環,遍歷所有取值后經過篩選和比較,選擇與目標輪廓圖相似度最大θ1,θ2的組合,獲得主要包含主體目標的輪廓圖.與對全局圖像直接進行的Canny邊緣計算結果相比較,本文方法處理后的圖像無關輪廓較少,可以有效突出圖像主體的輪廓,并且運算速度更快,算法流程圖如圖1所示.

圖1 輪廓檢測流程圖Fig.1 Flow chart of the contour detection
如圖2所示,實驗對象是具有單一目標的灰度圖像,目標主體為交通標志牌(包含指示標志下方的信號燈),全圖有房屋、柵欄、建筑、植物等無關背景,考慮到交通路況圖像的分辨率有限,實際檢測中不考慮圖像噪聲的影響.利用視覺注意的方法計算出視覺顯著區域進行圖像分割,將圖像分2個圖像塊,即1個視覺顯著區域塊和1個非視覺顯著區域塊,如圖3所示.在分割后的區域上分別定義不同的θ值,用不同尺度的Canny算子計算的各個圖像塊輪廓圖,分別對各個輪廓子圖的像素值進行疊加,獲得目標輪廓.

圖2 輸入圖像Fig.2 Input image

圖3 視覺顯著區域圖Fig.3 Visual salient region
如圖4所示,與傳統的Canny邊緣檢測方法相比較,對于全局圖像,定義θ的取值范圍為離散集合{0.1,0.2,0.3,0.4,0.5,0.6,0.7,0.8}中的值,隨著θ取值的增大,邊緣檢測的細致程度逐漸減弱,遍歷θ的所有取值,目標對象的邊緣無法單一化的準確描述.采用本文方法,利用視覺注意的效果分割圖像的結果,對于不同的區域,分別定義不同尺度的θ1,θ2,得到64幅組合輪廓圖,取8幅組合輪廓進一步分析,如圖5所示.在視覺顯著區域定義尺度較細的θ1,θ1的取值在0.5~0.1的逐漸減小的過程中,既定目標的邊緣越來越清晰;對視覺不顯著的區域定義尺度較細的θ2,θ2的取值在0.1~0.8的逐漸增大的過程中,在較大范圍內的無關輪廓越來越模糊,通對2個輪廓子圖的像素值進行疊加,當θ1=0.1,θ2=0.8時,既定目標輪廓清晰,無關輪廓影響較小,位于目標區域的交通標志牌和信號燈的輪廓突出,可較好地對既定目標進行提取,達到了預期的效果.

圖4 全局圖像在不同尺度Canny算子作用下的輪廓圖Fig.4 The Contour map in different scale by Canny method of whole image

圖5 分割圖像在不同尺度Canny算子作用下疊加后的組合輪廓圖(節選部分)Fig.5 The Contour map in different scale by Canny method of segmented image with overlay(Excerpt)
本文采用計算時間來評估不同方法輪廓提取的效率,并采用查全率和查準率來評估不同方法輪廓提取的質量.查全率A是表征有效信息被正確檢測的比例,查準率C是表征檢測出的信息正確部分的比例.

R代表被正確檢索的結果,M代表被檢索的結果,N代表檢索的全部結果.
傳統的全局圖像Canny邊緣檢測方法和本文方法性能的比較如表1所示.
從表1可以看出,全局圖像Canny邊緣計算方法無法突出既定目標的輪廓,本文方法采用視覺注意的結果作為分割依據,進行了目標區域與無關區域的分割,分別計算2個圖像塊的輪廓,對計算后的2個輪廓子圖的像素值進行疊加,突出了既定目標的輪廓,無關區域較少.采用細尺度的Canny邊緣檢測算子對目標區域進行精細檢測,使其標志牌上的文字和指向都可以清晰辨識,采用粗尺度的Canny邊緣檢測算子對無關區域的輪廓進行了模糊處理,使其建筑、植物等無關背景輪廓不被檢測,其檢測效率和檢測效果優于傳統的全局Canny檢測方法.

表1 目標輪廓檢測結果比較Tab.1 Compared with different methods in the part of target contour
視覺注意方法對目標區域的提取較傳統方法有了一定的進步,給圖像分割帶來了新的分割思路,Canny邊緣檢測是迄今為止最優秀的邊緣檢測方法,運用廣泛.本文結合視覺注意的結果對不同尺度要求下的不同區域,分別定義不同的Canny邊緣算子,對顯著性區域進行細尺度的目標提取,對于非顯著性區域進行粗尺度的模糊背景.該方法剔除了注意目標的冗余區域,將顯著部分的輪廓目標較為清晰地提取出來.本方法不足之處在于,視覺注意的機制依存于人腦和人眼的復雜機制和返回結果的不確定性,將對比度強烈的無關部分列入了注意區域(圖2中的左上角天空和中間柵欄也同時被誤認為目標的區域),針對上述問題,仍有進一步完善的空間.
[1]張軍,成禮智,楊海濱,等.基于紋理的自適應提升小波變換圖像壓縮[J].計算機學報,2010,33(1):184-192.
[2]李冉,譚光興,寧勝花.基于內容感知的圖像縮放研究[J].廣西工學院學報,2010,21(3):33-37.
[3]閆夏,譚光興,林川.基于免疫聚類算法的MRI膝關節圖像分割[J].廣西科技大學學報,2015,26(1):70-74.
[4]朱玉蓮,陳松燦.特征采樣和特征融合的子圖像人臉識別方法[J].軟件學報,2012,23(12):3209-3220.
[5]李滾,嚴發寶,蘇艷蕊,等.基于CANNY算子的自適應雙閾值油罐油位紅外成像檢測[J].電子測量與儀器學報,2009,23(9): 44-50.
[6]林川,呂曉峰,曹以雋,等.汽車車身焊點質量智能檢測系統設計[J].計算機測量與控制,2014,22(1):31-33.
[7]張鵬,王潤生.基于視覺注意的遙感圖像分析方法[J].電子與信息學報,2005,27(12):1855-1860.
[8]劉彥甲.視覺注意模型及其在SAR圖像中的應用研究[D].西安:西安電子科技大學,2013.
[9]宋雁斕,張瑞,支琤,等.一種基于視覺注意模型的圖像分類方法[J].中國圖象圖形學報,2008,13(10):1886-1889.
[10]孔銳,張冰.Gabor濾波器參數設置[J].控制與決策,2012,27(8):1277-1280.
[11]張思俊,王樂樂,陸振宇.基于Canny算子邊緣檢測的車牌圖像增強方法[J].重慶交通大學學報(自然科學版),2012,31(3): 439-442.A computational model of visual attention mechanism and edge extraction elgorithm of Canny in contour detection
YU Hao,LIN Chuan*,TAN Guang-xing,YANG Xu
(School of Electrical and Information Engineering,Guangxi University of Science and Technology,Liuzhou 545006,China)
Based on the classical method of visual attention,a bottom-up data driven model is set up and the target contour detection method combining visual attention and Canny edge detection is proposed.By fast locking visual interest,visual saliency regions can be found.Visual salient regions and non-salient regions are finely scaled and coarsely scaled in Canny edge extraction.From the contour of the salient map,the salient regions become more prominent.The experimental results show that the method proposed in the paper can reach 90.1%of the target contour in the experimental area.Compared with the traditional target extraction method,the proposed method can effectively improve the speed of positioning process,and the recognition of the target contour can be easily achieved.
visual attention;Canny;edge extraction;contour detection
TP391.41
A
2095-7335(2016)02-0087-06
10.16375/j.cnki.cn45-1395/t.2016.02.015
(學科編輯:黎婭)
2015-12-14
國家自然科學基金項目(61563005);廣西自然科學基金項目(2015GXNSFAA139293,2015GXNSFAA139289);廣西高校科學研究項目(YB2014214,KY2015LX173);廣西科技大學科學基金項目(校科自20161307)資助.
*通信作者:林川,副教授,碩士生導師,研究方向:仿生智能計算,E-mail:gxustlc@126.com.