侯小麗
(太原城市職業技術學院,山西 太原 030027)
圖像邊緣檢測技術發展綜述
侯小麗
(太原城市職業技術學院,山西 太原 030027)
圖像邊緣檢測是圖像處理與分析中最基礎的內容之一,論文就圖像邊緣的幾種檢測技術進行了討論和研究,并對進一步的研究作了展望。
圖像檢測技術;圖像邊緣;邊緣檢測
圖像是最直接的視覺信息,包含著最原始的巨大信息,其中最重要的信息是由它的邊緣和輪廓提供的。圖像邊緣是圖像最基本的特征,邊緣中包含著有價值的目標邊界信息,這些信息可以用于圖像分析、目標識別以及圖像濾波。所謂邊緣,是指其周圍像素灰度有階躍變化或屋頂變化的那些像素的集合。圖像邊緣檢測是圖像處理與分析中最基礎的內容之一,同時由于成像過程中的投影、混合、畸變和噪聲等導致圖像特征的模糊和變形,且圖像邊緣和噪聲均為頻域中的高頻分量,給邊緣檢測帶來了困難。邊緣檢測的難題是檢測精度與抗噪性能之間的矛盾。對于圖像邊緣檢測,尋求算法較簡單、能較好解決邊緣檢測精度與抗噪性能協調問題的算法,一直是圖像處理與分析研究的主要問題之一。圖像邊緣檢測通常有經典的基于微分、基于小波與分形理論、基于數學形態學,以及近年來發展的基于模糊學、基于神經網絡、基于遺傳算法等多種圖像邊緣檢測方法。
圖像邊緣檢測與提取的研究一直貫穿于圖像處理與分析的始終,傳統的圖像邊緣檢測方法大多可歸結為圖像高頻分量的增強過程,微分運算是邊緣檢測與提取的主要手段。人們最早提出了一階微分邊緣算子,如Robert算子、Sobel算子、Prewitt算子和Kirsh算子等,這些算子由于梯度或一階微分算子通常在圖像邊緣附近的區域內產生較寬的響應,即使用一階微分算子的方法多是在梯度值大于某一值時就認為此點是邊緣點,但這種方法導致檢測的邊緣點太多。故采用上述算子檢測的邊緣圖像常需作細化處理,這就影響了邊緣定位的精度。
一種更好的方法就是求局部的最大值點,并認為它們是邊緣點,這樣就變成了求圖像的二階微分,一階導的最大值對應的是二階導的過零交叉點,利用二階導數零交叉所提取的邊緣寬度為一個像素,所得的邊緣結果無需細化,有利于邊緣的精確定位。實際上拉普拉斯算子在機器視覺中并不太常用,因為任何包含有二階導數的算子比只包含一階導數的算子更容易受噪聲影響,甚至于一階導數很小的局部峰值也能導致二階導數的過零點。為了避免噪聲的影響必須采用特別有效的濾波方法,解決這一問題的算法就是LOG算法,圖像首先與高斯濾波器進行卷積,這樣平滑了圖像又降低了噪聲,將孤立噪聲點和較小的結構組織濾除,由于平滑后會導致邊緣的延展,因此邊緣檢測器只考慮那些具有局部梯度最大值的點作為邊緣點。二階微分形式的邊緣檢測算子是目前邊緣檢測的主要手段之一。
邊緣檢測的基本問題是檢測精度與抗噪性能間的矛盾。由于圖像邊緣和噪聲均為頻域中的高頻分量,簡單的微分運算會增加圖像中的噪聲,因此,在微分運算之前應采取適當的平滑濾波以減少高頻分量中噪聲的影響。針對此問題,產生了Canny邊緣檢測技術,Canny提出了由四個指數函數線性組合形成的最佳邊緣檢測算子,其方法的實質是用一個準高斯函數作平滑運算,然后以帶方向的一階微分定位導數最大值,它可用高斯函數的梯度來近似,屬于具有平滑功能的一階微分算子。
Canny邊緣檢測的基本思想是在圖像中找出具有局部最大梯度幅值的像素點,檢測階躍邊緣的工作集中在尋找能夠用于實際圖像的梯度數字逼近,圖像梯度的逼近必須能抑制噪聲且必須能精確地確定邊緣的位置。Canny算子邊緣檢測的方法是尋找圖像梯度的局部最大值,梯度是用高斯濾波器的導數計算的。Canny方法使用兩個閾值來分別檢測強邊緣和弱邊緣,而且僅當強邊緣和弱邊緣相連時,弱邊緣才會包含在輸出中。因此,此方法不容易受噪聲的干擾,能夠檢測到真正的弱邊緣,Canny算子對檢測階躍性邊緣時效果極好,去噪能力強,但由于檢測閾值固定,當檢測具有模糊邊緣的圖像時,很可能導致平滑掉部分邊緣信息。因此,為了能更精確地檢測出目標邊界,可先對圖像進行預處理,將其分割成若干子圖像,然后針對每幅子圖像中具體情況選用不同的閾值,采用針對各子圖所選擇的閾值對圖像進行動態閾值分割,實際應用時可以根據需要來調整子圖像的大小,以獲取所需的大小。
小波分析是當前應用數學和工程中一個迅速發展的領域。隨著小波理論和分形理論的廣泛應用,20世紀90年代初期關于小波理論的邊緣檢測方法和基于分形特征的邊緣檢測與提取方法也相繼出現。基于小波理論的邊緣檢測方法因小波理論時頻分析的優越性而優于一般的傳統圖像邊緣檢測方法,它可檢測出圖像在不同尺度下的邊緣特征。
小波變換在時域和頻域同時具有良好的局部化性質,它能將信號或圖像分解成交織在一起的多種尺度成分,并對大小不同的尺度成分采用相應粗細的時域或空域取樣步長,對高頻信號細處理,對低頻信號粗處理,從而能夠不斷聚焦到對象的任意微小細節。邊緣檢測的是找出信號突變部分的位置,這在數學上常表示為間斷點、尖點等。而在圖像信號上,這些奇異點就是圖像的邊緣點。由于實際圖像的空間頻率成分十分復雜,用普通的方法直接提取邊緣往往并不是十分有效,而用小波變換可以將圖像分解成不同頻率成分的小波分量,然后再從這些不同層次的小波分量中找出信號本身的特征以便更有效提取邊緣像素。雖然小波正交基用途廣泛,但也存在著不足,尤其是小波正交基的結構復雜。
數學形態學是20世紀60年代由法國科學家Serra和德國的Matheron提出的,到20世紀70年代中期完成了理論論證。數學形態學是分析幾何形狀和結構的數學方法,是建立在集合代數基礎上,用集合論方法定量描述幾何結構的科學。數學形態學由一組形態學的代數運算子組成。最常用的有7種基本變換,分別是膨脹、腐蝕、開、閉、擊中、薄化、厚化。其中膨脹和腐蝕是兩種最基本最重要的變換,其他變換由這兩種變換的組合來定義。用這些算子及其組合進行圖像形狀和結構的分析處理包括圖像分割、特征抽取、邊緣檢測等方面的工作。因而不同于其他的圖像處理理論(如空間域、頻率域的變換方法),是一種用于圖像處理的新理論和新方法。基于數學形態學的圖像邊緣檢測方法與微分算子法、模板匹配法等常用的邊緣檢測方法相比,具有算法簡單、運算速度快、效果好等優點。用形態學邊緣檢測方法所得的結果圖像,在邊緣的連續性及各向同性方面都優于傳統方法,形態學邊緣檢測方法對圖像細節和邊緣定位也有相當好的效果,所檢測出的邊緣寬度與所使用的結構元素形狀和大小密切相關,當結構元素的尺寸(刻度數)增大時,檢出的邊緣寬度將隨之增大。因而,合理地調節結構元素的尺寸將能有效地去除噪聲并能很好地保護細節。
圖像處理過程實際上是對圖像灰度矩陣的處理過程。圖像像素的灰度值都是一些確定值,圖像的模糊化就是將圖像灰度值轉換到模糊集中,用一個模糊值來代表圖像的明暗程度。模糊梯度法是基于圖像灰度梯度變化的原理而產生的。利用模糊理論的不確定性來反映圖像灰度梯度變化過程的模糊性,并根據像素的隸屬度來確定邊緣穿越的位置,可使邊緣檢測更加準確。但由于其算法的復雜性,實現很困難。
近年來,人工神經網絡正廣泛地被用于模式識別、信號與圖像處理、人工智能及自動控制等領域。神經網絡的主要問題是輸入與輸出層的設計問題、網絡數據的準備問題、網絡權值的準備及確定問題、隱層數及結點的問題、網絡的訓練問題。圖像邊緣檢測本質上屬于模式識別問題,而神經網絡能很好地解決模式識別問題。因此,用樣本圖像對多神經網絡進行訓練,將訓練后的網絡再進行實測圖像的邊緣檢測。在網絡訓練中,所提取的特征要考慮噪聲點和實際邊緣的差異,同時去除噪聲點形成的虛假邊緣,因此該方法具有較強的抗噪性能。在學習算法的設計中,常規的對圖像進行混合的結構訓練樣本對于神經網絡性能具有重要影響。使用神經網絡的方法得到的邊緣圖像邊界連續性較好、邊界封閉性好,而且對于任何灰度圖的檢測可以得到很好的效果。
遺傳算法是一類基于自然選擇和遺傳學原理的有效搜索方法,許多領域成功地應用遺傳算法得到了問題的滿意解答。雖然GAs(GeneticAlgorithms)通常是在并行計算機上實現,而大規模并行計算機的日益普及,又為并行GAs奠定了物質基礎。對于圖像的邊緣提取,采用二階的邊緣檢測算子處理后要進行過零點檢測,其計算量很大而且硬件實時資源占用空間大且速度慢,所以學術界提出了一種二次搜索尋優的閾值選取策略。通過遺傳算法進行邊緣提取閾值的自動選取,能夠顯著地提高閾值選取的速度,可以對視覺系統所產生的邊緣圖像進行閾值的實時自動選取,增強了整個視覺系統的實時性。
綜上所述,在圖像邊緣檢測領域有微分方法、基于小波與分形理論的方法,以及基于形態學、基于模糊學、基于神經網絡和基于遺傳算法等多種檢測手段。它們都不是一種具有絕對優勢的方法,有的方法邊緣檢測精度高,但抗噪聲性能較差;有的方法解決了抗噪聲性能差的問題,但檢測精度又不夠;還有一些算法盡管在一定程度上較好地解決了上述兩者的協調問題,但算法復雜、實現困難、運算時間長。可見,無論哪一種邊緣檢測算法在解決一定問題的同時也存在不同類型的缺陷。實質上邊緣檢測作為視覺的初級階段,通常認為是一個非良態問題,很難從根本上解決。因而,尋求算法較簡單、能較好解決邊緣檢測精度與抗噪聲性能協調問題的邊緣檢測算法將一直是圖像處理與分析中研究的主要問題之一,還有待許多工作進一步研究。
[1]馮俊萍,趙轉萍,徐濤.基于數學形態學的圖像邊緣檢測技術[J].航空計算技術,2004,(3):53-56.
[2]阮秋琦,阮宇智.數字圖像處理[M].北京:電子工業出版社,2004:420-445.
[3]張偉偉,劉學鋒.基于數學形態學的圖像邊緣檢測研究[J].計算機與數字工程,2006,(9):59-60.
[4]王慧燕.圖像邊緣檢測和圖像匹配研究及應用[D].浙江大學博士學位論文,2003:1-32.
[5]周德龍,潘泉.圖像模糊邊緣檢測的改進算法[J].中國圖像圖形學報,2001,(4):353-358.
TN
A
1673-0046(2010)10-0161-02