宋 野
(長(zhǎng)春工業(yè)大學(xué)人文信息學(xué)院,吉林 長(zhǎng)春 130122)
數(shù)字圖像信息量繁多,結(jié)構(gòu)多樣化,在表達(dá)、儲(chǔ)存、傳輸過(guò)程中會(huì)由于一些特殊環(huán)境影響,導(dǎo)致圖像低頻成分輪廓邊緣丟失,若這種情況下丟失的面積較大,難以用去噪的方法保留圖像邊緣,隨著專業(yè)人員的不斷探索,研究出大量的輪廓丟失邊緣保留方法。針對(duì)數(shù)字圖像而言,邊緣是由一系列的邊緣點(diǎn)構(gòu)成,數(shù)字圖像的低頻成分為圖像中灰度值變化緩慢的區(qū)域。
傳統(tǒng)的數(shù)字圖像低頻成分通過(guò)自適應(yīng)形態(tài)學(xué)、代價(jià)函數(shù)最小化、智能布線法等,保留成分輪廓丟失邊緣,然而,這些方法產(chǎn)生大量參數(shù),并且這些參數(shù)的制定與具體圖像有關(guān),不便于實(shí)際操作應(yīng)用。傳統(tǒng)方法利用代價(jià)最小化算法保留丟失的邊緣[1],此方法把圖像融入到邊緣保留中,使圖像邊緣得到恢復(fù),實(shí)驗(yàn)結(jié)果證明了該方法的有效性。但這種算法利用代價(jià)函數(shù)還不能夠準(zhǔn)確提取圖像的特征,同時(shí)若丟失邊緣位于目標(biāo)輪廓邊角處時(shí),傳統(tǒng)的算法無(wú)法保留目標(biāo)輪廓的邊緣信息,導(dǎo)致輪廓提取結(jié)果與圖像的初始形狀會(huì)出現(xiàn)不一致。傳統(tǒng)方法在主動(dòng)輪廓模型(Snake)的基礎(chǔ)上[2],提出了GVF Snake模型[3],利用變分與偏微分算法把新的外立場(chǎng)梯度向量場(chǎng)(Gradient Vector Flow,GVF)轉(zhuǎn)入到Snake模型中,經(jīng)典Snake模型能夠提取邊緣輪廓的目標(biāo),目前已有大量針對(duì)Snake模型改進(jìn)的算法,Snake模型主要是通過(guò)輪廓線來(lái)接近目標(biāo)的真實(shí)輪廓,能夠保留丟失邊緣,解決了對(duì)目標(biāo)輪廓的提取,但是,傳統(tǒng)的主動(dòng)輪廓模型不能夠完全保留圖像輪廓邊緣處的信息。
針對(duì)上述問(wèn)題,基于GVF Snake模型,將變分與微分算法轉(zhuǎn)入到丟失邊緣保留問(wèn)題中,對(duì)此提出一種新的邊角保留能量模型[4],用于改進(jìn)GVF外立場(chǎng)無(wú)法完全保留輪廓邊緣信息的問(wèn)題。將該模型極小化后,又重新得到了一種邊角保留GVF(CP-GVF)外立場(chǎng)[5],它將邊緣附近的梯度向量擴(kuò)散到丟失邊緣處,保留了目標(biāo)輪廓的初始信息以及丟失點(diǎn)位置邊緣方向,實(shí)現(xiàn)數(shù)字圖像低頻成分輪廓丟失邊緣保留的目的。最后,由仿真對(duì)比圖像可以看出,本文方法相對(duì)于其它方法更加具有實(shí)用性和準(zhǔn)確性。
邊緣檢測(cè)算法的核心是傳入圖像的像素點(diǎn)信息,根據(jù)映射法判斷出表征像素點(diǎn)是否為邊緣,利用某像素點(diǎn)的鄰域灰度分布和圖像特征向量的不同,將圖像分為邊緣像素點(diǎn)與背景像素點(diǎn)[6]。
圖像的邊緣實(shí)際上是圖像中灰度突變的點(diǎn),同時(shí)灰度分布有序,具有方向性。采用圖像邊緣灰度特性與噪聲差異來(lái)提取特征向量,建立相匹配的特征向量,能夠在檢測(cè)圖像邊緣的同時(shí)又具有較強(qiáng)的識(shí)別效果。
圖像邊緣特征向量的提取分為三個(gè)階段:第一階段是梯度特征分量提取[7],它不僅是反映變化速度的有效途徑,而且是檢測(cè)邊緣的主要依據(jù)之一,在建立像素點(diǎn)灰度值的梯度分量時(shí),結(jié)合了Robert算法,能夠在最短時(shí)間內(nèi)實(shí)現(xiàn)邊緣特征向量的提取,在圖像中邊緣附近梯度值越大,緩沖區(qū)梯度值越小,所以能夠較好的顯示出圖像邊緣信息;第二階段是中值特征分量提取[8],因?yàn)閳D像邊緣帶有特殊的結(jié)構(gòu)性,所以位于邊緣方向上的中值特征向量相當(dāng)于當(dāng)前像素點(diǎn)的灰度,由于該點(diǎn)是單獨(dú)的灰度突變,在取中值處理中被自動(dòng)消除,所以在進(jìn)行特征向量提取時(shí),縮短了操作時(shí)間,具有較高的時(shí)效性;第三階段是方向特征向量的提取,通過(guò)Kirsch方向算子[9],實(shí)現(xiàn)消除噪聲影響的目的,Kirsch算子將8種模塊分別與測(cè)試像素點(diǎn)位3×3的領(lǐng)域進(jìn)行卷積,中心點(diǎn)像素是由最大傳出值與最小傳出值相減得來(lái),當(dāng)鄰域內(nèi)有中心點(diǎn)邊緣并且具有方向性,則模板測(cè)試的位置與邊緣方向越接近時(shí)差值越大,當(dāng)該位置與邊緣方向距離最遠(yuǎn)時(shí)差值越小。
但當(dāng)鄰域的灰度突變由噪聲引起時(shí)且不具有方向性,卷積值都相近,差值達(dá)到最小,因此對(duì)于噪聲的干擾,具有較強(qiáng)的消除效果。
因?yàn)锽P神經(jīng)網(wǎng)絡(luò)具有多層化[10],所以可用來(lái)解決復(fù)雜的非線性問(wèn)題。首先,要收集一些具有代表性的圖像作為檢測(cè)樣本,提取該圖像的真實(shí)邊緣當(dāng)作主導(dǎo)信號(hào),然后建立BP神經(jīng)網(wǎng)絡(luò),采用準(zhǔn)確的邊緣信息當(dāng)作網(wǎng)絡(luò)訓(xùn)練的傳入樣品,最后用BP算法對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,通過(guò)不斷的訓(xùn)練,圖像的灰度信息以及邊緣檢測(cè)傳出數(shù)據(jù)被記憶于網(wǎng)絡(luò)的權(quán)值、閾值與框架中,能夠讓BP神經(jīng)網(wǎng)絡(luò)有效識(shí)別圖像邊緣像素點(diǎn)的特征。
然而,隱層神經(jīng)元數(shù)量的選取是一件非常困難的事情,需要經(jīng)過(guò)大量的實(shí)驗(yàn)結(jié)果綜合考慮來(lái)確定,與傳入、傳出神經(jīng)元數(shù)目有一定的關(guān)系,若數(shù)量過(guò)大會(huì)導(dǎo)致訓(xùn)練時(shí)間變長(zhǎng),結(jié)果不準(zhǔn)確,不能識(shí)別新樣品,對(duì)此,提出了一種可進(jìn)行模式識(shí)別及分類的BP神經(jīng)網(wǎng)絡(luò)隱層節(jié)點(diǎn)數(shù)目[11]。圖像邊緣特征向量提取函數(shù)如式(1)所示

(1)
式中,np代表傳入節(jié)點(diǎn)數(shù)量,nr代表傳出節(jié)點(diǎn)數(shù)量,a代表常數(shù),使用先少后多的訓(xùn)練辦法,慢慢增加隱層單元數(shù)量,直到達(dá)到最好效果為止。邊緣檢測(cè)時(shí),采用slide方法,即對(duì)每個(gè)像素點(diǎn)進(jìn)行逐一處理。
在對(duì)丟失邊緣進(jìn)行標(biāo)注前,首先要對(duì)圖像進(jìn)行形態(tài)學(xué)細(xì)化處理,然后對(duì)丟失邊緣進(jìn)行標(biāo)記,觀察每一個(gè)圖像中的邊緣像素點(diǎn),若圖像中僅有一個(gè)8鄰域點(diǎn),則對(duì)其標(biāo)注為丟失點(diǎn),將初始傳入圖像記為fο,形態(tài)學(xué)細(xì)化后的圖像記為f,標(biāo)記后的丟失邊緣圖像記為fc,如圖1所示。

圖1 標(biāo)記丟失邊緣過(guò)程圖
GVF外立場(chǎng)實(shí)際上是一種向量場(chǎng),它是將能量泛函數(shù)轉(zhuǎn)變成最小化得來(lái),GVF場(chǎng)是拓展的梯度向量場(chǎng)。但是,如果當(dāng)數(shù)字圖像中的低頻成分輪廓過(guò)于模糊,會(huì)導(dǎo)致輪廓處的邊緣提取結(jié)果發(fā)生丟失,從而在丟失邊緣處GVF場(chǎng)中的梯度向量都轉(zhuǎn)向了丟失點(diǎn)。對(duì)此,首先要對(duì)圖像中丟失邊緣處的最初梯度場(chǎng)與GVF場(chǎng)的特點(diǎn)進(jìn)行分析,為了保留丟失邊緣提出如下能量模型
Ecp=n?μ|?v|2
+|W(x,y)·?f|2|V-W(x,y)·?f|2dxdy
(2)
式中,W代表丟失點(diǎn)的對(duì)應(yīng)圖,v(x,y)=[u(x,y),υ(x,y)]代表新的向量場(chǎng),被叫做邊緣保留GVF(Corner Preserving GVF,CP-GVF)場(chǎng),?f代表低頻邊緣圖像f的梯度圖像,μ代表加權(quán)參數(shù),該能量函數(shù)中包含兩種,第一種μ|?v|2表示向量場(chǎng)V在坐標(biāo)(x,y)中的轉(zhuǎn)變,V的變化越小就會(huì)構(gòu)成一種緩變的向量場(chǎng);第2種|W(x,y)·?f|2|V-W(x,y)·?f|2代表V與W(x,y)·?f的差異度,差異度越小V和W(x,y)·?f越接近。所以GVF場(chǎng)是拓展的梯度向量場(chǎng)。
通過(guò)GVF向量場(chǎng)的處理方式,然后結(jié)合極小化式(2),能夠計(jì)算出CP-GVF場(chǎng)的Euler方程,如式(3)、式(4)所示
μΔu(x,y)-[u(x,y)-W(x,y)·fx(x,y)]·
|W(x,y)·?f|2=0
μΔυ(x,y)-[υ(x,y)-W(x,y)·fy(x,y)]·
|W(x,y)·?f|2=0
(3)
|W(x,y)·?f|2=

(4)
式中,?代表Laplace算子,偏微分用fx和fy來(lái)表示。把與當(dāng)作按時(shí)間變化的函數(shù)如下
u=u(x,y,t)
υ=υ(x,y,t)
(5)
因?yàn)閃(x,y)·fx(x,y)與W(x,y)·fy(x,y)都是標(biāo)量積,以上方程的求解方法與GVF模型相像,需將fx(x,y)和fy(x,y)分別與W(x,y)相乘。
為了完成W數(shù)值,需將圖像中的像素點(diǎn)i和j代替坐標(biāo)系中的x與y,這樣才能使W(x,y)=W(i,j),W的主要負(fù)責(zé)控制丟失點(diǎn)處的最初梯度場(chǎng),可通過(guò)形態(tài)學(xué)膨脹技術(shù)來(lái)完成W,首先要對(duì)丟失點(diǎn)標(biāo)記圖像f施行形態(tài)學(xué)膨脹,求出的丟失邊緣圖像fcx如式(6)所示
fcx=fc⊕SEcllipse
(6)
式中,SEcllipse代表圖像結(jié)構(gòu)元素,主要負(fù)責(zé)遮擋丟失邊緣周邊的其它點(diǎn),尺寸的選擇成為該方法實(shí)現(xiàn)的關(guān)鍵,太小會(huì)影響丟失點(diǎn)周邊向量的控制,太大會(huì)減少非丟失邊緣附近的向量場(chǎng),通常情況下會(huì)將SEcllipse的尺寸設(shè)為2。隨著丟失邊緣的范圍不斷增大,會(huì)形成一個(gè)連通區(qū)域,低頻成分輪廓丟失邊緣保留函數(shù)由下式得來(lái)
W(i,j)=1-λ·fcx(i,j)
(7)
式中,λ表示抑制因子,能夠顯示丟失邊緣附近向量場(chǎng)的抑制系數(shù),該系數(shù)是位于0~1之間的一種權(quán)重因子,通常取值為0.9可以抑制丟失邊緣的增大。W如圖1(d)所示。
W(x,y)·?f的值只在非丟失邊緣周圍才會(huì)增大,所以由第二項(xiàng)控制,當(dāng)時(shí)取最小值,但在其它范圍W(x,y)·?fV(x,y)=W(x,y)·?f較小,此時(shí)由第一項(xiàng)控制。最終的目的是:非丟失邊緣區(qū)域的梯度向量被分散到丟失邊緣區(qū)域,由此使目標(biāo)輪廓處的邊緣信息得到保留。
GVF外立場(chǎng)與CP-GVF外立場(chǎng)的對(duì)比圖如圖2、圖3所示。

圖2 GVF與CP-GVF外立場(chǎng)的對(duì)比圖

圖3 GVF外立場(chǎng)和CP-GVF外立場(chǎng)
在圖3(a)中,圖像的頂角邊緣丟失,該丟失邊緣圖相對(duì)應(yīng)的GVF外力場(chǎng)如圖3(b)所示,向量都被擴(kuò)散到了丟失邊緣區(qū)域,而在CP-GVF中丟失邊緣區(qū)域的向量保持了原邊緣的向量走勢(shì),使得丟失邊緣得到保留。
為了更好的檢驗(yàn)本文方法對(duì)丟失邊緣保留效果,收集了幾種不同的圖像進(jìn)行實(shí)驗(yàn)測(cè)試,輪廓的形狀與丟失邊緣點(diǎn)位也各不相同。
首先把圖像進(jìn)行灰度化,然后在進(jìn)行邊緣提取,該實(shí)驗(yàn)采用的系統(tǒng)為Matlab R2011,將μ取值為0.2,λ取值為0.9,把實(shí)驗(yàn)后的結(jié)果與GVF Snake方法做對(duì)比分析,如圖4所示。

圖4 對(duì)比分析圖
這兩種方法都能夠很好的保留圓形丟失邊緣圖像輪廓,對(duì)于丟失邊緣輪廓為三角形的圖像,經(jīng)過(guò)GVF Snake方法處理后,丟失邊緣圖像沒(méi)有被完全保留,但本文方法則能夠完好的保留三角形的輪廓,恢復(fù)到初始形狀。圖4(c)原始圖為規(guī)則的多邊形輪廓圖,GVF Snake方法仍然不能夠保留邊緣的原始信息,為了仿真圖像邊緣輪廓的丟失,圖4(a)中抹去了一些邊緣輪廓,GVF Snake方法直接將丟失邊緣處進(jìn)行連接,丟失了一部分的邊緣信息,沒(méi)有將其完全保留下來(lái),但本文方法能夠完整的保留圖像輪廓的邊緣信息,該實(shí)驗(yàn)采用的圖像真實(shí)邊緣尺寸為128×128,實(shí)驗(yàn)結(jié)果顯示,圖像中丟失邊緣間的尺寸在30個(gè)像素點(diǎn)以內(nèi),都能夠完成丟失邊緣的保留。
為了進(jìn)一步檢驗(yàn)低頻成分輪廓丟失邊緣保留的準(zhǔn)確性,將圖片進(jìn)行模糊化處理,然后在對(duì)模糊后的邊緣圖像進(jìn)行檢測(cè),同樣采用GVF Snake方法進(jìn)行對(duì)比分析。
從圖5中可以看出,目標(biāo)輪廓的邊緣位置已經(jīng)變的很模糊,通過(guò)邊緣檢測(cè)后,該位置的輪廓邊緣會(huì)有部分丟失,所以利用GVF Snake對(duì)目標(biāo)輪廓進(jìn)行提取的結(jié)果還不夠完善。然而通過(guò)CP-GVF外立場(chǎng)的作用能夠讓丟失邊緣信息得到復(fù)原,從而證明了利用本文提出的方法能夠?qū)崿F(xiàn)目標(biāo)輪廓的邊緣信息保留,并且具有較高的準(zhǔn)確性。同時(shí),在圖5的后兩行圖像中,凹陷處邊緣變得模糊,這些輪廓雖都是由形狀規(guī)則的矩形方框摞在一起形成,但由于雨水、光照等特殊原因?qū)е碌皖l成分部分邊緣變的非常模糊,經(jīng)過(guò)兩種方法的對(duì)比,如圖5(b)和(c)所示,GVF Snake方法處理后的圖像輪廓仍有一部分邊緣丟失,而本文的方法使得圖像輪廓的邊緣得以完整的保留。

圖5 準(zhǔn)確性對(duì)比分析圖
本文為了有效保留數(shù)字圖像低頻成分輪廓丟失邊緣,首先對(duì)圖像邊緣進(jìn)行檢測(cè),通過(guò)特征向量對(duì)圖像進(jìn)行特征提取的方式來(lái)減小像素點(diǎn)灰度傳入時(shí)的傳入范圍,具有較強(qiáng)的時(shí)效性,然后提出了一種新的能量模型即邊緣保留能量模型,極小化后得到了CP-GVF,實(shí)現(xiàn)了當(dāng)目標(biāo)輪廓邊緣丟失時(shí)能夠得到完整保留,實(shí)驗(yàn)結(jié)果證明了該算法的準(zhǔn)確性。