宋長(zhǎng)新 馬克 秦川 肖鵬
(青海師范大學(xué)計(jì)算機(jī)學(xué)院,西寧 810008)
(2012年5月3日收到;2012年10月4日收到修改稿)
紅外圖像的分割就是根據(jù)一致性準(zhǔn)則將圖像劃分為互不重疊的各具特性的區(qū)域,并區(qū)分出感興趣目標(biāo)的過(guò)程[1,2],是紅外圖像在軍事和民用中應(yīng)用的前提.紅外圖像分割的好壞關(guān)系到目標(biāo)檢測(cè)、識(shí)別和精確定位等任務(wù).通常采取的算法有閾值化分割、基于邊緣的分割及基于區(qū)域的分割等[1].由于紅外圖像具有紋理少、對(duì)比度差、信噪比低及復(fù)雜背景干擾等特點(diǎn),導(dǎo)致了紅外圖像分割問(wèn)題的困難[3].為了克服這些困難,提高分割的準(zhǔn)確性,人們提出了許多改進(jìn)的分割算法,如結(jié)合直方圖或熵的閾值化分割[1,4]、基于C-V模型的水平集分割[5]、空間約束聚類(lèi)分割[6,7]等分割算法.其中基于聚類(lèi)的紅外圖像分割算法是一種重要的分割算法,分割過(guò)程中不需過(guò)多的人工干預(yù),具有較好的抗噪性,適于紅外圖像自動(dòng)分割,得到了大量研究.常用的聚類(lèi)分割算法有K-means算法、模糊C均值算法(FCM)等,主要采用的是詞袋(BOF:bag of features)的思想[8],為了更準(zhǔn)確地從復(fù)雜背景中分割重要區(qū)域,后又在上述聚類(lèi)算法基礎(chǔ)上提出了空間約束FCM分割算法[7,9,10]、模糊核聚類(lèi)分割算法[3]等.這些算法本質(zhì)上都是K-means算法,對(duì)非凸的數(shù)據(jù)結(jié)構(gòu)和彼此交疊嚴(yán)重的數(shù)據(jù)存在局限性[8],也較少考慮像素點(diǎn)在空間上的依賴(lài)關(guān)系,導(dǎo)致分割效果并不理想.
本文結(jié)合稀疏編碼算法提出了一種紅外圖像聚類(lèi)分割算法.稀疏編碼是在超完備基上的一種稀疏表示,是計(jì)算機(jī)視覺(jué)領(lǐng)域的研究熱點(diǎn)之一,稀疏編碼方法廣泛應(yīng)用于圖像恢復(fù)、識(shí)別及檢測(cè)等模式識(shí)別的各個(gè)方面[11?14].稀疏編碼對(duì)K-means聚類(lèi)算法的擴(kuò)展在向量量化構(gòu)造BOF特征進(jìn)行識(shí)別時(shí)具有明顯改善[11,15,16],但直接將上述稀疏編碼用于聚類(lèi)進(jìn)行圖像分割容易產(chǎn)生過(guò)分割,難以得到有意義的區(qū)域,造成像素歸類(lèi)的判斷問(wèn)題.為此,我們?cè)谧值鋵W(xué)習(xí)過(guò)程中,將原子的聚類(lèi)算法引入其中,有助于縮減字典中原子所屬類(lèi)別的數(shù)目,同時(shí)將稀疏編碼系數(shù)同原子對(duì)聚類(lèi)中心的隸屬程度相結(jié)合來(lái)判斷像素所屬的類(lèi)別.這種處理方式能通過(guò)字典更好地反映類(lèi)別內(nèi)像素的內(nèi)在聯(lián)系性,由于采用局部塊進(jìn)行處理,自然地引入了局部信息,而且這些約束條件與聚類(lèi)算法相融合也較為自然,在此基礎(chǔ)上進(jìn)一步根據(jù)圖像特點(diǎn)對(duì)圖像中像素的鄰域像素施加空間類(lèi)別屬性約束提高分割質(zhì)量.實(shí)驗(yàn)結(jié)果表明,所提算法能更好地實(shí)現(xiàn)復(fù)雜背景及干擾下紅外圖像重要區(qū)域的準(zhǔn)確分割提取.
所謂稀疏編碼是指信號(hào)可以用一個(gè)過(guò)完備字典集中的少數(shù)幾個(gè)基向量的線性組合來(lái)表示,其所用的基向量個(gè)數(shù)要盡可能少,也就是稀疏[12],這些稀疏系數(shù)及其對(duì)應(yīng)的字典可以反映信號(hào)的主要特征和內(nèi)在結(jié)構(gòu).假設(shè)維數(shù)為m的n個(gè)樣本形成的數(shù)據(jù) X=[x1,x2,···,xn]∈ Rm×n,其中 xi是第 i個(gè)樣本,有過(guò)完備字典 D=[d1,d2,···,dK]∈ Rm×K(K>m),其中D中的每個(gè)列向量dk∈Rm×1稱(chēng)為原子(也可稱(chēng)基向量),滿足約束條件dTkdk≤1,K為字典中的原子個(gè)數(shù),稀疏編碼模型就是通過(guò)最小化下面重構(gòu)誤差求解信號(hào)的稀疏描述和過(guò)完備字典,即

其中 ‖·‖F(xiàn)表示 Frobenius范數(shù) (簡(jiǎn)稱(chēng) F 范數(shù)),‖·‖1是1范數(shù),表示稀疏性約束,αi∈RK×1是xi的稀疏系數(shù)向量,A=[α1,α2,···,αn]∈ RK×n,參數(shù) λ 平衡重構(gòu)誤差和系數(shù)的稀疏性.可以看出上述稀疏性約束采用的是1范數(shù),一般稀疏性用系數(shù)向量中的非零個(gè)數(shù)表示,即0范數(shù),如果(1)式采用0范數(shù)約束則是一個(gè)NP難的非凸優(yōu)化問(wèn)題,難以求解,通常用1范數(shù)代替0范數(shù),很多文獻(xiàn)已經(jīng)證明兩者具有等價(jià)性[12].上述代價(jià)函數(shù)同時(shí)對(duì)變量D和α求解是非凸函數(shù),但如果固定其中一個(gè)變量求解另一個(gè)變量,則是一個(gè)凸函數(shù)優(yōu)化問(wèn)題,一般分為兩步求解:字典學(xué)習(xí)和稀疏編碼,在固定字典D時(shí)求解稀疏系數(shù)α,在固定稀疏系數(shù)α?xí)r學(xué)習(xí)字典D,多次迭代進(jìn)行優(yōu)化,直到收斂.當(dāng)前稀疏編碼應(yīng)用的難點(diǎn)在于根據(jù)問(wèn)題設(shè)計(jì)反映任務(wù)需要的字典.
K-means聚類(lèi)算法是一種無(wú)監(jiān)督類(lèi)別劃分方法,通過(guò)最小化樣本和所屬聚類(lèi)中心的距離進(jìn)行優(yōu)化,其目標(biāo)函數(shù)表示為:其中vc為第c類(lèi)聚類(lèi)中心,J為類(lèi)別數(shù),是向量量化構(gòu)造BOF特征的一個(gè)重要步驟.K-means聚類(lèi)算法的目標(biāo)函數(shù)等價(jià)于如下形式:

式中 V=[v1,v2,···,vJ]∈ Rm×J是聚類(lèi)中心形成的矩陣;U=[u1,u2,···,un]∈ RJ×n是樣本對(duì)聚類(lèi)中心的歸屬指標(biāo)矩陣,其所有元素為非負(fù)值;函數(shù)card(x)表示x中的非零元素個(gè)數(shù),card(ui)=1表示ui中只有一個(gè)元素非零,‖ui‖1=1確保 ui所有元素的絕對(duì)值之和為1,上述限制使得ui只有一個(gè)元素為1,其余均為0,也就是ui確定了樣本xi所屬的聚類(lèi)中心,ui中的非零元素所在的位置對(duì)應(yīng)了xi所屬的聚類(lèi)中心,可以看出(2)式與原始K-means目標(biāo)函數(shù)是等價(jià)的.但card(ui)=1限制條件嚴(yán)格,從而使得對(duì)xi的重構(gòu)誤差較大,損失部分信息;如果放松該限制,會(huì)造成樣本屬于過(guò)多聚類(lèi)中心,這時(shí)采用反映非零元素個(gè)數(shù)的稀疏性約束代替‖ui‖1=1,則在稀疏編碼觀點(diǎn)下的K-means聚類(lèi)算法目標(biāo)函數(shù)為[11,17]

其中 ‖vc‖≤1,該歸一化項(xiàng)的約束防止產(chǎn)生奇異解.稀疏編碼觀點(diǎn)下的K-means算法與原始K-means算法相比,具有如下優(yōu)點(diǎn)[11]:1)(3)式由于約束條件更為寬松,較K-means具有更低的目標(biāo)函數(shù)誤差,對(duì)樣本有更低的重構(gòu)誤差,可保留樣本更多的信息;2)通過(guò)稀疏性能捕捉圖像更顯著的特征;3)圖像的統(tǒng)計(jì)特性表明圖像塊本身就具有稀疏性,更符合圖像的特性.可以看出采用(3)式的樣本只與幾個(gè)聚類(lèi)中心有關(guān)(對(duì)應(yīng)于稀疏系數(shù)的非零元素),與其他的聚類(lèi)中心不存在關(guān)系.
從(3)式中可以看出,樣本xi從單純的像素點(diǎn)聚類(lèi)擴(kuò)展到以該像素點(diǎn)為中心的圖像塊聚類(lèi),利于排除野點(diǎn)的干擾,具有一定的空間約束性;而且通過(guò)聯(lián)合所有像素點(diǎn)所在像素塊進(jìn)行學(xué)習(xí)字典,各個(gè)局部像素塊通過(guò)字典建立了某種聯(lián)系,挖掘了它們之間一定的內(nèi)在相關(guān)性,有利于利用像素的相似性進(jìn)行聚類(lèi);稀疏系數(shù)可以捕捉圖像更顯著的特征,抑制圖像中的非結(jié)構(gòu)信息,如雜點(diǎn)、噪聲和其他一些外來(lái)干擾.但直接將上述稀疏編碼用于聚類(lèi)進(jìn)行圖像分割有兩個(gè)困難:1)由于K>m,字典D中的原子個(gè)數(shù)較多,直接將D中的原子作為聚類(lèi)中心會(huì)造成類(lèi)別數(shù)過(guò)多,容易導(dǎo)致過(guò)分割,難以得到有意義的區(qū)域;2)得到的稀疏系數(shù)向量難以反映像素點(diǎn)所屬的類(lèi),造成像素歸類(lèi)的判斷問(wèn)題.
我們采用的思想是在字典學(xué)習(xí)過(guò)程中,將原子的聚類(lèi)算法引入其中,有助于縮減字典中原子所屬類(lèi)別的數(shù)目,防止產(chǎn)生過(guò)分割的問(wèn)題;同時(shí)將稀疏編碼系數(shù)同原子對(duì)聚類(lèi)中心的隸屬程度相結(jié)合來(lái)判斷像素所屬的類(lèi)別.但是字典中原子之間具有較大的相關(guān)性,如果采用K-means聚類(lèi)算法強(qiáng)制將原子劃分為某一類(lèi)別,容易產(chǎn)生較大的聚類(lèi)誤差,對(duì)后續(xù)的像素歸類(lèi)判斷產(chǎn)生誤導(dǎo).這里我們采用FCM算法進(jìn)行原子的聚類(lèi).FCM是在K-means算法的基礎(chǔ)上引入了模糊隸屬度的概念,樣本可以歸屬于多個(gè)聚類(lèi)中心,不再是硬劃分.定義樣本xi對(duì)第c類(lèi)的模糊隸屬度函數(shù)為wci,且隸屬度函數(shù)w滿足
ciFCM的目標(biāo)函數(shù)為:式中 p ≥ 1 是隸屬度指數(shù),一般取為2.若式中的隸屬度函數(shù)wci只取0或1,則為K-means聚類(lèi)算法.通過(guò)迭代更新隸屬度函數(shù)wci和聚類(lèi)中心vc最小化目標(biāo)代價(jià)函數(shù).FCM與(3)式不同之處在于:FCM算法中樣本通過(guò)歐氏距離與所有聚類(lèi)中心有聯(lián)系,而(3)式中樣本通過(guò)稀疏系數(shù)只與幾個(gè)聚類(lèi)中心有關(guān),這種基于稀疏系數(shù)的相關(guān)性正如上所述,反映的是圖像內(nèi)在結(jié)構(gòu)的相似性.根據(jù)以上分析,我們將基于FCM的原子聚類(lèi)算法引入到(3)式中進(jìn)行字典學(xué)習(xí),給出如下目標(biāo)函數(shù):

其中γ為控制樣本重構(gòu)誤差和原子聚類(lèi)誤差比例的參數(shù),zc表示原子的聚類(lèi)中心.上式中第一項(xiàng)是樣本在字典下的重構(gòu)誤差,反映字典和稀疏系數(shù)所含的樣本信息;第二項(xiàng)是稀疏性約束;第三項(xiàng)表示原子的聚類(lèi),反映原子的歸類(lèi)問(wèn)題,一般J?K,即將原子分為J類(lèi).如果γ過(guò)大,主要強(qiáng)調(diào)原子的聚類(lèi),則學(xué)習(xí)的字典V將有明顯的結(jié)構(gòu)信息,相對(duì)來(lái)說(shuō)會(huì)造成樣本重構(gòu)誤差過(guò)大,弱化字典V反映的樣本信息;反之,如果γ過(guò)小,則學(xué)習(xí)的字典V將更多地反映樣本信息,從而弱化結(jié)構(gòu)信息,難以取得較好的聚類(lèi)效果.
圖像分割中的空間約束是一個(gè)重要的信息,文獻(xiàn)[8—10,15,16]相關(guān)結(jié)論表明,考慮空間約束能有效提高實(shí)驗(yàn)效果,對(duì)于紅外圖像來(lái)說(shuō),其像素及其鄰域中的像素更具有類(lèi)別屬性一致性的特點(diǎn).我們將圖像像素的空間類(lèi)別屬性約束引入(4)式中,給出下面的目標(biāo)函數(shù):

其中ρ為空間約束性懲罰因子.Ni,t以xi為中心窗口,大小為(2t+1)×(2t+1)的鄰域.NR為鄰域中像素的個(gè)數(shù).rci是樣本xi對(duì)于聚類(lèi)中心zc的歸屬度,其他參數(shù)同(4)式所述.上式第四項(xiàng)是空間類(lèi)別屬性約束,反映某像素點(diǎn)及其鄰域像素應(yīng)盡可能屬于相同的一類(lèi).為了求解上式,首先需要定義樣本對(duì)于聚類(lèi)中心的歸屬度rci,要完成聚類(lèi)分割,需要判斷像素點(diǎn)所屬的類(lèi).由于稀疏系數(shù)反映了樣本xi對(duì)字典中各個(gè)原子的權(quán)重大小,而字典中各個(gè)原子對(duì)聚類(lèi)中心有不同的隸屬程度,所以我們定義樣本xi對(duì)于聚類(lèi)中心zc的歸屬度為


如果同時(shí)優(yōu)化全部4個(gè)參數(shù)比較困難,這里采用交替優(yōu)化迭代方法求解Z,U,V,W.隨機(jī)選取樣本初始化字典后,首先求解稀疏系數(shù);然后更新字典;最后計(jì)算聚類(lèi)中心和隸屬度.具體求解算法如下.
1)稀疏編碼:固定Z,V,W,即

2)字典學(xué)習(xí):固定Z,U,W,學(xué)習(xí)字典V,此時(shí)的優(yōu)化目標(biāo)函數(shù)為

對(duì)V中的原子逐一進(jìn)行求解,固定其他原子,則對(duì)原子vl有如下表示:


其中 qt是稀疏系數(shù) U 的行向量 (t=1,···,J),U=[q1;q2;·;qJ]. 令與原子 vl無(wú)關(guān)的項(xiàng) S=則 (10)式可以寫(xiě)成


其中η為調(diào)節(jié)參數(shù),將上式對(duì)vl微分有

然后,歸一化

如此對(duì)V中的原子逐一進(jìn)行更新.
3)更新聚類(lèi)中心:固定V,W,U,通過(guò)



4)更新隸屬度:固定Z,V,U,通過(guò)


求解W,根據(jù)拉格朗日乘子法有


通過(guò)上述的多次迭代優(yōu)化過(guò)程,可以求出字典V,稀疏系數(shù)U,字典聚類(lèi)中心Z及隸屬度W.最后完成聚類(lèi)分割,需要判斷像素點(diǎn)所屬的類(lèi),計(jì)算樣本xi對(duì)于聚類(lèi)中心zc的歸屬度:根據(jù)樣本對(duì)于各個(gè)聚類(lèi)中心的歸屬度按照最大化原則進(jìn)行分類(lèi),即可得到最終聚類(lèi)結(jié)果,從而完成紅外圖像的聚類(lèi)分割.
為了驗(yàn)證本文所提紅外圖像分割算法的性能,我們采用機(jī)載對(duì)地面飛機(jī)和道路的紅外圖像進(jìn)行實(shí)驗(yàn),分別如圖1(a)和圖3(a)所示,并采用K-means,FCM,模糊核聚類(lèi)(KFCM)和結(jié)合空間信息的模糊聚類(lèi)(SFCM)分割算法結(jié)果作為對(duì)比.首先,我們討論一下具體的參數(shù)選擇,FCM,KFCM,SFCM和本文算法中的隸屬度指數(shù)p統(tǒng)一取為2,FCM,KFCM及SFCM算法的迭代次數(shù)為100,本文算法中稀疏性參數(shù)λ取0.001,γ=0.2,η=0.5.空間約束目的是使得鄰域內(nèi)的所有像素盡量具有相同的類(lèi)別,對(duì)于SFCM和本文算法空間約束的鄰域大小選擇,正如文獻(xiàn)[8—10]中所論述的,選擇較大的鄰域進(jìn)行空間約束,如7×7,9×9等,雖能使得分割結(jié)果更為平滑完整,較好地消除野點(diǎn)及噪聲,但難以避免會(huì)丟失圖像中固有的邊緣或較小目標(biāo)等信息.一般來(lái)說(shuō),如果目標(biāo)較大,且較為平滑完整,則可適當(dāng)?shù)剡x擇較大鄰域.對(duì)于本文的圖像,我們選擇大小為3×3的鄰域用于SFCM和本文算法的實(shí)驗(yàn);其中對(duì)于空間約束懲罰系數(shù)α,選取過(guò)小的α將難以起到空間約束的作用,選取過(guò)大的α將抹殺圖像像素的固有屬性,這里我們?cè)赟FCM和本文算法中選取空間約束懲罰系數(shù)α=4.KFCM算法所用的核函數(shù)及其參數(shù)在后面實(shí)驗(yàn)中給出.另外,本文算法由于采用像素鄰域的圖像塊向量代替了原來(lái)的像素值,可以看出如果取較大的圖像塊,則容易抹殺了圖像的細(xì)節(jié)信息,本文算法實(shí)驗(yàn)中選取圖像塊大小為3×3.如文獻(xiàn)[11,12,20]所示,并對(duì)數(shù)據(jù)進(jìn)行歸一化處理,字典大小可以通過(guò)冗余性指數(shù)N和圖像塊向量維數(shù)m確定,即K=N×m,冗余性指數(shù)N反映了稀疏系數(shù)的稀疏性,N越大則越稀疏,本文中N取值范圍可設(shè)為5—10.K-means,FCM,KFCM,SFCM及本文算法中如何選擇類(lèi)別數(shù)J是一個(gè)普遍的難題,與諸多文獻(xiàn)類(lèi)似,我們通過(guò)實(shí)驗(yàn)根據(jù)不同的問(wèn)題選擇不同的類(lèi)別數(shù).針對(duì)多組實(shí)驗(yàn),本文算法的迭代次數(shù)統(tǒng)一選為50,其收斂性將在后面予以討論.
實(shí)驗(yàn)中計(jì)算機(jī)為i5-2.5 GHz Intel酷睿處理器,4 GB內(nèi)存,仿真工具為Matlab 7.10.紅外圖像分割的效果一般無(wú)法進(jìn)行定量評(píng)價(jià),一個(gè)廣泛采用的評(píng)價(jià)原則就是看能否分割出期望的或者重要的區(qū)域,并且盡量區(qū)分背景區(qū)域和目標(biāo)區(qū)域.本實(shí)驗(yàn)主要觀察分割算法能否分割出重要區(qū)域,保持重要區(qū)域的完整性,抑制非重要區(qū)域?qū)χ匾獏^(qū)域的誤導(dǎo).可以看出圖1(a)和圖2(a)所示的重要區(qū)域分別為飛機(jī)和道路.

圖1 分割結(jié)果對(duì)比 (a)原始圖像;(b)K-means分割;(c)FCM分割;(d)KFCM分割;(e)SFCM分割;(f)本文算法

圖2 含噪圖像分割結(jié)果對(duì)比 (a)噪聲圖像;(b)K-means分割;(c)FCM分割;(d)KFCM分割;(e)SFCM分割;(f)本文算法
對(duì)于圖 1(a)的分割實(shí)驗(yàn),K-means,FCM,KFCM,SFCM及本文算法中采用的類(lèi)別數(shù)J取為8,本文算法所采用圖像塊大小為3×3,字典大小為50.從圖1的對(duì)比中可以看出,K-means分割算法飛機(jī)輪廓并不完整,含有大量的非相關(guān)區(qū)域;FCM較K-means分割算法在抑制非相關(guān)區(qū)域較K-means效果好,但飛機(jī)輪廓也不完整;KFCM由于通過(guò)核方法提高了特征的區(qū)分性(采用高斯核,所用核參數(shù)σ=10),較K-means和FCM分割算法大量抑制了非相關(guān)區(qū)域,由于沒(méi)有考慮到空間信息,飛機(jī)輪廓并不完整;SFCM分割算法能較好抑制孤立的雜點(diǎn),使得分割結(jié)果具有較好的平滑性,由于特征的較弱區(qū)分性,并不能去除大量的非相關(guān)區(qū)域;而本文所提的算法由于考慮了圖像局部信息、像素之間的內(nèi)在相關(guān)性以及空間類(lèi)別屬性約束信息,飛機(jī)輪廓保持比較完整,同時(shí)非相關(guān)區(qū)域被較好抑制,分割效果較為理想.
為了進(jìn)一步驗(yàn)證算法的性能,對(duì)加入噪聲的圖像進(jìn)行分割實(shí)驗(yàn),在圖1(a)中加入標(biāo)準(zhǔn)方差為20的高斯噪聲,如圖2(a)所示,K-means,FCM,KFCM,SFCM及本文算法中采用的類(lèi)別數(shù)J取為8,本文算法所采用圖像塊大小為5×5,字典大小為100.從圖2中可以看出,K-means,FCM分割算法中飛機(jī)輪廓被大量雜點(diǎn)干擾,難以判斷;KFCM(采用高斯核,所用核參數(shù)σ=10)和SFCM具有一定的噪聲抑制性,飛機(jī)輪廓也受到干擾,并不完整,同時(shí)混有大量非相關(guān)區(qū)域;而本文所提的算法飛機(jī)輪廓較為完整,由于所用圖像塊較大,噪聲抑制很好,使得不屬于飛機(jī)的像素被分為飛機(jī)像素,所以飛機(jī)輪廓有所擴(kuò)大,但相比于K-means,FCM,KFCM和SFCM分割算法,本文算法取得了較好的結(jié)果.為了更加證實(shí)所提算法有效性,下面我們對(duì)機(jī)載對(duì)地道路紅外圖像進(jìn)行實(shí)驗(yàn).

圖3 分割結(jié)果對(duì)比 (a)原始圖像;(b)K-means分割;(c)FCM分割;(d)KFCM分割;(e)SFCM分割;(f)本文算法
對(duì)于圖 3(a)的分割實(shí)驗(yàn),K-means,FCM,KFCM,SFCM及本文算法中采用的類(lèi)別數(shù)J取為3,本文算法所采用圖像塊大小3×3,字典大小50.K-means,FCM,SFCM和KFCM(采用高斯核,所用核參數(shù)σ=2)算法雖能分割出道路的大致區(qū)域,但道路區(qū)域不夠清晰、完整,同時(shí)也將非道路區(qū)域分割為道路;本文所提算法分割得到的道路區(qū)域清晰、完整,更為接近實(shí)際情況,而且基本消除了非道路區(qū)域及雜點(diǎn)的干擾.我們將噪聲加入到紅外圖像中進(jìn)行實(shí)驗(yàn),在圖3(a)中加入標(biāo)準(zhǔn)方差為20的高斯噪聲,如圖4(a)所示,K-means,FCM,KFCM,SFCM及本文算法中采用的類(lèi)別數(shù)J取為3,本文算法所采用圖像塊大小3×3,字典大小50.K-means,FCM分割算法包含大量雜點(diǎn),影響道路的判斷,而且道路區(qū)域也不夠完整;KFCM(采用高斯核,所用核參數(shù)σ=2)和SFCM分割算法可以較好地抑制部分野點(diǎn),但道路區(qū)域也不夠完整;本文所提算法分割得到的道路區(qū)域更為接近實(shí)際情況,而且基本消除了背景、雜點(diǎn)及噪聲的干擾,分割效果較為理想.

圖4 含噪圖像分割結(jié)果對(duì)比 (a)噪聲圖像;(b)K-means分割;(c)FCM分割;(d)KFCM分割;(e)SFCM分割;(f)本文算法

圖5 本文算法目標(biāo)函數(shù)收斂性曲線 (a)圖1;(b)圖2;(c)圖3;(d)圖4
從實(shí)驗(yàn)結(jié)果可以看出,和傳統(tǒng)的聚類(lèi)算法相比,考慮了圖像局部信息、像素之間的內(nèi)在相關(guān)性以及空間類(lèi)別屬性約束信息能有效地改進(jìn)紅外圖像分割結(jié)果,同類(lèi)區(qū)域內(nèi)部能呈現(xiàn)較好的一致性,對(duì)平滑完整的目標(biāo)分割效果較好,所提算法在噪聲環(huán)境下也具有更好的魯棒性.針對(duì)四組仿真實(shí)驗(yàn),我們補(bǔ)充了目標(biāo)函數(shù)的收斂性曲線,如圖5所示,可以看出本文算法經(jīng)過(guò)50次迭代都可滿足收斂要求.
本文提出了一種結(jié)合稀疏編碼和空間約束的紅外圖像聚類(lèi)分割新算法,擴(kuò)展了傳統(tǒng)的聚類(lèi)分割算法,考慮到像素之間的相關(guān)性,引入了空間類(lèi)別屬性約束信息,并給出了一種交替優(yōu)化算法,聯(lián)合學(xué)習(xí)字典、稀疏系數(shù)、聚類(lèi)中心和隸屬度,通過(guò)稀疏系數(shù)和隸屬度構(gòu)造像素歸屬度完成分割.本文所提算法充分利用了像素的內(nèi)在相關(guān)性、局部信息以及空間類(lèi)別屬性約束信息,實(shí)驗(yàn)結(jié)果也表明,本文方法能有效提高紅外圖像重要區(qū)域的分割效果,很大程度上降低了背景雜波對(duì)感興趣區(qū)域的分割干擾,適于復(fù)雜背景下紅外目標(biāo)的準(zhǔn)確分割.但是該算法也存在一些需要解決的問(wèn)題,如字典大小及約束性參數(shù)等采用的是經(jīng)驗(yàn)值,如何自動(dòng)選取這些參數(shù)有待進(jìn)一步的研究.同時(shí),為了更好地提高分割效果,將本文算法與結(jié)構(gòu)字典[20]及有監(jiān)督的判別性字典學(xué)習(xí)算法[21]相結(jié)合也是將來(lái)的研究方向.
[1]Wu Y Q,Zhang J K 2010 Acta Phys.Sin.59 5495(in Chinese)[吳一全,張金礦2010物理學(xué)報(bào)59 5495]
[2]Liang Y M,Zhai H C,Chang S J,Zhang S Y 2003 Acta Phys.Sin.52 11(in Chinese)[梁艷梅,翟宏琛,常勝江,張思遠(yuǎn)2003物理學(xué)報(bào)52 11]
[3]Song C X 2009 Microelectronics and Computer 26 60(in Chinese)[宋長(zhǎng)新2009微電子學(xué)與計(jì)算機(jī)26 60]
[4]Tang Y G,Di Q Y,Zhao L X 2009 Acta Phys.Sin.58 15(in Chinese)[唐英干,邸秋艷,趙立興2009物理學(xué)報(bào)58 15]
[5]Ren JJ,He M Y 2008 J.Infrared Millim.Waves 27 72(in Chinese)[任繼軍,何明一2008紅外與毫米波學(xué)報(bào)27 72]
[6]Fan J C,Han M,Wang J 2009 Pattern Recognition 42 2527
[7]Wu J,Li J,Liu J,Tian JW 2004 International Conference on Robotics and Biomimetics Shenyang China August 22–26,2004 p742
[8]Jia JH,Jiao L C 2010 J.Infrared Millim.Waves29 69(in Chinese)[賈建華,焦李成2010紅外與毫米波學(xué)報(bào)29 69]
[9]Chen S C,Zhang D Q 2004 IEEE Trans.Syst.Man Cybern.34 1907
[10]Zhao F,Jiao L C,Liu H Q 2011 Frontiers of Computer Science in China 1 45
[11]Yang J C,Yu K,Gong Y H,Huang T S 2009 IEEE Conference on Computer Vision and Pattern Recognition Miami,USA,June 20–25,2009 p1794
[12]Wright J,Ma Y,Mairal J,Spairo G,Huang T,Yan S 2010 Proc.IEEE 98 1031
[13]Zhuang L S,Gao H Y,Liu C,Yu N H 2011 Journal of Software 22(Suppl.2)89(in Chinese)[莊連生,高浩淵,劉超,俞能海2011軟件學(xué)報(bào)22(增2)89]
[14]Zhao J J,Tang Z Y,Yang J,Liu E Q,Zhou Y 2011 J.Infrared Millim.Waves 30 156(in Chinese)[趙佳佳,唐崢遠(yuǎn),楊杰,劉爾琦,周越2011紅外與毫米波學(xué)報(bào)30 156]
[15]Wang J J,Yang J C,Yu K,Lv F J,Huang T S,Gong Y H 2010 CVPR San Francisco,USA,June 13–18,2010 p3360
[16]Liu L Q,Wang L,Liu X W 2011 ICCV Barcelona,Spain,November 6–13,2011 p2486
[17]Gao S H,Tsang WH,Chia L T 2010 ECCV Crete,Greece,September 5–11,2010 p566
[18]Yuan L,Liu J,Ye J P 2011 NIPS Sierra,Nevada,December 16–17,2011 p232
[19]Lee H L,Battle A,Raina R,Andrew Y N 2007 NIPS Vancouver,B.C.,Canada,December 3–6,2007 p801
[20]Ramirez I,Sprechmann P,Sapiro G 2010 CVPR San Francisco,CA June 13–18,2010 p3501
[21]Dahl A L,Larsen R 2011 BMVC Dundee,UK,August 29–September 2,2011 p77.1