(中國民用航空飛行學院空中交通管理學院,四川 廣漢 618307)
圖像分割是將圖像劃分為若干個具有獨特性質區域的過程,在計算機視覺領域諸多分支中獲取了廣泛的應用[1]。在對遙感圖像的分析過程中,分割方法應該考慮數據采集方面的信息,諸如光譜和空間分辨能力等[2]。作為一種無監督學習算法,模糊C均值(fuzzy c-means,FCM)在圖像分割領域獲取了廣泛的成功,其通常比硬聚類算法更加靈活。盡管傳統的FCM因其完美的數學理論在諸多方面尤其是圖像分割領域得到了廣泛的應用[3-15],然而在圖像分割過程中該方法亦存在對初始聚類中心敏感以及對噪聲魯棒性不強等問題。
為了克服傳統FCM算法在圖像分割中噪聲魯棒性差的問題,許多學者利用圖像空間信息對FCM進行了改進,使得圖像分割性能大大提高[3-8]。考慮到傳統的FCM沒有結合分析圖像的形狀等先驗知識,Ahmed等通過引入鄰域信息提出了基于空間信息的FCM算法(Fuzzy clustering with spatial constraints, FCMS),克服了傳統方法對異常點敏感的局限性[3]。FCMS方法計算復雜度較高,尤其是處理尺寸較大時相當費時。鑒于FCMS方法運算復雜度高的問題,Chen和Zhang等[4]利用均值濾波和中值濾波對FCMS進行了優化,提出了FCM_S1和FCM_S2算法降低了計算復雜度。文獻[6]基于核函數,通過對FCM的各個模塊進行獨立賦值,提出了基于領域信息的核廣義模糊均值聚類算法(Kernel generalized fuzzy c-means clustering with spatial information, KGFCMS),提升了圖像分割性能。Yang等[10]通過引入單一數據點至隸屬度函數提出了一種新的目標函數,提高了圖像分割過程中抗噪聲能力。文獻[12]利用領域灰度異質結構和上下文信息提出了自適應約束的核模糊C均值(adaptively regularized kernel-based fuzzy-means clustering, ARKFCM)方法。未解決FCM方法魯棒性問題,Tao等[14]基于形態學重構和隸屬度函數濾波提出了快速魯棒模糊C均值方法(fast and robust fuzzy c-means clustering, FRFCM)方法,大大提高了圖像分割性能,FRFCM被證明為當前最優的圖像分割算法。
盡管基于FCM的系列優化算法在圖像分割領域中已經表現出了良好的性能,但是邊緣保持和去噪仍是待解決的問題。利用FCM對圖像分割的主要困難在于這類方法對噪聲非常敏感并且難以保持清晰的圖像邊緣[4,7-9]。濾波技術已廣泛用于計算機圖形、圖像和視覺等諸多領域。其中,導向濾波器[16]是用于邊緣保持平滑的一種優秀方法,該濾波器的優點在于邊緣保持平滑的計算復雜度不依賴于濾波器尺寸。導向濾波器可以有效地平滑區域噪聲,并產生視覺上令人滿意的邊緣輪廓。相對于雙邊濾波器,導向濾波器在邊緣附近能得到更好的輸出。因此,導向濾波器現已成為圖像處理、特征提取和目標識別等計算機視覺應用領域的重要技術。考慮到分割任務之一是抑制噪聲并強化重要結構特征,在圖像分割處理中本文通過結合空間信息將導向濾波引入到FCM的目標函數中來進行模糊聚類。如果導向濾波器可以有效地抑制梯度翻轉導致的偽像并產生良好的視覺邊緣輪廓,本文認為利用該濾波技術FCM在分割圖像時可以獲得更準確的圖像分割。同時,考慮到圖像分割的性能在一定程度上依賴于初始的聚類數目和聚類中心,本文利用均值漂移算法[17]選取合適的聚類數目作為參考。與當前主流方法KGFCMS、RFCM、ARKFCM和FRFCM對比,實驗結果證明了本文所提算法的有效性。
本文的其余部分安排如下。文中的第二部分描述了一些相關工作基礎。第三部分詳細介紹了本文所提的圖像分割算法。第四部分給出了該算法的實驗結果。最后一部分對本文進行了總結。

(1)
(2)
最小化目標函數:
(3)
可以獲得J的局部最小值。在上式中,m是大于1的實數,‖·‖代表歐幾里德范數。
FCM是一種自動對圖像數據進行聚類的方法,其本質上利用歐幾里德范數計算像素點與聚類中心的隸屬度,進而判別每個像素點屬于各個模式的程度。與引入模糊劃分相適應,FCM引入的模糊隸屬度介于0和1之間,所以其比硬聚類分析更加靈活地分析圖像的不確定性和復雜性。
FCM算法進行聚類時僅考慮了像素的特征向量而忽略了相鄰像元間具有空間關系,有鑒于此Ahmed等人[3]利用圖像空域信息約束作為懲罰函數FCM 算法進行了優化和改進,提出FCM_S方法以提高圖像分割性能。但FCM_S方法在每一次迭代過程中需要計算一次鄰域項,算法的時間復雜度較高。為解決FCM_S 算法復雜度高和精確性不足問題,Chen等人[4]在此基礎上通過引入鄰域均值和鄰域中值濾波代替鄰域項,提出了FCM_S1和FCM_S2算法,得到了廣泛的應用。本文采用基于鄰域均值的FCM_S1算法,其目標函數如下:
(4)
其中,α是控制圖像非局部均值濾波項的參數。以類似于傳統的FCM算法, 利用拉格朗日乘子法對公式(4)的目標函數J求極小值,可求得聚類中心和隸屬度更新公式:
(5)
(6)
盡管FCM_S1/2方法較好地融合了領域信息,相對于FCM以及FCM_S實現了在分割性能以及運算速度方面的提升,但該方法亦存在缺乏對圖像邊界的平滑約束、對抗圖像區域強背景噪聲以及對初始聚類中心敏感等問題。
導向濾波器[16]定義為局部線性濾波過程, 包括引導圖像I、輸入圖像p和輸出圖像q。導向濾波器的關鍵假設是q和I為局部線性關系:
qi=akIi+bk, ?i∈wk,
(7)
式中,i是像素的索引,wk為以像素k為中心半徑為r的窗口。為了確定線性系數(ak,bk),建立目標函數E(ak,bk)在窗口wk中最小化q和濾波器輸入p的差值:
(8)
其中:ε是控制平滑度的正則化參數。公式(8)的結果可以通過下面的線性回歸得到:
(9)
(10)
這里,μk和σk分別為窗口k中I的均值和方差。基于上述,導向濾波器的輸出結果為:
(11)

圖1為導向濾波的過程,對輸入圖像p和輸出圖像q建立圖中模型可提取圖像中諸如噪聲等非感興趣信息n。

圖1 導向濾波的過程[16]。
均值漂移算法[17]的關鍵思想是其自適應地尋找概率密度極大值的估計方法,不需要任何先驗知識。具體利用感興趣區內數據密度變化計算和搜尋中心點的漂移向量,通過迭代移動中心點直到到達密度最大處,進而得到感興趣區域內的數據的次數。對于給定d維空間Rd中的n個樣本點X={x1,x2,…,xn},基于高斯核的均值漂移向量形式為:
(12)
新漂移中心為:
(13)
均值漂移算法本質上即為在每次迭代的時候求解一個向量,使得圓心向數據集密度最大的方向移動進而與局部極值點重合,圖2對這一過程進行了描述。

圖2 均值漂移過程描述(圖片來源:http://www.cse.psu.edu/~rtc12/CSE598G/introMeanShift.pdf)。
以均值漂移算法選定的初始聚類中心作為參考,本文通過結合空間信息和導向濾波提出了基于均值漂移和空間信息的導向模糊C均值聚類方法(Guided fuzzy c-means clustering with spatial information, GFCM_MS),旨在消除噪聲和保持邊緣細節。基于FCM_S1方法,通過迭代更新聚類中心V=[vj]和隸屬函數U={uik}:
(14)
(15)
最小化GFCM_MS目標函數:
(16)

相對于其他FCM系列圖像分割算法,本文所提出的GFCM_MS具有如下優勢:
1)GFCM_MS的優良邊緣保持特性,通過實現圖像邊界的平滑約束得到了光滑的分割邊界,使得不連續的原本屬于同一類像素點聚連一起形成具有實際意義的子圖;
2)GFCM_MS對噪聲的魯棒性,劃分空間推廣到可能性劃分空間可實現強噪聲背景下圖像的理想分割效果(詳見實驗結果);
3)GFCM_MS利用均值漂移初始化了聚類中心,迭代次數少、計算復雜度小、收斂速度快,進而較好地降低了算法陷入局部最優的可能性。
本章提出的GFCM_MS算法的步驟如表1所示。

表1 GFCM_MS算法的步驟
為了對GFCM_MS算法的性能進行評估,本文考慮了RFCM[10]、KGFCMS[6]、ARKFCM[12]和FRFCM[14]方法,并建立了對比實驗,數據集包括1個合成圖像和3個真實圖像。本文使用分割精度(segmentation accuracy, SA)[8]作為評估指標,分割精度SA定義為所有分類正確像素點數目與所有像素點數目比值:
(17)
其中:c為聚類數目,Ai表示屬于第i類的像素的數目,Ci表示表示實際中屬于第i類的像素的數目。
在本節中,本文利用合成圖像對算法的圖像分割性能進行評估,該合成圖像包含4個模式。使用合成圖像來驗證分割方法性能的優點在于合成數據包括了圖像實際模式以及噪聲參數控制等的先驗信息。

圖3 加噪合成圖像(方差為0.01高斯噪聲)的分割結果比較

圖4 加噪合成圖像(方差為0.02高斯噪聲)的分割結果比較

圖5 加噪合成圖像(方差為0.05高斯噪聲)的分割結果比較
圖3~5分別顯示了各方法對加噪合成圖像(分別加入方差為0.01、0.02和0.05高斯噪聲)的分割結果。從圖中可以看到,RFCM、KGFCMS、ARKFCM和FRFCM對噪聲較為敏感,不同區域邊界模糊,錯分點較多。在GFCM_MS所實現的結果中,錯分點很少,區域邊界比較清晰,因此該算法對高斯噪聲具有魯棒性,得到了滿意的分割結果。表2給出了不同方法對加噪合成圖像分割所得到的分割精度SA。由表中的SA可以看出,FRFCM方法表現出較高的精度,但該方法隨著噪聲強度的增加其分割精度逐步下降。GFCM_MS對不同強度噪聲表現出很好的魯棒性,較大程度上抑制圖像中噪聲,分割精度始終保持>0.94。綜合圖3~5和表2,GFCM_MS分割性能明顯優于其他方法。

表2 不同方法對加噪合成圖像分割所得到的分割精度SA
圖6顯示了不同方法對遙感圖像(航空港)分割結果。由圖6可以看出,RFCM、ARKFCM和FRFCM對不同區域進行了一定的保持,但由于受噪聲影響這三個方法在聚類區域內部都或多或少地出現了孤立的噪聲點。而GFCM_MS方法對兩個區域進行了較好的保持,分割的區域均勻性良好而且區域之間的邊界清晰,沒有孤立的像素點。

圖6 遙感圖像(機場)的分割結果
不同方法對遙感圖像(橋梁)的分割結果如圖7所示。圖中的目標區域橋梁,屬于“細長”模式。從視覺角度,RFCM、KGFCMS、ARKFCM和FRFCM沒有很好地實現對圖像的分類,橋梁與水域部分產生了較大的混疊,錯分比較嚴重,對橋梁這種“細長”模式無法實現正確的聚類連接。由于GFCM_MS引入了導向濾波信息和空間信息,使得分割結果在保持大量圖像細節的同時獲得比較干凈的同質分割區域,橋梁和水域之間不存在其他方法所得到的錯分問題,獲得了令人滿意的分割結果。

圖7 遙感圖像(橋梁)的分割結果
圖8展現了不同方法對遙感圖像(河流)的分割結果。在該測試圖像中,RFCM、KGFCMS和ARKFCM方法對河流、陸地和冰川3個區域的分割中,存在大量的錯分。相對于RFCM、KGFCMS和ARKFCM,FRFCM方法給予了較好的劃分,不同區域邊界相對清晰。而本文所提出的GFCM_MS則保持了清晰的圖像邊緣以及更多的細節,圖像分割更加準確,盡管有若干孤立的像素,但其區域均勻性和邊界定位都令人滿意。

圖8 遙感圖像(河流)上的分割結果
圖9比較了不同方法對遙感圖像(航空器)的分割結果。RFCM、FRFCM和GFCM_MS在對該測試圖像的分割中獲取了較為清晰的邊界。相對于RFCM和FRFCM,GFCM_MS機翼和垂直翼之間的機身邊界定位更加準確。

圖9 遙感圖像(航空器)上的分割結果
圖像分割是計算機視覺領域的一個重要問題,模糊聚類因其特有的描述形式比其他傳統的分割算法更具優勢,因此得到了廣泛的應用。本文提出了一種有效的遙感圖像分割方法,該方法較好地結合了聚類分析和導向濾波技術對圖像分割的優勢:一方面,該方法較好地對聚類的圖像邊界進行了平滑約束,獲得了平滑和封閉的分割邊界;另一方面,該方法因其對噪聲的魯棒性,提高了強噪聲背景下圖像分割的準確度;最后,通過結合均值漂移所導出的初始聚類中心,降低了算法陷入局部最優的概率。基于導向濾波技術,本文所提出的方法通過結合均值漂移和空間信息,使得像素在組合的特征空間中得到更加準確的表達。實驗結果表明,本文所提出的方法提升了圖像結構被噪聲損壞的分割準確度,該算法所得到的測試結果在可接受范圍之內。本文的后續工作將圍繞復雜場景分類問題開展研究。