馬 智 田 斌
(西安電子工程研究所 西安 710100)
合成孔徑雷達(Synthetic Aperture Radar, SAR)由于其特殊的成像機制,SAR圖像總是伴隨著相干斑噪聲,這種噪聲大大降低了SAR圖像的質量,對后續的圖像分割、目標檢測、目標識別等任務[1]帶來了嚴峻的挑戰。所以,如何抑制相干斑噪聲是SAR圖像處理中最重要的一步,值得下功夫去研究。
傳統的SAR圖像去噪方法分為兩類[2],一類是空間域濾波,它的代表方法有Lee濾波、均值濾波、Frost濾波等;另一類是變換域濾波,它的的代表方法是基于小波變換的閾值濾波方法。第一類方法采用局部處理的思想,雖然能去噪,但是不能很好地保留圖像的邊緣和細節。科研人員為了解決這個問題又提出了非局部均值(NLM)[3]算法,NLM算法在去除相干斑噪聲的同時也很好地保留了圖像的細節,但其效率很低,不容易推廣。SAR-BM3D算法[4]結合了兩類方法的優點,是目前最好的去噪方法之一,但其效率也較低,很難大規模的應用。
本文在卷積神經網絡的基礎上,提出了一種新的SAR圖像去噪方法。把帶噪SAR圖像輸入到本文設計的網絡中,利用網絡的卷積層讀取SAR圖像的深層特征,接著池化層進一步處理以使深層特征降維,再通過反卷積層得到與輸入圖像尺寸大小一樣的結果,并將其與原無噪圖像對比,以兩者的誤差作為神經網絡優化器的輸入,驅動網絡更新各層參數使誤差函數最小。為了縮短網絡訓練收斂的時間,引入ReLU激活函數和批歸一化處理,經過少次訓練后,網絡輸出的結果就能接近原始SAR圖像。實測數據試驗結果表明,與傳統SAR-BM3D和SAR-NL去噪方法相比,新方法去噪能力更強,圖像視覺效果更好。
卷積神經網絡是仿生人腦神經系統局部感知特性和權值共享特性得到的人工神經網絡結構。卷積神經網絡中低層的神經元把感知的局部信息在高層融合獲得全局信息。這兩個特性使得網絡的訓練參數減少,網絡的訓練速度得到提升。
一個典型的卷積神經網絡LeNet-5如圖1所示,該網絡一共7層,其中卷積層和池化層各2層,全連接層3層。本文所提方法重點應用卷積層和池化層,除此之外,還在網絡中加入了反卷積層用于圖像重建。下面分別對卷積層、池化層和反卷積層進行介紹,并對卷積神經網絡的訓練過程進行說明。

圖1 LeNet-5卷積神經網絡
卷積可以看作是輸入和卷積核之間的一種數學運算。通常把卷積運算得到的輸出稱為特征映射,每個卷積核可獲得一個特征映射,一個二維卷積運算示例如圖2所示。

圖2 二維卷積運算過程示意圖
由圖2可以看出,卷積操作將周圍幾個像素的取值經過計算得到一個像素值,具有很強的特征提取和表示能力。
池化操作對卷積后得到的特征進行進一步降維處理,池化會把一定大小區域內的像素值用一個元素替代。平均值池化使用區域內像素的平均值替代,最大值池化使用區域內像素的最大值替代,這兩種池化方式如圖3所示。

圖3 最大值池化和平均值池化
反卷積的主要作用是將特征圖放大恢復到原來的尺寸,其與原有的卷積操作在計算方法上并沒有差別,而主要區別是在于:反卷積是卷積的反向過程,轉置卷積可以保證在尺寸上做到卷積的反向過程,但是在內容上并不能保證完全做到卷積的反向過程,二維反卷積的工作示意圖如圖4所示。
整個訓練過程分為兩個階段,分別闡述。
1.4.1 前向傳播
1)從訓練集中隨機抽取一個樣本輸入到網絡中;
2)網絡計算得到該樣本的輸出。

圖4 反卷積示意圖
1.4.2 反向傳播
1)比較網絡輸出和真實值之間的偏差;
2)通過反向梯度下降算法調整網絡各層參數。
基于卷積神經網絡的SAR圖像去噪方法的基本工作原理是:第一步,將帶噪SAR圖像輸入神經網絡;第二步,利用卷積層獲取帶噪SAR圖像的深層特征信息;第三步,利用池化層對獲取得到的深層特征信息進行降維處理;第四步,利用ReLU激活函數和批歸一化處理加速網絡訓練過程,其中ReLU函數用于解決梯度消失,批歸一化處理用于緩解梯度彌散問題;第五步,通過反卷積層得到與輸入尺寸大小一樣的結果;第六步,將第五步產生的處理結果與原始無噪圖像對比,利用產生的誤差驅動網絡優化器朝著使誤差函數最小的方向更新各網絡參數;第七步,循環上述操作,直至SAR圖像殘差滿足約束條件。本文設計的網絡結構如下圖所示,其中包括卷積層、激活函數層、批歸一化層、池化層和反卷積層,下面對每層具體實現過程進行詳細介紹。

圖5 本文方法的網絡結構圖
1)卷積層
網絡中卷積層的卷積核大小為3×3,第一至三層的卷積層輸出通道為64,第四至五層卷積層的輸出通道為128,第六層卷積層的輸出通道為256。
2)池化層
網絡中的池化層都使用最大值池化,池化核的大小為2×2,步長為2。
3)反卷積層
網絡中的反卷積層采用3×3的卷積核,輸出通道數與卷積層輸出通道數恰好相反。
4)激活函數層
在沒有激活函數情況下,卷積層僅包含一個線性運算——內積。這樣卷積層就只能學習輸入數據的線性變換,這種學習非常有限,無法利用多個卷積層的優勢,因為多個線性層疊加并不會拓展特征空間,它實質上仍是線性運算。為了充分利用多層表示的優勢,可添加非線性或激活函數使網絡得到更豐富的特征空間。常用的激活函數有S(Sigmoid)型函數、雙曲正切(Tanh)函數、線性修正單元(Relu)函數等。具體公式和函數圖像如公式(1)至公式(3)及圖6所示。
(1)
(2)
ReLU(x)=max(0,x)
(3)
如圖6所示,ReLU激活函數只保留大于0的輸出,其余輸出全設置為0。因其函數關系簡單,計算速度很快,所以本文設計的網絡大都使用ReLU激活函數,只在最后一層使用Sigmoid激活函數。

圖6 常用激活函數圖像
5)批歸一化層
梯度在網絡反向傳播的過程中可能存在爆炸或者消失的問題,導致網絡不能收斂。引入批歸一化層就是為了解決這個問題。
網絡從k-1層傳到k層稱為前向傳播,公式為
(4)
其中,hk表示第k層的節點;hk-1表示第k-1層的節點;ωk表示第k層的權重。
網絡從k層傳到k-1層稱為反向傳播,公式為
(5)
其中,Δk為網絡反向傳播中第k層的偏差值。
當網絡從k層反向傳播到m(m (6) 批歸一化的處理過程如下,假設在某層中每批的訓練輸入數據為x1,x2,…xm,則有 (7) (8) (9) (10) 前兩步計算輸入數據的均值和方差,第三步做歸一化處理,其中ε是一個很小的正數,為了防止方差趨于0,導致結果溢出。經過處理后大部分數據會分布在激活函數的線性段,而非線性變換在神經網絡中非常重要,為了平衡非線性變換和梯度,第四步引入兩個參數對輸出數據進行調整。γ起到尺度變換的作用,β起到平移變換的作用,這兩個參數是網絡在訓練的過程中自動學習得到的。 6)網絡訓練及網絡去SAR噪聲過程 本文設計的網絡使用均方誤差作為損失函數,公式為 (11) 其中,N為每一批數據的數量,y0為網絡的實際輸出,y為原始無噪圖像。 網絡的訓練過程如下圖所示,通常來說SAR圖像為單通道圖像,相干斑噪聲服從瑞利分布,訓練時在原始SAR圖像中添加乘性噪聲作為訓練集訓練網絡。 將帶噪SAR圖像輸入到卷積神經網絡中,經過網絡的計算,輸出網絡映射后的圖像,把它和原始SAR圖像做對比,產生的誤差通過損失函數驅動網絡的優化器更新每層的參數。重復以上步驟,直至網絡的輸出與原始SAR圖像的誤差達到最小,網絡訓練結束。將訓練好的網絡作用到測試集上,網絡輸出即為去噪圖像。 圖7 基于卷積神經網絡的SAR圖像去噪流程圖 本節,采用本文所提方法對實測SAR圖像數據進行相干斑噪聲抑制處理。網絡訓練過程中損失函數值與訓練次數的關系如圖8、圖9所示,由圖8、圖9可以看出,在訓練3次后,損失值已達到了0.001左右,網絡收斂速度快,效果明顯。 圖8 訓練損失值與訓練次數關系圖 另外,為了對比抑制效果,還采用經典SAR-NL方法[5]和SAR-BM3D方法[6]對圖像進行處理,三種方法處理結果如圖10所示,其中,圖10(a)為原始SAR圖像;圖10(b)為SAR-BM3D方法去噪后的圖像;圖10(c)為SAR-NL方法去噪后的圖像;圖10(d)為本文方法去噪后的圖像。 圖9 驗證損失值與訓練次數關系圖 從圖10中可以看出,三種方法在不同程度上都能實現SAR圖像中相干斑噪聲的抑制,提高SAR圖像的質量。然而,從處理效果上來看,與兩種經典的SAR圖像去噪方法相比,本文所提方法去噪效果更好,SAR圖像質量提升度更高。容易看出,經本文方法去噪后的SAR圖像,建筑物邊緣的紋理結構和局部位置的輪廓更加清晰,更能如實地反應實際場景分布情況。 圖10 不同去噪方法對比結果圖 本文提出了一種基于卷積神經網絡的SAR圖像去噪方法。新方法在傳統卷積網絡中引入ReLU激活函數層和批歸一化層,加快了網絡的訓練速度,提高了去噪后SAR圖像的質量。實測數據處理結果表明:新方法除能夠有效抑制SAR圖像中相干斑噪聲外,同時還能較好保留圖像的紋理和細節信息。

3 實測數據試驗結果



4 結束語