白 玉,姜東民,裴加軍,張 寧,白 郁
(1. 沈陽航空航天大學電子信息工程學院,遼寧 沈陽 110136; 2. 上海航天電子技術研究所,上海 201109)
高分辨率、全天候的合成孔徑雷達(synthetic aperture radar,SAR)能有效識別偽裝物和穿透掩蓋物,并且不受光照和氣候條件的限制,對海洋動目標識別起到了巨大的作用,目前已成為艦船檢測的一種重要的手段。由于SAR圖像的迅猛發展趨勢,在國內外均掀起了一陣研究熱潮。但是傳統的SAR圖像檢測方法存在很多的缺點。例如,基于統計的SAR圖像檢測算法根據不同性質圖像區域的統計特性差異進行分類[1-2],由于該方法忽略了圖像的空間特性,所以得不到好的檢測效果;基于空間域濾波的SAR圖像檢測算法雖然對噪聲有很強的抑制能力,但是不能保留SAR的邊緣信息,使邊緣變得模糊;基于一些微分算子等方法,利用一些區域來進行卷積求梯度邊緣。缺點是產生大量的噪聲,為后續特征提取產生了困難。并且由于SAR圖像的分辨率不高,傳統的算法只適合于SAR圖像中的一種圖像檢測。
深度學習中的卷積神經網絡(convolutional neural network,CNN)[3-4]將SAR圖像的一小部分(局部感受區域)作為層級結構的最低層的輸入,信息再依次傳輸到不同的層,每層通過一個數字濾波器去獲得觀測數據的最顯著的特征。這個方法能夠獲取對平移、縮放和旋轉不變的觀測數據的顯著特征,降低了網絡模型的復雜度,減少了權值的數量。使SAR圖像可以作為網絡的輸入,避免了傳統識別算法中復雜的特征提取和數據重建過程。同時CNN還適合HH/HV/VH/VV極化等多種SAR圖像以及不同分辨率的艦船檢測。由于SAR圖像噪聲強等特點,一般的卷積神經網絡在訓練時會產生學習緩慢,并且網絡中的傳統分類函數不能很好地解決非線性問題。本文采用改進的ELU激活函數的卷積神經網絡,在訓練樣本中引入距離函數,使樣本有不同的貢獻程度,用模糊支持向量機(fuzzy support vector machine,FSVM)分類函數對特征進行分類[5-6]。ELU和模糊支持向量機函數對SAR圖像中的噪聲等有一定的抑制作用,試驗結果表明,該方法對艦船檢測具有良好的效果。
如圖1所示由于雷達目標回波信號的衰落,使得SAR圖像存在大量的相干斑點噪聲,讓海陸邊緣變得更加模糊。為了提高模型的檢測能力,將SAR圖像利用幾何定位,實現海陸分離,將海陸分離后的SAR圖像輸入到改進的ELU卷積神經網絡中訓練,最后檢測SAR圖像中的艦船。

圖1 艦船檢測流程
由于SAR圖像中的海洋和陸地的灰度特征差別較小,導致使用傳統的圖像處理的方法進行海陸分離誤差較大。本文采用幾何定位的方法,根據GPS計算出SAR圖像陸地和海洋的經緯度。然后利用海岸線模板匹配方法,對SAR圖像進行快速的海陸分離。
將海陸分離后的SAR圖像輸入卷積神經網絡(CNN)中,如圖2所示,CNN主要由輸入層、卷積層、混合層、輸出層等組成。在CNN中,輸入層用于接收SAR圖像;卷積層用于提取圖像特征;混合層用于簡化從卷積層輸出的信息;輸出層將提取特征映射為最終所得到的標簽。CNN的四項基本原則為局部感受野、共享權值、混合及使用多個卷積層。CNN的本質是輸入到輸出的映射,在訓練過程時它能夠學習大量的輸入和輸出之間的映射關系。CNN的練模型普遍采用后向傳播(back propagation,BP),BP算法[7]來調節網絡的參數和權重。在BP算法當中引入了代價函數,目的是使樣本的實際輸出值與期望的目標值無限接近的同時還需要保證學習速率。反向傳播的核心就是一個對代價函數C關于任何權重w(或者偏置b)的偏導數?C/?w的表達式。偏導數越大,學習速率越快。當偏導數接近于0時,學習速率越緩慢。在本文中引進了二次代價函數,其公式為
(1)
式中,n是訓練樣本的總數;求和運算遍歷了每個樣本x;y=y(x)是對應的目標輸出;L表示網絡的層數;aL(x)是輸入為x時的網絡輸出的激活值向量。

圖2 SAR圖像特征提取模型
在CNN中,不同的激活函數含有不同的偏導數,因而不同的激活函數影響著SAR圖像樣本的訓練速率。
傳統的激活函數有sigmoid、tanh、RELU等激活函數。如圖3所示,在sigmoid和tanh激活函數中,當訓練的SAR圖像樣本逐漸多時,兩個激活函數的輸出差異變得越來越小,即偏導數接近于0,學習速率緩慢。由于SAR圖像的斑點噪聲過多,RELU激活函數在訓練過程中非常的不穩定,在多次訓練過程中,樣本的特征差異過大。
在本文基于SAR圖像獨有的特征,采用改進的ELU激活函數代替傳統卷積神經網絡的傳統激活函數,如圖3所示,它融合了sigmoid和RELU,具有左側軟飽性。其公式為
(2)
式中,wj為模型的權重;b為偏置。

圖3 激活函數對比
導數形式
(3)
將ELU激活函數的公式代入式(1)中,最后得出
z>0時
(4)
如式(4)所示,當輸入x一定時,實際輸出值與預期值誤差越大,?C/?wl和?C/?bl的值越偏離零,因此學習速率越快。當z<0時,公式中α為ELU的超參數。當輸入值為負值時,該超參數控制著激活函數的輸入幅度,使卷積層神經元的均值趨向于0,從而使得學習速率更快,更接近于自然梯度下降。在圖3右半軸中,ELU和RELU一樣,ELU函數坐標的曲線也為線性且導數為1,因此能減少梯度消失的影響。在左半軸中ELU曲線體現的是對SAR圖像斑點噪聲的魯棒性。
為了進一步抑制SAR圖像的斑點噪聲,在訓練的樣本中引入隸屬度,即該樣本屬于某類的可靠程度。首先建立訓練樣本的特征與其所在類中心距離函數為
(5)
式中,xi為樣本;x0為樣本所在類的中心。故樣本的隸屬度為
(6)
式中,β大于且接近于0,防止隸屬度為零。
由于SAR圖像中每一個訓練樣本分為兩類,正類和負類。在分類時,每一個訓練樣本做出的貢獻是等同的,SAR圖像的訓練樣本存在大量的噪聲,常用的分類器很難識別出噪聲點,因此當噪聲點被選為樣本中的信息時,分類器的效果會很差[8-9]。而模糊支持向量機(FSVM)在求解分類面時,采用模糊隸屬度的求解求出每個樣本點屬于不同類別的概率,使分類器具有更高的分類效果[10-11]。在模糊支持向量機(FSVM)算法中,對SAR圖像訓練樣本加入不同的隸屬度,使樣本有不同的訓練程度。隸屬度越小的樣本在訓練過程中,起到的作用越小。
本文中用于SAR圖像檢測的CNN模型包含了輸入層,3個卷積層,3個混合層,輸出層,1個模糊支持向量機分類器。首先本文截取圖像的中央區域采用28×28大小的圖像用作輸入,卷積層采用的卷積核大小為24×24,且C1中的卷積層的神經元個數為20個,特征圖的大小為24×24,S2混合層的大小為12×12,含有20個神經元。C3的卷積層神經元有100個,輸出的特征圖為1×1。權重和偏置隨機初始化,學習速率為γ=0.5。在Linux系統上使用Google的Tensorflow平臺,采用MSTAR數據庫進行訓練。圖4(a)—(c)為艦船檢測過程的結果。圖5為在其他條件下的檢測結果。

圖4 SAR圖像艦船檢測
為了驗證本文方法的有效性,設計SAR圖像艦船檢測的任務,本次試驗類比了5類SAR圖像艦船檢測的方法。表1為5種算法對于SAR圖像艦船檢測的效率。本文方法識別率優于傳統圖像檢測、SVM、字典學習等方法。在試驗中,在相同條件下利用相同結構但未經改進的CNN模型進行了檢測測試,得到的平均識別率為97.2%,說明本方法相較于改進前CNN模型也有一定提高。

圖5 不同條件檢測結果

方法檢測效率/(%)基于小波變換算法的檢測88.3CMN97.2SVM93.5字典學習94.5本文方法98.6
針對SAR圖像的特點,本文提出了基于ELU激活函數的卷積神經網絡圖像檢測方法。通過用ELU激活函數的特性,對SAR圖像的噪聲具有一定的魯棒性,同時與二次代價函數的結合來增加學習速率。在本文的卷積神經網絡中引入了模糊支持向量機(FSVM),在訓練樣本中增加了距離函數,利用隸屬度,使樣本有不同的訓練程度。該方法提高了傳統CNN對非線性分類的不足,同時運用FSVM對噪聲點的識別度來增強艦船檢測能力。利用大量的SAR圖像對該方法進行驗證。試驗結果顯示,本文所提的方法在5類圖像檢測試驗中,達到了98.6%的檢測效果。表明本文所用方法具有有效性,且在SAR圖像檢測上具有一定的能力。
[1] DEKKER R J.Texture Analysis and Classification of ERS SAR Images for Map Updating of Urban Areas in the Netherlands[J].IEEE Transactions on Geoscience and Remote Sensing,2003,41(9):1950-1958.
[2] MA Y,HE J,WU L,et al.An Effective Face Verification Algorithm to Fuse Complete Features in Convolution Neural Network[C]∥Multi Media Modeling.Cham:Springer International Puishing,2016:39-46.
[3] LECUN Y,BOTTOU L,BENGIO Y,et al.Gradient-based Learning Applied to Document Recognition[J].Proceedings of the IEEE,1998,86(11):2278-2324.
[4] 尹寶才,王文通,王立春.深度學習研究綜述[J].北京工業大學學報,2015,41(1):48-59.
[5] CHU W,ONG C J,KEERTHY S S.An Improved Conjugate Gradient Method Scheme to the Solution of Least Squares SVM[J].IEEE Transactions on Neural Networks,2005,16(2):498-501.
[6] KEERTHI S S,SHEVADE S K.SMO for Least Squares SVM Formulations[J].Neural Computation,2003,15(2):487-507.
[7] RUMELHART D E,HINTO G E,WILLIAMS R J,et al.Learning Representations by Back-propagating Errors[J].Nature,1986,323(6088):533-536.
[8] CORTES C,VAPNIK V.Support Vector Network[J].Machine Learning,1995,20(3):273-297.
[9] KAPLAN L M.Analysis of Multiplicative Speckle Models for Template-based SAR AT[J].IEEE Transactions on Aerospace and Electronic Systems 2001,37(4):1424-1432.
[10] WESTON J,RATLE F,MOBAHI H,et al.Deep Learning via Semi-supervised Embedding[C]∥International Conference on Machine Learning.[S.l.]:ACM,2012:1168-1175.
[11] GLOROT X,BENGIO Y.Understanding the Difficulty of Training Deep Feed Forward Neural Networks[J].Journal of Machine Learning Research,2010(9):249-256.
[12] WU Tao,CHEN Xi,RUANG Xiangwei,et al.Study on SAR Target Recognition Based on Support Vector Machine[C]∥2009 2nd Asian-Pacific Conference Synthetic Aperture Radar.[S.l.]:IEEE,2009:856-859.
[13] 王璐,張帆,李偉,等.基于 Gabor 濾波器和局部紋理特征提取的 SAR目標識別算法[J].雷達學報,2015,4(6):658-665.
[14] BENGIO Y.Practical Recommendations for Gradient-Based Training of Deep Architectures[J].Lecture Notes in Computer Science,2012,7700(1-3):437-478.
[15] 齊會嬌,王英華,丁軍,等.基于多信息字典學習及稀疏表示的SAR目標識別 [J].系統工程與電子技術,2015,37(6):1280-1287.
[16] DING J,LIU H W,WANG Y H.SAR Image Target Recognition Based on Non-negative Sparse Representation[J].Journal of Electronics & Information Technology,2014,36(9):2194-2200.
[17] TISON C,NICOLAS J M,TUPIN F,et al.A New Statistical Model for Markovian Classification of Urban Areas in high Resolution SAR Images [J].IEEE Trans Geo science and Remote Sensing 2004,42(10):2046-2057.