孫志軍*① 薛 磊①② 許陽明①② 孫志勇①②
?
基于多層編碼器的SAR目標及陰影聯合特征提取算法
孫志軍薛 磊許陽明孫志勇
(電子工程學院 合肥 230037)(安徽省電子制約技術重點實驗室 合肥 230037)
針對合成孔徑雷達(SAR)圖像目標識別問題,提出一種基于多層自動編碼器的特征提取算法。該方法利用隨機神經網絡受限波爾茲曼機學習建模環境概率分布的能力,通過組建更具函數表達能力的多層神經網絡,提取描述目標及其陰影輪廓形狀的綜合特征。利用兩種分類模型實現目標自動識別。基于MSTAR數據的仿真實驗結果驗證了算法的有效性。
SAR;特征提取;多層自動編碼器;陰影
綜合目標圖像及其陰影信息的識別問題已成為合成孔徑雷達(Synthetic Aperture Radar, SAR)自動目標識別(Automatic Target Recognition, ATR)領域的研究熱點。文獻[1]利用目標及陰影輪廓特征通過串聯方式對目標進行識別。文獻[2]和文獻[3]研究了多視角SAR陰影的目標識別。文獻[4]引入高分辨距離像及陰影信息進行目標識別。
目前,多數研究均將目標及其陰影視作獨立特征進行處理。然而,這兩類數據均含目標類別的特征信息,并在識別率意義上存在相互作用。提取兩類數據的聯合特征將更有助于分類任務。SAR陰影形成機理使陰影輪廓反映目標空間結構特性,這使得基于綜合目標及陰影輪廓特征的SAR ATR成為可能。本文引入聲學識別領域中一種可獲取多模表示的多層自動編碼器,采用聯合編碼的方式提取反映目標及陰影輪廓信息的綜合特征,引入協同神經網絡在特征空間對目標進行識別。基于受限波爾茲曼機(Restricted Boltzman Machine)的多層神經網絡是深度學習框架下較為成功的特征提取模型。利用其生成性的訓練可以獲取輸入數據集的本質特征。協同神經網絡在數學意義上嚴格控制網絡演化,避免了其它神經網絡訓練的隨意性。此外,兩類模型均為基于神經網絡,更加便于算法的實現。
本文內容安排如下:第2節主要對本文所采用的深度編碼模型進行說明;在此特征提取基礎上,第3節介紹了基于協同神經網絡的分類模型;第4節給出了實驗細節、結果及分析;最后是本文的結論部分。
人們在聆聽話音時,若可同時觀察到發音口型,即使音量微弱也可辨別出講話的內容。人腦這種對聯合特征的提取更適合于分類任務。基于這種思想,多層自動編碼器已被成功應用于可視環境下的魯棒語音特征提取問題。本文基于此類多層自動編碼器,對SAR圖像中目標和陰影輪廓兩類數據進行編碼。旨在獲取一種綜合目標及陰影輪廓的特征提取算法。
深度學習算法通過訓練多層非線性網絡結構,表征輸入數據概率分布,展現了學習數據本質特征的能力。自2006年Hinton等人在Science發表利用深層神經網絡進行數據降維的論文后,深度學習的研究引起機器學習領域廣泛關注。多層自動編碼器就是深度學習研究領域典型模型之一。
多層編碼模型如圖1所示,編碼部分將預處理數據映射到共模特征層;解碼部分利用共模特征對輸入樣本重建。考慮到目標數據是實數據,而陰影輪廓是整形數據。目標編碼和解碼部分采用稀疏高斯-伯努利RBM模型;其它互聯模型均采用稀疏伯努利-伯努利RBM模型。

圖1 共模深度編碼模型
多層自動編碼器的訓練分3個步驟:子模型預訓練,多層模型組建,模型修正。
2.1 子模型預訓練
我們的多層編碼模型由多組RBM組成,首先分別利用目標及陰影數據訓練稀疏RBM模型。然后利用各自隱層輸出作為新一級模型的輸入數據,訓練隱層之間的稀疏RBM模型。
RBM是一種典型神經網絡,如圖2所示。為使獲取特征具備一定的稀疏性,利用如式(1)所示的正則化因子對隱單元進行約束。

圖2 RBM模型

在一個RBM中,模型聯合概率分布可用能量函數來表示:

(3)
伯努利(顯)-伯努利(隱)RBM能量函數定義為

(4)

(6)
對應的條件概率可寫成式(7)所示:



2.2多層模型組建
預訓練結束后,對各模型進行松綁,即將圖2所示的子模型按圖3所示進行拆解。構成僅有一個隱層的編解碼模型,其中,下層對應編碼模型,上層對應解碼模型。然后組建成如圖1所示的多層編碼器。
2.3模型修正
模型組建完成后,需要對網絡權值進行修正。本文采用文獻[13]提出的邊際Fisher準則進行修正,如式(9)所示。自動編碼器包括參數

圖3 RBM編解碼模型


由于深度學習網絡具有靈活的函數表征能力,往往造成過擬合訓練。算法的泛化性急劇下降,為此需在目標函數中進一步采用正則化手段。
提取特征應遵循數據分布的內在結構,通常獲取數據本質分布結構的方法是最小化重建誤差。由于自動編碼網絡的解碼部分自然形成了重建函數,因此非監督數據決定的正則化定義為

因此優化的目標函數變成式(11)所示:

(12)

(13)
同理,

(14)

按式(11)所示的目標函數以及式(15)所示的梯度函數,采用共軛梯度法獲取最小化目標對應的解。
在特征提取的基礎上,引入協同神經網絡(Synergetic Neural Network, SNN)對雷達目標進行分類。對待識別模式(初始輸入向量)可以構造一個動力學過程,使經過識別模式(中間狀態)進入到諸原型模式中的一個原型模式。網絡模型類似如圖4所示3層前饋型神經網絡,中間序參量按動力學方程進行演化。
圖4 協同神經網絡結構
Fig. 4 Structure of synergetic neural network

(17)
并且序參量的動力學方程:

協同神經網絡的識別步驟如圖5所示,其中原型向量和輸入模式特征向量均為訓練樣本及測試樣本在特征提取后的特征向量,伴隨向量以及各模式的序參量可由式(16)、式(17)獲取,動力學演化方程如式(18)所示。
4.1實驗數據
利用美國DARPA/AFRL MSTAR工作組提供的實測SAR地面靜止目標數據對算法進行仿真實驗,該數據集中目標圖像大小為128×128,分辨率為0.3 m×0.3 m。每類目標樣本均包含間隔1°的樣本數據。本實驗中所采用的訓練樣本如表1所示,為測試在不同樣本集規模情況下算法的性能,給出了不同實驗帶標簽訓練樣本規模。表2給出了測試數據的樣本集描述。

圖5 協同模式識別過程
4.2 預處理
本文在分析現有SAR圖像處理領域的分割技術基礎上,在算法復雜度及分割精度上折中采用如下的預處理分割算法。首先利用冪變換將噪聲分布由近似瑞利分布轉換為近似高斯分布。采用維納濾波方法對圖像相干斑噪聲進行去噪。根據圖像的統計均值及方差對目標圖像的前景、背景及陰影進行標記。通過中值濾波方法對圖像進行平滑。利用sobel算子進行陰影邊界提取。并實現對目標區域的分割。圖像預處理結果如圖6所示。
表1訓練數據集數量

Tab. 1 Training dataset description
表2測試數據集數量

Tab. 2 Test dataset description

圖6 SAR目標切片及其陰影輪廓
4.3仿真設定
為進一步降低訓練圖像大小,對圖像進行剪切。其中陰影圖像切割的像素范圍是(4089)×(2069);目標圖像切割的像素范圍是(4089)×(4089)。
RBM的步驟訓練按2.1節所述進行,訓練迭代次數epoch=2000;陰影輪廓和目標圖像的稀疏度分別為;本實驗中稀疏度按照不同的訓練集規模在以上范圍取值。在建模陰影區域時采用伯努利-伯努利RBM,在對目標進行建模時采用高斯-伯努利RBM;兩模型尺寸均為2500×1000,第2層RBM訓練的稀疏度取值范圍,模型訓練尺寸為2000×1000。
預訓練完成后按圖3所示的共模學習模型進行組建。監督式訓練的回合數為200次。
4.4實驗結果
(1) 輸入樣本對比實驗結果
實驗分別采用整幅(未分割)圖像,目標圖像(已分割),和目標及陰影輪廓作為輸入,在相同的學習模型及修正準則下,利用NC(Nearest Center) 分類器和SNN對目標進行分類。圖7給出了一次判決的識別演化過程曲線。仿真結果如表3所示,其中括號內為所采用的分類器。

圖7 序參量識別演化曲線
表3不同輸入數據時算法的識別率對比(%)

Tab. 3 Rate comparison of different input data(%)
(2) 特征提取對比實驗結果
作為對比,本文給出同類特征提取算法的識別結果。文獻[15]提出PCA及KPCA特征分析算法,提取主分量特征及基于核變換后的主分量信息。文獻[16]提出最大異類距離特征提取算法,同時也給出了基于KLDA特征提取算法的識別結果。本文對不同算法的識別性能進行對比。不同特征提取算法的識別性能對比結果如表4所示。
(3) 與其他淺層結構模型對比實驗結果
如表5中所示,文獻[1]分別利用傅里葉描述子描述目標輪廓和陰影輪廓數據,并用最大相關法進行模板匹配后采用串接準則融合識別。文獻[17]利用SVM識別模型直接在原始圖像樣本上進行分類。文獻[18]引入HMM模型對SAR目標進行識別。
表4不同特征提取算法識別性能對比(%)

Tab. 4 Performance comparison of different feature extraction algorithm (%)

Tab. 5 Recognition performance comparison of different classification (%)
4.5實驗結果分析
為考察輸入數據對分類性能的影響,利用如表3中所述的輸入數據,采用邊際深度Fisher模型進行特征提取。分類器分別采用NC和SNN。通過表4給出的對比實驗結果可以看出,在輸入整幅圖像時,由于圖像中尚存相干斑等噪聲,影響了識別精度。在對圖像進行分割后,采用純凈的目標單獨作為識別器輸入,分類性能明顯提高。繼而引入陰影信息按本文所述的多層編碼器進行編碼,并利用聯合特征進行識別,結果表明提取特征具有一定的魯棒性。最后比較了協同神經網絡的識別結果,由于引入了更多的訓練樣本信息,進一步提升了識別精度。
從表4所示的識別結果可以看出,KLDA與KPCA的識別率相差不大。在大樣本集情況下基于最大異類距離的算法具有較好的效果,但當樣本集不匹配時性能下降很快。由于基于最大異類距離算法僅考慮不同類間訓練樣本,對同類樣本未考慮,在訓練樣本數較多情況下,可以實現正確分類,但當樣本數減少時,對于待測樣本找不到其鄰近的同類樣本匹配。所以在樣本數較小時出現誤判。同時由于本文算法同時考慮了同類樣本及異類樣本,識別性能在樣本數下降時仍保持很高的識別率。
表5給出了淺層結構分類模型的識別結果。由于本文利用多層自動編碼器獲取目標及陰影的聯合特征,而同類型的淺層算法或不提取特征,或直接“鏈接”特征并在此基礎上采用其他分類模型進行分類。難以提取魯棒的特征表示。結果驗證了本文算法的有效性。
本文探討了結合SAR圖像及陰影信息特征提取的算法性能。采用多層自動編碼器對聯合特征進行提取,并引入邊際Fisher準則及多種正則化手段對網絡權值進行修正,利用兩種分類模型對MSTAR數據進行分類。結果驗證了本文算法在識別性能上具有一定的優越性。同時本文算法優勢源于非監督的預訓練過程,并適用于半監督學習應用場合。更大規模的數據集獲取更好的性能。本文仿真實驗采用標準的公開數據庫進行,如何合理增加數據集規模,縮小仿真數據與真實數據的差異是進一步深入研究的問題。
[1] 尹奎英, 金林, 李成, 等. 融合目標輪廓和陰影輪廓的SAR圖像目標識別[J]. 空軍工程大學學報(自然科學版), 2011, 12(1): 24-28.
Yin Kui-ying, Jin Lin, Li Cheng,.. An SAR ATR based on fusion of target contour and shadow contour[J].(), 2011, 12(1): 24-28.
[2] Yang Lujing, Hao Wei, and Wang Deshi. SAR image recognition based on multi-aspect of shadow information[J].&, 2009, 26(4): 320-326.
[3] Scott Papson and Ram M Narayanan. Classification via the shadow region in SAR imagery[J]., 2012, 48(2): 969-979.
[4] Cui Jingjing, Jon Gudnason, and Mike Brookes. Radar shadow and superresolution features for automatic recognition of MSTAR targets[C]. IEEE International Radar Conference, Arlington, VA, USA, 2005: 534-539.
[5] Jakulin A. Machine Learning Based on Attribute Inter- actions[D]. [Ph.D. dissertation], The University of Jubljana, 2005.
[6] Jiquan Ngiam, Aditya Khosla, Mingyu Kim,.. Multimodal deep learning[C]. Proceedings of the 29th International Conference on Machine Learning (ICML), University of Edinburgh, Scotland, 2012: 1-9.
[7] HintonGE and SalakhutdinovRR. Reducing the dimensionality of data with neural networks[J]., 2006, 313(5786): 504-507.
[8] Hinton G E, Osindero S, and Teh Y W. A fast learning algorithm for deep belief nets[J]., 2006, 18(7): 1527-1554.
[9] 孫志軍, 薛磊, 許陽明, 等. 深度學習研究綜述[J]. 計算機應用研究, 2012, 29(8): 2806-2810.
Sun Zhi-jun, Xue Lei, Xu Yang-ming,.. Overview of deep learning[J]., 2012, 29(8): 2806-2810.
[10] VincentP,Larochelle H, Lajoie I,.. Stacked denoising autoencoders: learning useful representations in a deep network with a local denoising criterion[J]., 2010, 11(2010): 3371-3408.
[11] HintonG E. UTML-TR 2010-003 Apractical guide to trainingrestricted boltzmann machines[R]. University of Toronto: Toronto, HintonG E, August 2010.
[12] Honglak Lee, Chaitanya Ekanadham, and Andrew Y Ng. Sparse deep belief net model for visual area V2[J]., 2008: 873-880.
[13] YanS C, Xu D, Zhang B Y,.. Graph embedding and extensions: a general framework fordimensionality reduction[J]., 2007, 29(1): 40-51.
[14] 緱水平, 焦李成, 田小林. 基于免疫克隆聚類協同神經網絡的圖像識別[J]. 電子與信息學報, 2008, 30(2): 263-266.
Gou Shui-ping, Jiao Li-cheng, and Tian Xiao-lin. Image recognition using synergetic neural networks based on immune clonal clustering[J].&, 2008, 30(2): 263-266.
[15] 韓萍, 吳仁彪, 王兆華, 等. 基于KPCA 準則的SAR 目標特征提取與識別[J]. 電子與信息學報, 2003, 25(10): 1297-1301.
Han Ping, Wu Ren-biao, Wang Zhao-hua,.. SAR Automatic target recognition based on KPCA criterion[J].&, 2003, 25(10): 1297-1301.
[16] 王兵, 黃鈺林, 楊建宇, 等. 基于最大異類距離特征提取的SAR目標識別方法[J]. 中國科學技術科學, 2011, 41(10): 1388-1392.
Wang Bing, Hang Yu-lin, Yang Jian-yu,.. A feature extraction method for SAR automatic target recognition based on maximum interclass distance[J]., 2011, 41(10): 1388-1392.
[17] Zhao Q and Principe J C. Support vector machines for SAR automatic target recognition[J]., 2001, 37(2): 643-654.
[18] Kottke D P, Fiore P D, Brown K L,.. Design for HMM based SAR ATR[C]. Proceedings of SPIE, Orlando, FL, 1998, 3370: 541-551. DOI: 10.1117/12.321857.
Shared Representation of SAR Target and Shadow Based on Multilayer Auto-encoder
Sun Zhi-junXue LeiXu Yang-mingSun Zhi-yong
(Electronic Engineering Institute, Hefei 230037, China)(Anhui Province Key Laboratory of Electronic Restriction, Hefei 230037, China)
Automatic Target Recognition (ATR) of Synthetic Aperture Radar (SAR) images is investigated. A SAR feature extraction algorithm based on a multilayer auto-encoder is proposed. The method makes use of a probabilistic neural network and Restricted Boltzmann Machine (RBM) modeling probability distribution of the environment. Through the formation of a more expressive multilayer neural network, the deep learning model learns the shared representation of the target and its shadow outline reflecting the target shape characteristics. Targets are classified automatically through two recognition models. The experiment results based on the MSTAR verify the effectiveness of the proposed algorithm.
SAR; Feature extraction; Multilayer auto-encoder; Shadow
TN957
A
2095-283X(2013)02-0195-08
10.3724/SP.J.1300.2013.20085
孫志軍(1985-),男,吉林磐石;電子工程學院通信與信息系統專業博士生,研究方向為模式識別與圖像處理。

薛 磊(1963-),男,安徽霍邱;電子工程學院教授,博士生導師,研究方向為通信系統與通信信號處理。
許陽明(1964-),男,安徽舒城;電子工程學院副教授,研究方向為通信信號處理與信息融合等。
孫志勇(1974-),男,湖北黃岡;博士生,電子工程學院講師,研究方向為雷達信號處理。
2012-11-20收到,2013-03-04改回;2013-03-11網絡優先出版
國家部委基金資助課題
孫志軍 robotman@126.com