交叉驗證的GRNN神經網絡雷達目標識別方法研究

2018-08-22 09:13:58林悅夏厚培

現代防御技術 2018年4期

關鍵詞：模型

林悅，夏厚培

(1.南京信息工程大學電子與信息工程學院，江蘇南京 210044；2.中國船舶重工集團公司第七二四研究所，江蘇南京 211106)

0 引言

在雷達自動目標識別(automatic target recognition, ATR)技術中，對雷達目標高分辨距離像(high-eesolution range profile, HRRP)的研究最為廣泛[1]。HRRP主要依托于寬帶高分辨雷達獲取目標多個散射中心點子回波在雷達徑向方向上投影分布的矢量和[2]。目標的回波為與目標散射點分布相關的一維距離像，反映了在特定的雷達視角方向目標散射體雷達散射截面積(radar cross section, RCS)沿雷達視線方向散射點相對幾何關系的分布情況[3]。

人工神經網絡(artificial neural network, ANN)由于具有自適應能力，在識別領域中作為一種性能優良的分類器已被廣泛應用[4]。廣義回歸神經網絡(generalized regression neural network, GRNN)作為徑向基函數神經網絡(radial basis function, RBF)的一個重要分支，是一種基于非線性回歸理論的典型前饋式局部逼近神經網絡，通過激活神經元來逼近目標函數。GRNN具有良好的局部逼近性、全局最優性和較快的計算速度等優點。此外，網絡中需要根據樣本調整的參數只有一個光滑因子spread，因此能夠避免人為因素對網絡預測性能的影響[5]。

本文充分利用了GRNN局部逼近性能以及運算迅速的特點，將其作為分類器應用于雷達目標識別。此外，針對網絡中需要人為調節的參數spread因子，本文利用交叉驗證方法(cross-validation)改進了GRNN神經網絡[6]，在選取最優的網絡結構的同時，利用循環判別法篩選出適用于樣本參數的光滑因子spread最優值，以達到對目標的最優識別效果。

1 目標距離像的數據預處理

在雷達自動目標識別中，對輸入分類器的距離像樣本數據的預處理至關重要。本文的預處理流程首先對原始距離像數據進行分角域建立模型，然后對數據進行加窗處理剔除周圍冗余的噪聲信號粗篩選，對距離像進行最大值粗對齊，再利用全局最小熵距離對齊算法對一維距離像完成精確對齊，最后使用歸一化算法處理對齊后的數據。

1.1 全局最小熵距離對齊算法

全局最小熵距離對齊算法有良好的魯棒性，且運算速度較快，能夠實現對雷達目標回波距離像的精確對齊。該算法主要通過對距離像包絡的幅度值運算，將平均距離像(average range profile, ARP)熵值作為對齊的標準，通過迭代求解法使熵值趨于最小，搜索其對應的位置來完成距離像的精確對齊[7]。

將距離像經壓縮后的脈沖包絡定義為p(r,n)，r表示距離，n代表回波信號的脈沖數序號，N為回波信號總數，Δ(n)表示當前第n個回波信號脈沖的偏移值，則可將ARP定義如下

當各回波信號未對齊時，其相應距離的信號幅度值相加所得的合成波形會因為各信號的波峰波谷相互錯開相加發生鈍化，此時檢驗回波信號是否對齊的問題就轉化為求解ARP波形的銳化度大小，由此可得各個波形與原始位置的偏移量Δ(n)。波形銳化度可以使用信息熵來量化衡量，當合成波形的熵最小時，可以認為各個回波信號已經完成對齊處理。根據信息熵的定義，ARP的熵可以定義為[8]

對式(2)求導可得ARP熵的最小值

將式(1)代入，則有

(4)

根據傅里葉變換的微分性質，式(6)可以表示為

(6)

重復迭代對所有的脈沖進行移位并不斷更新ARP，使其熵逐漸逼近全局最小值不再減小時，所得到的Δr(n)每次回波信號所需移位的偏移最終估值。由于式(6)中卷積運算可以利用FFT求解，因此全局最小熵距離對齊算法比傳統的相關對齊法運算速度較快。算法流程圖如圖1所示。

1.2 歸一化處理

高分辨距離像x(n)在距離像空間中是一個矢量點，其任意正倍數kx(n)(k>0)同樣表示這個距離像。針對HRRP幅度敏感性的問題，一般用歸一化的方法處理，使所有類別目標的距離像具有統一的尺度，方便待測HRRP樣本與模版之間在尺度上比較。本文采用能量歸一化方式，即每幅距離像x(n)對其總能量進行歸一化處理，表達式如下

2 廣義回歸神經網絡GRNN模型

廣義回歸神經網絡(GRNN)由 Donald F. Specht 在1991年提出，它建立在數理統計非線性回歸法的基礎上，根據樣本數據逼近其間隱藏的映射關系[9]。GRNN通過激活神經元來逼近目標函數，在局部逼近、全局最優及分類性能上比RBF具有更強的優勢。網絡收斂于數據樣本量聚積較多的優化回歸面，當樣本數較少或樣本數據不穩定時，回歸預測效果十分明顯[10]。此外，對于具體的網絡樣本訓練而言，GRNN更顯著的優勢在于整個網絡中需要根據樣本數據調整的參數只有一個光滑因子spread，因此可以更快地預測網絡且能在最大程度上避免人為因素影響，網絡的學習全部依賴于輸入的樣本數據[11]。

2.1 GRNN的網絡結構

GRNN網絡結構如下圖2所示，由4層模塊組成，輸入層將輸入樣本數據傳遞給模式層，其神經元數目與需要學習的輸入樣本中向量維數相同；數據通過模式層中各自對應的n個神經元傳遞函數處理后進入求和層；求和層中使用2種不同的神經元對輸入數據加權求和；輸出層中各神經元將求和層中處理后的數據相除，最終得到輸出結果。

2.2 GRNN的理論原理

式中：n表示學習樣本數據容量；p為隨機變量x的維數；Xi，Yi為隨機變量xi和yi的樣本觀測值；σ表示寬度系數，一般在神經網絡中稱作光滑因子spread，也就是網絡的擴展速度。

此時，根據神經網絡的特性令

式中：Pi即為上圖2中神經網絡模式層第i個神經元的傳遞函數，其中X是神經網絡的輸入樣本參數，Xi是第i個神經元所對應的學習樣本參數。SD和SN則是神經網絡求和層中2種神經元，SD負責對模式層所有神經元的輸出值進行算術求和，連接權重值為1；而SN則是加權求和，權重值為輸出樣本Yi中各元素值。將上式帶入，就可得到所對應的輸出向量Y，即

GRNN模型只需要一個光滑因子σ參數所以結構簡單，很大程度上減少了人為因素對模型參數選擇的影響，因此網絡結構的設計更加合理。從數學的角度來說，GRNN模型網絡的優化實際上是參數σ確定的優化，找到了適用于網絡的最優σ，也就能使經過網絡訓練后的樣本輸出值與實際值之間的均方差最小。參數σ取方法大多采用人工調整方法，存在著效率低、精度差的問題。

2.3 改進GRNN

針對GRNN神經網絡光滑因子spread參數σ選擇，本文采用了K重交叉驗證法，根據最小均方誤差(mean square error,MSE)尋找出的σ最優值，同時獲得目標識別訓練樣本的最優輸入輸出值。

交叉驗證(cross validation，CV)是數據分析時用來驗證分類器模型性能的一種統計分析方法，基本思路是將數據重復使用以提高模型的精度，原理是將原始數據樣本分組切割成較小子集，先在一個子集即訓練集上作分析，再用其他子集即驗證集或測試集分別用作選擇模型和對學習方法的評估。交叉驗證法主要的優點是將新數據代入訓練好的模型時可以在一定程度上減小過擬合，并且可以從有限的數據中獲取盡可能多的有效信息。

交叉驗證法主要有以下3種方法：

(1) 簡單交叉驗證法：隨機選取一部分樣本為訓練集，剩下做測試集，選擇測試誤差最小的模型。方法簡單速度快，但浪費了部分數據，數據量較小時影響較大。

(2)K-重交叉驗證法(k-folder cross validation，K-CV)：將樣本數據集隨機劃分為k份，k-1份作為訓練集，1份為測試集，依次輪換訓練集和測試集k次[12]，驗證誤差最小的模型為所求模型，并將k次的平均交叉驗證識別正確率作為分類器的性能指標。優點是所有的樣本都被作為了訓練集測試集，每個樣本都被驗證一次，結果更加客觀，通常k取10也就是10重交叉驗證。

(3) 留一法(leave one out cross validation，LOO-CV)：設原始樣本數據集有N個樣本，LOO-CV也就相當于K=N時的K-CV，即每一個樣本都單獨作為一次測試集，其余的N-1本作為訓練集，所以LOO-CV會得到N個模型。優點是每個樣本都用于訓練模型，因此最接近原始樣本的分布，且實驗過程中沒有隨機因素的影響，評估所得的結果更加可靠。

上面3種方法中，LOO-CV評估結果是最客觀可靠的，不過其計算成本高，運算時間長，在實際操作上很困難。綜上，本文采用的是K-CV，其中k取10，即10重交叉驗證法，算法的示意圖如下圖3。

本文將樣本集隨機劃分為10份，其中9份作為訓練數據，另1份作為測試數據，訓練和驗證10次。10次結果的正確率均值作為對算法精度的估計，具體方法如下：

(1) 將樣本數據集S隨機劃分為10個不同的子集，分別記作S1,…,S10，每個子集中樣本的數量為e/10個。

(2) 對于每個模型Ei，進行如下操作：使j從1至10循環；訓練集為S1∪…∪Sj-1∪Sj+1∪…∪S10，訓練模型為Ei，對應的假設函數為hij；驗證集為Sj，得出泛化誤差。

(3) 計算各模型的平均泛化誤差，泛化誤差最小的模型Ei即為系統的最佳模型。

本文選取均方誤差(MSE)作為實驗中的泛化誤差，也就是神經網絡的性能函數。若有n組樣本數據，每組輸入輸出樣本數據為[Pi,Ti],i=1,2,…,n，Yi為經網絡訓練后的輸出數據，則MSE定義為每一組數據的誤差平方和除以樣本的總組數n式如下

3 系統仿真

為驗證本文方法的有效性，將算法與運用徑向基函數神經網絡(RBF)雷達目標識別方法[13]進行了比較。仿真實驗采用的數據為測量飛機數據，其脈沖重復頻率為400 Hz，信號帶寬為400 MHz，采用Dechirp接收，轉換后信號的采樣頻率為10 MHz驗數據飛機分別為, 大型噴氣飛機“雅克Yark-42”、小型噴氣飛機“獎狀Jiang”和中小型螺旋槳飛機“安An-26”，為了更客觀準確地驗證識別方法準確性，訓練和測試數據選取不同的數據段，其中每個HRRP樣本含有256個距離單元，數據俯仰角有微小差別[14]。

實驗基于目標中心散射模型[15]，主要用全局最小熵距離對齊算法對數據進行預處理，使用GRNN神經網絡作為分類器，利用K重交叉驗證法訓練網絡。將經過預處理后的數據隨機抽取 12/13數據作為訓練樣本，剩下的則作為測試樣本放入訓練好的網絡中進行訓練計算目標識別準確率。

本實驗使用Matlab將本文改進GRNN神經網絡算法與傳統RBF神經網絡算法、GRNN神經網絡算法進行對比，表1為3類飛機目標分別在3種算法下識別率。其中識別準確率的定義為正確識別樣本個數/測試樣本總數，識別率為仿真100次的平均識別率，每次的訓練集和驗證集均為隨機選取。

表1 針對不同飛機目標識別準確率Table 1 Target recognition accuracy for different aircrafts

仿真實驗中網絡光滑因子spread的最優值由最小均方誤差(MSE)得出，圖4所示為10-CV時不同Spread取值對神經網絡MSE的影響。

由圖4可以看出，在10次不同訓練集和驗證集情況下，雖然每次光滑因子spread最優位置即MSE的最低點位置都不同，但是大致位置基本在一定范圍內，因此對圖4的10重交叉驗證后產生的10組數據進行累加，得出網絡綜合最優光滑因子spread的取值大小，如圖5所示。

仿真主要從目標識別準確率和時間2個方面對應用了不同神經網絡方法進行了比較，表2分別給出了采用不同神經網絡時的識別準確率比較。從數據中可以看出，本文改進的GRNN神經網絡算法與RBF網絡以及原有GRNN網絡算法相比具有相對較高的識別率。

表3對比了采用不同神經網絡時的系統所用的運算時間，其中運算時間包括訓練時間和測試時間。從表中可以看出，改進的GRNN神經網絡算法運算時間明顯少于RBF網絡。

表2 幾種算法對比的平均識別率Table 2 Average recognition rate of several algorithms

表3 幾種算法對比的平均運算時間Table 3 Average computing time of several algorithms

4 結束語

本文對基于GRNN神經網絡的雷達目標識別方法進行了研究，利用了全局最小熵距離對齊算法以及歸一化等方法對數據進行了預處理，針對廣義回歸神經網絡光滑因子spread參數采用K重交叉驗證法對進行優化，并取得最優樣本輸入輸出值。仿真實驗結果表明，本文改進的GRNN神經網絡解決了設計參數σ選取時的隨意性，減少了人為因素對預測結果的影響，該方法模型的目標識別預測精度和穩定性上優于RBF神經網絡模型，具有較高的識別率以及良好的識別效率。