趙佳歡 楊海明 邱令存
上海機電工程研究所,上海201109
目標類型識別是防空作戰領域的研究熱點。在現代信息化戰爭中,識別敵方來襲目標的類型是指揮控制系統做出正確決策的重要依據,準確地識別目標類型有利于精確的威脅評估和合理的火力分配,從而提高我方防空武器系統的作戰效能[1-2]。
面對高動態不確定性的戰場環境,空襲目標種類和數量劇增,如何根據雷達目標序列數據準確而又快速地識別目標類型是一個急需解決的問題。傳統的方法主要依據目標的高度和速度特性對目標類型進行判斷[3],文獻[4-5]利用貝葉斯網絡對目標類型進行識別,該方法存在的問題是對于目標高度、速度等一系列非離散的數據,需要依據經驗進行離散化,該過程專家主觀因素比重過大。文獻[6]提出一種基于支持向量機(Support Vector Machine, SVM)的目標識別模型,該模型結構簡單,在小樣本訓練集上表現優秀,但在面對大規模樣本時將消耗大量的機器內存和運算時間,且經典SVM算法很難處理多分類問題。
不同類型的目標,其運動特性、行為特性有所不同,其差異性會體現在目標不同維度的特征中。傳統方法僅僅依據目標的速度和高度特征進行目標類型的判斷,但有些類型的目標運動特性起伏大,不同類型的目標之間在高度、速度特性上會有重疊,這些因素都降低了識別的準確率。除了目標速度、高度等特征以外,本文考慮引入雷達目標信噪比(Signal-Noise Ratio, SNR)特征用于目標識別,增加識別準確率。而SNR特征起伏大,規律不明顯,傳統目標識別方法通常不將其作為識別特征之一,而智能化模型循環神經網絡(Recurrent Neural Network, RNN)能從大量的歷史樣本自動學習得到特征,適合處理雷達的時序數據。
RNN是一種深度學習模型,深度學習(Deep Learning, DL)通過多層網絡結構和非線性激活函數的組合,將低層次特征轉化為高層次特征[7]。RNN由于其特殊的循環輸入結構,是眾多深度學習模型中公認的最適合處理時序數據的模型,能從大量歷史雷達數據中挖掘出隱藏在時間層面的目標特征,并以網絡權值的形式記錄下來。這種方法僅從雷達數據層面入手,不需要改良現有雷達的體制,便于實際的工程應用。
現代戰爭空襲目標種類和數量劇增,防空反導作戰面臨的主要威脅可分為2大類:飛機類和導彈類。選擇具有代表性的隱身飛機、常規飛機、空地導彈、巡航導彈、隨隊掩護電子干擾機這5類典型的空中目標作為研究對象。
隱身飛機利用各種技術手段削弱雷達反射、紅外輻射信息,躲避敵方探測系統的偵測,具有極強的突防及攻擊能力,是各國軍事專家的研究熱點[8-10]。隨著美軍F-35各機型陸續服役,我國周邊地區國家諸如日本、澳大利亞等國家訂購的F-35相繼下線交付使用,隱身戰機對我國安全形勢造成極大威脅,反隱身需求越來越迫切。區分隱身飛機目標與常規飛機目標具有重要意義。
空地導彈是指從航空器上發射攻擊地(水)面目標的導彈,與普通的航空炸彈相對,具有目標毀傷概率高、機動性強、隱蔽性好的特點。
巡航導彈是指一類以巡航狀態在稠密大氣層內低空飛行的導彈,美國的戰斧巡航導彈在巡航飛行階段的高度一般在50m左右,掠海飛行高度可達7~15m,能有效避開雷達搜索,躲避攔截。
電子對抗是作戰雙方利用電子設備在電磁維度進行的斗爭,為了削弱甚至破壞對手電子設備的作戰效能,保護己方作戰單位。電子對抗是現代戰爭中一種重要的作戰手段[11-12],本文以典型的隨隊掩護電子干擾機作為一類研究目標。隨隊掩護干擾是指電子干擾機在指定空域內跟隨攻擊編隊戰機飛行,釋放干擾,掩護攻擊編隊。
RNN是一種以序列數據為輸入,且所有循環節點按鏈式連接的神經網絡。最早由Jordan和Elman分別于1986年和1990年提出,目前RNN在語音識別、機器翻譯等領域有廣泛的應用,但在目標識別領域的研究較少。RNN具有記憶性、參數共享并且圖靈完備,在學習時間序列非線性特征時具有獨特的優勢,而雷達目標數據都是大量的時序數據,因此應用RNN對目標進行識別具有很大的可行性。
圖1是單向循環神經網絡及其結構展開圖。

圖1 RNN結構圖
圖1中x是多維時間序列數據,依次循環輸入RNN,s為隱藏層輸出,o為輸出層輸出,U是輸入層與隱層全連接權值矩陣,V是隱層與輸出層全連接權值矩陣,W是隱層與隱層之間的循環權值矩陣。
RNN最大的特點在于引入了隱層自身之間的循環結構,從其展開圖中可以得到,t時刻隱藏層的輸出st不再僅依賴于U和xt,還依賴于新的權值矩陣W以及上一時刻隱藏層的輸出st-1,正是因為這種特殊的結構,RNN才能有效地處理時間序列數據。
隨時間反向傳播(Back Propagation Through Time, BPTT)算法是RNN模型最經典的優化算法,與傳統的BP算法不同,BPTT算法中計算誤差不僅在空間上傳播,還會在時間尺度上傳播。
BPTT算法主要有以下3個步驟:1)根據當前時刻的輸入和上一時刻隱層的輸出,計算當前時刻各神經元的輸出;2)從最后一個神經元開始,在時間尺度和空間結構上分別反向計算各個神經元的誤差項;3)計算各個權值的梯度,采用梯度下降法進行權值的更新。
基于RNN的目標識別算法如圖2所示。
該算法主要有3大步驟,首先是利用訓練集數據對目標識別循環神經網絡進行訓練,在訓練次數達限后,轉入網絡的測試階段,若準確率達標,則進入網絡實時分類識別階段,否則需要重新設置超參數,再次進行訓練。
其中主要包含了5個核心內容:數據預處理、網絡結構確定、損失函數確定、網絡測試評估、實時分類識別。

圖2 RNN目標識別算法
2.2.1 數據預處理
首先需要分析樣本數據結構,將數據集以8∶2的比例劃分為訓練集和測試集,訓練集數據用于優化循環神經網絡的權值,測試集用于測試訓練完成的模型的識別性能并調整合適的超參數。
本文所用的數據集中目標特征包含了相對距離R、方位角A、俯仰角E、速度的三軸分量、徑向速度V、高度H以及信噪比。為了消除不同特征屬性之間數量級差異較大造成的不良影響,提高RNN的收斂速度,增加模型識別的準確率,需要對雷達數據進行歸一化處理。本文采用常用的min-max歸一化。min-max歸一化方法對原始數據做簡單的線性變換,使得結果映射到[0,1]區間上,對于某一維數據中的任意x,歸一化公式為
(1)
xmin表示該數據集里的最小值,xmax表示該數據集里的最大值。
最后需要對樣本標簽轉換為獨熱(One-Hot)編碼形式。獨熱編碼能很好地處理離散型屬性的編碼問題,并在一定程度上起到擴充特征的作用,具體編碼如表1所示。

表1 One-Hot編碼形式
2.2.2 網絡結構確定
接著需要確定網絡結構,設置合適的超參數,比如學習率η、網絡層數、各層神經元數量、循環次數、激活函數、批處理容量等。超參數是指在網絡學習過程中不發生變化,需要事先依據經驗進行設置,并在后續仿真中具體確定的參數類型。
學習率η用于控制每次更新時網絡權值調整的大小,與網絡收斂速度和識別準確率息息相關。如果學習率設置過小,雖然最終能達到較高的識別準確率,但是模型收斂速度慢;如果設置太大,模型的識別準確率波動較大,且不一定能收斂。因此需要確定合適的學習率η,同時保證網絡的收斂速度和識別準確率。據經驗,學習率的典型值在0.001到0.1之間。
網絡層數和各層神經元數量直接確定了RNN模型的結構。一般而言,網絡層數越多,神經元數量越多,模型的準確率也會越高,但受限于計算機存儲空間和計算量的限制,往往需要在滿足準確率要求的情況下,確定最簡單的網絡結構,從而減小存儲空間和計算量的消耗。
循環次數是指RNN循環輸入的次數,一般循環次數越多,識別準確率越高,但是實時性會受到影響。
激活函數一般選擇非線性函數,可以使神經網絡具有表征復雜非線性映射關系的能力。
批處理容量是在網絡權值優化過程中,每次迭代訓練所使用樣本數據的數量。一般來說,在合理范圍內,越大的批處理容量使梯度下降方向更準確,振蕩越小。若設置過大,可能會陷入局部最優;若設置過小,引入的隨機性更大,難以收斂。
2.2.3 損失函數確定
損失函數又稱為代價函數,通過計算當前分類結果與期望結果之間的差異,進一步計算出每個神經元的誤差,最后根據BPTT算法優化網絡權值。BPTT算法的核心思想是根據誤差關于網絡權值U,V和W的梯度,用梯度下降法更新U,V和W的值。
這里選擇交叉熵損失函數,公式為
(2)

其次需要確定訓練過程中給網絡喂數據的方式,本文選擇小批量梯度下降法(Mini-Batch Gradient Descent, MBGD),既可以克服經典的梯度下降法需要計算全體樣本損失值導致的計算復雜度高的問題,也可以解決隨機梯度下降法(Stochastic Gradient Descent, SGD)學習過程噪聲多,并不是每一步都向最優化進行的問題。
2.2.4 網絡測試評估
在測試數據集上對網絡性能進行測試,涉及到的主要評估指標有準確率(Accuracy)、精確率(Precision)、召回率(Recall)及F1得分。下面給出這些指標的具體定義。
準確率:所有被正確識別的樣本數量占全體樣本的比例。
精確率:每一類都有各自的精確率,即所有識別為X類的樣本中真正屬于X類的比例。
召回率:每一類都有各自的召回率,即所有實際為X類的樣本中被正確識別的比例。
F1得分:每一類的F1得分為該類的精確率和召回率的調和平均數,公式為
(3)
其中,PX為X類的精確率,RX為X類的召回率。對于分類模型總的F1得分為各類的F1得分的算數平均值。
2.2.5 實時分類識別
當戰場傳感器的實時數據經過預處理之后,直接輸入訓練完成的RNN網絡進行實時的目標識別,識別過程如圖3所示。

圖3 基于RNN的目標識別模型
當雷達探測到來襲目標,對目標數據進行預處理,得到9維的目標特征向量,包括了目標的相對距離R、方位角A、俯仰角E、xyz三軸上的速度分量、徑向速度V、高度H和信噪比,然后將每一拍的目標特征向量依次循環輸入到RNN網絡中,最終網絡輸出目標類型結果,完成實時目標識別。這里輸入的拍數需要視具體情況由雷達頻次和識別實時性共同確定,由公式n=f×t計算得到,n為拍數,f為雷達頻次,t為人為設定預期需要在發現目標后多久時間內給出識別結果。
仿真校驗使用的數據集來源于某型號真實檢飛數據,數據規模為21276,每條數據都包含了40拍的目標狀態,即RNN模型的循環次數為40次,其中各目標種類占比為常規飛機31.2%、隱身飛機20.9%、空地導彈13.3%、電子干擾機18.2%和巡航導彈16.4%,雷達數據包含了目標相對距離、方位角、俯仰角、速度、信噪比等狀態。
仿真實驗平臺硬件設備:處理器Intel(R) Core(TM) i5-6500 CPU@3.20GHz,內存8GB,集成開發環境為Spyder3.2.8,編程語言為Python3.6,深度學習框架為Tensorflow1.9.0。
仿真參數設置如下:RNN循環次數40,激活函數為雙曲正切tanh函數,批處理容量為128。
本小節通過仿真實驗確定最優的網絡結構,包括網絡的層數和各層神經元的數量。圖4是不同網絡結構下測試集的識別準確率對比。

圖4 不同網絡結構下模型識別準確率對比
可以看出,單隱層結構下,一定范圍內增加神經元數量能顯著提高模型識別準確率,當數量增加到一定程度,比如從32個增加到64個,識別準確率上升不明顯,但計算量大幅上升;雙隱層結構下,雖然用16~16的結構就能達到單隱層結構32個神經元的準確率,但是雙隱層結構相對復雜,需要的計算量大。綜合考慮準確率與計算量,這里選擇單隱層32個神經元的網絡結構。
本小節通過仿真確定最優的學習率,圖5給出了不同的學習率對于模型收斂速度的影響。

圖5 不同學習率模型識別準確率對比
當學習率為0.1時,準確率能很快到達峰值,但準確率僅有0.45,且波動幅度大;當學習率為0.0001,模型在迭代200步后才接近收斂,收斂速度慢,最終準確率為0.85;當學習率為0.01或0.001時,收斂速度快,最終準確率為0.95。
為保證模型收斂的快速性及較高的準確率,本文將學習率設置為0.001。
3.3.1 信噪比的影響
圖6給出了3類不同目標的信噪比特征對比圖。

圖6 不同目標SNR對比
從圖6可以看出,隱身飛機的SNR特征相對于常規飛機起伏較小,數值也較低,而空地導彈的SNR特征雖然也有起伏,但是從直觀上看程度比隱身飛機大,比常規飛機小,在數值上也小于常規飛機。可見不同類型目標的SNR特征有一定的區別,可以將其作為目標識別的特征之一,RNN模型能從大量數據中學習得到隱藏在SNR中的特征。下面將研究引入SNR特征對識別模型識別準確率的影響。
首先僅依據目標的相對距離、方位角、俯仰角、高度、速度特征屬性對目標類型進行識別,并給出模型在測試集上的準確率、F1得分等各項指標。然后研究了雷達目標SNR特征的引入對于目標識別模型性能的影響。表2中①代表引入SNR特征前的模型各項指標,②代表引入SNR特征后識別模型的各項指標。

表2 信噪比對識別準確率的影響
準確率與F1得分是衡量分類模型性能優劣的重要指標,可以看到,當目標識別模型的輸入未包含SNR這一特征時,識別準確率為89.9%,F1得分為0.760;當加入SNR這一特征時,識別準確率為95.3%,提高了5.4%,F1得分為0.822,提高了0.062。
從多角度看待問題,能對問題有更全面的認知。根據表2可得結論,結合雷達目標SNR特征,可以有效提高目標識別的準確率,證明空中目標識別過程中,目標相關特征屬性越多,越可能提高識別模型的準確率,為后續雷達其他相關信號能用于目標識別提供了支撐。
3.3.2 RNN與其他方法的對比
本小節將基于RNN的目標識別模型與其他傳統目標識別方式進行對比。
貝葉斯網絡是一種概率圖模型,可以解決目標識別過程中不定性和不完整性的問題;SVM是機器學習中最經典的分類算法之一。
表3給出了3種模型的識別準確率。

表3 不同目標識別方法準確率
可以看出,RNN模型的識別準確率最高,SVM次之,貝葉斯網絡的準確率最低。構建貝葉斯網絡時有分布獨立的假設前提,但在實際目標各屬性之間基本不可能完全獨立,并且構建網絡時極其依賴專家經驗知識,導致識別準確率較低。經典SVM算法是針對二分類問題提出的,對于多分類問題,有其一定的局限性。而RNN模型在選擇了適當的超參數后,能自動學習得到目標類型特征,并以網絡權值的形式記錄下來,結果表明該模型能達到95%的識別準確率。
傳統目標識別方法使用的目標特征單一,往往僅憑目標速度、高度做出判斷,但不同類型目標的速度、高度特性上會有一定重疊,導致傳統目標識別方法準確率低。本文利用智能化算法將雷達目標SNR特征融入到目標識別方法中,構建了基于RNN的目標類型識別模型,擴展了使用的目標特征屬性維度,提高了識別準確率。最后應用某型號真實檢飛數據,檢驗該方法的有效性,并與樸素貝葉斯網絡模型和SVM模型進行了對比。仿真結果顯示樸素貝葉斯網絡模型的識別準確率為63.0%,SVM模型的識別準確率為80.8%,而RNN模型的識別準確率達到了95.3%,且引入雷達信噪比特征能提高識別準確率。結果表現,RNN智能化模型能有效地將SNR特征融入到目標識別過程中,并能得到較高的識別準確率。