王現磊,王義江,陳春江,吳家健
(解放軍63861 部隊,吉林 白城 137001)
在武器系統試驗靶場,獲取高精度彈道參數是評定和分析武器打擊精度的重要內容[1]。而彈藥的著速是影響目標毀傷程度的重要參數之一,因此,精準獲取彈藥的著靶速度成了重要研究目標。目前靶場大多采用梳狀靶、電探針等區截裝置接觸式測量法[2],測量值與真值相差較大;高速攝影裝置可以對彈藥飛行過程實時記錄其影像,但人工判讀底片過程,不可避免引入一定程度的測量誤差[3];連續波測量雷達是獲取彈藥徑向速度的重要途徑,具有測速精度高的優點,但是立靶對雷達回波信號產生較大噪聲和干擾,后續對彈藥著速的提取依賴于信號的濾波、特征點的提取以及對數據處理的經驗,其精度受到不同程度影響。本文通過使用雷達采集的時間速度序列數據,將循環神經網絡應用于彈藥著速的預測,以期提高彈藥著速的精確性,具有較大的理論意義。
彈藥飛行的速度數據,具有三大特性:隨機性、連續性和周期性。當前時間點的速度受到溫度、風速等空氣動力學因素的影響,速度數據具有隨機性;相鄰時間速度的值是連續的,具有時間依賴性,因此,具有連續性;周期性是指時間速度數據呈某種趨勢的現象,因此,將速度數據作為時間序列進行分析與預測具有可行性,利用RNN 對彈藥著速進行預測,并與RFR 算法和基于BP 的MLP 模型預測結果進行對比,取得了滿意的擬合效果,對彈藥后續指標的評估具有實用價值。
時間序列預測的方法主要包括基于數學理論模型的預測方法和基于大數據驅動預測方法[4]。數學理論模型預測方法主要基于數學和統計學等知識,僅從時間的維度對被預測對象建模,對復雜時間序列數據難以建立精確的數理統計模型,適用性受到極大限制且預測精度大大降低?;诖髷祿寗宇A測的方法主要有傳統機器學習方法、前饋神經網絡方法和循環神經網絡等[5]。傳統的機器學習方法,如線性回歸、支持向量機、隨機森林等算法[6-8],對于時間序列的處理,是利用數據中的維度特征,進而構建起從因變量到目標預測值的函數方程,通過不斷優化構建的損失函數,來構造回歸模型。但是該類模型在建模時僅考慮時間序列當前時間點的特性,忽略了數據彼此間具有時間依賴性,因此,預測精度不高。
神經網絡是一種由大量運算節點之間互相連接構成的運算模型。每個節點代表一種特定的輸出函數,即激勵函數。每兩個節點間的連接都代表一個對于通過該連接信號的加權值,稱之為權重,這相當于人工神經網絡的記憶。網絡的輸出則以網絡的連接方式、權重值和激勵函數的不同而不同。而網絡自身通常都是自然界某種算法或者函數的逼近,也可能是一種邏輯策略的表達[9]。神經網絡模型的神奇點就在于它是一個“黑盒”模型,輸入大量歷史數據,模型就可以自動學習到序列之間的規則以及依賴關系。神經網絡方法彌補了傳統統計模型固有的劣勢,可以處理具有非線性模式數據。根據需要,僅對前饋神經網絡做簡單介紹。
人工神經網絡(artificial neural network,ANN)由神經生理學家Warren McCulloch 和數學家Walter Pitts 于1943 年首次提出,通過對生物神經元進行建模,首次提出了一種形式神經元模型;1957 年Frank Rosenblatt 提出了感知機,感知機是最簡單的ANN架構,能夠確定神經元的連接權重,但無法解決線性不可分問題,基于此人們提出了MLP 模型,也稱為前饋網絡模型。MLP 通常采用3 層結構,由輸入層、隱藏層及輸出層組成。如圖1 所示。

圖1 多層感知機模型Fig.1 Multi-layer perceptron model
輸入層表示神經元接受x1,x2,…,xn作為輸入,隱藏層通過權重與輸入層的各單元相連接,通過激勵函數計算隱藏層各單元的輸出值,同樣通過權重與輸出層相連接。由于模型的輸出與模型自身之間不存在反饋過程,因此,被稱為前饋神經網絡。
1986 年 David Rumelhart、Geoffrey Hinton 和Ronald Williams 發表的開創性文獻[10]介紹了誤差反向傳播訓練算法,該算法能夠針對每個模型參數計算網絡誤差的梯度,并通過比較實際輸出和期望輸出得到誤差信號E,把誤差信號從輸出層逐層向前傳播得到各層的誤差信號,再通過調整各層的連接權重以減小誤差。其權重的調整主要結合梯度下降法,過程如圖2 所示。

圖2 梯度下降法Fig.2 Gradient descent method
通過實際輸出和期望輸出之間的誤差E 和梯度,確定連接權重w0調整值,得到新的連接權重w1,然后反復不斷地調整權重以使誤差E 達到最小,并從中學習得到最優的權重連接wopt,即網絡收斂到最優解。
著速預測網絡模型是一個從序列到向量的網絡,由連續波雷達采集的時間速度數據作為輸入序列,并忽略彈藥著速外的所有輸出,即忽略飛行過程的速度值,輸出著靶速度。其模型按時間展開的網絡如圖3 所示。

圖3 時間展開的網絡模型Fig.3 Network model of time expansion
圖3 為含有一層循環神經網絡、若干隱藏節點的著速預測模型。其中,損失衡量序列結束時的輸出與相應的訓練目標的距離;U 表示RNN輸入層到隱藏層的連接權重矩陣,W 表示隱藏到隱藏的循環連接權重矩陣;V 表示隱藏到輸出的連接權重矩陣;f 為激活函數;為記憶單元且滿足式(1),即在時間步長t 時刻遞歸神經元的輸出是先前時間步長中的所有輸入函數
式中,b 為偏置向量。
為量化實驗結果便于比較,本文選取了預測問題的典型性能指標均方根誤差(RMSE),其公式如下:
實驗選用某型穿甲彈連續波雷達采集并處理后的速度數據共計60 發,作為實驗數據集,每發彈的數據格式為等間隔的、連續的81 個時間速度點,其中,最后一點為彈藥著靶速度。隨機選取42 發(占70%)作為訓練集,6 發作為驗證集,剩余12 發(占20%)作為測試集。樣本輸入特征(x_train,x_valid,x_test)為[42,80,1],即總共42 發數據,每發前80 個點作為輸入樣本,維度為1;輸出特征(y_train,y_valid,y_test)為[42,1,1],即每發彈藥的著靶速度,共計42 發。
激活函數選擇不同會導致梯度不穩定問題,通過控制變量方法,為著速預測網絡模型選取ReLU 激活函數,并使用其初始化策略即He 初始化;對比常規梯度下降優化器,選取Adam 優化器加快訓練速度,由于Adam 是一種自適應學習率算法,因此,不對學習率超參數η 進行調整,使用其默認值η=0.001。
本實驗中多層感知機模型和預測網絡模型的隱藏層數(n_hidden)與每層包含的神經元數(n_neurons),采取RandomizedSearchCV 探索超參數空間,如表1 所示。

表1 超參數空間Table 1 Hyperparametric space
設置n_hidden:[0,1,2,3],n_neurons 為[0,100],設置最大迭代次數為200,當損失值連續10 次未發生改變或至最大迭代次數時,嘗試其他超參數組合,結束并輸出最佳超參數組合。
經過RandomizedSearchCV 探索超參數空間,多層感知機模型和著速預測網絡模型返回最佳超參數組合及超參數設置如表2 所示,根據訓練過程,兩個模型epoch 在90 左右RMSE 值收斂于穩定狀態,因此,設置epoch=110。

表2 最佳超參數組合Table 2 Best combination of hyperparametric
多層感知機模型和著速預測網絡模型訓練過程中其訓練樣本RMSE 曲線分別如圖4、圖5 所示;隨機森林回歸算法,通過調整參數訓練樣本并對測試集進行預測,其RMSE 值如表3 所示。從圖中可以看出,訓練樣本在兩種模型中RMSE 最終均趨于穩定的收斂狀態,其網絡學習過程較為類似,相較而言著速預測網絡模型收斂速度更快;由表3 可直觀的看出著速預測網絡模型在測試集上的RMSE值相比其他兩種更小,即擬合效果更佳。

表3 測試集RMSE 值Table 3 RMSE values of test set

圖4 多層感知機訓練過程Fig.4 Training process of multi-layer perceptron

圖5 著速預測模型訓練過程Fig.5 Training process of target velocity prediction model
著速預測模型真值與預測結果如圖6 所示,實驗結果表明該模型的適用性較強,可通過網絡模型的不斷訓練較準確的學習出不同彈速的飛行規律,并給出精準的預測,由后續的測試誤差圖可知,該模型具有很好的穩定性。

圖6 著速預測模型測試結果Fig.6 Test results of target velocity prediction model
為了直觀地對比3 種模型對彈藥著速的預測,實驗測試集誤差結果如圖7~圖9 所示。

圖7 隨機森林測試誤差Fig.7 Random forest test errors
隨機森林回歸算法是一種基于集成學習的監督式機器學習算法,通過加入不同或相同類型算法獲取強大且穩健的預測模型,且不易陷入過擬合;但因其隨機性,由圖7 可知預測結果不是很穩定,有較大的波動性,該算法對測試集著速預測誤差在0.2 左右。多層感知機模型,超參數空間較大且復雜,其隱藏層包含的神經元數更多,通過選擇適宜的激活函數和超參數,基于BP 算法訓練其模型用于著速預測,由圖8 可知,測試集著速預測誤差在0.15 左右,相比于隨機森林回歸算法預測精度和穩定性得到改善,但預測結果穩定性仍有起伏。而著速預測網絡模型受益于隱藏層之間有循環連接,考慮了速度數據之間存在時序上的依賴關系,極大地提高了網絡模型對速度數據的分析、學習能力和預測精度,且加快了網絡模型的訓練速度,從而使網絡學習效果得到提高,由圖9 可知,其預測誤差絕對值在0.02 左右,且穩定性更好;相比于前兩個算法模型,其預測精度有數量級的提升,取得了較好的實驗效果,得到了更精確的預測結果。

圖8 多層感知機測試誤差Fig.8 Multi-layer perceptron test errors

圖9 著速預測模型測試誤差Fig.9 Test errors of target velocity prediction model
本文分別使用隨機森林回歸算法、基于BP 的多層感知機模型和基于RNN 的著速預測模型,對某型穿甲彈的著速進行預測,從預測結果分析得出基于RNN 的預測模型,可更好地從速度數據中挖掘序列之間的內部關聯且模型的適應性較強,預測精度優于傳統方法。實驗結果表明,基于RNN 的著速預測模型,切實提高了分析預測效果,其預測結果可作為彈藥著靶速度。本文構建的模型具有一定的應用推廣價值,可推廣應用于雷達測速數據跳點、丟失點的填補。