一種基于改進PSO優(yōu)化的LSTM航跡預測模型*

2022-11-09 07:27:46韓超

艦船電子工程 2022年8期

關(guān)鍵詞：模型

韓超

（海裝沈陽局駐大連地區(qū)第一軍事代表室大連 116000）

1 引言

雷達航跡預測是雷達目標跟蹤的關(guān)鍵環(huán)節(jié)，其主要目的是利用目標航空器的歷史航跡數(shù)據(jù)，預估其未來軌跡。隨著戰(zhàn)場環(huán)境日益復雜和干擾技術(shù)的快速發(fā)展，對敵對目標的航跡預測需要面對更多的干擾因素，由此帶來的誤差問題對雷達機動航跡預測提出了日益嚴峻的考驗。

目前關(guān)于飛行器的短期預測算法大致可分為兩類。其中一類方法為傳統(tǒng)機器學習，運用卡爾曼濾波算法對觀測數(shù)據(jù)進行最小二乘估計，使用諸如卡爾曼濾波算法［1］、競爭神經(jīng)網(wǎng)絡(luò)［2］、支持量機［3］、灰色模型結(jié)合馬爾科夫鏈［4］等方法對飛行器的航跡進行處理，并給出軌跡預測。此類方法的缺陷是較為明顯的，那就是依賴專家知識搭建目標飛行器的動力學方程，無法進行實時預測，且易受到外部環(huán)境因素的影響。另一類方法為神經(jīng)網(wǎng)絡(luò)算法的若干變種［5］，相較于上面一類算法，它們具備用時短、通用性強等特點，能夠滿足對飛行器軌跡預測的實時、高效的要求，但針對復雜的海面飛行器軌跡預測問題，神經(jīng)網(wǎng)絡(luò)的映射表達能力有限，參數(shù)難以調(diào)整，且在本質(zhì)上算法更容易使得損失函數(shù)的訓練結(jié)果落入局部最優(yōu)點而不是全局最優(yōu)點，且無法針對時間序列上的變化進行建模。

本文充分結(jié)合PSO算法和LSTM網(wǎng)絡(luò)的設(shè)計思想，以PSO優(yōu)化實現(xiàn)LSTM航跡預測網(wǎng)絡(luò)在訓練中的自動調(diào)參，通過對LSTM超參數(shù)的全局尋優(yōu)，實現(xiàn)航跡預測效果的提升。

2 LSTM單元構(gòu)造方法

定義1若一個遞歸神經(jīng)網(wǎng)絡(luò)隱藏層單元具備如下特征，則稱該單元為LSTM單元。

圖1 LSTM隱藏層單元結(jié)構(gòu)圖

其中，it為輸入門，ot為輸出門，ft為遺忘門；ht-1為t-1時刻隱藏層狀態(tài)，ht為t時刻隱藏層狀態(tài)；xt為t時刻輸入層狀態(tài)；σ為Sigmoid函數(shù)，tanh為雙曲正切函數(shù)，Ct為t時刻單元狀態(tài)；Ct-1為t-1時刻單元狀態(tài)；為記憶單元的輸入狀態(tài)。算法的執(zhí)行步驟如下。

步驟1利用遺忘門篩選ht-1和xt信息

式中，bf為遺忘門的偏置項。

步驟2利用輸入門確定此時須更新的數(shù)值和即將加入的新單元狀態(tài)

式中，bt，bC為輸入門的偏置項；Wt，WC為輸入門權(quán)重。

步驟3綜合輸入門和遺忘門的信息計算單元狀態(tài)Ct：

步驟4利用輸出門，將Ct傳遞給激活函數(shù)獲得最終輸出：

3 PSO優(yōu)化算法原理

PSO算法是一種對多維搜索空間內(nèi)最優(yōu)解的搜尋算法。其核心原理是在空間內(nèi)維持一定數(shù)量的粒子，每個粒子均代表問題的一個可能解，包含位置、速度和適應度三項指標。粒子在解空間內(nèi)移動，并通過粒子間信息交互，不斷迭代尋找較優(yōu)區(qū)域，從而實現(xiàn)在整個解空間內(nèi)的最優(yōu)化過程。

PSO算法的實現(xiàn)步驟如圖2所示。

圖2 PSO算法流程圖

步驟1初始化粒子群參數(shù)。設(shè)目標粒子群位于D維解空間中，包含N個粒子，個體歷史最優(yōu)適應度值為fp，種群歷史最優(yōu)適應度值為fg，則有初始粒子群參數(shù)如下所示。

式中，Xid和Vid為第i個粒子的位置與速度；Pid，pbest為個體最優(yōu)解；Pd，gbest為種群最優(yōu)解。

步驟2若全局最優(yōu)位置滿足最小界限，則輸出全局最優(yōu)位置并結(jié)束，否則執(zhí)行步驟3。

步驟3對粒子速度進行迭代更新。

式中，ω為慣性權(quán)重，表征了粒子維持當前運動趨勢，在全局與局部極值間的平衡；c1和c2為學習因子，用于調(diào)整粒子向自身與全局最優(yōu)值前進的步長；r1和r2為滿足[0，1]間均勻分布的隨機數(shù)。

步驟4對粒子位置進行迭代更新。

式中，λ為速度系數(shù)。

步驟5根據(jù)步驟3與步驟4中的結(jié)果，對比歷史個體最優(yōu)位置與全局最優(yōu)位置，若較好，則將其保存為個體最優(yōu)位置或全局最優(yōu)位置，并跳轉(zhuǎn)至步驟2。

4 本文算法設(shè)計

4.1 基于自適應權(quán)重的PSO算法

經(jīng)典的PSO算法在解空間尋優(yōu)過程中可能會出現(xiàn)容易陷入局部極值、搜索精度低等問題。為了加快收斂速度、避免陷入局部最優(yōu)值，本文構(gòu)建了慣性權(quán)重與學習因子的動態(tài)變化公式，將固定參數(shù)轉(zhuǎn)換為非線性變換參數(shù)，以改善收斂的精度和速度。

步驟1慣性權(quán)重ω的自適應改進。慣性參數(shù)決定了粒子的歷史飛行狀態(tài)對當前飛行速度的影響力，對于在局部尋優(yōu)與全局尋優(yōu)間取得均衡具有重要意義。慣性權(quán)重應當與粒子種群狀態(tài)有關(guān)：在尋優(yōu)的初期，應當盡可能擴張每個粒子的搜索空間；在尋優(yōu)后期，應當逐步收斂至適應度值較好的區(qū)域，并進行精細搜索。其表達式為

式中，g為當前的迭代次數(shù)；a為慣性權(quán)重的最大值值，b為慣性權(quán)重的最小值；gmax代表迭代次數(shù)的最大值。

步驟2學習因子c1和c2的自適應改進。其中，是粒子自我認知的體現(xiàn)，用于對粒子自身知識進行總結(jié)；是粒子社會認知的體現(xiàn)，用于向表現(xiàn)更好的粒子學習；在尋優(yōu)初期，我們需要關(guān)注個體自我認識的能力，而后期則應注重個體獲取社會信息的能力。由此其表達式為

式中，g為當前迭代次數(shù)；gmax為最大迭代次數(shù)；e1和f1取值1，e2和f2取值2。

4.2 Dropout正則化

由于航跡數(shù)據(jù)在微觀上具備小幅震蕩特征。在這樣的前提下，如果LSTM模型的參數(shù)過多而訓練樣本不足時（這種情況極為常見），會誘發(fā)過擬合現(xiàn)象，表現(xiàn)為航跡圖像上的毛刺與震蕩，泛化性和準確性變差。為了解決這一問題，我們在LSTM模型中引入Dropout正則化層，其核心思想是在每輪訓練中令隨機部分LSTM單元暫時失活，使模型不再依賴于部分節(jié)點之間的耦合作用，如圖3所示。

圖3 PSO算法流程圖

Dropout層的算法步驟如下。

步驟1利用伯努利法設(shè)置激活概率ρ。設(shè)網(wǎng)絡(luò)的激活函數(shù)為Sigmoid函數(shù)，輸入為X=[x1，...，xm]，單元初始權(quán)重為W=[ω1，...，ωm]，則LSTM單元的激活值如下式所示。

式中，M為服從伯努利分布的掩模矩陣，其中每個元素為1的概率為ρ；b為偏置值。

步驟2通過ρ備份并刪除BiSRU網(wǎng)絡(luò)隱藏層中的部分單元，并進行本輪訓練。

步驟3恢復在步驟2中刪除的BiSRU網(wǎng)絡(luò)隱藏層單元。轉(zhuǎn)至步驟2，直至所有數(shù)據(jù)訓練完成。

4.3 基于PSO優(yōu)化的LSTM模型

將基于自適應權(quán)重的PSO算法與LSTM算法進行結(jié)合，構(gòu)建組合模型，如圖4所示。設(shè)目標飛行器第k個雷達航跡點特征Fk坐標輸入該模型的格式為

圖4 PSO-LSTM模型結(jié)構(gòu)圖

式中：Lngk為當前時刻點的經(jīng)度，Latk為當前時刻點的緯度，Heightk為當前時刻點的高度，t為當前時刻時間。

步驟1航跡數(shù)據(jù)預處理。包括坐標系轉(zhuǎn)換、重復航跡點剔除、缺失航跡點填充、異常值處理等步驟，并按7：3的比例切割為訓練集與預測集。

步驟2初始化粒子種群X。設(shè)置粒子群種群規(guī)模、迭代次數(shù)、初始速度與位置區(qū)間。

步驟3初始化粒子速度、位置。隨機產(chǎn)生一個X中粒子xi，0(α，ε，ρ)，其中，(α，ε，ρ)為粒子群的尋優(yōu)參數(shù)，α為LSTM層的隱藏層單元數(shù)；ε為學習率；ρ為Dropout層丟棄概率。

步驟4設(shè)置本文模型的誤差指標為適應度值，包含均方根誤差（Root Mean Square Error，RMSE）與平均絕對值誤差（Mean Absolute Error，MAE）兩種指標。其中，RMSE通常表示為真實值與預測值偏差值的標準差；MAE是絕對誤差的平均值，通常表示為偏差在樣本上的均值。對兩種指標的定義如下。

式中，n為航跡數(shù)據(jù)集內(nèi)樣本點數(shù)量；xi為第i個航跡樣本點的實際值；為第i個航跡樣本點的預測值。

步驟5根據(jù)適應度值變化，更新單個粒子的個體最優(yōu)位置與全局最優(yōu)位置，并更新自身的位置坐標與速度。

步驟6粒子群迭代更新，直至適應度值RMSE與MAE趨于穩(wěn)定，并確定尋優(yōu)參數(shù)(α，ε，ρ)數(shù)值。

步驟7將最優(yōu)參數(shù)輸入至LSTM網(wǎng)絡(luò)，訓練并進行預測。

5 仿真驗證與分析

5.1 實驗數(shù)據(jù)

為了證明模型的有效性，仿真實驗在某型多源信息融合系統(tǒng)仿真平臺上完成。我們選擇雷達數(shù)據(jù)集中的5000個包含正常值和異常值的連續(xù)航跡數(shù)據(jù)流進行預測。并使用BP神經(jīng)網(wǎng)絡(luò)、FC-LSTM算法與本文的PSO-LSTM算法進行對比實驗。

5.2 實驗結(jié)果分析

PSO-LSTM航跡預測模型初始參數(shù)設(shè)置如表1所示，尋優(yōu)參數(shù)范圍設(shè)置如表2所示。

表1 PSO-LSTM初始參數(shù)設(shè)置

表2 PSO-LSTM尋優(yōu)參數(shù)范圍設(shè)置

由圖5（a）可見，適應度值在26次迭代后趨于穩(wěn)定，可得到最優(yōu)解；由圖5（b）可見，LSTM隱藏層神經(jīng)元單元數(shù)量同樣在26次迭代后穩(wěn)定，最優(yōu)神經(jīng)元數(shù)量為25；由圖5（c）可見，學習率在11次迭代后趨于穩(wěn)定，最優(yōu)學習率為0.0087；由圖5（d）可見，Dropout層概率在40次迭代后趨于穩(wěn)定，最優(yōu)概率為0.45。

圖5 PSO優(yōu)化超參數(shù)變化曲線

由圖6與表3所示，PSO-LSTM航跡預測模型的RMSE為5.953121，相對于FC-LSTM模型降低了0.32，相對于BP模型降低了3.47；PSO-LSTM模型的MAE為4.841432，相對于FC-LSTM模型降低了0.65，相對于BP模型降低了3.06。說明PSO-LSTM模型相對于傳統(tǒng)算法改進了尋優(yōu)能力，在預測精準度與準確性上有所提升。

圖6 航跡預測效果圖

表3 不同預測模型評估指標

本實驗使用的計算機配置為AMD Ryzen 7 3700X8-Core Processor 3.60 GHz，Windows操作系統(tǒng)。實驗數(shù)據(jù)為人工生成，實驗使用Python語言在Pytorch平臺下訓練。

6 結(jié)語

本文提出了一種基于改進PSO優(yōu)化的LSTM航跡預測模型，利用PSO算法解決了LSTM網(wǎng)絡(luò)的自動參數(shù)尋優(yōu)問題，能夠降低人為因素對網(wǎng)絡(luò)的干擾，高效地實現(xiàn)重要超參數(shù)的自動調(diào)整。使用某飛行器數(shù)據(jù)進行實驗，本文模型相對傳統(tǒng)模型的RMSE與MAE值均有下降，證明了本文方法的有效性。