基于數據驅動的機動目標跟蹤

2024-10-19 00:00:00馬云紅李欣怡王澤霖曹天航王永坤

航空科學技術 2024年4期

摘要：目標跟蹤是進行目標精準打擊的關鍵，特別是對于機動目標的精確跟蹤可以提高對目標狀態的估計精度，從而實現目標的精確打擊任務。針對機動目標跟蹤問題，基于神經網絡理論，本文提出了基于數據驅動的機動目標跟蹤算法。通過生成大量不同機動方式運動的飛行數據，建立目標機動的數據樣本庫，采用基于雙向輸入的深度神經網絡，對大量不同的機動飛行數據進行訓練，生成不同機動軌跡的模型，通過軌跡序列數據與不同機動模型匹配，實現對任意機動目標的運動軌跡預測，進而實現對機動目標的跟蹤。仿真結果驗證了基于數據驅動進行目標跟蹤算法的有效性，提供了機動目標軌跡預測的新思路和新方法，提升了軌跡預測的時效和精度。

關鍵詞：神經網絡；數據驅動；機動目標；目標跟蹤；軌跡預測

中圖分類號：TN953 文獻標識碼：A DOI：10.19452/j.issn1007-5453.2024.04.013

基金項目：航空科學基金（2020002005300）

目標跟蹤技術在視覺導航和軍事偵察等領域具有廣泛的應用。目標跟蹤是以既定目標的觀測位置狀態作為參考，在后續時刻準確預測該目標的狀態，從而實現對目標的穩定跟蹤。對于機動目標跟蹤，多模型交互（IMM）算法是一種有效的算法，也得到一些學者的深入研究。BarShalom等[1]提出了將目標機動建模為目標狀態模型的切換，采用IMM算法來估計目標狀態，驗證了IMM算法比傳統濾波器效果更好。尹聚祺和趙楚楚等[2-3]提出了自適應交互式多模型算法，提高了模型集的自適應能力，優化了不同模型集的計算量。邵堃等[4]提出了一種自適應交互多模型算法，引入模糊邏輯算法計算機動檢測的可信度，利用目標的機動信息和模型的后驗概率動態調整模型集。呂鐵軍等[5]提出了一種基于角速度估計的自適應交互式多模型算法解決機動目標跟蹤。馬云紅等[6]提出了一種自適應轉彎率目標跟蹤算法，根據目標轉彎半徑和速度實時計算角速度，利用模型先驗概率變化的斜率實時校正概率轉移矩陣，減少了跟蹤誤差，提高了跟蹤的魯棒性。盡管這些IMM相關算法取得了較好的跟蹤效果，但仍然存在一定的局限，表現在目標的運動模型集包含的模型數量總是有限的，而目標的運動的狀態變化是連續的、無法窮盡的，有限的模型集合難以覆蓋目標所有的機動情況[7]，特別是當模型失配時就會導致跟蹤精度降低而失去跟蹤目標。另外，IMM算法是通過先前時刻的觀測估計得到的模型，預測模型滯后于目標當前的實際運動狀態，因此產生的由概率轉移矩陣控制的運動模型切換，不能消除模型滯后帶來的誤差。傳統方法往往是根據當前目標信息進行一步估計，難以從全局的角度挖掘目標的運動規律。神經網絡因其強大的學習能力[8-11]成為解決復雜模型學習的有效解決手段，用于不確定模型的預測和模型識別。然而，由于訓練數據的科學性以及神經網絡的網絡結構和參數難以確定，對于目標機動軌跡的復雜特征仍然存在巨大挑戰[12]。

為此，本文提出基于目標軌跡數據驅動的深度神經網絡學習方法，提高機動目標軌跡預測的準確性，從而實現對機動目標的精確跟蹤。算法通過生成大量的在目標機動性能約束內的任意的機動方式的小的軌跡段，通過時間窗重疊的拼接，完成對任意的機動軌跡段隨機組合，達到模擬任意機動軌跡的目的，經過神經網絡的訓練，可以快速匹配機動模型，并進行狀態預測，實現機動目標快速跟蹤。

1 生成機動軌跡數據集

采用神經網絡學習方法進行目標機動的模型預測，需要大量的訓練數據。而飛行器的每一次實際飛行要耗費大量的人力物力，也難以完成所有的機動組合，因此難以獲得充足的機動目標軌跡真實數據。本文通過選擇不同的目標運動狀態方程模擬目標的運動模型，生成機動目標軌跡數據，獲取訓練數據并構建充足的軌跡數據庫。

1.1 目標運動狀態空間模型

1.2 機動軌跡生成器

由于不同的運動模型對應不同的狀態轉移矩陣，給定了初始狀態、系統噪聲、量測噪聲和狀態轉移矩陣，可以根據式（1）生成任意的機動軌跡段。本文假設雷達為機場監控雷達，其探測半徑為0～30km；目標的速度不超過聲速（0～340m/s）；飛行器的轉彎角速率在-15～15（°）/s之間，轉彎角速率定義為目標左轉彎時為正，目標右轉彎時為負，轉彎率變化的最小分辨率為0.1（°）/s。由此生成任意的目標機動軌跡，將這些軌跡數據存儲到數據庫，作為訓練深度神經網絡的數據集。

1.3 適用于神經網絡訓練的軌跡樣例生成

基于以上參數，利用軌跡生成器生成用于深度神經網絡訓練的軌跡段數據和對應的雷達測量數據。軌跡生成器通過設定不同的轉移矩陣，包含多個運動模型，為網絡訓練提供充足的含有目標機動信息和量測噪聲特征的數據源。

2 基于數據驅動的深度神經網絡訓練

循環神經網絡（RNN）能夠記憶序列化的數據，機動目標軌跡就是一系列的時序數據。因此選擇基于RNN及其衍生的改進神經網絡模型作為設計適用于機動目標軌跡識別的深度神經網絡模型，實現基于數據驅動的機動目標在線跟蹤。Mike Schuster提出了一種雙向RNN模型（Bi-RNN），包含正向網絡模型及反向網絡模型，采用前后向兩個獨立網絡進行歷史信息輸入[13]，用來自序列兩端的信息來估計輸出，比單層RNN模型的訓練效果更穩定。選用Bi-RNN神經網絡進行軌跡模型的訓練和學習。

與傳統的基于模型的跟蹤算法不同，基于數據驅動的深度神經網絡機動目標跟蹤是基于經過離線訓練的深度神經網絡（DTN）來跟蹤機動目標沒有多模型跟蹤算法中的機動檢測和模型匹配過程，避免了估計延遲。算法包括訓練和在線跟蹤階段，如圖1所示。

目標跟蹤算法主要有以下幾個步驟：（1）軌跡映射模塊將軌跡數據庫中的軌跡段的雷達測量數據處理為適合DTN學習的輸入輸出；（2）在訓練階段，以均方根誤差作為損失函數訓練學習軌跡段的運動模型；（3）在跟蹤階段，采用相同步驟處理雷達實時測量數據，由訓練后的DTN網絡預測殘差修正UKF的狀態估計；（4）進行軌跡重建和解映射完成對目標機動軌跡的在線跟蹤。

2.1 基于NACT-UKF的軌跡映射和解映射

軌跡映射模塊基于已經建立的軌跡段數據庫。由于雷達量測的目標距離的數值遠遠大于目標方位角的數值，采用原始數據時距離信息的數值量級遠遠大于方位角的信息數量級，而且不同軌跡段的數據變化范圍大，也容易帶來神經網絡學習效果不佳。另外，網絡輸入層中單元的激活函數會落入零梯度區域（飽和區域），阻礙了該單元對損失函數的反向學習過程。為此，本文設計了一種基于自適應轉彎率無跡卡爾曼濾波算法（NACT-UKF）的軌跡映射器，將軌跡的雷達量測數據轉換為適合神經網絡訓練的輸入數據，使神經網絡快速收斂。

軌跡映射的步驟如下：（1）從軌跡數據庫中取得一對軌跡段的雷達測量值；（2）通過NACT-UKF算法對雷達量測值進行一次濾波估計，NACT為轉彎率自適應算法，UKF將雷達觀測空間的輸入數據轉換到目標狀態空間，得到目標狀態空間的估計數據；（3）對軌跡段狀態估計數據輸入進行歸一化，作為深度神經網絡的輸入；（4）軌跡段實際量測數據經過軌跡映射模塊得到映射后的量測值；（5）基于軌跡映射數據，根據式（5）計算殘差并作為神經網絡的輸出。

在軌跡數據庫中用于訓練網絡的軌跡片段為10s，即深度神經網絡的分段輸出為10s。為了保證跟蹤效果，將重疊片段設置為9s，假設測試算法的軌跡為100s，則在線跟蹤過程如圖3所示。在整個跟蹤過程中，通過滑動窗口依次獲得10s的輸入數據，送入DTN網絡中進行修正，將修正后的軌跡進行重構，最后通過式（7）進行解映射得到跟蹤結果。圖3給出了流程示意圖。

4 基于數據驅動的目標跟蹤仿真

4.1 DTN網絡參數

構建10萬條軌跡數據用于網絡訓練。將軌跡數據分為兩部分，即數據的85%作為訓練數據用于訓練網絡，其余15%作為測試數據用于測試神經網絡估計性能，訓練回合為20000次。分別選擇GRU網絡層數為1～5，以網絡節點數為32、64、128、256進行試驗，通過試驗確定合適的網絡層數和網絡節點數。試驗結果得出，DTN結構為三層，網絡節點數為128時，輸出的跟蹤誤差最小，選用BiGRU和一層全連接的輸出層構成，其中輸出層的網絡節點數為4，BiGRU的網絡節點數為128，并采用階梯遞減學習速率（StepLR）作為學習率調整策略，初始學習率為10-2，更新步長為100，更新學習率的乘法因子為0.65。

4.2 跟蹤弱機動目標的仿真驗證

4.2.1 弱機動目標跟蹤

本組仿真用于驗證算法在跟蹤弱機動目標場景下的跟蹤性能。測試軌跡為3條，其參數見表1。目標初始狀態為[xyx？y？]，分別為二維平面的位置和速度信息。 T1、T2、T3分別表示三個不同的軌跡段數據，表示三個不同的弱機動目標10s內的軌跡信息。T1目標勻速運動，T2進行左轉彎運動，T3目標進行右轉彎運動。采用了不同跟蹤算法，得到跟蹤誤差，見表1。圖4為勻速直線運動的跟蹤軌跡，圖5為左轉彎跟蹤軌跡，圖6為右轉彎跟蹤軌跡。仿真結果可以看出DTN算法在跟蹤勻速直線、左轉彎和右轉彎的目標時的跟蹤誤差都明顯小于EKF算法，略小于UKF算法。但是DTN的跟蹤軌跡相較于UKF算法更平滑，也更接近目標的運動軌跡。

4.2.2 跟蹤強機動目標的仿真驗證

目標進行強機動時無法獲知目標正在進行哪種運動模型的運動以及何時會發生運動模型切換，采用DTN可以規避這種不足。將DTN算法與文獻[6]提出的自適應轉彎率的IMM算法（NACT-IMM）進行比較，針對三組軌跡算例進行了1000次的蒙特卡羅試驗。分別選擇最大機動的位置進行比較。最大機動位置的誤差數據見表2，軌跡T4的結果跟蹤效果如圖7所示，軌跡T5的仿真結果如圖8所示，軌跡T6的仿真結果如圖9所示。從仿真結果可以看出，采用基于數據驅動的DTN算法跟蹤誤差更小。而且DTN的仿真計算時間為24.8ms，顯著小于NACT-IMM的時間為74.7ms。

5 結束語

本文提出了一種基于數據驅動的機動目標跟蹤算法。算法主要通過軌跡生成器生成大量可能的目標機動運動的軌跡數據，再基于生成的目標軌跡數據進行神經網絡學習訓練，得到可以進行軌跡預測的神經網絡。實際軌跡數據數據輸入神經網絡，神經網絡給出軌跡模型預測殘差并進行修正，實現在線機動目標位置的預測，完成目標跟蹤。由于數據驅動來自大量的軌跡生成，大量的軌跡數據可以充分包含目標的機動運動模型，從而快速實現目標軌跡預測。本文進行了基于數據驅動的神經網絡的目標跟蹤算法和傳統目標跟蹤算法的仿真比較，仿真結果顯示，基于數據驅動的神經網絡目標跟蹤效果優于傳統的目標跟蹤算法，有效地規避了傳統模型預測的時延問題。本文采用的深度學習神經網絡進行目標軌跡跟蹤，進行了軌跡段的重構，重構的重疊段對跟蹤精度的影響可以進一步深入研究。

參考文獻

[1]Bar-Shalom Y， Chang K C.Tracking a Maneuvering Target Using Input Estimation Versus the Interacting Multiple Model Algo‐rithm[J].IEEE Transactions on Aerospace Electronic Systems， 1989， 25（2）：296-300.

[2]尹聚祺，楊震，羅亞中，等.空間機動目標跟蹤的改進自適應IMM算法[J].系統工程與電子技術， 2021， 43（12）：3658-3666. Yin Juqi， Yang Zhen， Luo Yazhong， et al. Improved adaptive IMM algorithm for space maneuvering target tracking， [J]. Systems Engineering and Electronics， 2021，43（12）： 3658-3666.（in Chinese）

[3]趙楚楚，王子微，丁冠華，等.基于模糊邏輯的改進自適應IMM跟蹤算法[J].信號處理， 2021， 37（5）：724-734. Zhao Chuchu， Wang Ziwei， Ding Guanhua， et al. Fuzzy-logic adaptive IMM algorithm for target tracking[J]. Journal of Signal Processing， 2021，37（5）：724-734. （in Chinese）

[4]邵堃，雷迎科.基于模糊邏輯和機動檢測的AGIMM跟蹤算法[J].空軍工程大學學報（自然科學版），2020，21（4）：80-87. Shao Kun， Lei Yingke. AGIMM tracking algorithm based on fuzzy logic and maneuvering detection[J].Journal of Air Force Engineering University （Nature Science Edition），2020，21（4）： 80-87. （in Chinese）

[5]呂鐵軍，蔣宏，丁全心，等. 基于角速度估計自適應的IMM目標跟蹤算法[J].航空科學技術， 2012（1）：74-77. Lyu Tiejun， Jiang Hong， Ding Quanxin， et al. Turn rate-based adaptive interactive multiple-model target tracking[J].Aeronau‐tical Science Technology， 2012（1）：74-77. （in Chinese）

[6]Ma Yunhong， Wang Zelin， Zhang Yimin， et al. Maneuvering target tracking based on adaptive turning rate interactive multiple model[C]. 2022 IEEE 17th International Conference on Control Automation （ICCA），2022.

[7]彭章友，陳琳妍.基于BPNN的自適應機動目標跟蹤[J].電子測量技術，2019，42（15）：29-34. Peng Zhangyou， Chen Linyan. Adaptive maneuvering target tracking based on Back propagation neural network[J].Electronic Measurement Technology， 2019， 42（15）： 29-34. （in Chinese）

[8]Liu Jingxia， Wang Zulin， Xu Mai. Deep MTT： A deep learning maneuvering target-tracking algorithm based on bidirectional LSTM network [J]. Information Fusion， 2020， 53：289-304.

[9]洪培欽，羅靈鯤，劉冰，等.引入輕量注意力的孿生神經網絡目標跟蹤算法[J].計算機工程與應用， 2022， 58（12）：112-121. Hong Peiqin， Luo Lingkun， Liu Bing， et al. Siamese neural network target tracking algorithm with lightweight attention[J]. Computer Engineering and Applications，2022， 58（12）：112-121.（in Chinese）

[10]宋婷，賀豐收，程宇峰. 深度學習技術在雷達目標檢測中的研究進展[J].航空科學技術， 2020， 31（12）：12-20. Song Ting， He Fengshou， Cheng Yufeng. Research progress of deep learning technology in radar target detection[J]. Aeronauti‐cal Science Technology，2020， 31（12）：12-20. （in Chinese）

[11]武天才，王宏倫，劉一恒，等. 基于深度學習的飛行器故障情況下可配平能力快速預示方法[J].航空科學技術， 2023，34（2）： 72-77. Wu Tiancai， Wang Honglun， Liu Yiheng， et al. Fast prediction method of aircraft trim capability under actuator faults based on deep learning [J]. Aeronautical Science Technology， 2023， 34（2）：72-77. （in Chinese）

[12]徐西蒙，楊任農，于洋，等.基于運動分解和H-SVM的空戰目標機動識別[J].控制與決策， 2020， 35（5）： 1265-1272. Xu Ximeng， Yang Rennong， Yu Yang， et al. Target maneuver‐ing recognition in air combat based on motion decomposition and H-SVM[J].Control and Decision， 2020，35（5）： 1265-1272.（in Chinese）

[13]Schuster M， Paliwal K K. Bidirectional recurrent neural net‐works[J]. IEEE Transactions on Signal Processing， 1997， 45（11）：2673-2681.

Maneuvering Target Tracking Based on Data-driven

Ma Yunhong1， Li Xinyi1， Wang Zelin1， Cao Tianhang1， Wang Yongkun2

1. Northwestern Polytechnical University，Xi’an 710072， China

2. AVIC Leihua Electronic Technology Research Institute， Wuxi 214063， China

Abstract： Target tracking is the key to accurate target strike， especially for maneuvering targets， which can improve the estimation accuracy of target state and achieve precise target strike tasks. This paper proposes a data-driven maneuvering target tracking algorithm based on neural network theory for the tracking problem of maneuvering targets. By generating a large amount of flight data with different maneuvering modes， a data sample library for target maneuvering is established. A deep neural network based on bidirectional input is used to train a large amount of different data， generate models of maneuvering trajectories， and match trajectory sequence data with different maneuvering models to achieve trajectory prediction for any maneuvering target， thereby achieving tracking of maneuvering targets and effectively improving the tracking accuracy of maneuvering targets. The simulation results validate the effectiveness of data-driven target tracking algorithms， provides new ideas and methods for predicting maneuvering target trajectories， and improves the timeliness and accuracy of trajectory prediction.

Key Words： neural networks； date-driven； maneuvering target； target tracking； trajectory prediction

航空科學技術2024年4期

航空科學技術的其它文章: 復雜背景下空中小目標動態紅外成像仿真技術研究; 誤差狀態卡爾曼濾波的視覺慣性自適應融合定位方法研究; 人工神經網絡在飛機下沉速度控制中的應用; 全電高速無人直升機電池風冷散熱能力研究; 基于模型預測控制的翼傘航跡跟蹤; 結構調制型長周期光纖光柵溫度傳感器研究