高機動目標跟蹤ATPM-IMM 算法

2022-08-04 02:14:22曾浩母王強楊順平

通信學報 2022年7期

關鍵詞：模型

曾浩，母王強，楊順平

（1.重慶大學微電子與通信工程學院，重慶 400044；2.西南電子技術研究所，四川成都 610036）

0 引言

在以飛行器為載體的衛星通信收發機中，高精度的跟蹤系統能有效地克服天線平臺的運動、自身姿態的旋轉和平臺周圍的環境對衛星通信的影響，保證天線波束始終對準衛星，最終實現飛行器與衛星的穩定通信。但由于飛行器在運動過程中受到大氣流擾動、駕駛員控制等影響，飛行器的運動規律會隨時發生變化，甚至出現高機動運動，使飛行器丟失衛星的方位信息，最終導致通信質量下降甚至通信中斷。

因此，如何解決機動目標的跟蹤問題是目標跟蹤領域的難點，相關學者對此展開了廣泛的研究。對于非機動目標的跟蹤而言，基本卡爾曼濾波[1]、擴展卡爾曼濾波[2]、粒子濾波[3]等算法具有良好的跟蹤效果，這類算法一般采用一個狀態空間模型來描述目標的運動軌跡。但由于機動目標的運動軌跡比較復雜，很難通過單個狀態空間模型去描述機動目標的運動軌跡，因此基于高斯過程的狀態空間模型（GPSSM,Gaussian process state-space model）方法[4]和多模型方法[5]是常用的解決方法。其中，GPSSM方法能夠在目標跟蹤過程中在線學習目標運動模型[4]，從而提高系統運動模型和目標運動軌跡的匹配程度，最終提高濾波精度。而多模型方法使用多個狀態空間模型來共同描述目標運動軌跡。其中交互式多模型（IMM,interacting multiple model）算法是一種具有最佳成本效益的濾波算法，如果構造的系統運動模型和目標運動軌跡匹配，那么IMM 算法可以跟蹤任意機動目標。但基本IMM（CIMM,common IMM）算法以及結合非線性濾波器的改進算法[6-7]根據先驗信息將轉移概率矩陣（TPM,transition probability matrix）設定為固定的主對角占優矩陣[8]，從而導致模型切換滯后。此外，如果先驗信息不足或者不準確，使用固定的TPM 往往會導致目標狀態估計不準確，濾波性能下降，甚至算法失效[9]。

因此，如果能夠實現TPM 自適應調整，從而提高系統運動模型和目標運動軌跡的匹配程度，那么將會提高系統濾波精度，最終實現對機動目標的準確穩定跟蹤。文獻[10-11]根據模型后驗概率定義了轉移概率修正因子，從而實時修正TPM。部分學者利用跟蹤系統的似然函數來更新模型后驗概率，但由于在更新過程中進行了近似，從而導致模型匹配誤差[12]；此外，由于似然比不受限制，TPM的主對角元素不再占主導地位[13]，且算法的計算復雜度較高[13-14]。文獻[15-16]根據指數函數的非負單調性，利用模型后驗概率的變化率來實時修正TPM。文獻[17]通過模型誤差壓縮率來自適應調節TPM，從而增大匹配模型的概率。文獻[18]利用梯度的定義，根據當前時刻和上一時刻的模型后驗概率定義了轉移概率修正函數，然后利用該修正函數來修正TPM，從而實現TPM 自適應調整，但需要用到2 個CIMM 框架，導致系統結構復雜度增加了一倍。

上述對TPM的自適應調整都是對上一時刻的TPM 乘以一個修正因子，從而得到當前時刻的TPM，導致調整性不強。此外，上述方法對系統的先驗信息要求較高。如果先驗信息不足或者不準確，會導致系統的濾波性能下降。因此，本文基于貝葉斯框架，根據測量序列給出一種自適應TPM（ATPM,adaptive TPM）更新計算式，最終提出了一種在先驗信息不足或者不準確情況下的IMM 跟蹤算法，稱為ATPM-IMM 算法。仿真結果表明，本文算法的TPM和模型后驗概率的自適應效果更好，且濾波精度比現有算法高。

1 自適應TPM 更新策略

CIMM 算法假設不同模型之間的轉移服從已知轉移概率的有限態馬爾可夫鏈，從而r個模型的TPM 為

其中，πij表示從n? 1時刻模型Mi轉移到n時刻模型Mj的轉移概率，即

可以看出，CIMM 算法根據先驗信息使用固定的TPM，如果先驗信息不足或者不準確，使TPM初值和實際系統模型不符，最終會導致系統跟蹤失敗。此外，TPM 在整個跟蹤過程中固定不變，使TPM 在目標穩定運動階段和機動轉換階段是一致的，不能根據目標狀態實時調整，最終降低了系統跟蹤精度。

針對上述問題，本文根據測量序列對TPM 進行自適應更新，并將模型轉移概率建模為采樣時間n和測量序列Zn?1的函數

其中，Zn?1表示前n? 1個時刻測量值的集合，即Zn?1={z(1),z(2),…,z(n?1)}。在得到n時刻的測量值z(n)后，為了將πij(n? 1)遞推到πij(n)，本文定義了n? 1時刻TPM的后驗估計值πij(n? 1|n)，即

式(4)和式(5)的不同之處在于πij(n? 1|n)考慮了n時刻的測量值z(n)，所以πij(n? 1|n)可以被認為是n? 1時刻的模型轉移概率的后驗估計值。根據貝葉斯公式，πij(n? 1|n)可以進一步表示為

其中，合并概率μi|j(n? 1|n)定義為在已獲得測量序列Zn且n時刻模型Mj有效的條件下，模型Mi在n? 1時刻的概率，即

μj(n)表示在給定測量序列Zn的條件下，n時刻模型Mj的后驗概率，即

根據條件概率公式和全概率公式，合并概率μi|j(n? 1|n)可以進一步表示為

其中，似然函數Λij(n)的計算式為

其中，aij(n)和Aij(n)分別表示新息過程及其對應的協方差矩陣，表示求Aij(n)的行列式，符號“T”表示求一個矢量或者矩陣的轉置。

因此，πij(n? 1|n)的最終計算式為

為了得到n時刻的模型轉移概率πij(n)，需要建立πij(n? 1|n)和πij(n)的關系。πij(n)的定義為

由于很難得到模型Mi(n)到模型Mj(n+1)的轉移概率，因此認為對于同一測量序列Zn，從n?1時刻到n時刻的模型轉移概率是不變的，即

2 ATPM-IMM 跟蹤算法

將第1 節提出的TPM 更新策略應用到CIMM算法中，本文提出了一種跟蹤機動目標的ATPM-IMM 算法。其迭代步驟為：1) 混合概率計算；2) 模型交互；3) 并行濾波；4) 模型后驗概率更新；5) TPM 更新；6) 狀態融合輸出。ATPM-IMM算法原理如圖1 所示。

圖1 ATPM-IMM 算法原理

對于并行濾波器，以模型Mj(j=1,2,…,r)為例，根據標準卡爾曼濾波算法，給出ATPM-IMM算法的迭代過程。考慮以下線性馬爾可夫系統

式(16)和式(17)分別表示系統的狀態方程和測量方程，xj(n)和zj(n)分別表示n時刻的狀態矢量和觀測矢量；Fj和Hj分別表示狀態轉移矩陣和測量矩陣；wj(n)和vj(n)分別表示狀態噪聲和測量噪聲，兩者是互不相關的零均值高斯白噪聲序列，且滿足

其中，Qj(n)和Rj(n)分別表示狀態噪聲協方差矩陣和測量噪聲協方差矩陣。

1) 混合概率計算

根據混合概率μi|j(n? 1|n? 1)的定義，在已獲得測量序列Zn?1且n時刻模型Mj有效的條件下，模型Mi在n? 1時刻的概率為

3) 并行濾波

r個獨立的相同濾波器對各自輸入數據同時進行濾波處理，計算得到n時刻的狀態矢量(n|n)及其對應的估計誤差協方差矩陣Pj(n|n)和新息過程aj(n)及其對應的協方差矩陣Aj(n)。

其中，Λj(n)表示n時刻模型Mj的似然函數，其計算式為

5) TPM 更新

根據式(15)實現對模型轉移概率πij(n)的自適應更新。

6) 狀態融合輸出

計算n時刻狀態矢量的估計值x?(n|n)及其對應的估計誤差協方差矩陣P(n|n)，即

不同算法計算復雜度對比如表1 所示。

從表1 可以看出，文獻[16]算法和CIMM 算法的計算復雜度相差不大。文獻[18]算法由于利用了2 個CIMM 基本框架，導致計算復雜度大約為CIMM 算法的兩倍。ATPM-IMM 算法的計算復雜度略低于文獻[18]算法。

3 仿真分析

為了驗證ATPM-IMM 算法的跟蹤性能，本文在三維空間進行機動目標跟蹤實驗，并將本文算法和CIMM 算法、文獻[16]算法、文獻[18]算法的跟蹤性能進行比較。系統的狀態方程和測量方程分別如式(16)和式(17)所示。

為了對算法進行評價，本文采用位置濾波值的均方根誤差（RMSE,root mean square error）來評價算法性能，即

其中，(n)、x(n) 分別表示第m次蒙特卡洛實驗在n時刻x方向的位置估計值、位置真值，M表示蒙特卡洛實驗次數，RMSEx(n)、RMSE(n)分別表示n時刻x方向、三維空間的位置估計的均方根誤差，N表示跟蹤次數，ARMSEx、ARMSE分別表示x方向、三維空間的位置估計的均方根誤差的均值。

3.1 實驗設置

模型集包含3 個模型，①勻速（CV,constant velocity）直線運動模型；②勻加速（CA,constant acceleration）直線運動模型；③勻加速直線運動模型，該模型與模型②類似，但狀態噪聲協方差矩陣不同。CV 模型、CA 模型的狀態矢量均為x=，狀態轉移矩陣Fj根據物理運動方程得到，狀態噪聲協方差矩陣Q為

模型M1、M2、M3的狀態噪聲協方差矩陣分別為Q1=Q、Q2=Q、Q3=30Q。估計誤差協方差矩陣的初值Pj(0|0)均為 30I9×9，其中I9×9表示9 × 9的單位矩陣。由于觀測量為目標的位置坐標，因此觀測矩陣為

假設本文算法和CIMM 算法、文獻[16]算法、文獻[18]算法的TPM 初值均相同，模型后驗概率的初值也均相同，即

3.2 算法濾波性能對比

根據3.1 節的實驗設置，目標在3 個方向的運動軌跡如圖2 所示，其中圖2(a)表示真實軌跡，圖2(b)表示測量軌跡。

圖2 目標在3 個方向的運動軌跡

結合式(35)得到的位置估計的均方根誤差如圖3所示。圖3 表明算法開始時波動較大，然后才進入收斂過程。從圖3 中可以看出，本文算法的收斂后誤差明顯低于其他算法，說明本文算法能夠進一步降低濾波誤差，提高目標跟蹤精度。

圖3 位置估計的均方根誤差

進一步對圖3 數據進行分析，根據式(37)得到的位置估計的均方根誤差的均值如表2 所示。其中，測量值在3 個方向的濾波精度和空間位置精度分別為30.06 m、29.93 m、29.81 m、51.93m。

表2 位置估計的均方根誤差的均值

從表2 可以看出，4 種算法中本文算法的估計誤差最小，文獻[16]算法次之，CIMM 算法的估計誤差最大。本文算法相比于文獻[16]算法，在3 個方向的濾波精度分別提升了16.09%、18.35%、1.05%，而空間位置精度提高了11.32%。

本文通過算法運行時間來完成對算法計算復雜度的驗證。在處理器為 Intel(R) Core(TM)i5-8500、主頻為3 GHz的環境上運行MATLAB R2018b，不同算法執行一次的運行時間如表3 所示。從表3 可以看出，本文算法相對于其他算法在計算復雜度方面并無優勢，但4 種算法的運行時間都在微秒量級。

表3 算法運行時間對比

3.3 模型后驗概率初值對濾波性能的影響

假設模型M1和模型M2的后驗概率初值均為a，模型M3的后驗概率初值為1?2a。設定a在0.10 到0.45 內均勻變化，步進為0.05。其他參數和3.1 節的實驗參數設置保持一致。根據式(37)得到的算法位置估計的均方根誤差如圖4 所示。

圖4 模型后驗概率初值對濾波性能的影響

圖4 表明，對于不同的模型后驗概率初值，文獻[16]算法和文獻[18]算法的位置估計誤差受模型后驗概率初值的影響較大，而本文算法幾乎不受影響。這說明本文算法對模型后驗概率初值的要求不高，即使先驗信息不足或者不準確，也能夠自適應調整狀態空間模型的概率分布，從而提高系統運動模型和目標運動軌跡的匹配程度，降低跟蹤誤差。另外，雖然CIMM 算法也幾乎不受模型后驗概率初值影響，但濾波誤差遠大于本文算法。

3.4 TPM 初值對濾波性能的影響

TPM 初值b根據文獻[19]的設計策略來設置，其初值設置為

設定b在0.05 到0.95 內均勻變化，步進為0.05。其他參數和3.1 節的實驗參數設置保持一致。根據式(37)得到的算法位置估計的均方根誤差如圖5 所示。

圖5 TPM 初值對濾波性能的影響

從圖5 可以看出，4 種算法的位置估計誤差受TPM 初值的影響較大。當b小于0.8 時，本文算法的濾波誤差最小，即對于大多數TPM 初值，本文算法的濾波精度都比現有算法高。這說明本文算法對TPM 初值的要求不高，即使先驗信息不足或者不準確，也能夠實現TPM的自適應更新，從而提高系統運動模型和目標運動軌跡的匹配程度，最終提高濾波精度。

3.5 狀態噪聲對濾波性能的影響

圖6 不同Q 對濾波性能的影響

從圖6 可以看出，隨著狀態噪聲的增大，4 種算法的位置估計誤差都在增大。這是因為Q表征了系統運動模型和目標運動軌跡的不確定程度。如果Q越大，說明系統運動模型和目標運動軌跡的匹配程度越低，此時更加信任測量值，而對系統運動模型得到的預測值的信任度不高，所以4 種算法的位置估計誤差隨Q增大而增大。

對于高機動目標而言，系統運動模型和目標運動軌跡的失配度高，所以為了保證高機動目標的跟蹤效果，系統模型的狀態噪聲應該大一點，反之亦然。圖6 表明無論是高機動目標還是弱機動目標，本文算法的濾波誤差均比現有方法低。

3.6 測量噪聲對濾波性能的影響

圖7 不同R 對濾波性能的影響

從圖7 可以看出，隨著測量噪聲的增大，4 種算法的位置估計誤差都在增大，但和測量誤差相比，4 種算法的濾波性能均逐漸提高。另外，對于任意測量噪聲，本文算法的濾波誤差均比現有算法低，進一步說明了本文算法的優越性。

4 結束語

本文基于貝葉斯框架，利用測量序列，提出了一種自適應TPM的ATPM-IMM 跟蹤算法。該算法對于模型后驗概率和TPM的先驗信息要求不高，對高機動目標和弱機動目標跟蹤都適用，且空間位置估計精度比現有算法提升了11%左右。下一步工作將把 GPSSM 方法和本文算法相結合，利用GPSSM 方法在學習系統運動模型的同時跟蹤目標運動軌跡的能力，通過在線學習的方式提高系統運動模型和目標運動軌跡的匹配程度，進一步提高定位精度。