裴家正,黃勇,董云龍,陳小龍
(海軍航空大學,山東 煙臺 264001)
檢測前跟蹤(TBD,track-before-detect)是現今雷達系統對“低慢小”目標進行檢測的一類強有力方法。該方法不設置門限,能充分挖掘多幀原始雷達掃描數據,通過能量的積累提高信噪比,根據多幀信息對運動目標建立航跡跟蹤,進而檢測到目標的存在[1-2]。由于基于隨機有限集(RFS,random finite set)框架的多目標跟蹤具有避免數據關聯的理論優勢[3-4],眾多學者都將基于RFS 理論的TBD方法作為檢測前跟蹤領域的研究熱點。
多伯努利(MeMBer,multi-target multi-Bernoulli)濾波是Mahler[5]繼概率假設密度(PHD,probability hypothesis density)和勢概率假設密度(CPHD,cardinalized probability hypothesis density)濾波后[6],提出的另一種基于RFS 的多目標跟蹤方法。對于多目標非線性濾波,Vo 等[7]提出了MeMBer濾波,相較于上述2 種算法,該算法在濾波精度和計算復雜度方面都更有優勢。Vo 等[7]還針對MeMBer 濾波在更新過程中因對概率生成泛函數近似的不準確而導致的目標數目過估計問題進行了改進,即勢均衡多伯努利(CBMeMBer,cardinality balanced multi-target multi-Bernoulli)濾波。
平滑操作雖然消耗了更多的時間,但與濾波相比換來了估計精度的提升,目前已有將平滑思想應用到檢測前跟蹤中的理論驗證[9]。文獻[10-11]利用伯努利RFS 前向后向平滑進行建模,完成對單目標的跟蹤。伯努利前向后向平滑在提高伯努利濾波[12]對目標數目變化和目標狀態估計的精度的同時,也驗證了伯努利濾波前向后向平滑濾波的可行性。孫杰等[13]提出了基于多伯努利的平滑方法,提高了多目標場景下多伯努利RFS 的跟蹤性能。Wong 等[14]在地雜波背景下完成對道路機動車輛的平滑檢測前跟蹤,從而論證了前向后向平滑TBD 的可行性和性能優勢。
本文針對CBMeMBer-TBD 算法對目標的數目估計及狀態估計精度提高問題,提出了一種改進的基于勢均衡多伯努利平滑的多目標檢測前跟蹤方法。該算法在CBMeMBer 濾波的預測過程和更新過程之間加入多目標粒子群優化算法,使粒子向后驗概率密度較大的方向移動;后向平滑再次采用CBMeMBer 概率密度近似多目標一步平滑的概率密度,得到CBMeMBer 的平滑參數,繼而推算出多目標的CBMeMBer 平滑狀態。仿真實驗表明,在多目標機動運動的場景中,不同信噪比條件下所提算法的檢測性能均優于CBMeMBer-TBD。
假設多目標機動運動遵循協同轉彎(CT,coordinate turn)模型,k時刻共Mk個目標,第t個目標的運動狀態方程為


其中,α為轉彎角速度。
信息Zk包含N r×N d×Nb個分辨單元[9],即
對于脈沖多普勒雷達,k時刻一幀掃描的測量



針對Swerling 0 型目標模型而言,目標RCS 沒有起伏,復回波幅度的模為定值,即表示第t個目標在k時刻對周圍分辨單元的影響,是以為中心的區域;(i,j,k)單元處的觀測噪聲為復高斯過程,由均值為0、方差為σ2的高斯白噪聲的同向分量與正交分量組成。
第t個目標在(i,j,l)單元內的能量擴散函數[16-17]為

其中,ri、dj和bl表示(i,j,l)單元的距離、多普勒和方位信息;R、D和B表示距離、多普勒和方位單元的尺寸系數,分別與帶寬、積累時間和波束寬度有關;Lr、Ld和Lb分別表示每個觀測維度上的損耗系數;分別表示k時刻目標t所處的距離、多普勒和方位單元;表示t時刻目標k的強度信息。
借助以上觀測模型,目標似然函數可表示為[18]

其中,H0表示觀測單元沒有目標的假設,H1表示有Nk個目標的假設,g0表示沒有目標時(i,j,l)單元處噪聲的似然函數,g1表示存在Mk個目標時(i,j,l)單元目標加噪聲的似然函數[19],則有

其中,g0和g1服從式(11)和式(12)所示的高斯分布,N 表示高斯分布,得到似然比函數Lk為

同MeMBer 濾波一樣,CBMeMBer 濾波是對多目標貝葉斯濾波的多階矩近似,它根據多伯努利概率密度的參數(存在概率r及其概率密度分布p)描述多伯努利濾波的后驗概率密度,并不對利用多伯努利密度與多目標概率密度進行區分,近似表示為概率密度。但是與MeMBer 濾波不同的是,在更新過程中CBMeMBer 對概率生成泛函的近似值較MeMBer 濾波更加準確,不易產生勢偏差。
CBMeMBer 前向后向平滑濾波算法實質上是在傳統勢均衡多伯努利濾波算法的基礎上增加了(一步)平滑遞歸步驟,因此更多地利用了觀測信息。具體實施步驟如3.1 節和3.2 節所示。
對于單目標而言,其概率密度函數在伯努利隨機集框架下可表示為[20]

考慮到M個目標整體,概率密度函數則體現為多個單目標并集的形式,由參數集表示,即

1)預測
假設k-1 時刻后驗多目標概率密度是一個多伯努利RFS 形式Mk-1為k-1時刻濾波估計的目標航跡個數。多目標的預測密度依然為多伯努利的表示形式[12],且

2)更新
在k時刻,多目標預測密度以多伯努利RFS 表示為為預測的目標航跡數。則k時刻的后驗概率密度也是一個多伯努利形式[8],即

平滑是為了利用l時刻的數據溯前估計k時刻的狀態值(l>k)。給定一個從l到k的一步平滑的多伯努利密度參數。后向平滑遞歸可表示為[10-11]

其中,有

其中,pb表示目標新生概率,pS,k|l表示平滑過程中的目標存活概率,bk|k1-表示新生進程的空間分布函數,分別表示代入計算的輔助變量,沒有實際意義。
序貫蒙特卡洛(SMC,sequential Monte-Carlo),即粒子濾波采用序貫重要性采樣方法[21],根據粒子的權重近似估計后驗概率密度。為了克服迭代造成的權值退化,粒子濾波進行重采樣舍棄小權重,復制大權重,造成的最大問題就是粒子貧乏。當實際系統初始狀態未知,且粒子數目比較小時,沒有足夠數量的粒子分布在真實狀態附近,經過幾輪濾波,粒子難以收斂到目標狀態。當觀測信息非常準確時,似然函數的峰值將會變窄。更新后,只有小部分粒子權重增加,重要的粒子很可能在估計結果中丟失,并錯過良好的假設[22]。
為了解決3.3 節所描述的問題,本節將粒子群優化(PSO,particle swarm optimization)算法與勢均衡多伯努利平滑濾波相結合,改善粒子貧化的問題,增加粒子多樣性,提高粒子的使用效率,并將該方法應用到檢測前跟蹤場景。
粒子群優化算法是由Kennedy 等[23]提出的一種群體優化算法,通過粒子之間的相互信息尋求群體中的最優值。與粒子濾波中的粒子類似,算法需要初始化粒子集群,集群中的粒子都將代表尋優中最優值的可能位置,通過定義適應度目標函數,作為衡量最優值的標準,進行n次循環迭代,得出使目標函數值最大/最小的最優解。第k(k≤n)步按式(31)和式(32)來更新群體中每個粒子的狀態,將粒子移動至全局最優解周圍,提高整個粒子集群的適應度[24]。

在進行多目標優化跟蹤的步驟中,本文運用的是多目標粒子群優化(MOPSO,multi-object particle swarm optimition)。對于多個目標同時存在的情況,由于各個目標之間的沖突,往往對一個目標的最優解并不能滿足其他剩余目標最優解的要求,導致每一個目標的最優解只會陷入局部最優。多目標優化問題的設計關鍵在于將粒子引導、移動以求得非支配最優解集[25-26]。
MOPSO 依據多個目標函數篩選粒子,并依賴于NSGA-II 算法實現,NSGA-II 算法是常規遺傳算法上的改進[27],關鍵步驟介紹如下。
步驟1快速非支配的排序。每一個粒子的解都必須與粒子群中其他粒子的解進行比較,為根據粒子的非劣解水平對種群分層,從而得出支配關系,引導搜索向非支配最優解集方向進行。
步驟2個體擁擠距離的計算。計算擁擠距離便于將相同非支配層的粒子進行選擇性排序。同一非支配層中粒子j的擁擠距離disj[28]為

其中, disj+1,m、disj-1,m分別表示粒子j相鄰的j+1、j-1 粒子對第m個目標函數的函數值,fmax,m、fmin,m分別表示層中粒子對第m個目標函數的最大值和最小值。基于所有的適應度目標函數,都需要循環上述步驟,每一個目標函數擁有與之相對應的函數權重Wm,對所有的Wmdisj,m求和,得到粒子j的擁擠距離。
步驟3精英粒子的篩選策略。雖然經過式(31)和式(32)更新之后的粒子普遍擁有更高的適應度目標函數值,但是為了避免漏過未更新時函數值較高的粒子,有必要將更新前后的粒子合并為一個整體篩選。按照非支配排序從低到高、擁擠距離從大到小的順序,將2N大小的粒子篩選出新一輪的粒子種群,直到粒子群總數為N。為了避免陷入局部最優解,再加入變異機制增加粒子的多樣性。將粒子分為三部分,第一部分不變異,第二部分統一增加變異量,第三部分隨機增加變異量。
改進的勢均衡多伯努利平滑濾波器平滑濾波的過程如圖1 所示。
1)預測
假設k-1 時刻的后驗(濾波)密度參數以伯努利RFS 參數給出,為,其中,利用粒子[10]可表示為


圖1 改進的勢均衡多伯努利平滑濾波器平滑濾波的過程
則預測的伯努利參數為

對應的粒子狀態及權重按照式(38)和式(39)進行計算。

2)優化

步驟1父代種群粒子Pi經過式(31)和式(32)更新得到子代種群iQ,同時父代粒子的權重也傳遞給子代對應的粒子。
步驟2對Qi中的粒子進行變異操作。
步驟3將Pi和Qi合并,進行非支配排序。
步驟4運用式(33)和式(34)計算種群擁擠度。
步驟5篩選生成新的父代種群粒子Pi+1。
步驟6繼續利用Pi+1進行下一輪的優化操作,直到適應度函數值達到閾值Thpso。利用目標函數和目標函數權重Wn計算加權和,得到目標i中粒子j的最終目標函數 Fit(i,j),并根據目標函數值對粒子權重進行重新分配,而后進行歸一化處理,得到優化后的粒子權重

通過優化過程,粒子集在權重值更新前更加集中于高似然區域,從而解決了上一時刻重采樣導致的粒子貧乏問題。面對初始狀態未知的情形,借助優化過程,即使在粒子數較少的情況下,也同樣可以提高粒子的利用效率,從而進行準確估計。

為了保持粒子在平滑過程中的多樣性,此處更新完畢之后先不進行重采樣操作,等到平滑完成之后再進行。
4)平滑

5)航跡修剪與重采樣
對存在概率rk1|-l與修剪門限進行比較,只有大于門限的航跡才能被保留。同時還要解決粒子權值退化問題[21],所以對粒子集進行重采樣。

在重采樣之后,真實狀態附近大權重值的粒子將會被復制,數目增多。之后一直循環上述步驟,直到完成時間迭代。
實驗仿真主要針對多目標機動的脈沖雷達跟蹤場景,不考慮目標衍生的情況雷達位于原點處。探測區域設置為[0,2 000]m×[0,2 000]m,采樣間隔T=1 s,探測時間長度為100 s,并進行100 次蒙特卡洛仿真。傳感器可實時獲取探測區域內目標的位置和速度信息,觀測模型為CT 模型。假設在探測時間內,有多個目標在探測區域內做連續運動,目標強度p為目標功率,是目標復幅度取模的平方值。借此可以根據信噪比(本文設置為9 dB、7 dB 和5 dB)推導觀測噪聲方差。目標存活概率pS,k=pS=0.99,檢測概率pD,k=pD,具體賦值在下文進行詳細說明。表1 設定了各目標初始狀態及其起止時刻,其中,角速度為正則為順時針轉彎,為負則為逆時針轉彎。

表1 目標初始狀態及其起止時刻
為了描述簡便,仿真中將常規CBMeMBer-TBD 算法記為CB-TBD,結合平滑的CBMeMBer-TBD 算法記為SCB-TBD,結合粒子群優化和平滑的CBMeMBer-TBD 算法記為PSCB-TBD。
任意k時刻單個目標航跡i的生存粒子和新生粒子的粒子數設置區間為[300,1 000]。新生進程建模遵循多伯努利隨機集分布,其中,,新生進程的空間分布滿足高斯分布,新生進程的目標強度I1、I2、I3、I4分別是15~25 的隨機數。粒子群優化過程中,一個時刻k內的迭代次數gen=10,目標函數閾值Thpso=0.5。狀態提取過程中,設置航跡的修剪門限Thprune=10-3,最大航跡數目Tmax=100,航跡之間的合并距離D=4 m。
探測區域內,雜波服從泊松分布,每次掃描平均產生20 個雜波點,雜波密度λc=5 ×10-6個/m2。圖2 給出了表1 所列出的多目標實際運動狀態,圖中三角形表示目標的起始位置,正方形表示終止位置。
本文共設置了檢測概率PD分別為0.98、0.95和0.90 時在3 種信噪比場景(信噪比分別為9 dB、7 dB 和5 dB)下的仿真實驗。
當檢測概率PD=0.98時,3 種算法在不同信噪比場景下的目標數目如圖3 所示。從圖3 可以看出,三者都可以對目標數目進行較為準確的估計,結合圖3(a)和圖3(b),隨著信噪比的降低,相比于另2 種方法在第80 幀之后對目標數目的過估,PSCB-TBD 方法對目標數目的估計效果更好。從圖3 中細節處還可以看出,當目標數目變化時,2 種平滑TBD 算法都優于傳統的CB-TBD,但是PSCB-TBD 算法要優于SCB-TBD 算法。

圖2 目標真實的運動狀態
得益于100 次蒙特卡洛實驗的數據,在每一個測量時刻,都會產生對多目標數目的估計,進行求取標準差得到關于目標數目估計的標準差分布,如圖4 所示。
借助于蒙特卡洛仿真實驗,繼續計算每一時刻的OSPA 距離[30],如圖5 所示。從圖5 可以較為直觀地看出,PSCB-TBD 方法的OSPA 誤差在3 種算法中最低,從而證實了PSCB-TBD 算法的優越性。
當檢測概率PD=0.95時,隨機集理論受檢測概率的影響較大,如圖6 所示。隨著檢測概率的降低,3 種算法的性能都表現出不同程度的損失,但是算法之間比較來看,PSCB-TBD 依然是其中最穩定、性能最好的選擇,SCB-TBD 方法次之,CB-TBD 在信噪比逐漸降低時性能越來越不穩定并出現了目標數目過估計的情況。當PD=0.95時,目標數目估計標準差分布和OSPA 距離分布分別如圖7 和圖8 所示。

圖3 3 種算法在不同信噪比場景下的目標數目(PD=0.98)

圖4 目標數目估計的標準差分布(PD=0.98)

圖5 OSPA 距離分布(PD=0.98)

圖6 3 種算法在不同信噪比場景下的目標數目(PD=0.95)
當檢測概率PD=0.90時,3 種算法在不同信噪比場景下的目標數目、目標數目估計標準差分布和OSPA 距離分布分別如圖9~圖11 所示。由于雜波的影響,仿真過程中算法都出現了目標過估計的情況,具體而言,CB-TBD 方法的過估計情況最為嚴重,已經不能提供較為準確的目標估計,致使OSPA誤差距離過大,直接逼近截斷距離100 m。

圖7 目標數目估計標準差分布(PD=0.95)

圖8 OSPA 距離分布(PD=0.95)

圖9 3 種算法在不同信噪比場景下的目標數目(PD=0.90)

圖10 目標數目估計標準差分布(PD=0.90)

圖11 OSPA 距離分布(PD=0.90)

表2 3 種算法在不同信噪比和檢測概率下的標準差與OSPA 誤差均值
為了更加直觀地分析統計數據,本文將3 種算法在不同信噪比和檢測概率下的標準差與OSPA 距離分別按100 幀進行算數平均,其結果如表2 所示。根據表2 提供的數據可以很直觀地看出,隨著檢測概率和信噪比條件的降低,3 種算法的性能都有一定程度的下降,但是不同算法的性能損失情況不同,CB-TBD 算法的穩定性最弱,在仿真條件惡劣的情況下已經無法提供正確的檢測結果,SCB-TBD 算法性能稍好,相比較而言,PSCB-TBD算法最具穩定性,算法性能較前2 種算法更優異。
為了解決多機動目標的跟蹤問題,提高CBMeMBer-TBD 算法估計目標數目和狀態的精度,本文提出了帶多目標粒子群優化的SMC-CBMeMBer 平滑濾波器。仿真結果表明,粒子群優化算法的引入,使CBMeMBer 平滑濾波算法針對機動目標的收斂性能又有新的提升,使估計目標數目和位置的準確性得到了提高。同時,在不同檢測概率和信噪比條件下的對比結果驗證了本文算法的穩定性。下一步研究計劃將預測之后的粒子進行選擇性的優化,通過設定目標函數的閾值完成自適應的優化,并著重于提高粒子群優化算法應用于TBD 算法中的效率,節約計算成本。