基于標簽多貝努利多傳感器組網目標跟蹤算法

2021-05-31 11:21:56楊超群

系統工程與電子技術 2021年6期

關鍵詞：融合

胡琪, 楊超群

(中國電子科技集團公司第十四研究所, 江蘇南京 210000)

0 引言

目標跟蹤的本質是根據探測器獲得的目標信息來估計目標的狀態,包括目標起始、消亡、衍生、機動、監測區域目標個數等。目標狀態估計的精度和穩定性不僅是整個探測系統的核心,也是評判探測系統最重要的指標之一。特別對于承擔較大監測范圍內或復雜電磁環境條件下的多目標跟蹤任務的雷達,由于單個雷達的最大作用范圍和波束資源有效,通常采用多個雷達組網的形式獲取目標多全方位、多維度目標信息,以達到增大系統整體的探測距離、融合抗干擾、提高目標狀態估計的精度和穩定性等目的。

多個雷達探測信息參與目標狀態估計屬于多傳感器融合目標跟蹤的范疇。多傳感器融合根據處理架構的不同大體上分為3種形式,分別為集中式融合,分布式融合和混合式融合。其中集中式融合因其目標信息損失小、貝葉斯建模融合框架構建簡單、工程實現簡單等優點備受國內外學者關注。此外,對于目標點跡級融合來說,需要把所有傳感器獲得的目標點跡傳送到融合中心進行處理,天然地適用于集中式融合的框架。點跡級集中式融合框架下的目標跟蹤算法大多是單傳感器目標跟蹤算法擴展到多目標跟蹤算法。例如,將最近鄰(nearest neighbor, NN)算法推廣到集中式多傳感器NN(centralized multi-sensor NN, CMS-NN)[1-3];將全局NN算法引申到集中式多傳感器全局NN(centralized multi-sensor global NN, CMS-GNN)[4];概率數據關聯(probabilistic data association,PDA)算法被改造適用于多傳感器目標跟蹤環境[5-6];多假設跟蹤(multiple hypothesis tracking,MHT)算法也被成功運用到多傳感器系統中[7-8]。然而,上述算法理論上均不能解決數目變化的多目標跟蹤建模問題,因此引入隨機有限集(random finite set,RFS)思想來描述多目標跟蹤場景[9-15]。同樣地,RFS框架下的單傳感器多目標跟蹤問題也被嘗試運用到多傳感器場景中。概率假設密度(probability hypothesis density,PHD)框架分別運用迭代修正和多項乘積的思想提出了多傳感器迭代修正PHD(iterated corrector PHD, IC-PHD)濾波算法[16-19]和乘積形式的多傳感器PHD (product multi-sensor PHD, PM-CPHD)濾波算法[20-23]。此外，標簽多貝努利(labelled multi-Bernoulli,LMB)框架[24-25]也初步探索應用于多個傳感器數據級融合,提出了多傳感器廣義LMB(multi-sensor generalized LMB, MS-GLMB)算法[26-30]。基于RFS理論的算法最大優勢在于能對探測區域內目標數進行建模并實時給出估計,然而上述RFS框架算法均假設目標同時落入多個雷達的探測范圍內,即無法有效疊加不同探測器探測距離,導致目標數估計出現偏差。

本文針對數目變化的不同探測距離的多傳感器組網目標跟蹤問題,提出了一種基于LMB框架的多傳感器組網目標跟蹤算法。該算法將每個傳感器的威利范圍引入到目標建模中,得到適用于不同探測距離多傳感器組網MS-GLMB(different detection range MS-GLMB,DDR-MS-GLMB)算法。仿真結果表明,該算法能有效疊加不同探測距離的多部雷達,使得多部雷達組網系統的探測范圍得到有效疊加,不僅能穩定地獲取有效范圍內的目標狀態,還能捕捉目標新生、消亡等關鍵時間,實時地給出準確的目標數估計。

本文的具體章節安排如下,引言部分給出了基礎多傳感器組網目標跟蹤算法的研究背景和研究意義。第1節簡單介紹了相關的RFS理論。第2節詳細闡述了DDR-MS-GLMB推導過程和算法基本處理流程。最后給出了仿真分析性能對比和結論。

1 基于標簽RFS目標跟蹤算法研究現狀

1.1 GLMB

Vo提出的GLMB濾波算法將目標的狀態和標簽空間相融合,是基于RFS理論的全貝葉斯跟蹤器。不同于PHD、CPHD等濾波器只對狀態進行建模,GLMB還對目標身份屬性設置靜態標簽,即

Xk={xk,1,xk,2,…,xk,Nk}∈F(X×Lk)

(1)

式中,RFS集合Xk表示k時刻所包含的所有目標狀態;帶標簽的目標狀態向量具體形式為xk,Nk=(xk,lk)∈X×Lk;F表示帶標簽的目標狀態向量的狀態空間;xk和X分別表示不帶標簽的目標狀態值和相應的狀態空間;lk和Lk分別表示目標靜態標簽和相應的標簽空間,靜態標簽lk=(k,i)中k表示目標的新生時刻,而i表示k時刻新生多個目標的序號。標簽的構造能保證不同目標之間具有不同的標簽,標簽在整個濾波過程中動態分配給不同目標,目標標簽一旦被給定,則在該目標的整個生存時間內不再改變。此外,標簽隨機集濾波一些通用符號如下:

(2)

(3)

根據隨機集積分規則[22],集合X中多個目標狀態相對實數函數h的集積分可以簡化為一個指數形式函數hX=∏x∈Xh(x),如果集合為空,則hφ=1。兩個函數的內積可以表示為

1.2 MS-GLMB

MS-GLMB傳感器的貝葉斯框架建模為

(4)

(5)

給定上一時刻后驗概率密度函數和當前時刻的量測似然函數，基于式(4)中貝葉斯濾波框架得到當前時刻濾波后的概率密度函數形式為

πk(X)=

(6)

Θ=Θ(1)×Θ(2)×…×Θ(S),

θ=(θ(1),θ(2),…,θ(S))∈Θ

(7)

(8)

(9)

(10)

lBk(l)pB,k(·,l)

(11)

(12)

式中,下標+表示映射θ(s)(·)θ(s)(·)≥0中的情況;I+表示濾波后所有存活目標的標簽集合;I表示濾波前所有可能目標的標簽集合。值得注意的是,式(6)和式(4)具有相同的形式,表明整個濾波過程滿足貝葉斯估計共軛先驗的基本要求。

2 DDR-MS-GLMB濾波算法

基于LMB多傳感器濾波算法需要在多個傳感器中找到每個目標對應的量測(存在漏檢、虛警等情況),然后再統一計算所有量測分配情況的似然情況。這就意味著算法建模伊始即假設目標都落在每個傳感器的探測范圍內,如式(10)所示。如若目標不在探測威力范圍內,則找不到對應傳感器的量測,該傳感器的量測分配情況則一直是漏檢,會影響整個量測分配情況似然權值的計算,繼而影響目標狀態估計和監測區域目標數估計情況。因此,必須把目標是否在探測威力范圍這一重要因素納入到似然權值的計算中。

仍然假設有S個傳感器,每個傳感器的自身位置和探測范圍分別為(ST(j),DT(j)),j=1,2,…,S,目標i是否在傳感器探測范圍內可用如下公式表示:

(13)

式(13)表明,如果目標i存在于傳感器j的探測范圍內,則indi, j為1,否則為0。對于m個目標S個傳感器可建立傳感器指示矩陣:

IM(m,S)=

(14)

式中,i=1,2,…,m。

(15)

(16)

式中,第一種情況表明目標存活(包括目標漏檢或目標量測更新),第二種情況表明目標消亡。

若直接從矩陣γ中尋找使權值(見式(15))最大的分配情況,則難免遇到非確定多項式問題。為此,可以基于矩陣γ構建多目標后驗狀態采樣分布,用采樣的方法來避免高維矩陣最優化問題。首先,對矩陣γ中的P個目標定義P個元,即

(17)

式(17)中4種情況的定義域分別為

(1) 1≤i≤R,(j(1),j(2),…,j(S))任意數小于0;

(2) 1≤i≤R,(j(1),j(2),…,j(S))全部大于或等于0;

(3)R+1≤i≤P,(j(1),j(2),…,j(S))任意數小于0;

(4)R+1≤i≤P,(j(1),j(2),…,j(S))全部大于或等于0。

(18)

若當前目標不在某一個傳感器探測范圍內,理論上該傳感器就不會采集到包含該目標的量測。在原始的MS-GLMB算法中,若該傳感器一直無法獲得該目標量測,會判定該目標在當前傳感器一直處于漏檢測的狀態,造成目標計算出的權值偏小,最終導致傳感器較難快速發現目標。特別是當組網范圍內存在多個目標時,這種權值計算結果與實際情況不匹配的情況尤為嚴重。當一目標處在較多傳感器探測威力交叉的范圍內時,該目標權值較大。而當目標只處在一個傳感器探測范圍時,該目標的權值相對于多個傳感器探測到目標顯得更小,導致較難被Gibbs采樣獲取到,因此需要更多的樣本才能解決該問題,但這會造成更重的計算負擔。

本文利用前面得到的傳感器指示矩陣,將目標相對于每個傳感器范圍的情況帶入到該權值計算公式,即若目標(·,l)超出傳感器的探測范圍,則

(19)

若目標不在目標的探測范圍內,該權值為1,相當于不納入該傳感器對該目標的影響,隨后提供給Gibbs采樣器權值所代表的目標量測空間概率分配更為合理,最終濾波器得到的結果也更為準確。

根據式(17)中定義的元,式(6)中目標后驗概率分布可重寫為

(20)

(21)

(22)

式中,γi代表第i個目標j(1),j(2),…,j(S)值的選取情況。

直接從式(20)的概率分布中采樣是很困難的,需要基于該概率分布來構建合適的馬爾可夫鏈使采樣過程快速收斂到正確值[27]。一般情況下,可以遵循以下馬爾可夫鏈的構建形式,即

πk(γ′|γ)=

(23)

輸入: γ(1),T,P,S,ηi=ηi((j(1),j(2),…,j(S))),i=1,2,…,P,|Z(s)|,s=1,2,…,Sm:=[-1;…,:-1];p:=ηi(γi)for (j(1),j(2),…,j(S))=(0,…,0):(|Z(1))|,|Z(2))|,…,|Z(S)|) m:=[m;[j(1),j(2),…,j(S)]]; end for t=2:T γ′k=[ ]; for n=1:P for(j(1),j(2),…,j(S))=(0,…,0):(|Z(1))|,|Z(2))|,…,|Z(S)|)pn(j(1),j(2),…,j(S)):=ηn(j(1),j(2),…,j(S)) ∏Ss=1(1-1{1:|Z(s)|}(j(s))1{γ′1:n-1,γt-1n+1:P}(j(s))) end γ′n～Categorical(m,pο); γ′k+1:=[γ′ο,k+1;γ′ο,n] end γ(t)=γ′k; End輸出: γ(1),γ(2),…,γ(T)

其中,T表示采樣器需要采樣樣本的個數,|Z(s)|表示傳感器s量測集合的元素個數。

3 實驗仿真

為了驗證所提DDR-MS-GLMB濾波器的有效性,設計如下仿真場景:設置5個傳感器不同站址的布局以及檢測區域內存在多個數目變化的目標,5個傳感器的位置分別為

S1=[-280 519,137 705]T

S2=[109 091,275 410]T

S3=[140 260,0]T

S4=[-265 935,-59 016]T

S5=[-46 753,-334 426]T

其中,每個傳感器檢測目標的概率均設為0.6,傳感器笛卡爾坐標系位置的單位為m,每個傳感器的有效半徑均為40 km。每個傳感器的虛警率設置為極坐標環境下每5°和每50 m的區域內為0.1%(每個傳感器監測區域內每時刻產生雜波個數的泊松期望值大約為58),傳感器的采樣周期為5 s,每個傳感器的周期誤差為隨機的0.1～0.3 s。具體情況如圖1所示。

圖1 目標真實軌跡、站址分布及各自威力范圍Fig.1 Target real track, station location distribution and their respective power range

9個目標的出發時間和位置設置如下所示。

m1=[-20 000,8,-40 000,32]T,ts=1,te=100

m2=[-40 000,-8,-20 000,32]T,ts=10,te=110

m3=[-20 000,8,40 000,-32]T,ts=20,te=120

m4=[-20 000,-10,-40 000,30]T,ts=30,te=130

m5=[-20 000,-10,-40 000,30]T,ts=40,te=140

m6=[40 000,-32,-20 000,0T,ts=50,te=150

m7=[40 000,-16,-20 000,-16]T,ts=60,te=160

m8=[-20 000,35,40 000,30]T,ts=70,te=170

m9=[-20 000,-8,40 000,-35]T,ts=80,te=200

仿真實驗結果如圖2和圖3所示。從圖2中可以看出,本文提出的DDR-MS-GLMB算法能準確估計目標的個數,這得益于該算法實時計算目標是否在傳感器的威力范圍內,準確建模目標是漏檢還是超出探測范圍,據此來動態調整目標權值的計算方式,更能反應真實情況。而原始的MS-GLMB算法由于開始假設所有目標落在傳感器探測范圍內,目標只有漏檢和消亡兩種情況,無法準確計算目標權值,最終導致目標嚴重漏估。圖3中MS-GLMB算法最優次模式(optimal sub-pattern assignment, OSPA)距離偏大主要是目標數估計不準造成的。

圖2 目標數估計結果Fig.2 Target number estimation results

圖3 OSPA估計結果Fig.3 OSPA estimation results

4 結論

本文立足于實際多傳感器組網場景,深入討論了MS-GLMB算法工程應用問題。本文提出的算法將不同傳感器布站以及傳感器不同探測范圍對目標跟蹤的影響考慮到MS_GLMB算法建模中,提出了DDR-MS-GLMB算法,較好地將LMB多傳感器框架應用于工程實際場景。實驗仿真結果表明,所提算法能準確估計監測區域內目標數以及每個目標的狀態。