999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于區間箱粒子多伯努利濾波器的傳感器控制策略

2021-07-25 17:50:18陳輝鄧東明韓崇昭
自動化學報 2021年6期

陳輝 鄧東明 韓崇昭

多目標跟蹤中傳感器控制的核心是根據一定的優化準則,選擇傳感器的工作狀態或運行參數,進而控制量測過程以達到優化多目標跟蹤性能的目的.本質上,它是一個最優非線性控制問題.這類問題的解決通常是在部分可觀測馬爾科夫決策過程(Partially observable Markov decision process,POMDP)的理論框架下[1?4]進行.POMDP 一般包括表征狀態信息的多目標概率密度函數,一個可允許的傳感器控制集合和評價函數.然而,多目標傳感器控制問題一般處理高度復雜的多目標隨機系統,其目標的數量不僅隨時間變化,而且其量測也會受到漏檢和虛警的影響.這些復雜的不確定性因素都使得多目標傳感器控制策略的求解變得非常困難.

近些年來,基于隨機有限集(Random finite set,RFS)的多目標跟蹤方法備受關注.該方法將多目標狀態和多目標量測建模為有限集值.同時通過引入有限集統計(Finite set statistics,FISST)[5?6]理論,將雜波環境下的多目標狀態估計問題描述為貝葉斯濾波問題,從而避免了傳統跟蹤算法中較難處理的數據關聯問題.基于RFS 的多目標跟蹤方法可在貝葉斯濾波框架下根據每個時刻接收的集值量測遞推更新多目標狀態的概率密度函數.為簡化在多目標狀態空間上直接求解多目標貝葉斯濾波器的復雜度,Mahler 和Vo 提出了一系列最優近似多目標濾波器[7?14],包括矩遞推濾波器和形式多樣的(有標簽和無標簽)多伯努利濾波器.這些方法目前已應用在多目標傳感器控制問題[15?19]中.值得注意的是,這些傳統的量測模型通常用量測噪聲來表征量測模型的不確定性,稱為統計不確定性.然而,在許多實際應用中,這種標準的量測建模方式是不夠準確的.例如,復雜的監控系統通常會遭遇未知的同步偏差和系統延遲.由此產生的量測通常會受到典型未知分布和偏差的邊界誤差的影響.此時,這種帶有邊界誤差的量測可以用一個“區間量測”而不是點值量測來描述.區間量測表示一種不確定性,稱為集論不確定性[20?21].文獻[22] 結合序貫蒙特卡羅方法和區間分析技術,在目標跟蹤背景下首次提出箱粒子的概念,其核心思想是利用狀態空間內的多維區間或者體積非零的矩形區域代替傳統的點粒子,同時用誤差界限模型代替傳統的誤差統計模型.作為一種“廣義粒子濾波”算法,箱粒子濾波仍然在貝葉斯濾波框架下進行[23],并通過一組帶有權值的箱粒子來表征多目標后驗概率密度函數.由于箱粒子可以被解釋為一種由大量點粒子組成的集總形式,因此,用箱粒子濾波器進行狀態估計時相當于箱粒子所覆蓋的空間中的所有點粒子都參與估計,這就在很大程度上減少了所需粒子的數量,降低了算法的復雜度,節省了計算資源,提高了算法的運行速度.鑒于箱粒子濾波器估計效果較好,運行速度更快的優點,近幾年,已有一些學者相繼提出了箱粒子概率假設密度濾波器[24],箱粒子(多)伯努利濾波器[25?28]等.

箱粒子濾波器運行速度快的優點使得其與傳感器管理的結合更具優勢.遺憾的是,截至目前基于箱粒子濾波器的傳感器管理并沒有引起太多學者的關注,而且在我們現有的知識背景中,也并未查閱到有相關研究成果的發表.實際上,基于箱粒子濾波器進行傳感器控制策略的求解,最大的難題在于如何用表征多目標概率密度的箱粒子直接求解以信息散度為代表的評價函數.這與利用點粒子求解評價函數大不相同.由于德爾塔粒子的正交特性和易于求解積分的特點,點粒子求解評價函數是方便和容易的.但箱粒子作為體積非零的矩形區域,其并沒有正交消除冗余項的便利,因此直接利用箱粒子求解評價函數是極其困難的.

鑒于此,本文基于區間不確定性推理,利用箱粒子多伯努利濾波器提出了一種基于信息測度的傳感器控制策略.首先,利用箱粒子實現多伯努利濾波器,并通過一組帶有權值的箱粒子來表征多目標后驗概率密度函數.其次,利用箱粒子的高斯分布假設,將多伯努利密度近似為高斯混合.顯然,這不但避免了利用箱粒子直接求取評價函數的難題,而且將其轉化為利用高斯混合求解評價函數的問題.隨后,針對高斯混合分布間的信息增益大都不存在閉式解的問題,本文基于高斯混合多伯努利濾波器,研究并推導了兩個高斯混合之間的柯西施瓦茲(Cauchy-Schwarz,CS)散度求解公式,并以此為基礎提出相應的傳感器控制策略.為了對比說明所提方案的合理性和有效性,基于蒙特卡羅方法,本文也給出了通過混合均勻采樣近似箱粒子,進而利用點粒子求解CS 散度的遞推公式,并給出了相應的傳感器控制策略.最后,仿真實驗驗證了所提算法的有效性.

1 問題描述

1.1 多目標隨機有限集建模

對于一個單目標系統,目標狀態和量測一般由不同維數的隨機矢量構成.這些矢量在隨時間演變的過程中,其維數是恒定的.而多目標系統顯然并非如此,其狀態和量測一般由各自包含多個狀態和量測的集合構成,且維數隨時間而變化.假定k ?1時刻在目標狀態空間中存在Nx(k ?1)個目標,狀態分別為,目標狀態維數為nx.隨著時間的演化,這些目標可能會消亡,或以新的狀態繼續存活,而新的目標也有可能出現.此時,k時刻Nx(k)個目標的狀態可記為,且狀態順序和目標順序無關.同時,k時刻傳感器接收到Mz(k)個量測在量測空間中取值分別為,量測維數為nz.這些量測既可能來自于目標,也可能來自于雜波,并且量測順序和目標順序無關.那么,k時刻多目標狀態和多目標量測都分別構成一個無序的RFS.其中,F(X)表示X所有有限子集的并集,F(Z)表示Z所有有限子集的并集.在區間不確定性分析中,量測一般表示為區間量測,此時多目標量測為∈F(IZ),其中IZ為區間量測空間,F(IZ)表示IZ所有有限子集的并集.對于k ?1 時刻給定的多目標狀態Xk?1,假設目標xk?1∈Xk?1以存活概率pS,k(xk?1)繼續存活在k時刻.若不考慮衍生目標,則多目標狀態集Xk可建模為

其中,Sk|k?1(xk?1)是從k ?1 時刻到k時刻存活目標狀態的RFS.Γk為k時刻新生目標狀態的RFS.

假設目標狀態轉移方程為

其中,fk是系統的狀態轉移矩陣,wwwk~N(0,Qk)為過程噪聲.

此外,假設k時刻傳感器以檢測概率pD,k(xk)檢測到目標xk∈Xk,且被檢測目標以式(3)產生量測zk∈Zk.

其中,vvvk為量測噪聲.在本文的實際仿真場景中,pvvv描述為零均值高斯白噪聲.k時刻的傳感器位置xs,k(ν)=[xs,k(ν),ys,k(ν)]T由傳感器控制方案ν所決定.考慮傳感器檢測不確定性,此時傳感器對應目標量測是一個RFS,可表示為Θk(xk).若考慮雜波的影響,則k時刻傳感器接收到的多目標量測集Zk可建模為

1.2 多目標跟蹤中基于信息論的傳感器控制方法

多目標跟蹤中基于信息論的傳感器控制通常是在POMDP 框架下進行的.實際上,POMDP 是馬爾科夫決策過程的推廣形式,其通常包括三個要素:表征多目標狀態信息的概率密度函數,一個可允許的傳感器控制集合和評價函數.具體來講,FISST理論框架下的多目標狀態信息可用k時刻多目標后驗概率密度pk|k(Xk|k|Z1:k)來描述.用Uk表示k時刻可允許的傳感器控制集合,每一個傳感器控制ν∈Uk決定下一時刻傳感器的位置.對于每一個傳感器控制ν給定一個對應的評價函數R(ν).則最優控制序列uk可按以下準則確定

其中,pk|k?1(X|Z1:k?1)表示k時刻多目標先驗概率密度,R(ν,p,Z)是與傳感器控制ν相關的評價函數,由未來量測集Zk(ν)所決定.通常未來量測集可由式(3)和(4)獲得.但這種方法通常會給傳感器的求解帶來極大的計算負擔.比較常用且實際的做法是在不考慮雜波、噪聲且檢測概率pD,k=1 的情況下,對每一個控制ν產生一個預測理想量測集(Predicted ideal measurement set,PIMS)[29?30],進而用PIMS 代替實際量測來進行傳感器控制的求解.

此外,評價函數依據控制決策評價體系的不同可分為兩大類:基于任務驅動和基于信息驅動.基于任務驅動的傳感器控制策略旨在某個單一準則下基于某個特殊任務進行優化.而基于信息驅動的傳感器控制策略由于能夠兼顧多任務指標的競爭優化而備受關注,其評價函數通常反映了多目標概率密度間的信息增益DI(·,·),即R(ν)選擇為信息測度

1.3 區間分析

區間分析又稱區間數學,是一門用區間變量代替點變量進行運算的數學分支.通常,由于測量誤差的存在,濾波會產生不精確結果,而區間分析技術卻能精確給出誤差界限.因此利用區間分析技術進行運算,其運算結果相對于傳統數學方法具有更高的置信度.

區間通常定義在實數域R 內,是一個連續且封閉的實數子集,表示為.其中,表示區間下界,表示區間上界.一般地,一個d維區間或者箱體[x]∈Rd是d個一維區間的笛卡爾乘積,表示為[x]=[x1]×···×[xd].箱體的體積定義為|[x]|.

值得注意的是,對于一個非線性系統,箱體[x]在經過非線性轉移函數f傳遞后一般會得到不規則的非箱體形狀.為了保證轉移后得到規則形狀,以便于分析計算,區間分析技術引入了包含函數(Inclusion functions)的概念,其目的是通過包含函數快速的找到包圍這種不規則形狀的最小箱體.若有函數f,其包含函數可定義為:已知函數f:Rn→Rm,如果?[x]∈IR,[f]([x])?f([x]),那么區間函數[f]:IRn→IRm是包含函數.收縮算法是區間分析技術中的另一個重要概念,實現箱粒子收縮首先要解決的問題就是“約束滿足問題(Constraint satisfaction problems,CSP)”.它的實質是在約束集H:(f(x)=0,x∈[x])中尋找一個滿足約束函數f(x)=f(x1,x2,···,xn)=0 的最小約束集S,即找到一個包含[x] 中所有x且滿足約束函數f的最小體積[x].本文采用一種被廣泛應用的約束傳播方法(Constraints propagation,CP)[25],又稱為前向后向法.

2 Box-CBMeMBer 濾波器

2.1 SMC-CBMeMBer 的本質

CBMeMBer 作為MeMBer 的改進版本,在概念上完全不同于PHD 和CPHD.它并沒有“壓縮”狀態信息,進而用統計特性去近似多目標密度,而是通過傳遞一組相互獨立且數量固定的伯努利參數來直接近似多目標密度.顯然,CBMeMBer 的這種優勢為多目標跟蹤問題的遞推求解和執行效率提供了極大的方便和提高.SMC-CBMeMBer 作為多伯努利濾波器的具體實現形式之一,本質上是隨時間傳遞和更新一組德爾塔粒子和對應的權值,并最終由這組帶有權值的德爾塔粒子的加權和近似表征多伯努利密度.

2.2 點粒子到箱粒子

在SMC-CBMeMBer 中,假設多目標多伯努利密度可以表示為,其中r(i)表示第i個伯努利過程的存在概率,p(i)(x)表示該伯努利過程的概率分布,M為伯努利過程個數.p(i)(x)一般有如下形式

其中,L(i)表示該概率分布的粒子個數,w(i,j)是其對應的粒子權值,δx(i,j)(x)為狄拉克德爾塔函數.當L(i)→∞時,式(7)收斂于p(i)(x).一般地,粒子個數通常會對濾波器的性能產生極大影響.粒子數越多,濾波器整體性能越優異,這顯而易見.但與此同時,大量的粒子參與濾波過程會極大地提高算法的計算復雜度.文獻[22] 結合粒子濾波技術和區間分析技術,提出了一種利用箱粒子代替點粒子,進而減少粒子個數的處理方法.此外,文獻[22?26] 將每個“箱體”刻畫成一個以箱粒子為支撐集的概率密度函數,每個均勻函數都充分反映了對應箱粒子的特性.因此,若箱粒子[x]作為支撐集,令U[x]表示該箱粒子的均勻概率密度函數,則式(7)可以表示為

事實上,Box-CBMeMBer 濾波器在形式上可以看成是用箱粒子代替點粒子的SMC-CBMeMBer濾波器,以下將給出具體遞推公式.

2.3 Box-CBMeMBer 遞推

1)預測步

假設k ?1 時刻后驗多目標多伯努利密度表示為,且每一個概率密度具有以下形式

則k時刻預測多伯努利密度可表示為

nB為新生箱粒子個數.

2)更新步

結合存活目標多伯努利密度和新生多伯努利密度,可令k時刻預測多伯努利密度πk|k?1為

其中

則后驗多伯努利密度πk|k可表示為

3)重采樣和狀態估計

和傳統的點粒子濾波器一樣,箱粒子濾波器仍然需要進行重采樣.但具體的采樣方法卻顯著不同,箱粒子濾波器通常采用隨機子劃分法進行重采樣,即可以將權重大的箱粒子用一組區間更小的箱粒子去替代.此外,目標狀態是所對應箱粒子質心狀態的加權和.

3 Box-CBMeMBer 中基于箱粒子高斯分布近似的傳感器控制方法

盡管Box-CBMeMBer 也類似地通過一組帶有權值的箱粒子來逼近多伯努利密度.但相比于SMCCBMeMBer,基于Box-CBMeMBer 進行傳感器求解顯然要困難許多.利用點粒子求解信息散度是極具優勢的,這主要是因為狄拉克德爾塔函數(Dirac delta function)的正交特性和便于求解積分的特性.而對于箱粒子,這一體積非零的矩形區域,顯然并沒有正交消除冗余項的便利.因此,利用箱粒子直接求解信息測度是相當困難的.

文獻[25] 利用服從高斯分布的量測噪聲來構造服從均勻分布的區間量測噪聲,即給出了一種由統計不確定性轉化為區間不確定性的有效方法.該方法給本文以啟發式的思考.特別是該方法用嚴格的等式給出了計算過程.由于不存在等式成立的限定條件,因此該等式合理的給出了一個高斯分布和區間箱體相互轉化的方法.換而言之,利用區間噪聲近似代替服從高斯分布的噪聲,這顯然是一個可逆過程.假設任一箱粒子[x],其質心狀態mx=mid([x])=[x,x′,y,y′]T,其區間中心到邊界的長度.則可通過構造高斯分布來逼近服從混合均勻分布的箱粒子,即

式(33)的重要意義就在于代替式(19)來近似多伯努利密度,如此不但避免了直接利用箱粒子求解評價函數的難題,而且進一步將基于Box-CBMeMBer 的傳感器控制求解問題轉化為利用高斯混合求解評價函數的問題.

利用高斯混合求解評價函數即便在以點目標濾波器為基礎的傳感器控制策略中也不多見,究其原因主要在于高斯混合分布間的信息散度大都不存在閉式解.盡管如此,相比于點粒子求解評價函數,高斯混合求解仍有其無法比擬的執行效率上的優勢,這對于傳感器的實時管理具有很重要的價值和意義.有鑒于此,本文基于GM-CBMeMBer 濾波器,研究了兩個高斯混合之間的CS 散度的求取,并以此為基礎提出相應的傳感器控制策略.

假設p0和p1分別表示兩個概率密度函數,則它們之間的CS 散度可表示為

根據式(6)和(34),評價函數可以表示為

GM-CBMeMBer 濾波器通過傳遞一組帶有權值的高斯分量來逼近多目標密度.顯而易見,每個伯努利過程對應的高斯分量對于整體的多目標密度的逼近程度是不同的.出于簡化計算的考慮,本文提取存在概率r較大的伯努利過程(r >rm),從而利用這些伯努利過程去聯合近似空間多目標概率密度,進而研究相應評價函數的求解.

其次,對于每種控制方案ν∈Uk確定傳感器的位置xs,k(ν).隨后對每一個控制ν僅產生一個相應的PIMS,可表示為

由于不考慮雜波和噪聲,且pD,k=1,因此不存在繼承航跡(漏檢)的伯努利RFS,而對于每個PIMS 更新的伯努利RFS,其存在概率恒為1.因此,我們只需要結合GM-CBMeMBer 濾波算法,利用PIMS 對式(36)中的每個高斯分量參數進行更新,則更新后的多目標概率密度也具有高斯混合的形式,即

其中,每個高斯分量對應權值為

k時刻目標狀態估計、估計誤差協方差分別為

其中,Hk表示k時刻非線性量測函數的雅克比矩陣.更新后的多目標概率密度可近似表示為

值得注意的是,為了計算式(35),本文需要借助兩個高斯分布之間的乘積公式,即

根據式(36)和(48),式(35)第一項可推導如下

其中

式(35)中的第二項和第三項類似于第一項的推導方法,不再贅述.則最后評價函數可寫成如下形式

其中

為了直觀地說明本節所提方案的求解步驟,以下給出算法1 實現偽碼.

4 Box-CBMeMBer 中基于箱粒子混合均勻采樣的傳感器控制方法

事實上,除了上文中給出的通過構造高斯分布近似箱粒子的方法以外,一個自然的選擇是基于蒙塔卡羅方法,利用采樣粒子集去代替箱粒子.如前所述,箱體是一個均勻分布函數,因此本文利用混合均勻采樣的思想,對每個箱粒子進行均勻采樣,用得到的點粒子來近似代替箱粒子,從而將傳感器策略求解問題轉化為更一般的利用點粒子求解評價函數的問題.以下將給出利用點粒子求解CS 散度的遞推公式.

一般地,CS 散度除了有式(34)的表示方法外.Hoang 等[31]也推導了兩個泊松點過程之間的CS 散度,表達如下

其中,π1和π2表示泊松點過程,u1和u2分別是其強度函數,K表示目標狀態的量測測度.此外,值得注意的是,對任一多目標概率分布最有效的泊松近似是多目標分布的一階矩.基于這種思想,文獻[19]結合式(55)給出了兩個多伯努利分布間的CS 散度.本文進一步給出了傳感器控制中CS 散度的粒子求解方法.

假設k時刻預測多目標多伯努利密度表示為,且每一個概率密度被一組帶有權值的粒子近似

則預測多伯努利密度的強度函數為

此外,由于不考慮雜波和噪聲,且pD,k=1,因此不存在繼承航跡(漏檢)的伯努利RFS.此時利用PIMS 更新后的后驗多伯努利密度可表示為

類似地,后驗多伯努利密度的強度函數為

將式(57)和(59)代入式(55)可得

利用德爾塔函數積分特性,則基于CS 散度的傳感器評價函數為

為了直觀地說明本方案的求解步驟,以下給出算法2 實現偽碼.

5 算法程序的偽碼

為了說明基于Box-CBMeMBer 傳感器控制策略的整體算法流程,列出算法偽碼如下:

6 仿真分析

6.1 場景參數

本文考慮距離方位跟蹤 (Range-bearing tracking,RBT).設置監控區域為 [?π,π]×.場景中目標軌跡均為近常速運動模型(Nearly constant velocity model,NCVM)[32],共計出現4 個目標,其狀態轉移密度為

其中[25],

其中,T=1 s 為采樣周期,總共采樣50 次.Qk為過程噪聲協方差,I2為2 階單位矩陣,?為克羅內克積,?=0.05 為過程噪聲強度.本文借鑒文獻[25](如式(32))將服從高斯分布的Qk轉化為服從均勻分布的區間過程噪聲.

在本文仿真中,設置檢測概率pD,k=0.98.雜波強度κk(z)=λcV u(z),其中每周期雜波平均數λc=5,V為監控區域體積,u(z)表示監控區域內的雜波均勻分布.目標存活概率pS,k=0.99.目標新生過程是一個多伯努利RFS,其密度為,其中,Pγ=diag{[10,5,10,5]T}.新生箱粒子可通過采樣得到.假設軌跡刪減閾值為rT=10?3,伯努利過程存在概率提取閾值為rm=0.5,對應高斯混合分量權值提取閾值為wm=0.2,箱粒子個數Lbox=40,每個箱體(箱粒子)均勻采樣粒子數Lsam=30.

在RBT 中,量測函數hk(x)有如下形式

其中,xk和yk表示k時刻目標的位置,xs,k和ys,k表示k時刻傳感器的位置.量測噪聲vvv是零均值高斯白噪聲,其協方差為,其中σθ=0.25°,σr=2.5 m.此外,傳感器返回的是區間量測,其區間長度為Δ=[Δθ,Δr]T,其中Δθ=4°,Δr=70 m 分別是區間量測的角度長度和距離長度.值得注意的是,傳感器通常有偏差(系統誤差),此時hk(x)+vvvk并不在區間量測的中心位置.因此,結合RBT 量測方程,傳感器區間量測可構造如下

6.2 多目標跟蹤性能評價

本文采用OSPA(Optimal subpattern assignment)距離[33]來評估多目標跟蹤的性能.其定義如下:設真實的和估計的多目標狀態集合分別為X={x1,···,xm}和,若m≤n,則OSPA 距離為

6.3 傳感器控制集合

若k時刻傳感器實際位置為xs,k=[xs,k,ys,k]T,則下一時刻傳感器所有可允許控制的位置集合Uk+1可表示為

其中Nθ=8,NR=2,則Uk+1總共包括17 種控制方案(包含傳感器處于靜默狀態).vs,c是傳感器自身的容許控制速度,設為20 m/s.

6.4 實驗仿真

本文設計的RBT 仿真場景中,共計出現四個目標,其運動參數如表1 所示.

表1 多目標參數Table 1 Parameters of multi-target

首先基于Box-CBMeMBer 濾波器對RBT 場景中的多目標進行單次跟蹤仿真,如圖1 所示.顯然,即便在雜波較多的環境下,Box-CBMeMBer 仍能克服目標新生和消亡帶來的不確定性,排除雜波干擾,最終得到良好的跟蹤估計效果.

為了對比說明所提控制方案的合理性和有效性.本文在如圖1 所示同樣的場景條件下,構造了四種控制方案并進行了200 次蒙特卡羅(Monte Carlo,MC)實驗.其中,方案一是“箱粒子高斯分布近似”,即本文所提控制方案.該方案通過構造高斯分布來近似表示箱粒子,進而利用高斯混合加權和來逼近多目標狀態空間分布,最終在求解本文所給出的高斯混合CS 散度的基礎上得到傳感器最優控制方案.方案二是“箱粒子混合均勻采樣”即通過混合均勻采樣得到點粒子進而代替箱粒子,利用加權粒子集近似表達多目標空間分布,并求其強度函數.該方案借鑒了傳統粒子濾波的思想,利用德爾塔粒子的正交特性和易于求解積分的特點,計算CS 散度并最終得到傳感器最優控制方案.方案三是“隨機控制”,代表每個時刻的傳感器控制方案在可允許的控制集合中隨機選取.這種隨機選取看似簡單,但該方案往往會獲得比較良好的控制效果,因此經常作為典型的控制方案被加以比較.方案四是“ENT”作為一種經典的控制方案[34],其仍然利用箱粒子混合均勻采樣得到的點粒子來求取相應的評價函數,其目的旨在一套可允許的傳感器控制集合中決策出相應的控制方案,以使得傳感器檢測到目標勢的后驗期望值(PENT)達到最大.

圖1 實際的目標軌跡Fig.1 Actual target trajectories

圖2 給出了四種控制方案在200 次MC 實驗中對多目標狀態估計的OSPA 距離統計對比結果.可以看出,四種控制方案都有較好的跟蹤估計效果,這說明了四種控制方案的有效性.具體地,OSPA 距離分別在5 s,10 s,15 s 呈現出明顯的波動,這是因為隨著目標的新生,多目標狀態空間分布發生了較大變化,但隨著傳感器有目的的機動,相對于其他傳感器控制方案,Box-CBMeMBer 濾波器顯然很快應對了這種變化,因此OSPA 距離在短暫波動后又回到理想的平穩狀態.這種快速收斂性說明在目標勢攝動的情況下,本文所提算法具有相對較好的魯棒性.另外,多目標狀態OSPA 在30 s 左右也發生了較為明顯的波動,究其原因主要在于在25 s 到32 s 之間,目標3 和目標4 在空間中非常接近(如圖1 所示),兩個目標運動過程中的“匯集”影響了彼此的狀態估計.此外,比較四種方案可以看出,方案一顯然比其余三種方案的跟蹤估計效果要好.尤其是相比于方案二,方案一通過構造高斯分布顯然更能表征箱粒子,更能逼近多目標狀態空間分布,從而通過CS散度指導傳感器得到最優的控制方案.而最優的控制方案能夠提供更加精確的量測,進而得到更好的估計效果.方案四跟蹤估計效果較差,這是因為該控制方案是以目標勢后驗期望值(PENT)最大化為評價準則,并沒有以多目標跟蹤精度達到最優作為評價指標.

圖2 四種控制方案的OSPA 距離比較Fig.2 OSPA distances for four control strategies

圖3 給出了方案一,即本文所提控制方案在單次實驗中對傳感器的最優控制軌跡.可以看出,在整個控制過程中,傳感器會始終依據當前的濾波結果不斷地對自身的位置進行自適應調節,即基于最優評價準則求解出當前時刻傳感器相對于所有目標的最佳觀測位置.特別是隨著目標的出生和消亡,傳感器總是會產生明顯的機動來適應這種變化,進而適應總體多目標概率密度函數的變化,以保證自身能在最優的位置最大化地接收多目標信息.

圖3 所提方案的傳感器控制軌跡Fig.3 Sensor trajectory for the proposed strategy

目標勢估計如圖4 所示.顯然,四種控制方案的勢估計均值都很接近真實目標數.但通過統計目標勢估計標準差(如圖5,表2),仍能發現方案一有相對較好的估計效果.尤其是相比于方案二,方案一由于更能真實地反映多目標狀態空間分布,從而能夠為CS 散度的求解乃至于最優傳感器位置的決策提供更加精確的多目標信息,這使得方案一在估計效果上要優于方案二.方案四對目標勢的估計效果最好,這毫不奇怪,因為該方案是以目標勢的后驗期望值最大化為評價準則,只是針對目標勢優化的單一任務進行決策,雖然在這種情況下,并不能使多目標整體定位的性能得到提升,但卻可以提升濾波器對于多目標的檢測性能.

表2 四種控制方案勢估計誤差均值的絕對值Table 2 Absolute value of cardinality error for four control strategies

圖4 四種控制方案的勢估計比較Fig.4 Cardinality estimation for four control strategies

圖5 多目標勢估計標準差Fig.5 Standard deviation of multi-target cardinality estimation

此外,圖6 給出了四種控制方案在200 次MC實驗中的平均包含值.可以看出,四種方案下的平均包含值都非常接近1,這說明多目標的估計狀態幾乎都被包含在相應箱粒子內,這同時也說明了基于四種控制方案的Box-CBMeMBer 濾波器都具有良好的跟蹤估計性能.

圖6 多目標平均包含值Fig.6 Mean inclusion values of multi-target

四種方案在同樣的場景參數下均運行50 步,其單步平均運行時間如表3 所示.可以看出,方案一在執行效率上要優于方案二,這種差別主要來自于傳感器評價函數的求解所花的時間.而利用高斯混合求解評價函數,在執行效率上具有天然的優勢.從這點來看,顯然方案一,即本文所提控制方案更適合作為Box-CBMeMBer 的傳感器控制策略,因為兩者的結合更能保留Box-CBMeMBer 濾波器執行速度快的優點.方案三運行速度最快,這是因為其在傳感器求解上的時間花費幾近于無,時間成本主要來源于濾波過程.方案四運行較慢,這是因為在求解評價函數的過程中需要對所有預測箱粒子混合均勻采樣后的所有點粒子進行更新.

表3 四種控制方案單步平均運行時間對比Table 3 The average execution time for four control strategies

為了驗證過程噪聲變化對所提算法性能的影響,本文結合式(64),通過改變過程噪聲強度?的大小,在同樣的場景條件下運行MC 仿真并統計OSPA 均值加以比較.如圖7 所示,隨著過程噪聲強度?的不斷變大(?=0.05,0.5,1,5,10),多目標估計精度在不斷下降.但就總體趨勢而言,多目標估計精度僅是有限度小范圍的變化,整體變化趨勢比較平穩.這說明了在參數攝動(過程噪聲)的情況下,本文所提傳感器控制方法具備良好的魯棒性.

圖7 所提方案中不同過程噪聲強度對估計性能的影響Fig.7 Tracking performance of different process noise intensities for the proposed strategy

以下討論量測噪聲的變化對本文算法的影響.本文仍然在相同的仿真場景下通過改變量測噪聲協方差系數來控制量測噪聲協方差的大小,進而對比說明其對濾波器性能的影響.如圖8 所示,隨著?的不斷增大,多目標狀態的OSPA 在不斷增大,估計精度在不斷降低,這反應了量測不確定性程度對濾波器精度的影響.此外,盡管噪聲協方差的增大如預期的那樣引起了多目標跟蹤估計效果的變差,但總體而言,多目標整體濾波效果呈現了一個相對平穩的過程,在參數攝動的范圍內,多目標狀態估計OSPA 均值的最大變化(最大值和最小值)小于15 m,這說明了所提算法在不同的量測噪聲水平下有著較好的魯棒性.

圖8 所提方案中不同量測噪聲系數對估計性能的影響Fig.8 Tracking performance of different measure noise factors for the proposed strategy

事實上,箱粒子濾波同樣適用于解決非線性非高斯跟蹤問題.本文選擇具有普遍意義的閃爍噪聲[35?36]模擬非高斯噪聲,閃爍噪聲與高斯噪聲的主要差別在于尾部較長.一般地,閃爍噪聲可以分解為高斯噪聲和具有“厚尾”特性的噪聲之加權和[35?36],即f(g)=(1?ξ)fN(g)+ξfI(g),其中,f(g)為閃爍噪聲,fN和fI分別為高斯和大方差高斯分布,其協方差分別為ΣN和ΣI,ξ為閃爍噪聲概率,0<ξ <1.本文基于以上非高斯模型,設定,σθ=0.25°,σr=2.5 m,閃爍噪聲概率ξ=0.2,ΣI=K ·ΣN,并在K分別取值為5,10,20,50,100 的條件下進行MC 仿真,進而對多目標狀態估計的OSPA 均值進行統計分析.如圖9 所示,隨著K的不斷增大,厚尾程度越嚴重,相應的多目標狀態的估計精度不斷下降.但從OSPA所呈現出的總體趨勢來看,面對不同厚尾程度的非高斯噪聲,所提算法仍能以較好的精度跟蹤多目標,這也證明了本文所提方法對典型的非高斯噪聲具有較好的適應性.

圖9 所提方案中不同K 值對估計性能的影響Fig.9 Tracking performance of different K values for the proposed strategy

在本文所提算法中,傳感器速度也會在一定程度上影響多目標狀態的估計精度.本文結合實際的場景設置,分別在設定不同的傳感器速度的基礎上進行MC 仿真,并統計多目標跟蹤估計的OSPA 均值.如圖10 所示,可以看出,傳感器速度的不同設定會對多目標跟蹤精度產生影響,而速度為20 m/s時,多目標估計精度較好.總體而言,隨著傳感器速度的增大,多目標估計精度似乎在一定范圍內進行有限的優化.可以理解的是,傳感器的速度越大將會使傳感器越快到達“最佳”觀測區域.但也不是傳感器速度越快就越好,因為在離散時間動態系統中,傳感器每周期內的控制距離過大,也可能會使傳感器“錯過”最優觀測位置.

圖10 所提方案中不同的傳感器速度對估計性能的影響Fig.10 Tracking performance of different sensor speeds for the proposed strategy

為了詳細說明由于分量刪減所產生的不同的高斯混合分量個數對多目標狀態估計精度和計算復雜度的影響,本文分別在rm和wm不同取值的情況下進行MC 仿真,并在表4 中對多目標狀態估計的OSPA 和對應運行時間進行對比分析.可以看出,隨著rm和wm的不斷減小,越多的高斯分量參與近似多目標密度.多目標密度的近似程度越高,所提出的多目標概率密度間的信息增益的計算也就越精確,傳感器控制的效果也就越好,這最終反映在多目標狀態的OSPA 上.很顯然,隨著閾值的不斷減小,多目標的跟蹤效果也在不斷優化.但這種優化是有限度的,閾值小到一定程度并繼續減小,跟蹤精度并沒有得到顯著的提高,算法的計算花銷卻在顯著提高,這嚴重影響了多目標跟蹤中傳感器管理的計算效率.因此,當進行傳感器控制時,需要控制高斯分量個數來平衡多目估計精度和計算復雜度.本文中設定rm=0.5,wm=0.2,此時被提取的高斯混合分量在事實上幾乎涵蓋了所有的多目標信息,在保證估計精度的同時,也有著不錯的運行速率.

表4 不同高斯分量個數的性能比較Table 4 Tracking performance comparison of different Gaussian components

圖11(a)給出了RBT 在200 次MC 仿真中,方案一所遍歷的所有傳感器控制位置及與目標的相對位置.可以看出,隨著多目標的不斷變化(新生、消亡及狀態的變化),傳感器總會及時調整自身的位置以適應目標的不確定性所帶來的多目標狀態空間分布的變化.如圖11(b)(傳感器軌跡云放大效果圖),盡管跟蹤場景中存在諸多隨機因素,導致每次MC仿真中的傳感器運動軌跡都不大可能一致,但該軌跡云仍能夠充分展示傳感器軌跡控制的總體趨勢.

圖11 所提方案的傳感器控制軌跡Fig.11 Sensor control trajectories for the proposed strategy

7 結論與展望

本文的主要工作是基于區間不確定性推理,利用Box-CBMeMBer 濾波器提出了基于信息測度的傳感器控制策略.文中首先利用箱粒子實現Box-CBMeMBer 濾波器,并通過一組帶有權值的箱粒子來表征多目標后驗概率密度函數.其次,利用箱粒子的高斯分布假設,將多伯努利密度近似為高斯混合.隨后,選擇CS 散度作為評價函數,并詳細推導了兩個高斯混合之間的CS 散度的求解公式,以此為基礎提出相應的傳感器控制策略.該方法也是本文提出的最為核心的基于區間不確定性推理的傳感器控制方案.此外,作為一種對比方案,本文利用蒙特卡羅方法,即通過對箱粒子進行混合均勻采樣,進而利用點粒子求解CS 散度提出了相應的控制策略.后一種方案符合粒子濾波解決傳感器控制問題的傳統思路,但它的計算效率還是要明顯低于所提出的箱粒子高斯近似的傳感器控制策略.最后,通過幾種經典方案的對比,驗證了所提算法的有效性.所提方法的意義在于,通過對傳感器控制策略合理近似求解,成功將Box-CBMeMBer 濾波器與現代傳感器管理系統相結合.這對于廣泛存在著區間不確定性的現實多目標跟蹤系統的管理與控制具有重要的理論價值.顯然,所提方法可以進一步推廣到基于現代高分辨率傳感器的多擴展目標跟蹤問題中,未來對利用區間不確定性推理解決多傳感器管理也具有重要的參考價值.

主站蜘蛛池模板: 欧美亚洲国产一区| 99re在线视频观看| 亚洲精品大秀视频| 亚洲婷婷丁香| 日本精品αv中文字幕| 91免费国产高清观看| 蜜芽国产尤物av尤物在线看| 亚洲AV成人一区二区三区AV| 国产在线观看人成激情视频| 欧美日韩精品一区二区视频| 最新亚洲人成网站在线观看| 国产激情无码一区二区免费| 一级香蕉人体视频| 欧洲av毛片| 激情无码视频在线看| 深夜福利视频一区二区| 国产91透明丝袜美腿在线| av一区二区三区在线观看| 51国产偷自视频区视频手机观看| av在线无码浏览| 视频二区中文无码| 欧美翘臀一区二区三区| 美女裸体18禁网站| 伊人色综合久久天天| 伊在人亚洲香蕉精品播放| 亚洲成人免费看| 99青青青精品视频在线| 呦系列视频一区二区三区| 91年精品国产福利线观看久久| 亚洲精品视频网| 热99精品视频| 国产精品手机在线播放| 67194在线午夜亚洲| 亚洲av日韩av制服丝袜| 67194在线午夜亚洲 | 亚洲色欲色欲www网| 午夜无码一区二区三区在线app| 一本无码在线观看| 重口调教一区二区视频| 国产丝袜一区二区三区视频免下载| 不卡视频国产| 亚洲免费毛片| 漂亮人妻被中出中文字幕久久| 在线中文字幕网| 午夜色综合| 久久亚洲高清国产| 精品视频福利| 亚洲伦理一区二区| 福利国产微拍广场一区视频在线| 91一级片| 日韩精品毛片人妻AV不卡| 亚洲人成网7777777国产| 2019国产在线| 中文一区二区视频| 国产精品一区不卡| 国产导航在线| 亚洲国产精品成人久久综合影院| Jizz国产色系免费| 成人免费黄色小视频| 国产91色在线| 免费中文字幕在在线不卡| 成年看免费观看视频拍拍| 国产成人三级在线观看视频| 色成人综合| 国模粉嫩小泬视频在线观看| 婷婷色在线视频| 亚洲系列中文字幕一区二区| 国产精品亚洲五月天高清| 在线观看精品国产入口| 欧美三级日韩三级| 欧美一级视频免费| 午夜老司机永久免费看片| 伦精品一区二区三区视频| 原味小视频在线www国产| 国产色伊人| 女人天堂av免费| 国产精品片在线观看手机版| 少妇极品熟妇人妻专区视频| 蝌蚪国产精品视频第一页| 中文字幕人成乱码熟女免费| 在线播放91| 国产一区成人|