文元全
(大連海事大學 輪機工程學院,大連 116026)
周 銳 吳雯漫
(北京航空航天大學 自動化科學與電氣工程學院,北京 100191)
孔繁峨
(中國航空工業集團公司 洛陽電光設備研究所,洛陽 471009)
異構多無人機協同目標跟蹤分散化最優控制
文元全
(大連海事大學 輪機工程學院,大連 116026)
周 銳 吳雯漫
(北京航空航天大學 自動化科學與電氣工程學院,北京 100191)
孔繁峨
(中國航空工業集團公司 洛陽電光設備研究所,洛陽 471009)
針對主被動傳感器協同目標跟蹤需要,考慮到可擴展性、異構性和動態可重構性等特點,建立了適于不同測量類型和不同測量維數的異構多傳感器分散化信息融合算法.以極大化信息融合所得到的信息熵及無人機(UAV,Unmanned Aerial Vehicles)觀測信息質量為效能函數,建立了異構多 UAV協同目標跟蹤的分散化最優控制代價函數以及通信、防撞和控制等約束模型.實現了多 UAV協同目標跟蹤的分散化模型預測控制,并分析了通訊噪聲等因素對分散化信息融合和協同控制的影響.
目標跟蹤;協同控制;信息融合;模型預測控制;無人機
近年來,以任務和信息相耦合的多 UAV(Unmanned Aerial Vehicles)協同問題越來越受到關注和廣泛研究.通過協同可以完成單個 UAV所不能完成的一些復雜任務[1].多 UAV協同目標感知是多平臺協同主要形式之一[2],通過協同可以得到單平臺所不能得到的一些信息.通過攜帶光電被動探測設備的多平臺協同作用,可以實現對目標的協同定位,進而實現靜默攻擊.另外,也可以通過主、被動傳感器的結合,實現異構型多運動平臺的分散優化與協同控制[3].
多傳感器數據融合技術是多 UAV協同目標跟蹤的關鍵技術之一.經典卡爾曼濾波算法在異構探測器的多平臺分散化協同目標跟蹤應用中遇到了諸多困難,而信息濾波算法以其易解析為簡單代數疊加之形式,并具有較好的可擴展性、異構性和動態可重構性等特點[3-4],獲得廣闊的應用前景.
在多 UAV的協同控制環境中,平臺的運動、敏感及通信通道故障等原因,使得集中控制變得非常困難,集中控制系統缺乏基本的魯棒性和隱蔽性.分散控制系統則能較好解決這些問題[5].
本文主要研究分別具有主動雷達和被動紅外的異構多 UAV分散化協同目標跟蹤方法.
考慮線性系統:

其中,x(k)為 n維狀態向量;F(k)為狀態傳遞矩陣;G(k)為噪聲輸入傳遞矩陣;w(k)為零均值不相關的高斯白噪聲;Q(k)為其噪聲方差陣.
非線性觀測模型為

其中,z(k)為測量值;v(k)為均值為零、方差為R(k)的高斯白噪聲;h(·)為非線性測量模型.
線性化觀測方程為

其中,H(k)為 Jacobian矩陣.
卡爾曼濾波得到的是目標狀態估計 x^及方差P,而信息濾波得到的是信息狀態 y^及費歇信息Y.滿足關系[4]:


其中,i(k)為觀測向量 z(k)的信息狀態分布;I(k)為信息矩陣.i(k),I(k)維數僅與目標狀態維數有關,與傳感器測量維數無關.信息濾波可以分為預測和估計兩個過程.
預測過程:

估計過程:

估計結果:

設有 n個 UAV,每個 UAV的觀測方程為

分散化信息融合算法在對 y^(k|k)及 Y(k|k)進行更新時,除了考慮 UAV自身的 I(k)和 i(k),還要考慮臨近 UAV的通信信息.
假設Ni(Ni<n)表示與第 i個 UAV具有通信連接的其它所有 UAV集合,則通信拓撲可表示為

融合通信鄰域內所有 UAV的 I(k)和 i(k):

卡爾曼濾波器的估計值不能表示成各 UAV觀測信息簡單線性疊加的形式[4],即

由此可見,以信息濾波為基礎的分散化信息融合算法可以通過簡單的代數和來融合其它UAV的信息[6],因而具有較好的可擴展性、異構性和動態可重構性.信息濾波算法對初始值的選取具有良好的魯棒性,在得不到系統確切的初始統計特性時,選取小的非零初始值即可迭代計算[7],從而克服了卡爾曼濾波算法對初始值選取比較敏感的問題.
分別攜帶主動和被動傳感器的兩個 UAV對運動目標位置和速度進行分散化協同估計:


其中,T為采樣周期;(xi(k),yi(k)),φi(k)分別為 UAV的位置和方位角;ui(k)為 UAV控制量,這里指 UAV的偏航角速率.
設 UAV-i攜帶被動光電探測器,觀測模型為

其中,θi(k)為目標的方位角;(xf(k),yf(k))為目標位置;vi(k)為零均值高斯白噪聲,方差.hi(k)的 Jacobian矩陣為

設 UAV-j攜帶主動雷達探測器,觀測模型為

其中,r(k)為相對距離;vj(k)為零均值高斯白噪聲,方差(k)的 Jacobian矩陣為

進而可得到兩個 UAV的信息狀態及信息矩陣 i(k),I(k),UAV之間通過數據鏈交換各自的信息 i(k)和 I(k),實現分散化信息融合.得到本地信息及目標狀態的分散化估計為


由此可見,分散信息融合與 gij(k)有關,UAV之間傳輸的信息僅是 I(k)及 i(k),而不是傳感器的原始測量信息.由定義可知,I(k)及 i(k)與觀測向量維數無關,僅與目標狀態的維數有關,因此對異構傳感器,只要目標狀態維數相同,分散信息融合算法就可將各 UAV傳輸信息I(k)及 i(k)直接線形疊加,不必考慮各傳感器的類型和測量維數,而且對通信拓撲和 UAV數量的改變具有很強的適應性.
分散化信息融合與協同控制是基于局部不完全通信,則通信拓撲、數據可靠性、通信延遲、噪聲和數據包丟失等情況對融合結果具有影響.考慮以上主要因素后的信息融合結果為

其中,0<αij(k)≤1為第 j個 UAV向第 i個 UAV傳輸信息的可靠性程度;τij和 Cij分別為通信延遲和通信噪聲方差.可見,UAV數量越多,累積通信噪聲的影響越大.
僅考慮 UAV之間通信噪聲影響,且假設同一信道雙向傳遞時的通訊噪聲相等,即

通訊噪聲與傳輸距離、信號功率、頻率、量級及信道比特數等因素[8]有關.這里采用較為簡單通訊噪聲方差模型[9]:

其中,SNR為信噪比;μ>0為通信通道質量常量;dij為 UAV之間的距離.
通信拓撲范圍內 UAV數量越多,累積通信噪聲影響越大.所以在增加 UAV數量以提高信息冗余度的同時,應綜合考慮通信噪聲的影響.另外,UAV之間距離越小,通訊噪聲也越小.因此,為提高跟蹤精度而縮短 UAV與目標之間的距離時,應綜合考慮通過提高通訊質量來提高跟蹤精度,進而降低對縮短距離的要求,以提高 UAV安全性.
UAV協同目標跟蹤任務是獲得目標狀態的最佳估計,并降低目標狀態估計的不確定性程度.因此,選擇分散信息融合得到的目標狀態估計的信息熵(IE,Information Entropy)作為分散協同最優控制的性能指標[4],即

其中,JIE,i(·)為分散協同最優控制的代價函數.
信息融合精度還依賴于傳感器對目標的觀測信息質量,一般來說,傳感器距目標之間的距離越近,觀測信息的質量越高.
假設 UAV在固定高度上對目標進行觀測,則UAV距目標之間的距離主要取決于 UAV在地面投影與目標之間的距離.此時可以考慮分散協同控制總的代價函數為[10]

其中,w1,w2,w3分別為 UAV控制量、目標狀態估計的信息熵以及 UAV在地面投影與目標之間距離的加權值.
UAV偏航角速度約束為

UAV之間防撞距離約束 d1為

UAV之間通信保障距離約束 d2為

采用滾動優化(模型預測控制)方法得到UAV的分散最優協同控制策略為

采用控制器參數化或分段線性化方法實現對UAV的分散最優協同控制策略的優化,具體描述見文獻[10-11].
將控制輸入 ui的滾動優化時域 T′=t2-t1等間隔地劃分成 np∈{1,2,…}等分,每等分的時間長度為 Δtp,因此,T′可表示為

在每個 Δtp內,根據對應分段區間內的控制輸入作用,對 UAV模型進行數值積分、迭代運算.
T′被劃分為 np等分 ,在 T′內 ,第 i架 UAV的連續控制輸入 ui可以采用常量分段函數近似地表達為


在考慮 ui,d1和 d2情況下,兩個 UAV對一個靜止目標進行探測和定位,并考慮通信噪聲的影響.假設 UAV-1為既能探測距離又能探測方位的雷達探測器,UAV-2為只能探測方位的紅外探測器.仿真結果如圖 1~圖 3所示.

圖1 UAV協同目標跟蹤的運動軌跡

圖2 x方向分散化協同估計誤差
從仿真結果可以看出:通訊噪聲對分散協同目標跟蹤結果及誤差收斂性具有明顯的影響.且通訊噪聲與距離有關,距離越近,通訊信噪比越高,因此 UAV協同目標跟蹤最優控制運動軌跡有相互靠近的趨勢.

圖3 y方向分散化協同估計誤差
基于分散化信息融合算法實現了對攜帶主、被動傳感器的異構多 UAV協同目標跟蹤的分散化最優協同控制.分散化信息融合算法不受 UAV傳感器數量、類型、觀測維數的限制,具有較好的異構性和可擴展性.另外,通信噪聲對協同目標跟蹤性能尤其是收斂性影響較大,因此,在增加UAV數量以提高信息冗余度的同時,應綜合考慮累積通信噪聲的影響.減小 UAV之間的通信距離,可降低通信噪聲,進而提高對目標的跟蹤精度.
References)
[1]Samad T,Bay JS,Godbole D.Network-centric systems form ilitary operations in urban terrain:the role of UAVs[J].Proceedings of the IEEE,2007,95(1):92-107
[2]Beard RW,McLain TW,Nelson D B,et al.Decentralized cooperative aerial surveillance using fixed wing miniature UAVs[J].Proceedings of the IEEE,2006,94(7):1306-1324
[3]Mathews G M,Durrant-Whyte H F,Prokopenko M.Scalable decentralised decision making and optim isation in heterogeneous teams[C]∥2006 IEEE International Conference on Multisensor Fusion and Integration for Intelligent Systems,MFI.Piscataway,NJ,United States:Institute of Electrical and Electronics Engineers Inc,2006:383-388
[4]Grocholsky B.Information-theroretic control of multiple sensor platforms[D].Sydney:University of Sydney,2002
[5]Fax JA,Murray R M.Information flow and cooperative control of vehicle formations[J].IEEE Trans on Automatic Control,2004,49(9):1465-1476
[6]Nettleton E,Ridley M,Sukkarieh S,et al.Implementation of a decentralised sensing network aboard multiple UAVs[J].Telecommunication Systems,2004,26(2-4):253-284
[7]李嘯,張洪鉞,邱紅專.基于分散化信息濾波的移動機器人定位[J].航天控制,2004,22(3):4-8 Li Xiao,Zhang Hongyue,Qiu Hongzhuan.Mobile robot localization using decentralized extended information filtering[J].Aerospace Control,2004,22(3):4-8(in Chinese)
[8]李嘯.基于多傳感器信息融合的移動機器人定位[D].北京:北京航空航天大學自動化科學與電氣工程學院,2006 Li Xiao.Mobile robot localization using multisensor information fusion[D].Beijing:School of Automation Science and Electrical Engineering,Beijing University of Aeronautics and Astronautics,2006(in Chinese)
[9]Mostofi Y,Chung T H,Murray R M,et al.Communication and sensing trade-offs in decentralized mobile sensor networks:a cross-layer design approach[C]∥2005 Fourth International Symposium on Information Processing in Sensor Networks.Los Angeles,CA,United States:Institute of Electrical and Electronics Engineers Computer Society,2005:118-125
[10]Geiger B R,Horn JF,Delullo A M.Optimal path planning of UAVs using direct collocation with nonlinear programming[C]∥Collection of Technical Papers-AIAA Guidance,Navigation,and Control Conference 2006.Keystone,CO,United States:A-merican Institute of Aeronautics and Astronautics Inc,2006:1257-1269
[11]Furukawa T,Whyte H F,Bourgault F,et al.Time-optimal coordinated control of the relative formation of multiple vehicles[C]∥Proceedings 2003 IEEE International Symposium on Computational Intelligence in Robotics and Automation.Kobe,Japan:[s.n.],2003:259-264
(編 輯:劉登敏)
Decentralized optimal control of multiple heterogeneous UAVs in cooperative target tracking
Wen Yuanquan
(Marine Engineering College,Dalian Maritime Universitiy,Dalian 116026,China)
Zhou Rui Wu Wenman
(School of Automation Science and Electrical Engineering,Beijing University of Aeronautics and Astronautics,Beijing 100191,China)
Kong Fan'e
(Luoyang Institute of Optic-Electronic Equipment,China Aviation Industry Corporation,Luoyang 471009,China)
The decentralized information fusion algorithms for multiple heterogeneous sensors platforms with different types and dimensions was developed to meet the needs of the target tracking with active and passive sensors.The decentralized information fusion algorithm was scalable,heterogeneous and reconfigurable.The performance cost function and constraints model of communication,collision avoiding and control for decentralized optimal control of multiple heterogeneous unmanned aerial vehicles(UAV)in cooperative target tracking were established to maximize the local information entropy obtained by information fusion and the quality of information observed by each UAV.The cooperative target tracking based on multiple heterogeneous UAV was implemented using decentralized model predictive control.The effects of imperfect communication on decentralized information fusion and cooperative control were investigated.
target tracking;cooperative control;information fusion;model predictive control;unmanned aerial vehicles
TP 273+.1
A
1001-5965(2010)05-0545-05
2009-10-14
國家自然科學基金資助項目(60975073);博士點基金資助項目(20091102110006);航空科學基金資助項目(2008ZC 13011)
文元全(1967-)男,遼寧大連人,博士生,wyq@dlmu.edu.cn.