趙恩嬌,楊 明,晁 濤,王松艷
(哈爾濱工業大學控制與仿真中心,哈爾濱 150080)
近年來,隨著作戰形式與航空航天技術的不斷發展,傳統采用單一飛行器攻擊的困難日益增大,因此,多飛行器協同作戰的理念逐漸得到重視[1-2]。相比于傳統的一對一攔截方式,多飛行器協同制導具有較大的優勢,協同制導能夠提高制導精度和攔截概率,進而取得更好的攔截效果。因此,對多飛行器協同攔截方法的研究具有非常重要的工程意義。
齊射攻擊是協同作戰中一種典型的作戰形式,要求來自不同方向和位置的導彈同時擊中目標[3]。齊射攻擊不僅能夠大大提高命中概率,還能明顯增強攻擊效果。近年來,多導彈協同制導的研究已逐漸引起國內外學者的關注[4-10]。現有多數關于協同制導方法的研究,均是假設各飛行器之間的通信處于理想條件下,實際通信拓撲固定。然而復雜的戰場環境中,通信極有可能受到干擾,同時,由信息傳輸引起的隨機時延也無法避免。因此,在設計多飛行器協同制導方法時,必須考慮時變拓撲對制導效果的影響。多枚飛行器齊射攻擊這類問題與多智能體協同控制具有相似之處,都是研究和探索由個體之間的相互作用所產生的群體協調現象的內在機制和原理,其中一致性理論已經被大量研究,并應用在相關背景中,如衛星編隊控制[11],無人機協同控制[12],多機器人系統分布式控制[13]等。因此,多智能體協同控制的一些研究結果對于多飛行器協同制導律的研究具有一定的借鑒意義。
在末制導過程中,目標的逃逸機動是影響制導精度的主要因素。針對機動目標的跟蹤,卡爾曼濾波技術是一種常用的方法,但其算法復雜,且需要精確知道系統模型和特性,不利于在飛行器攻防對抗過程中使用,需要探索不依賴于目標機動模型的目標信息估計新方法。擴張狀態觀測器(Extended state observer, ESO)可對系統中的不可測狀態以及未知擾動進行觀測,它是自抗擾控制[14]等非線性控制技術的重要組成部分,在干擾估計、故障診斷中發揮著重要作用,被應用到很多工程領域[15-17]。由于擴張狀態觀測器理論日趨成熟以及擴張狀態觀測器表現出的種種優勢,因此進一步探索擴張狀態觀測器在協同攔截制導律研究中的應用具有重要的工程意義。
針對上述討論中存在的問題,研究提出了一種適用于通信拓撲切換情況下的多飛行器協同攔截方法。將目標的狀態視作擾動,并擴張成為新的一階狀態,再利用特定的非光滑非線性誤差反饋,然后選擇適當的觀測器參數,得到系統所有狀態的觀測值,將得到的機動目標的狀態在制導律中進行相應的補償。利用有限時間一致性理論,為各飛行器設計一致性協議,使得各飛行器的剩余飛行時間能夠收斂到一致,從而保證同時攔截機動目標,最后驗證了此方法的有效性。
多個飛行器間通信關系可以用圖G=(v,ε,A)來描述,非空節點的集合v={1,2,3,…,n},它的節點數目稱為階,邊的集合ε?v×v={(i,j):i,j∈v}。加權鄰接矩陣A=[aij]∈Rn×n,i,j=1,2,…,n,其中aij表示以i為起點,j為終點的邊的權值。根據邊有無方向,圖分為有向圖和無向圖,如果無向圖的鄰接矩陣是對稱的,則從節點i到節點j之間有一條邊,也就是說(i,j)∈ε?(j,i)∈ε,則aij=aji>0,無向圖的鄰接矩陣一般是不對稱的且節點之間的邊是有方向的。節點j稱作節點i的鄰居,而節點i的所有鄰居用集合可以表示為Ni={j∈v:(i,j)∈ε,j≠i}。

考慮如下非線性系統
(1)
式中:f(x):U→Rn為在包含原點的開區域U上對x的連續函數。


論文研究目的是為網絡中的各個飛行器設計一個協同攔截方案。網絡由n個飛行器組成,并將飛行器序號順序標記為從1到n。
考慮平面內多個飛行器協同攔截單個高價值機動目標的情況,平面幾何關系如圖1所示。XOY為慣性參考坐標系,M代表飛行器,下角標為飛行器的編號,即Mi代表第i個飛行器,T為目標;帶有下腳標i和t的變量分別表示第i個飛行器和目標的狀態量;V,a,θ,λD以及R分別代表飛行器的速度、法向加速度、彈道傾角、視線高低角和彈目相對距離。

圖1 多飛行器與目標的相對運動關系Fig.1 Relative kinematics of flight vehicles and target
由圖中的飛行器和目標間的相對運動關系,以第i個飛行器為例,可以得到如下第i個飛行器與目標的相對運動關系。
(2)
(3)
式中:wR和uRi分別是目標加速度和第i個飛行器加速度在視線方向上的分量;wλ和uλi分別是目標加速度和第i個飛行器加速度在視線法向上的分量。
當多個飛行器協同攔截空中來襲機動目標時,如果采用齊射攻擊的作戰方式,也就是要求來自不同位置和方向的多個飛行器同時擊中目標,就可以大大提高命中目標的概率,并增強摧毀目標的效果。研究中要求多個飛行器同時擊中目標,也就是要求各飛行器的剩余飛行時間達到一致,因此也屬于一致性問題。
根據上節描述飛行器與目標之間的相對運動關系,以第i個飛行器與目標的相對運動關系為例給出協同制導模型。在視線坐標系下相對運動方程描述為
(4)
式中:Ri表示第i個飛行器與目標之間的相對距離;VRi表示第i個飛行器與目標之間視線方向的相對速度分量;Vλi表示第i個飛行器與目標之間視線法向的相對速度分量;uRi和uλi分別表示第i個飛行器的加速度在飛行器與目標的視線方向及視線法向的加速度分量;wRi和wλi分別表示目標的加速度在飛行器i與目標的視線方向及視線法向的加速度分量。
在多飛行器系統執行協同攔截任務時,為了達到同時擊中目標的目的,要求各飛行器具有時間一致性,也就是剩余飛行時間一致。Tgoi表示飛行器i與目標之間末制導剩余時間,采用下式估計飛行器的剩余飛行時間,這種估算方法在制導末期估計精度較高
(5)
為了得到Tgoi的變化率,對上式求導可得
(6)
為了實現多飛行器同時攔截目標,需要對各飛行器末制導剩余飛行時間進行控制,使得多個飛行器的Tgoi能達到一致,式(6)中uRi即為剩余時間變化的控制量。
在末制導過程中,當彈目接近速度小于零、視線轉率接近于零時,根據平行接近原理,導彈與目標在視線方向上的加速度分量對于導彈攔截目標沒有影響,因此在制導律設計時可以不考慮目標在視線方向的加速度分量[19]。因此,在研究中,考慮多個飛行器協同攔截來襲目標的情況,彈目接近速度一定小于零,可以假設目標機動加速度在視線方向的分量為零,即wRi=0,則式(4)中第二個方程可以化簡為
(7)
令
(8)
將上式代入式(4)、式(7)并結合式(6),可以得到如下協同制導模型
(9)

在本研究中采用切換的通信拓撲結構,各飛行器根據通信拓撲結構與相鄰的飛行器也進行信息交互,達到各飛行器的剩余飛行時間一致。在協同攔截問題的研究中,多對一制導律的設計包括兩個主要內容:①通過對目標狀態的精確估計來設計合理的制導律對目標的機動進行補償,保證每個飛行器與目標間的視線旋轉運動趨于穩定;②對多個飛行器到達目標的時間進行協調,以實現同時攔截的目的。


(10)

(11)

(12)
根據ESO理論,對式(12)設計如下的ESO
(13)

在本文協同攔截機動目標的研究中,假設各飛行器分別對目標的狀態進行估計,然后將觀測結果補償到制導律中。
根據上文的研究成果,本節給出攔截機動目標時利用ESO的估計結果進行協同攔截制導律的設計方法。
協同制導模型可知,多飛行器的協同攔截問題被轉化為多飛行器系統的時間一致性問題。不僅需要設計合理的制導律對機動目標加速度進行補償,還需要設計合理的一致性控制協議,保證各飛行器的剩余飛行時間達到一致。

(14)

(15)
此時,引入新的變量Tfi,定義Tfi為在t時刻預測得到的第i個飛行器與目標的交會時刻,則有
Tfi=t+Tgoi
(16)
對式(16)求導,并結合式(9)中剩余飛行時間變化規律可以得到
(17)
根據有限時間一致性理論,為第i枚飛行器設計視線方向的控制量
(18)

用Tgoj-Tgoi替換式中的Tfj-Tfi,Tgoi為第i枚飛行器到達目標的剩余飛行時間,Tgoj為第j枚飛行器到達目標的剩余飛行時間,因此可以得到多飛行器系統有限時間一致性定理。
假設1[21]. 假設飛行器間的通信拓撲是無向聯通的,即對應于無限的時間序列[ts,ts+1),s=0,1,2,…,存在切換信號σ: [0, ∞)→P和常數T1,T2滿足T1>T2>0,其中0 定理1. 對于協同制導系統(9),存在正常數T2>0使得假設1成立,采用如下控制協議 (19) 可以保證多飛行器同時攔截目標,且末制導剩余時間的一致時間 (20) 在每個區間[ts,ts+1),s=0,1,2,…,上,選取半正定函數 (21) 作為一致性分析的Lyapunov函數。 由于G(A)是連通的,V1(Tgo)=0表示對于任何i,j,都有Tgoi=Tgoj。由矩陣A的對稱性可知 (22) 因此, (23) 顯然 (24) 如果V1(Tgo)≠0, (25) 令L(A)的根λ1(LA),λ2(LA), …,λn(LA)按照增序排列。因為G(A)是聯通的,根據引理1,得λ1(LA)=0,λ2(LA)>0。并且, (26) 因此, (27) 給定初始狀態Tgo(0),如果V1(0)≠0,根據微分相似原則可以得到 (28) 并且 (29) 因此,V1(t)會在有限時間t1收斂到0,V1(t)與G(A)的代數連通性是近似相關的,因此定理1能夠解決有限時間一致性問題。 (30) 飛行器法向控制指令由設計的導引律給出,本文設計有限時間導引律并對目標機動進行補償 (31) 式中:wλi為估計得到的目標加速度值,βi>0, -1<ηi<1。 為了驗證本文設計的利用擴張狀態觀測器(ESO)的協同制導律的在通信拓撲切換情況下的制導性能,采用如下仿真條件進行仿真校驗。目標的機動信號采用機動頻率為0.5 Hz,最大機動能力為amax=±3的方波信號為機動目標信號。綜合考慮系統的估計精度、動態響應速度等因素,以第1枚飛行器為例,參數取值分別為β11=40,β12=140,δ1=0.001,α1=0.4,其他飛行器的參數取值與第1枚飛行器相同。仿真步長(系統的基礎采樣時間)為0.005 s。 各飛行器的初始狀態參數如表1所示。 表1 飛行器初始狀態參數Table 1 Initial state parameters of flight vehicles 三個飛行器間的通信拓撲結構如圖2所示,飛行器間的通信拓撲結構以8 s為周期,每2 s切換一次,切換順序依次為(a)→(b)→(c)→(d)。 圖2 通信拓撲結構Fig.2 Communication topologies 可以得到對應的鄰接矩陣為 (32) 利用上述仿真初始條件,得到如下仿真結果。圖3為目標機動加速度估計值,圖4為各飛行器的飛行軌跡圖,圖5為各飛行器與目標之間的距離變化曲線,圖6給出了各飛行器的剩余飛行時間變化曲線,圖7給出了各飛行器視線法向控制量變化曲線,圖8給出了飛行器1和飛行器2之間的通信拓撲連接權值。對比圖3目標加速度的實際值和估計值可知,經過前期的調整,利用擴張狀態觀測器得到的目標加速度估計值后期與實際值曲線完全重合,可見觀測精度較高,說明設計的狀態觀測器是有效的。由圖4展示的三枚飛行器協同攔截空中來襲機動目標的場景可知,來自不同方向和位置的三枚飛行器給來襲的目標形成了包圍的態勢,大大減小了機動目標逃逸的可行性,提高了摧毀目標的概率。觀察圖5的彈目距離曲線可知,各飛行器到目標的距離在初始階段有很大差異,因此需要對飛行器的狀態進行適當的調整,圖7的剩余飛行時間曲線也體現了這一點,經過對剩余時間的調整,剩余飛行時間收斂到一致,并且各飛行器的彈目距離也在同一時刻變為零,說明三枚飛行器同時擊中目標,實現了對來襲的機動目標的協同攔截。通過在控制指令中對機動目標的加速度進行補償,圖9的飛行器法向加速度指令變化曲線后期趨于穩定,因此各飛行器的視線轉率在控制作用下能夠穩定在零附近,保證飛行器能夠擊中目標。因此論文中設計的協同制導方法在通信拓撲切換的情況下是有效的。 圖3 目標加速度估計值Fig.3 Estimation of the target acceleration 圖4 飛行軌跡Fig.4 Trajectories of flight vehicles 圖5 彈目相對距離Fig.5 Distance between flight vehicles and the target 圖6 剩余飛行時間Fig.6 Time-to-go of flight vehicles 圖7 法向加速度指令Fig.7 Control command perpendicular to the LOS 圖8 飛行器1和飛行器2之間通信權值Fig.8 Communication connection weight value between flight vehicle 1 and flight vehicle 2 為驗證本文設計方法的有效性及分析通信拓撲切換對仿真結果的影響,這里給出相同仿真條件下固定拓撲條件下的部分仿真結果圖,其中通信拓撲采用圖2(c)所示的結構圖。選取仿真結果中比較有代表性的剩余飛行時間和彈目相對距離仿真結果圖與通信拓撲切換情況下的仿真結果進行對比。 圖9 固定拓撲條件下的剩余飛行時間Fig.9 Time-to-go of flight vehicles in fixed topology 圖10 固定拓撲條件下的彈目相對距離Fig.10 Distance between flight vehicles and the target in fixed topology 觀察固定拓撲條件下同樣仿真條件得到的剩余飛行時間曲線和彈目相對距離曲線如圖9和圖10可知,本文設計的協同攔截方法在通信拓撲固定和切換兩種情況下都能實現剩余飛行時間的一致,從而完成協同攔截任務,由彈目相對距離曲線可知,兩次仿真的彈目相對距離都能在同一時間收斂到零。同時,對比兩種情況下的剩余飛行時間,通過局部放大圖可以發現,通信拓撲切換條件下的一致收斂時間在7 s左右,而固定拓撲條件下的一致收斂時間在4.5 s左右,由此可見,切換的網絡會影響一致收斂時間,使的系統達到一致的時間延長。 本文針對機動目標加速度的協同攔截問題,提出了一種適用于通信拓撲切換的基于擴張狀態觀測器實現協同攔截機動目標的新思路。設計擴張狀態觀測器估計目標加速度,并在有限時間制導律中進行相應的補償,保證各飛行器能夠命中目標。同時,基于有限時間一致性理論設計了多飛行器系統協調控制量,使得各飛行器剩余飛行時間達到一致,并對系統有限時間穩定性進行分析,從而保證了在通信拓撲切換的情況下多個飛行器能夠同時到達目標。仿真研究表明,基于擴張狀態觀測器估計目標加速度的方法具有算法簡單、收斂速度快、估計精度高的優點,且無須建立機動目標模型。并且利用多智能體一致性理論設計的控制協議能夠使得飛行器狀態快速收斂,實現了有限時間一致性。表明本文設計的協同攔截方法是有效的。



5 仿真分析










6 結 論