趙學遠,周紹磊,祁亞輝,王帥磊
(中國人民解放軍海軍航空大學,山東 煙臺 264001)
近年來,隨著無人機技術的發展和多智能體系統控制廣泛的應用前景,使得無人機編隊在軍事和民用領域都早已嶄露頭角,至今已經取得了大量的研究成果[1,2],無人機系統隨著工作量的提高和難度的提升,無人機數量逐漸增多,因此對編隊的控制提出了更高的要求[3]。目前相對成熟并運用較為廣泛的控制方法有虛擬結構法[4]、leader-follower法[5]、基于行為法[6]。
眾多學者在多智能體系統的一致性問題方面的研究,為無人機編隊控制提供了新的解決思路,使得多無人機系統僅僅依靠鄰居無人機的信息就能夠形成編隊。文獻[7]利用了一種基于一致性反饋線性化的方法實現了多無人機系統快速形成編隊,并且所形成的編隊為時變編隊。文獻[8]利用一致性控制器解決了異構多智能體系統的編隊控制問題,文獻[9]通過設計一致性控制器,使得多無人機系統在形成編隊的同時,具有一定的防碰撞能力。
設計一致性控制器實現編隊控制問題,首先要關注的是多智能體系統的通信拓撲結構。文獻[10]給出了拓撲圖是連通的是多智能體系統一致收斂的充要條件,文獻[11]證明了有向網絡拓撲存在有向生成樹,多智能體系統即可實現一致性。文獻[12,13]研究了切換拓撲下多智能體的一致性問題。目前基于一致性理論實現編隊控制的研究多集中于固定拓撲。文獻[14]對離散系統設計了一致性控制器,使得離散多智能體系統形成編隊。文獻[15]研究了在有向通信拓撲條件下,多智能體系統的時變編隊控制問題。文獻[16]研究了二階積分系統中利用一致性方法使得系統軌跡與編隊隊形一致。也有部分文獻突破了固定拓撲圖結構的限制,文獻[17]在已知所有可能的拓撲集合條件下,設計一致性控制器,解決了一階積分模型的多智能體編隊控制問題。文獻[18]的編隊控制研究過程對有向切換拓撲提出了極為苛刻的限制條件,它要求有向拓撲集合內的所有拓撲圖是強連通且平衡,顯然所得結論不具有一般性。設計一致性控制器,使得多智能體系統在一般的有向切換拓撲條件形成編隊的研究還并不深入。
在實際的多智能體系統當中,往往要建模成非線性系統,作為一種常見的非線性環節,Lur’e型非線性,在一致性研究過程中,文獻[19]研究了包含Lur’e型非線性的系統在固定拓撲條件下的控制問題,文獻[20]研究了具有Lur’e型非線性環節的多智能體系統追蹤領導者的一致性問題。文獻[21]研究了有向切換拓撲條件下Lur’e型非線性智能體系統的控制問題,設計了分布式控制器,使得系統達成一致。在基于一致性理論解決編隊控制問題時,將Lur’e型非線性環節考慮在內的成果還較少。
本文在一致性理論研究基礎上,設計了分布式控制器,用于解決有向切換拓撲條件下線性多智能體系統包含Lur’e型非線環節時的編隊控制問題。所研究的拓撲圖是隨時間切換的,對通信要求更具一般性。設計的編隊為時變編隊,更具有實際意義。
G=(V,E,A)用來表示多智能體系統的有向通信拓撲圖,其中V={v1,v2,…,vN}是拓撲圖的節點集合,E?V×V為拓撲圖的邊集合,A=[aij]N×N為拓撲圖的具有非負元素aij的鄰接矩,節點vi和vj之間的連接權重用aij表示,當aij=1時節點vi可以接收到節點vj的信息,當aij=0時則節點vi不能接收到節點vj的信息。如果G中存在一個節點vi,從這個點出發沿著有向邊可以到達圖中的任意其它點,稱圖G包含有一個有向生成樹,該節點vi為根節點。圖的Laplacian矩陣定義為L=[Lij]N×N,其中Lii=∑j≠iaijLij=-aij,i≠j。
智能體之間的拓撲關系隨時間變換,Γ={G1,G2,…,Gp},p≥1為所有可能的有向拓撲的集合,切換信號σ(t):[0,+∞)→={1,2,…,p},切換時刻表示為0=t0 引理1[22]:對于任意給定的x,y∈n,和具有相容維數的矩陣P>0,D和S,可以得到 2xTDSy≤xTDPDTx+yTSTP-1Sy 根據文獻[23]可得到類似的引理2。 引理2存在一個正數α0和與L1σ(t)同步切換的正定矩陣Qσ(t)使得 其中0<α0 考慮由N個具有Lur’e型非線性項的無人機構成的無人機系統,每個無人機的運動模型描述如下 yi(t)=Cxi(t) (1) xi(t)∈n,ui(t)∈p,yi=(yi1,…,yiq)T∈q分別是第i個智能體的狀態、控制輸入和測量輸出。ABCD是合適維的系統矩。Lur’e型非線性項由非線性函數f(yi)描述,其滿足斜率條件[0,Δ],Δ=diag{δ1,…,δq}即 0≤(fi(b)-fi(a))≤δi(b-a), fi(0)=0,?b≠a,i=1,…,q. 針對此類問題,基于一致性方法,僅利用鄰居智能體的狀態信息,將控制器設計如下 ui=K1(xi(t)-hi(t))+wi(t) i=1,2,…,N (2) 將控制器(2)帶入原系統可得到 +BK1(xi(t)-hi(t)) (3) 因此可以得到 +(L?BK2-IN?BK1)h(t) +(IN?B)w(t)+(IN?D)f(y) (4) 令ξi(t)=xi(t)-hi(t)故得到 +(IN?A)h(t)+(I?B)w(t) (5) 如果上式各狀態量能夠達成一致,則多無人機系統能夠形成編隊。 利用Laplacian矩陣的特殊性質,做如下的線性變換,令ηi(t)=ξi(t)-ξi+1(t) 因此可以得到 +(E?A)h(t)+(E?B)w(t) (6) 基于以上的分析,推導出多無人機系統能夠形成編隊h(t)的充要條件是 (7) +(IN-1?D)φ(y) (8) 是漸進穩定的。 根據系統(1)B為列滿秩矩陣,因此對(7)兩端同時乘以(I?),其中因此可以得到 (9) (10) 對于式(7),可以恰當的選取輸入w(t)使其成立。欲所設計的控制器能夠使得系統形成編隊,對編隊也是有要求的,即編隊h(t)需滿足式(8)。 定義于隨時間變化的通信拓撲Gσ(t)=0,其在時間區間[t0,t)上的平均駐留時間τa定義為 其中Nδ(t0,t)表示Gσ(t)在時間區間[t0,t)上的切換次數。 結合平均駐留時間的定義,控制器設計算法如下 算法: 1)設w1(t)=0,求解方程,得到輔助函數w(t) 2)根據編隊中心軌跡配置(A+BK1)的極點,求解K1 根據矩陣不等式(11),求解可行解P (11) 其中 H1=(A+BK1)TP+P(A+BK1)-2αPBBTP+βP 定理:按照如上算法設計的控制器,能夠使得多無人機系統在切換拓撲時即使受到外部擾動也能夠形成時變編隊。 證明:構建Lyapunov函數 V(t)=ηT(t)(Qσ(t)?P)η(t) (12) 對上式沿著系統求導,整理可得 η(t)-ηT(t)(((EM)TQσ(t)+Qσ(t)EM) ?PBBTP)η(t)+2η(t)(Qσ(t)?PD)φ(y) (13) 由引理1得 2η(t)(Qσ(t)?PD)φ(y) =2η(t)(I?PD)(Qσ(t)?I)φ(y) ≤ηT(t)(I?PD)(R?I)(I?DTP)ηT(t) (R-1?I)(Qσ(t)?C)ηT(t) (14) 其中R>0為維數相容的特定矩陣,令R=Qσ(t),則可以得到 (15) 如前所述,當t∈[tk,tk+1)時,V(t)是連續的,求導可以得到(20),由(11)可以得到 (16) 考慮到Qσ(t)≤φ1I和Qσ(t)≥φ2I,所以在拓撲切換時刻tk有 (17) 通過迭代推導,因此 (18) 由(12)可得 (19) 其中?1=φ1max{λ(P)},?2=φ2min{λ(P)} 考慮多無人機系統的通信拓撲結構在如下的有向拓撲圖中隨機切換。 系統矩陣描述如下 將智能體狀態分量理解為無人機位置,初始狀態如下 編隊定義為 因此編隊形成后,4架無人機將構成一個平行四邊形。 圖1為有限的有向拓撲集合,按照圖2的切換拓撲過程隨意切換。 圖1 有限的拓撲集合 圖2 拓撲切換過程 首先將(A+BK1)極點配置在(-1+i,-1-i,-1),可得到 令α0=0.4求解不等式(12),得到可行解 所以可得到反饋矩陣 如圖3所示,無人機的第一狀態量與無人機編隊第一狀態量的誤差曲線,從圖中可以得出無人機狀態和編隊誤差達成一致,編隊即可以形成編隊。 圖3 無人機的第一狀態量與無人機編隊第一狀態量的誤差 第二狀態量與第三狀態量都與第一狀態量具有類似的變化規律。圖3分別為4架無人機在1s,4s時刻的三維狀態值。 圖4 無人機在1s時刻的三維狀態值 圖5 無人機在4s時刻的三維狀態值 可以看出在4s之后,四架無人機形成平行四邊形編隊,且編隊隊形處于動態變化中,與預先設定的編隊隊形一致,驗證了所設計的控制器的有效性。 利用一致性理論知識,用于解決多無人機系統編隊控制問題,所研究的系統包含lur’e型非線性項,通信拓撲結構為有向切換拓撲。本文的主要創新點是考慮了外部擾動的影響,并降低了多無人機系統的通信要求,且利用Laplacian矩陣的特殊性質將其分解,從而將編隊控制問題轉化為低階系統的穩定性問題,利用矩陣不等式求解反饋矩陣,使得設計控制器難度降低。2.2 相關引理
3 問題描述
4 控制器設計


















5 仿真驗證









6 結論