班永鑫,葉永強
(南京航空航天大學自動化學院,南京 211106)
伴隨通信效率的提高和無人機制造成本的降低,無論在民用領域還是軍事領域,多無人機集群的協同可以勝任更多的工作,多機問題的研究也逐漸成為熱點。在信息化、智能化、無人化戰場環境下,飛行器集群因具有作戰能力強、體系生存率高以及攻擊成本低等諸多優勢,受到世界各國的青睞[1-5]。這同時也對無人機集群系統的路徑規劃、障礙躲避等方面提出了更高的要求。如在俄烏戰場上,數十架甚至數百架自殺式無人機同步出擊的場景屢見不鮮,相對于單一戰斗部的常規彈藥,無人機集群攻擊具有進攻成本低、防御成本高、攻擊面廣、目標分散等優勢。這些無人機集群系統由相當多個簡單的無人機和一些簡單的作用規則及結構拓撲組成,通過集群內多機通訊協調來共同完成系統目標,其集群系統具有自主性、分布性、協調性。無人機系統的包含控制是一種編隊控制問題,其主要目標是構造單個無人機與其鄰居無人機之間的分布式控制協議,一部分領導無人機形成一個幾何隊形,其余的跟隨無人機最終進入到由領導者形成的幾何隊形中,以實現距離保持、避免碰撞等控制要求。
目前,關于無人機集群包含控制的設計方法已經得到發展,文獻[2-3]分別提出多無人機編隊分組覆蓋路徑規劃算法和集群對抗多耦合任務智能決策方法,但對系統抗干擾的魯棒性能缺乏分析;文獻[4]建立了領導-跟隨編隊模型和無人機運動模型,并設計內環魯棒控制律對編隊外環控制產生的指令信號進行跟蹤,但并沒有考慮集群通信拓撲切換的情形;文獻[5-6]均針對切換拓撲下多機編隊的跟蹤控制展開研究,但均未考慮到實際場景下的失效、故障等擾動問題給系統的干擾和抑制問題。
無人機集群的合圍控制問題,其本質是一種多個自主獨立的個體組成集群的包含控制,目前該領域已經有諸如李雅普諾夫、圖論、線性矩陣不等式、解耦合、離散時間、魯棒H∞控制等較多研究。文獻[7]針對固定有向拓撲下連續時間和離散時間的包含控制問題進行了研究;文獻[8]研究了時變時滯二階無人機集群系統的包含控制問題,給出實現包含控制應滿足的拓撲結構、反饋增益和時滯上界。文獻[9]對比分析了有時滯和無時滯情況下多智能體網絡的穩定性,文獻[10]給出了具有非凸約束的二階分數階離散時間多智能體系統實現包含控制的充分條件,但沒有給出相應的實現算法。
當內部完全自由通訊的無人機集群出發時,由于個體故障導致集群通訊失能的代價太大,因此集群必須有隨時變換通訊的能力以應對個體的失效。變換通信拓撲下無人機集群系統的動力學行為更加復雜,文獻[11-12]解決了有向拓撲結構切換問題,并將其拓展到非凸受限情況和任意有界大時滯情況。文獻[13]進一步分析了拓撲結構與達成一致性的效率之間的關系,表明該關系趨向于正比例。文獻[14-15]在考慮時滯的情況下,研究了二階多智能體系統拓撲結構固定及切換情況下的分布式一致性問題,并給出系統收斂的一致性條件。
本文的主要貢獻是研究了變換通信拓撲下二階無人機集群系統魯棒L2-L∞包含控制問題,并給出了相應的控制算法。不同于切換拓撲的情況,文獻[16-17]僅針對通信變化的情況進行了研究;雖然文獻[18]研究了在隨機切換有符號交互拓撲的線性多智能體系統的魯棒均方一致控制問題,但不適用于系統非線性的情況。文獻[19]針對受參數不確定性和外部干擾影響的均勻線性多智能體系統(MaS),提出了兩種分層控制的魯棒控制設計。文獻[20]利用雙線性矩陣非等性式合成了線性參數變化多智能體系統鄰接矩陣的非線性規劃邊權值。文獻[19-20]中的參數不確定性不同于拓撲結構的切換,因此不適用于變換通信拓撲的情形。文獻[14-15]中的分析方法也不能直接應用于本文的無人機集群控制場景。為了解決變換通信拓撲情況下的編隊魯棒包含控制問題,本文首先提出了一種針對跟隨者無人機的非線性投影控制算法;然后,通過引入模型變換,將原模型進行轉換,基于李雅普諾夫穩定性方法及魯棒控制等理論知識,利用微分方程求解方法,結合比較定理,分析單個無人機、無人機間的運動軌跡趨勢,盡可能抑制外部擾動給無人機集群系統帶來的振蕩,最終所有跟隨無人機收斂到由領導無人機構成的物理區域。
本文所研究的無人機集群系統由M個無人機構成,其均為二階連續結構,即n個跟隨無人機和M-n個領導無人機,其中假設先期到達指定位置,并在跟隨無人機到達前保持其位置固定。其中,跟隨無人機集群為F={1,2,…,n},領導無人機集群為YL={n+1,n+2,…,M},因此,跟隨無人機可分別表示為f1,f2,…,fn,領導無人機可分別表示為ln+1,ln+2,…,lM。每個智能體在圖G=G1∪G2∪…∪Gm中用節點來進行表示,Ni={j∈V(Gk)|(j,i)∈E(G),Ni=k∈{1,2,…,m}}表示圖Gk中節點i的鄰居集合,即無人機i在第k種拓撲連接狀態下能接收到Ni集合中各無人機的信息。此外,每個無人機基于Ni集合中所接收的鄰居無人機信息來更新當前的狀態信息,這意味著并非每個智能體均能實時接收到YL={n+1,n+2,…,M}中領導無人機的信息。
考慮每個跟隨無人機的二階動力學模型如下:
(1)
式中:跟隨無人機i∈F={1,…,n},xi(t),vi(t)和ui(t)分別表示在t時刻第i個無人機的位置狀態、速度狀態和控制輸入;wi(t)是t時刻第i個無人機對應的外部擾動,且wi(t)∈L2[0, ∞)。
考慮給定的凸包Y?RM-n為領導無人機位置狀態xln+1,xln+2,…,xlM的線性組合,可表示為如下形式:
(2)
本文旨在設計合適的分布式控制律,基于各無人機間的信息交互,使跟隨無人機群在位置狀態和速度狀態上進入給定的凸包Y?RM-n中,進而實現包含控制。并且在所有跟隨無人機進入領導無人機集群所形成凸包Y?RM-n的同時,無人機集群系統需要滿足的L2-L∞性能指標如下:
(3)

(4)
式中:c1為給定的正實數;PY(η)表示向量η在非空閉凸集Y上的最小投影;y(ηi(t))描述了無人機集群系統中無人機i位置狀態或速度狀態到非空閉凸集Y的最大距離;y(ηi(t))反映出外部擾動w(t)對于各無人機進入給定凸包Y?RM-n的影響。
本文旨在設計合適的分布式控制律,實現無人機集群變通信拓撲結構下的魯棒L2-L∞包含控制,即跟隨無人機在位置和速度狀態上都進入給定的非空閉凸包Y?RM-n中,且滿足L2-L∞性能指標。
因此,本文設計的分布式控制律如下:
βi(t)[xi(t)-PY(xi(t))]
(5)

為便于后續用數學方法進行解耦分析,對系統(1)進行變換,其變換算法如式(6)所示:
(6)

(7)
因此,后續將轉而討論控制律(5)使模型轉化后的系統(7)進入領導無人機集群所形成的凸包進而實現包含控制,并將進一步探討系統是否滿足L2-L∞性能指標。
假設1.針對通信拓撲切換的情形,考慮一個非空閉集連續時間序列[ts,ts+1),s∈N,即s=0,1,…,n。式中:t0=0, 0≤ts+1-ts≤T,T為正實數。在每個時間序列[ts,ts+1)中,包含如下時間子序列:
[ts0,ts1), [ts1,ts2),…,[tsm-1,tsm),
ts0=ts,tsm=ts+1
當m≥1時,tsd+1-tsd=λ,d=0,1,…,m-1成立,λ為正實數。通信切換拓撲圖在每個時間點tsd進行切換,且在時間間隔[tsd,tsd+1)維持當前通信形式。
在通信拓撲集合G中,每個時間間隔[tsd,tsd+1)內,每個跟隨無人機i至少有一條與領導無人機相連的通路,且無人機ij能接收到Nij集合中各無人機的信息(不存在孤立點),即αijif(tsd)>0。亦即每個時間間隔[tsd,tsd+1)內,跟隨無人機能夠直接或間接地獲取領導無人機的狀態信息。


(8)


(1)當u(x)為右行最小解或v(x)為右行最大解時,那么在x∈[x0,b)區間,u(x)≤v(x)成立;在x∈(a,x0]區間,u(x)≥v(x)成立。
(2)當u(x)為左行最大解或v(x)為左行最小解時,那么,在x∈[x0,b)區間,u(x)≤v(x)成立;在x∈(a,x0] 區間,u(x)≥v(x)成立。
引理4.假設有矩陣M,A,B,及與時間參數t相關的向量δ,w,如果對式V=δTMδ存在以下關系:
(9)
則上式函數V的對t導數可以表示如下:
(Aδ+Bw)=δT(ATM+MA)δ+wTBTMδ+δTBw
(10)
引理5.對于無人機集群系統(7),基于假設2,其系統的位置狀態對于極小的時間間隔Δt,滿足以下不等式:
||xi(t+Δt)-PY(xi(t+Δt))||≤(1-kiΔt)·
(11)
其系統的速度狀態滿足:
(12)
式中:
(13)
證.針對模型(1)引入ki轉化后的系統(7),基于導數的性質,可得下式成立:
(14)
即有
(15)
式中:ki=bi+ri為正實數,其詳細定義與式(6)一致,且有1>1-kiΔt>0, 1>kiΔt>0,且(1-kiΔt)+kiΔt=1。根據式(15),結合引理2,可以推導得出:
||xi(t+Δt)-PY(xi(t+Δt))||≤(1-kiΔt)·
(16)
同理,基于模型轉化后的系統(7)及導數的性質,可得式(17)成立:
PY(xi(t))+0
(17)
也即,有式(18)成立:
(βi(t)/ki)ΔtPY(xi(t))]
(18)

(19)
在假設2中,有:

(20)
可推導出即有式(21)成立:
(21)
此外,通過觀察式(21),可得出:
(22)
由于PY(xi(t))∈Y,基于投影算子的性質:向量xi(t)到非空閉凸集Y的一次投影與二次投影相等,即有PY(xi(t))-PY(PY(xi(t)))=0成立,根據式(18)、(21)和(22),結合引理2,可以推導得出系統的速度狀態項性質如式(23):
a2i||xi(t)-PY(xi(t))||+a3ij||xj(t)-
PY(xj(t))||
(23)
定理1.在變換通信拓撲圖G中,針對動力學方程(1),通過設計合適的控制律(5),如果存在正定矩陣M使下式成立:
(24)

式中:c1x,c1v為正常數;L為通信拓撲圖所對應的拉普拉斯矩陣;A,B是與控制律(5)參數有關的對角陣。對A,B的詳細定義如下
(25)
式中:Λ1,Λ2,Λ3,Λ4分別定義如下
(26)
證.從wi(t)=0和wi(t)≠0兩種情況進行分析,首先分析wi(t)≠0的情形如下:
(1)當擾動wi(t)≠0時,分析多系統性能指標,獲得滿足L2-L∞性能指標的條件。

(27)

(28)
通過以上變換,完成了對原有非線性系統的線性轉換,系統轉換后如式(29)所示:
(29)
基于正定矩陣M,此時,構造李雅普諾夫函數如下:
V1(t)=λT(t)Mλ(t)
(30)
根據引理4,結合定義(25)、(26),對式(30)李雅普諾夫函數V1(t)進行求導,可得:
(31)
基于式(31),利用L2-L∞性能指標,構造性能指標函數J(w)來分析系統的穩定性。構造的性能指標函數J(w)如下:

(32)
式中:外部擾動w(t)=[w1(t),…,wn(t)]T∈L2[0, ∞)。由于在零初始條件下,存在V1(0)=0成立。因此,式(32)可化為如下形式:

(33)


(34)
(35)


(1-qi(t))<γM,
(1-qi(t))λ(t)<γMλT(t)λ(t),
yT(t)y(t)<γV1(t)
(36)


(37)
因此,對于任意外部擾動w(t)∈L2[0, ∞)≠0,存在:
(38)

綜合上述分析,若系統穩定,所設計的控制律(5)能夠使依照動力學方程(1)運動的跟隨無人機進入領導無人機集群所形成的閉凸包中,并且滿足L2-L∞性能指標。
(2)當擾動wi(t)=0時,分析系統性能指標,獲得滿足L2-L∞性能指標的系統穩定條件。即對于系統模型(1),置wi(t)=0,構造李雅普諾夫函數如下:
(39)

根據定義可知,李雅普諾夫函數V2(t)≥0。
基于模型轉化后的系統(7)的位置狀態項(12)、速度狀態項式(13),可得:ξk(t+Δt)-PY(ξk(t+Δt))是ξk(t)-PY(ξk(t))的凸組合。再結合引理2,有:
PY(ξk(t))||
(40)
基于式(40),可得V2(t+Δt)≤V2(t),即李雅普諾夫函數V2(t)隨著時間t的增長是非增的。根據式(39)對李雅普諾夫函數V2(t)的定義,可得V2(t)≥0,因此,V2(t)有界。
另,結合式(12),根據導數的定義,有
(41)
同時,根據式(13)及導數的定義,可得:
(42)
式中:
基于式(40),李雅普諾夫函數V2(t)隨著時間t的增長是非增的,即有:
||ξk(t+Δt)-PY(ξk(t+Δt))||≤V2(t)
(43)
基于以上的非增特性,分析系統的收斂性,只需要研究能夠接收到跟隨無人機if信息的無人機ij在位置狀態和速度狀態上的變化趨勢,即分析推導無人機間的運動趨勢。首先分析無人機if自身的位置和速度狀態到凸包的距離趨勢如下:
在時間t∈[tsd,tsd+1)內,基于該初始條件,根據位置和速度狀態因子式(41)和(42),可得:
(44)
βif為在時間t∈[tsd,tsd+1)間隔內所有的βif(t)取值中的最小值,通過微分方程的求解方法,結合比較定理,對式(44)進行求解,得到:
(45)


(46)

-kif||xif(t)-PY(xif(t))||+
(47)


(48)

接下來,需要研究可以從跟隨無人機if接收信息的無人機ij的位置和速度狀態變化,即無人機之間的運動趨勢。當αijif(t)>0,假設αijif(t)有下界αijif>0,那么根據式(42)可得出:

(49)
結合微分方程解的性質,可以得出:
(50)


(51)
同樣地,通過(41)結合微分方程的解,可得:

(52)


(53)
根據假設1,在圖G中,在每個時間間隔[tsd,tsd+1)內,每個跟隨無人機i均能直接或間接接收到領導無人機的信息,那么意味著,在時間間隔[tsd,tsd+1)內,至少有一個無人機能接收到領導無人機的信息,而存在無人機i2能夠接收到領導無人機或無人機i1的信息,那么對于φ1,φ2∈(0, 1),有下式成立:
(54)
由于隨著時間增長,跟隨無人機的位置狀態和速度狀態變化趨勢始終是非增的,因此,在時間序列[ts,ts+1)中,時間t→∞時,式(55)成立:
(55)
即在時間段t∈[tsd,tsd+1)內,當跟隨無人機if能夠接收到領導無人機il的變化趨勢信息時,或者跟隨無人機if能夠接收到鄰居跟隨無人機if的變化趨勢信息時,所有能收到信息的無人機均會收斂至凸包Y,進而實現包含控制。
綜合上述分析,控制律(5)能夠使依照動力學方程(1)運動的跟隨無人機進入領導無人機集群所形成的閉凸包中,并且滿足L2-L∞性能指標,即:
為驗證理論分析的正確性,由4臺固定的領導者無人機和6臺跟隨無人機,共同組成無人機集群系統,其中領導者無人機群的位置形成一個凸區域。對跟隨無人機集群位置與速度進行仿真,加入所設計的控制律(5)和擾動,結果表明,所設計的控制算法能夠使符合系統動力學方程的(1)跟隨無人機集群全部進入由領導無人機群形成的區域Y內,并且滿足L2-L∞魯棒控制性能指標。
基于上述理論分析結果,仿真設置控制算法(5)中參數如下:
pi=5,αi(t)=0.8,βi(t)=0.5
(56)
且所有跟隨無人機的初始位置狀態如下:
(57)
初始速度狀態如下:
(58)
同時,所有靜止領導無人機群的位置狀態如下:
(59)
令k=4,即系統進行了4次切換,仿真給出各跟隨無人機之間的拓撲圖集合G={G1, G2, G3, G4}如下:
同樣地,根據通信拓撲圖1,取通信拓撲圖中所有邊的權值為0.8,即αij=0.8,并由此可計算出無人機集群系統中通信拓撲圖所對應的拉普拉斯矩陣集L。

圖1 切換通信拓撲系統圖Fig.1 Communication topological graph
為了驗證證明過程中wi(t)=0的情形,先進行無擾動情況下無人機集群系統的仿真,跟隨無人機的位置狀態、速度狀態和系統輸出能量指標仿真結果如圖2~4所示。

圖2 位置狀態曲線(無擾動)Fig.2 Curve of position states (without disturbance)

圖3 速度狀態曲線(無擾動)Fig.3 Curve of velocity states (without disturbance)

圖4 投影誤差曲線(無擾動)Fig.4 Projection error curve (without disturbance)
為了驗證所設計的控制律(5)作用于動力學方程(1)系統的L2-L∞性能指標滿足情況,設計外部擾動wi(t)為能量有限、按一定時間間隔出現的脈沖信號,外部擾動wi(t)的具體情況見圖5。

圖5 外部擾動(基于變拓撲)Fig.5 External turbulence (switching topology)
當上述所設定的外部擾動wi(t)作用于變換通信拓撲的二階無人機集群系統時,跟隨無人機的位置狀態、速度狀態和L2-L∞性能指標仿真結果見圖6、圖7、圖8,其反應了所設計的控制律(5)對由6個滿足二階動力學模型(1)的無人機所構成無人機集群系統的控制效果。在圖6和圖7中,所有跟隨無人機在位置狀態和速度狀態都最終進入領導無人機所形成的凸包,即解決了無人機集群系統的包含控制問題;在圖8中,可以觀察到代表包圍控制效果的投影誤差逐漸減小,干擾得到抑制,系統滿足L2-L∞性能指標:

圖6 位置狀態曲線(變拓撲的有擾動情形)Fig.6 Curve of position states (disturbance case of switching topology)

圖7 速度狀態曲線(變拓撲的有擾動情形)Fig.7 Curve of velocity states (disturbance case of switching topology)

圖8 投影誤差的變化曲線(變拓撲)Fig.8 Variation curve of the projection error (switching topology)
通過分析圖6~8可以得出:所設計的控制律(5)能夠使符合動力學模型(1)的所有跟隨無人機位置狀態和速度狀態進入領導無人機集群形成的閉凸包Y內,并且滿足L2-L∞性能指標。因此,基于MATLAB/SIMULINK平臺的仿真結果與定理1分析推導的結果是一致的。
本文研究了具有通訊變換特點的無人機集群系統的魯棒控制控制問題,基于系統動力學方程,分析了外部干擾不確定甚至未知的工作環境疊加通信拓撲切換對原系統的影響。理論分析結果和數值仿真的結果均表明,在常見的變換通信拓撲時間序列中,在僅有部分跟隨無人機能夠得到領導者信息的狀態下,其他無人機僅僅需要用到部分鄰近的同伴無人機信息,即使是間接獲得領導者的信息,也可以通過合適的控制律(5),來調整自身位置狀態、速度狀態,最終使無人機系統中所有跟隨無人機進入領導無人機群的合圍凸區域里,且證明了該方法具有L2-L∞魯棒性,該工作在無人機集群理論研究和實際的集群控制系統中都有重要的應用價值。