張 毅, 于 浩, 楊秀霞, 姜子劼
(海軍航空大學航空作戰勤務學院, 山東 煙臺 264001)
隨著分布式作戰、馬賽克戰等前沿作戰理論的提出,無人集群系統成為世界各國研究新型作戰樣式的重要武器平臺。由無人機(unmanned aerial vehicle,UAV)和無人車(unmanned ground vehicle,UGV)組成的空地協同作戰系統,在協同探測、偵測等任務場景中發揮了重要作用。UAV具有偵察范圍廣、機動能力強的優勢,作為通信中繼,可通過伴飛偵察為UGV提供精準的環境信息,能夠克服不利地形對地面車輛的影響,顯著提升了作戰效能。
編隊控制是實現集群系統協同的基礎,通過控制協議的設計,使智能體按照預定的時變隊形形成期望的相對陣位關系,執行特定任務[1-3]。合圍控制由傳統的編隊控制問題衍生而來,在確保部分智能體(領導者)形成期望隊形的同時,還使其余智能體(跟隨者)的狀態或輸出收斂至領導者形成的凸包內[4]。在目標跟蹤等典型任務場景中,領導者和跟隨者除了需要形成預設的編隊合圍構型外,還需跟蹤目標的運動軌跡,由此便催生了更為復雜的跟蹤-合圍控制問題[5-6]。
研究跟蹤-合圍控制問題的大多數文獻中,一般將目標視為“自治系統”[7-10],即不考慮目標的機動行為。而在執行對非合作目標的合圍任務時,目標往往通過改變機動形式實時調整期望軌跡,來擺脫集群系統的跟蹤。文獻[11]針對具有未知輸入目標的跟蹤-合圍控制問題,設計了分布式控制協議,利用光滑的非線性函數有效抑制時變輸入的影響;文獻[12]提出一種雙層編隊跟蹤-合圍控制策略,給出控制參數選取的具體算法,并基于移動機器人驗證方案的可行性。
上述文獻的研究對象均為同構集群系統,即智能體具有相同的動力學模型和狀態維度,利用克羅內克爾積可直接對集群系統進行狀態維度的擴展,進而得到系統穩定的可行性條件;而對于可以發揮互補優勢的異構集群系統來說,模型及狀態維度的顯著差異使得傳統的線性齊次分析方法不再直接適用,無法為跨區域、多維度的復雜任務提供有效的解決方案。隨著研究的深入,國內外學者基于輸出調節和狀態調節兩種策略,對異構集群的合圍問題進行研究。文獻[13]分別構造靜態和動態輸出反饋控制協議,解決了同構和異構集群系統的時變輸出合圍控制問題;文獻[14]結合觀測器理論和事件觸發機制設計控制律,使集群系統實現輸出合圍的同時避免了智能體之間的連續通信;文獻[15]利用動態補償技術,將合圍控制問題轉化為多智能體系統的輸出調節問題,提出一種分布式動態自適應狀態反饋和自適應輸出反饋控制協議。
需要指出的是,在執行如多目標探測、合圍等分布式作戰任務時,僅靠單一編隊難以解決問題,此時需要將集群系統分為多個小組,通過組間的協同配合共同完成任務。目前,解決異構集群系統分組合圍問題的研究成果尚未見報道。文獻[16]研究了同構集群系統的分組合圍控制問題,提出完全分布式的控制協議,并將其應用到多機器人系統;文獻[17]在文獻[11]的基礎上推導得到分組編隊間拉普拉斯矩陣的耦合性質,實現了對多目標的分組合圍。
受上述研究成果的啟發,本文研究了目標控制輸入未知情形下異構集群系統分組編隊的跟蹤-合圍控制問題。集群系統中的智能體分為目標、領導者和跟隨者,控制目標是使領導者以期望輸出隊形按預定分組跟蹤目標,同時跟隨者以期望輸出隊形收斂至所屬分組內的領導者輸出形成的凸組合,間接實現對目標的分組合圍。本文主要貢獻有:
(1) 領導者和跟隨者的期望輸出隊形均是時變的,每個智能體的動力學模型和狀態維度均是異構的,且目標均具有未知控制輸入;
(2) 基于節點和通信邊的自適應控制方法,分別為領導者和跟隨者設計分布式觀測器,利用鄰接信息估計目標和領導者狀態的同時,實現對時變控制輸入的動態補償,并給出觀測器收斂的充分條件;
(3) 利用Luenberger觀測器估計智能體自身狀態,并基于狀態估計值和輸出調節策略,設計分組跟蹤-合圍控制律,避免了對拉普拉斯矩陣特征值的顯式計算,并給出異構無人集群實現分組跟蹤-合圍的充分條件。
異構集群系統中各類智能體因動力學模型或分配任務的不同,使得工作空間或外部環境存在較大差異,而通過不同智能體之間的相互通信、自主協調,可以并行解決問題,顯著提高作戰效能。例如,受地球曲率的影響,無人艇的探測距離相對受限,無法直接獲取視距外目標的狀態信息,對此引入多架UAV作為通信中繼,可以為前者提供豐富的環境信息,大幅提升集群系統的安全性和探測的精度;在野外執行任務時,UGV易因高山、樹木的遮擋,而使通信和探測能力受到制約,此時需要探測能力強的多UAV系統提供第三視角,提高UGV行駛工況的穩定性和安全性同時,實現對目標的跟蹤。
結合圖1,解釋說明本文空地異構協同跟蹤的任務背景及控制目標。圖中目標設定為在地面移動且輸入未知的智能體,領導者表示執行空中伴飛偵察任務的UAV,跟隨者表示UGV。為此本文的控制目標確定為:通過控制協議的設計使多UAV根據預定分組形成期望隊形跟蹤目標,同時使UGV以期望隊形收斂至多UAV形成的凸包投影內部。由于空中UAV完成對目標的跟蹤后,將以地面目標為中心建立期望隊形,而UGV又以多UAV狀態的加權值作為編隊中心形成期望隊形,據此可以確保UGV間接實現了對目標的合圍。

圖1 UAV-UGV異構集群系統協同目標跟蹤Fig.1 Cooperative target tracking of UAV-UGV heterogeneous swarm system

假設異構無人集群系統包括p個目標、N個領導者和M個跟隨者。其中,領導者和跟隨者的模型[18-19]可描述為
(1)
式中:i=1,2,…,N,…,N+M,xi(t)∈Rni、yi(t)∈Rl和ui(t)∈Rmi分別表示智能體的狀態、輸出和控制量;Ai∈Rni×ni、Bi∈Rni×mi和Ci∈Rl×ni分別表示系統矩陣、輸入矩陣和輸出矩陣。其中,(Ai,Bi)是可控的且(Ci,Ai)是可測的。目標的模型為
(2)
式中:j=1,2,…,p,vj(t)∈Rm、sj(t)∈Rl和rj(t)∈Rr分別表示目標的狀態、輸出和控制量;AT∈Rm×m、BT∈Rm×r和CT∈Rl×m分別表示系統矩陣、輸入矩陣和輸出矩陣。其中,(AT,BT)是可控的且(CT,AT)是可測的。

假設2異構集群系統包括p個分組且滿足:① 每個分組中均存在以目標為根節點的有向生成樹;② 領導者之間可進行跨組通信;③ 跟隨者只能接收本組領導者的信息,并與其鄰居跟隨者是雙向通信的,且不存在孤立領導者;④ 目標相對獨立,僅向領導者發送信息而不接收信息。
根據假設2,集群系統的拉普拉斯矩陣可表示為
(3)
式中:LET∈RN×p表示目標到領導者的通信;LE∈RN×N表示領導者之間的通信;LF∈RM×M表示跟隨者之間的通信;LFE∈RM×N表示領導者到跟隨者的通信。
結合假設2可進一步將LE分解為
(4)


假設4[20]對于領導者i=1,2,…,N,調節器方程:
(5)
有對解(Xi,Ui),且矩陣方程:
BiRi-XiBT=0
(6)
存在解Ri。
假設5[20]對于跟隨者j=N+1,N+2,…,N+M,調節器方程:
(7)
有對解(Wji,Yji),且矩陣方程:
Bjφji-WjiBi=0
(8)
存在解φji。
由于異構集群系統狀態維度的差異,無法直接利用智能體的狀態信息進行控制器的設計,為此利用假設4和假設5中的調節方程進行輸出維度的統一。
分別設時變向量hi(t)、δj(t)為領導者和跟隨者的期望時變輸出隊形,hi(t)和δj(t)是可微的,且分別滿足輸出方程hEi(t)=Cihi(t)和δFj(t)=Cjδj(t)。

(9)
則稱領導者實現以期望輸出隊形hEi(t)跟蹤目標。

(10)

定義3若定義1和定義2同時成立,則稱異構無人集群系統實現了對多目標的分組跟蹤-合圍。

為實現上述控制任務,本節分別針對領導者和跟隨者進行控制律設計。

ηBTfi(ζi(t))
(11)
(12)

在分布式觀測器式(11)中,自適應增益ci(t)的引入,使得在進行狀態估計的過程中,同步進行鄰接估計誤差的實時反饋和補償,實現狀態估計的自調節,能夠提高狀態估計的精度和觀測器的收斂速度。
為使領導者形成期望隊形并實現對目標精確跟蹤,設計如下控制協議:
(13)
wi(t)-η?i(t)
(14)
在觀測器中,設計了基于節點的自適應補償增益,使得對目標的鄰接估計誤差能夠進行實時反饋,提高了集群系統的跟蹤性能。
引理 1[17]在假設2成立的條件下,對于含組間通信耦合的LaplacianLE,存在實對角矩陣Δ1和G使不等式成立:
(15)
為實現領導者對目標的分組跟蹤,控制協議式(11)~式(14)中的部分參數需滿足:

(16)
式中:Q>0。
(2) 選取(Xi,Ui)、Ri使假設4成立,設計Ei、K1i使Ai+EiCi和Ai+BiK1i是Hurwitz的,K2i滿足K2i=Ui-K1iXi。
(3) 非線性函數fi(ζi(t))、?i(t)定義為
(17)
?i(t)=RiGi(t)
(18)
式中:
(19)

(4) 存在正定矩陣Mi,滿足方程:
Mi(Ai+BiK1i)+(Ai+BiK1i)TMi+2Ini=0
(20)
(5) 選取控制輸入抑制參數:η>rmax。
下面給出異構無人集群系統實現分組編隊跟蹤控制的充分條件。
定理1若假設1~假設5成立,控制律中的參數滿足式(16)~式(20)且期望隊形的補償函數wi(t)滿足:
(21)
則異構集群系統在控制協議式(11)~式(14)的作用下,實現了分組編隊的跟蹤控制。

η(IN?BT)f(ζ(t))-(IN?BT)rT(t)
(22)
式中:
ζ(t)=[ζ1(t),ζ2(t),…,ζN(t)]T
c(t)=diag{c1(t),c2(t),…,cN(t)}
ρ(t)=diag{ρ1(t),ρ2(t),…,ρN(t)}


(23)
結合式(22)可得
η(LE?BT)f(ζ(t))-(LE?BT)rT(t)
(24)
構造具有如下形式的Lyapunov函數,
(25)

(26)
式中:
2ζT(t)[(c(t)+ρ(t))Δ1GLE?PBT]rT(t)-
2ηζT(t)[(c(t)+ρ(t))Δ1GLE?PBT]f(ζ(t))
(27)
根據f(ζ(t))定義并結合Cauchy-Schwarz不等式可得
-2ηζT(t)[(c(t)+ρ(t))Δ1GLE?PBT]f(ζ(t))≤
(28)
根據假設1有
-2ζT(t)[(c(t)+ρ(t))Δ1GLE?PBT]rT(t)≤
(29)
綜上可得
(30)

(31)

(32)

下面證明領導者在控制律的作用下能夠實現以期望隊形跟蹤目標。
將控制律代入系統方程可得

(33)
對ξi(t)求導可得:
(34)
構造具有如下形式的Lyapunov函數:
(35)
沿式(35)求導得到:
(36)

(37)


(38)
由此可得

(39)

故領導者最終能夠以期望輸出隊形跟蹤上目標。
證畢
在實際任務背景下,因外部環境的限制,跟隨者無法直接獲取目標的狀態信息,因此需要領導者作為中介,間接“傳遞”目標狀態。在第2.1節中,領導者以目標為中心形成期望隊形,則只需保證跟隨者以期望的輸出隊形在控制協議的作用下收斂至領導者輸出的凸組合,即可完成跟隨者對于目標的輸出合圍。
(40)
(41)
(42)
式中:

與觀測器式(11)不同,式(41)中設計基于通信邊的自適應增益,實現估計誤差實時反饋的同時,便于后續Lyapunov函數的設計和閉環系統穩定性的分析。
為實現跟隨者對目標的分組合圍,控制協議式(40)~式(42)中的部分參數需滿足:

(2) 非線性函數fj(t)、κji(t)定義為
(44)
(3) 存在正定矩陣Mj,滿足方程:
Mj(Aj+BjK1j)+(Aj+BjK1j)TMj=-2Inj
(45)
(4) 選取控制輸入抑制參數:
η1>umax
(46)
下面給出異構無人集群系統實現分組合圍的充分條件。
定理2若假設1~假設5成立,且控制參數滿足上述條件且編隊輔助函數滿足可行性條件:
(47)
則跟隨者在控制協議式(40)~式(42)的作用下以期望隊形收斂至領導者輸出的凸組合。
證明首先證明觀測器的收斂性。定義跟隨者對領導者的估計誤差為


(48)
定義具有如下形式的Lyapunov函數:
(49)
對式(49)求導可得
(50)
式中:
(51)
根據fj(t)的定義及假設1可得
(52)
且
(53)
結合式(46),據此可將式(50)化簡為
(54)

(55)

(56)
令

證畢
將控制律式(42)代入系統方程可得
(57)

(58)
根據式(47)及假設5化簡得
(59)
設計如式(60)所示的Lyapunov函數:
(60)
求導得
(61)


(62)

(63)
故可將式(61)化簡為

(64)

證畢
綜上,異構集群系統能夠在控制協議的作用下實現分組編隊的跟蹤-合圍控制。
上述控制協議的設計是針對多目標的跟蹤與合圍問題展開的,適用于目標空間位置較為分散的情形。而當多個目標空間位置較為集中時,無需對異構集群系統進行分組設計, 此時本文研究的問題便轉化為單一編隊對目標的跟蹤-合圍控制問題,領導者對目標狀態的估計轉化為
ηBTfi(ζi(t))
(65)
(66)
(67)

(68)
定義估計誤差:
(69)

(70)
(71)
ζ(t)-η(LE?BT)f(ζ(t))-(-LET?BT)rT(t)
(72)
后續證明過程與定理1類似。與分組編隊不同,在此情形下觀測器的期望值為目標狀態的加權值,即所有領導者都以多目標狀態的凸組合為編隊中心,并在控制協議的作用下形成期望隊形,實現了對目標的跟蹤控制,跟隨者的控制策略與前文類似。相較于文獻[23],本文的運動目標具有未知的控制輸入,而非傳統的“自治系統”,需在觀測器及控制律的設計中利用非線性函數對rT(t)進行抑制。
為驗證本文控制策略的有效性,本節考慮由12架UAV、9輛UGV組成的空地異構無人集群系統共同執行對3個機動目標的跟蹤-合圍任務,其中領導者i=1,2,…,12表示UAV,跟隨者j=1,2,…,9表示UGV。考慮實際任務背景下,受限于高山或其他建筑物的遮擋,UGV無法利用自身攜帶的傳感設備探測地面機動目標的具體方位,此時需要UAV作為通信中介在空中形成期望編隊,并確保目標處于UAV隊形在地面的投影內,同時UGV以期望輸出隊形跟蹤UAV輸出的凸組合,進而間接實現了UGV對地面目標的合圍。
考慮如下目標模型:
在本文研究的跟蹤-合圍問題中,重點關注智能體之間的位置關系,且由于目標在XOY平面內運動,因此僅考慮UAV在定常高度下飛行,基于文獻[24]中位置環的控制架構,給出UAV線性化模型
利用反饋線性化理論,基于麥克納姆輪結構的UGV模型[25]可表示為
Aj=02×2,Bj=I2,Cj=I2
假設在初始階段t取0~30 s,目標沿同一方向運動,此時異構智能體構成單一編隊進行合圍,智能體間的通信關系如圖2(a)所示,目標的控制輸入設定為

圖2 集群通信拓撲 Fig.2 Swarm communication topology
目標初始運動狀態設定為:v1(0)=(1,0,2,0),v2(0)=(3,0,2,0),v3(0)=(2,0,2,0)。
為直觀描述異構集群系統的控制效果,分別設計UAV、UGV的編隊函數為
為使UGV以期望輸出隊形跟蹤UAV輸出的凸組合,設置權重αji=1/12,即,將UAV輸出的平均值作為UGV期望編隊的中心。智能體的初始狀態隨機給出。
下面對控制策略中的參數值進行設計。

取Q=0.5I2,求解Riccati方程得
求解Lyapunov方程得
根據編隊可行性條件求得編隊輔助函數:
wi(t)=
wj(t)=
假設各目標在t取30~60 s進行分散機動,為實現分組合圍,智能體間的通信拓撲切換為圖2(b)所示的結構,控制輸入調整為
r1(t)=[0.8sin(0.06t),0.8cos(0.04t)]
r2(t)=[0.5sin(0.06t),0.8cos(0.05t)]
r3(t)=[0.3sin(0.06t),0.8cos(0.06t)]
UAV和UGV按預定分組繼續執行上一階段的編隊函數。
異構集群系統在不同時刻對目標的合圍情況如圖3所示,其中UAV設定在固定高度20 m飛行,并以顏色區分不同群組。t取0~30 s時,UAV在空中形成圓形編隊,并圍繞目標旋轉,UGV以UAV輸出的加權值為中心,在地面形成時變編隊,實現對目標的合圍;t取30~60 s時,集群系統在控制協議的作用下形成3個子編隊,實現對目標的分組圍捕。圖4表示各架UAV對目標狀態的估計值,在t取0~30 s期間,目標運動軌跡相對集中,各架UAV對多目標狀態的加權值進行估計,作為編隊中心形成期望隊形,t取30~60 s期間,目標進行分散機動,各UAV按預定拓撲對分組內的目標狀態進行估計,并形成分組隊形;由圖5可知,各UAV對目標狀態估計誤差的范數隨時間收斂至較小幅值范圍內。從圖6可以看出,UAV對目標跟蹤誤差的范數在有限時間內迅速衰減到合理范圍內,在t取30 s時集群開始形成分組隊形,誤差的范數經短暫增大后迅速收斂至較小幅值范圍內,說明UAV能夠以期望隊形跟蹤目標輸出的凸組合。從圖7可以看出,輸出合圍誤差的范數能夠收斂至較小范圍內,說明UGV的輸出能夠在控制協議的作用下收斂至UAV輸出的凸組合。圖8表示UAV對目標狀態估計的自適應增益演化曲線。

圖3 異構集群系統目標合圍示意圖Fig.3 Schematic diagram of target containment of heterogeneous swarm system

圖4 目標狀態估計值Fig.4 Estimation value of target state

圖5 目標狀態估計誤差Fig.5 Estimation error of target state

圖6 UAV目標跟蹤誤差Fig.6 UAV target tracking error

圖7 UGV合圍誤差Fig.7 UGV containment error

圖8 自適應增益Fig.8 Adaptive gain
本文研究了異構集群系統分組編隊的跟蹤-合圍控制問題,主要結論如下:
(1) 系統中目標軌跡通過時變輸入進行規劃,克服了“自治系統”(無控制輸入)機動能力差的缺陷,使后續控制策略的設計過程更符合工程實踐;
(2) 為獲取目標和領導者狀態的凸組合,結合自適應控制理論分別為領導者和跟隨者設計基于鄰接信息的分布式觀測器,實現對時變控制輸入的動態補償,并給出觀測器收斂的充分條件;
(3) 針對智能體模型異構的特點,利用狀態估計值和輸出調節策略,設計分組跟蹤-合圍控制律,避免了對拉普拉斯矩陣特征值的顯式計算,并給出異構無人集群實現分組跟蹤-合圍的充分條件;
(4) 仿真結果表明,在控制協議的作用下,UAV-UGV異構集群系統能夠實現目標的分組合圍。
下一步,將對含外部擾動和時延約束的異構集群系統分組編隊的合圍問題進行深入研究,并對研究成果做進一步驗證。