左仁偉, 李穎暉,*, 呂茂隆, 聶鴻雁
(1. 空軍工程大學航空工程學院, 陜西 西安 710038; 2. 空軍工程大學空管領航學院, 陜西 西安 710051;3. 中聯西北工程設計研究院有限公司, 陜西 西安 710077)
多領導者包容控制是近年來多智能體協同控制領域的研究熱點之一,其主要任務是通過設計控制協議,驅使一組跟隨者運動至多個領導者所圍成的最小幾何空間(凸包)中[1]。包容控制可有效規避復雜危險環境中的動態障礙物干擾,顯著提高任務執行效率和系統安全裕度,在多智能體遂行敵區搜索、火災營救以及合作運輸等任務中有著廣闊應用前景[2-3]。然而,實際網絡化多智能體對信道帶寬和傳輸頻率有著較高要求。當信號傳輸通道帶寬受限、智能體之間交互頻繁時,網絡通信可能出現信號阻塞/數據丟包等不利情形,嚴重降低控制系統的實際運行性能。為在有限通信資源的基礎上保證群系統安全穩定運行,學者們提出以事件發生來驅動信號傳輸的事件觸發通信機制[4-6]。相比傳統采樣周期固定的時間觸發通信機制,事件觸發通信機制具有網絡通信頻次低和信道帶寬占用小等優勢,因而廣泛應用于航天器組網[7]、智能電網[8]、自動駕駛汽車編隊[9]、高速列車協同[10]等實際系統。
值得注意的是,上述成果[4-10]均屬于靜態事件觸發通信機制,即基于靜態觸發函數解算下一信號傳輸時刻,其系統能耗與帶寬占用相對較高。為進一步放寬事件觸發閾值,Girard在靜態事件觸發機制(static event-triggered mechanism, SETM)的基礎上提出一種動態事件觸發機制[11](dynamic event-triggered mechanism, DETM),該機制的關鍵特征是觸發函數包含一個額外的內部動態變量,其動態可被視為靜態觸發函數的濾波輸出。相比于SETM,DETM具有更大的事件觸發閾值和更少的信號傳輸頻次,因而吸引了大量學者關注;Ge等為調度智能體間的通信,開發了一種動態事件觸發通信機制,減少了智能體間不必要的數據交換,獲得了更高的通信資源利用效率[12];Ahmad等針對配備動態阻尼器的輪轂式電動汽車,研究了分布式動態事件觸發通信和主動懸架控制的協同設計問題[13];Coutinho等采用協同設計方法,同時設計DETM和增益調度控制器,并利用狀態相關的調度函數對控制器進行參數化[14]。然而,上述事件觸發機制均要求智能體連續監測系統狀態信息,以便實時判斷是否滿足觸發條件,在一定程度上會造成傳感器資源浪費。
為進一步放松該限制條件,Anta等提出一種無需連續監測系統狀態信息的自觸發機制,該機制只需目標當前狀態信息即可解算下一采樣時刻,并在該時刻進行狀態測量、控制律計算、執行器更新[15]。在文獻[15]的基礎上,自觸發機制被大量應用于線性系統[16]、非線性系統[17]、線性多智能體[18-20]以及非線性多智能體[21-23]的控制設計中;Wang等擴展了傳統自觸發反饋系統L2穩定性的相關工作,基于采樣狀態預測下一事件的開始和完成時間,放寬了傳統工作中過程噪聲幅值受系統狀態限制的假設條件[16];Wang等設計了一種能夠有效補償輸入遲滯非線性的自觸發控制方法,保證跟蹤誤差由設計參數的顯式函數限定[17];Xu等構建了一種完全分布式自觸發機制,在線調度每個線性智能體網絡信道的信息傳輸[20];Chen等針對一類傳感器飽和情形下的非線性多智能體,提出了一種基于神經網絡的自觸發一致性控制方案[21]。上述文獻工作為推進研究自觸發通信機制下高階不確定非線性多智能體協同控制問題提供了堅實的理論基礎。然而,以上工作在設計事件觸發機制時沒能綜合考慮動態事件觸發和自觸發機制的優勢[24-26]。如何設計一種無需連續監測系統狀態信息且觸發閾值較大的動態自觸發通信機制是目前亟需解決的關鍵難題。
鑒于此,本文在DETM[11-14]和自觸發機制[15-23]的基礎上提出一種新型動態自觸發通信機制,在具有更大觸發閾值的同時無需連續監測系統狀態信息,進一步減少對網絡帶寬、通信成本以及智能體自身能量等有限資源的不必要消耗;采用徑向基神經網絡(radial basis function neural networks, RBFNNS)在線逼近系統不確定項,并設計自適應律實時更新網絡權值信息;利用高增益觀測器在線估計系統全狀態變量,并在此基礎上構建一種輸出反饋多領導者包容控制協議,驅使所有跟隨者收斂到領導者所圍成的動態凸包中,同時保證閉環系統所有信號半全局一致終結有界(semi-globally uniformly ultimately bounded, SGUUB)。
本文利用有向圖G(V,ε)刻畫N+M個智能體的通信拓撲,其中V∈N1:N+M表示節點集,ε?V×V表示邊集,i∈N1:n表示i=1,2,…,n。若智能體j能夠接收到智能體i的信息,則記(i,j)∈G。記智能體i的鄰域為Ni{j/(j,i)∈ε}。定義圖G對應的加權鄰接矩陣為A[aij]∈R(N+M)×(N+M),當(j,i)∈ε時aij>0,當(j,i)?ε時aij=0。假設節點不存在自環,即aii=0。定義圖G的度矩陣為Ddiag[Di]∈R(N+M)×(N+M),式中Di=∑j∈Niaij。定義圖G對應的Laplacian矩陣如下:

考慮具有N+M個節點的高階非線性多智能體,其中節點1,2,…,N表示跟隨者,節點N+1,N+2,…,N+M表示領導者。智能體i的動力學模型描述如下:
(1)

本文針對事件觸發通信下的高階非線性多智能體,提出一種輸出反饋包容控制方法,通過局部信息交互保證所有跟隨者輸出y1,y2,…,yN均收斂到由領導者輸出yN+1,yN+2,…,yN+M所圍成的動態凸包中,同時保證閉環系統所有信號SGUUB。
以下技術引理將用于推導本文的主要結論。
引理 1[27]定義向量和矩陣如下:
P=diag{pi}=diag{1/qi}
式中:1=[1,…,1]T。由上述定義可知P=PTf0和Q=QTf0。

式中:μ=mini≠j‖μi-μj‖/2。根據文獻[30]可知,RBFNNs能夠在緊集Ωx?Rq內以任意精度逼近函數F(x),即F(x)=WTS(x)+(x),x∈Ωx,式中W∈Rp為最優權值向量,(x)∈R為逼近誤差并滿足條件|(x)|≤m,m為正數。
(2)


(3)

(4)


本文采用如下的高增益觀測器估計系統全狀態信息[31]:
(5)

(6)
式中:Ψ=ηn+ρ1ηn-1+…+ρn-2η2+ρn-1η1。

(7)

隨后,計算H的i階導數可得
(8)


(9)


(10)
式中:?,δ和γ為正的設計參數。


(11)
對上式左右兩端分別進行積分可得

(12)

基于上述分析,設計如下的輸出反饋包容控制協議:

(13)


(14)
式中:Γ=L?I;L=diag[Γ1,Γ2,…,ΓN];Γ=L?I為正的設計參數。
進一步,將式(13)代入式(3)可得


(15)
本節首先分析動態事件觸發通信下高階非線性多智能體的穩定性結果,然后證明Zeno現象不存在。
定理 1考慮由動力學系統(1)所組成的多智能體網絡,在輸出反饋包容控制協議(13)、自適應更新律(14)以及動態事件觸發通信機制(9)的作用下,閉環系統所有信號SGUUB,同時領導者和跟隨者之間的包容誤差收斂到原點附近的任意小鄰域內。
證明首先構造Lyapunov函數如下:

(16)

根據式(14)~式(16),求V關于時間的導數可得

(17)

由文獻[29]的推論4.2和文獻[2]的引理1可知,存在常數Wm,Sm,εm,ym使得‖W‖≤Wm,‖S‖≤Sm,‖‖≤m,成立。另一方面,根據式(8)下方結論可得+λ2X3+λ3X4)。將上述不等式代入式(17)可得

(18)
式中:
λmax(P)λmax(L1)(λmax(L-1)(ξm+2)?+
2WmSm+kξm+ym+m)-4δλmin(P)-
2λmax(A1)‖Λ‖+λmax(L1)Zm)


(λmax(A1)+λmax(L1))λmax(P)Smξm)
β=σ-(λmax(A1)+λmax(L1))λmax(P)Smξm-
Smλmax(P)λmax(A1)
結合式(16)可進一步改寫不等式(18)為
(19)
式中:參數μ具有如下形式:
求解不等式(19)可得
V(t)≤(V(0)-ω/μ)e-μt+ω/μ
(20)



(21)
式中:

隨后,將式(21)改寫為
(22)

(23)
式中:ν和ι設置為
結合式(22)和式(23)可得
(24)

(25)
根據式(25)可進一步得到:
(26)
(27)

(28)
至此已得到事件觸發間隔的下確界。



(29)

(30)
計算|eξi(t)|2的右上迪尼導數可得
(31)
為獲得D+|eξi(t)|2的上界,由式(15)可得


(32)


(33)
結合式(30)和式(33)可得自觸發間隔:

(34)
由此構建如下的動態自觸發通信機制:
(35)
由式(34)可知

(36)
所提出的動態自觸發通信機制(35)兼具了DETM[11-14]和自觸發機制[15-23]的優勢,一方面通過引入動態變量(29)獲得更大的事件觸發閾值,降低了網絡信號采樣頻次;另一方面取消了連續監測系統狀態信息這一限制性假設條件,僅需當前狀態信息即可解算下一采樣時刻,在保證群系統包容誤差快速收斂的基礎上動態調整網絡信號采樣頻率,進一步節省網絡通信資源與傳感器資源。
本節以高超聲速飛行器(hypersonic flight vehicle, HFV)群系統為例,驗證所提出控制方法的有效性和理論分析的正確性。
考慮由4個領導者和4個跟隨者組成的HFV群系統,其中第i架HFV的縱向動力學方程表示如下:
(37)
式中:hi,γi,αi,qi,xi,Vi分別為高度,航跡角,迎角,俯仰角速度,前向位移,速度;ηij,mi,Iiyy,gi,ζij,ωij分別為第j個廣義彈性模態,飛行器質量,轉動慣量,重力加速度,阻尼比,自然頻率;Li,Di,Ti,Mi,Nij分別為升力,阻力,推力,俯仰力矩,廣義彈性力,其表達式如下:
(38)


為方便模型分析,現有文獻廣泛采用一類面向控制的模型解耦方法,其將運動學模型(37)分為垂直動態[hi,γi,αi,qi]T和前向動態[xi,Vi]T。由文獻[34]可知,在巡航段航跡角γi通常較小,為簡化模型可采用近似值sinγi≈γi。此外,由于在巡航段迎角αi足夠小,導致Tisinαi遠小于Li,因此現有文獻通常忽略Tisinαi對航跡角γi動態的影響[34]。綜上,建立不確定垂直動態如下:
(39)
式中:
復合擾動
由結構彈性和外部干擾Δih,Δiγ,Δiα,Δiq(如陣風,湍流和大氣擾動)生成。建立前向動態:
(40)
式中:
此外,復合擾動
式中:Δix,ΔiV為外部干擾。
為方便控制設計,定義一組狀態變量{xij},i∈N1:4,由此可將垂直動態(39)轉化為如下Brunovsky標準型:
(41)
通過定義xi(t)=[xi1(t),xi2(t),…,xi4(t)]T∈R4,可將式(41)進一步轉化為如下形式:
(42)

式(42)表明,垂直動態(39)已經轉化為與式(1)相同的形式,因此可以直接應用所提出的控制方法。同時,對前向動態采用相同的系統轉化方法。
考慮4個領導者和4個跟隨者組成的HFV群系統,其中Laplacian矩陣設置如下:

設置作動器δie和Φi的幅值限制分別為δie∈[-20°,20°]和Φi∈[0.05,1.2]。同時,設置HFV群系統的初始位置如下:
h1(0)=85 830 ft,x1(0)=960 ft
h2(0)=85 480 ft,x2(0)=1 070 ft
h3(0)=84 660 ft,x3(0)=580 ft
h4(0)=84 130 ft,x4(0)=1 280 ft
h5(0)=86 000 ft,x5(0)=900 ft
h6(0)=85 700 ft,x6(0)=2 000 ft
h7(0)=85 200 ft,x7(0)=0 ft
h8(0)=83 800 ft,x8(0)=1 200 ft

在仿真實驗中,設計參數對系統的收斂性能有著多重影響:設計較大的k,?和Γi會提升系統收斂速率,但同時也會增大包容誤差的收斂范圍。因此,需要在收斂速率和跟蹤精度之間進行權衡。此外,選擇較小的正常數σ能夠減小自適應估計誤差的收斂范圍,但也會帶來更加嚴重的抖振現象。由文獻[31]可知,參數κ通常設置為一個小的正常數,且通過選擇較小的設計參數ρ1,ρ2,ρ3,λ1,λ2和λ3,能夠將包容誤差的收斂范圍調整至任意小。另一方面,設置較大的γ和較小的δ,可以減小包容誤差的收斂范圍,但同時也會增加信號采樣頻次。因此,在實際工程中,參數γ和δ的選取應在收斂性能和通信成本之間進行平衡調整。

仿真以0.01 s的固定步長運行300 s,所獲得的結果如圖1~圖7所示。圖1為HFV群系統的飛行軌跡和跟蹤性能。

圖1 HFV群系統的飛行軌跡和跟蹤性能Fig.1 HFV swarms flight trajectories and tracking performance



圖2 群系統編隊隊形變化過程Fig.2 Formation changing process of swarm system
HFV剛體狀態的運行軌跡如圖3所示,可見所提出的控制方法具有快速的收斂速度和光滑的瞬態性能,并且面對外部干擾展示出較強的魯棒性。

圖3 HFVs剛性狀態Fig.3 Rigid-body states of HFVs
圖4分別展示了所提出DETM以及動態自觸發機制(dynamic self-triggered mechanism, DSTM)下的采樣信號和控制輸入。

圖4 采樣信號與控制輸入Fig.4 Sampling signals and control inputs
圖5分別給出了DETM和DSTM下的信號采樣誤差eξi(t),i∈N1:4。


圖6 采樣瞬間Fig.6 Sampling instants
為進一步說明所提出事件觸發機制的優越性,將DETM,DSTM與現有SETM[35]進行對比,其觸發條件為
為公平對比,對3種事件觸發通信機制設置相同的參數。仿真結果如圖7和表1所示。

表1 3種觸發機制下的采樣次數Table 1 Sampling times of three triggering mechanisms

圖7 3種觸發機制下的采樣次數Fig.7 Sampling times of three triggering mechanism
相比于靜態事件觸發通信機制[35],所提出動態事件觸發通信機制的信號采樣次數更少,具有更高的通信資源利用率。另一方面,盡管動態自觸發通信機制的信號采樣次數更多,但具有無需連續監測系統狀態信息的顯著優勢,更貼近于實際工程應用。
本文研究了動態自觸發通信機制下,高階非線性多智能體的輸出反饋包容控制問題。首先綜合考慮動態事件觸發和自觸發機制的優勢,提出一種動態自觸發通信機制,在具有更大觸發閾值的同時無需連續監測系統狀態信息,減少了信號采樣頻次和系統能量耗散;進而依據智能體鄰接個體的相對信息為智能體設計輸出反饋控制協議,驅使跟隨者收斂到由多個領導者圍成的動態凸包中,實現網絡的多領導者包容控制;最后以HFV群系統為例驗證了所提出方法的有效性。未來的研究方向包括時變拓撲、切換拓撲下動態自觸發通信機制設計,以及所提出控制方法在實際HFV縮比模型上的仿真實驗研究。