張瑀航,姜玉蓮,崔立朝,王海偉
(長春工業大學 電氣與電子工程學院,吉林 長春 130012)
近年來,多智能體系統協調合作在航天器[1]、無人飛行器[2]、傳感器網絡[3]、移動機器人[4]以及無人地面車輛[5]等領域應用普遍,受到了廣泛關注和深入研究。作為多智能體協調控制的基本問題之一,一致性控制問題已成為熱門話題[6-7]。
在多智能體網絡系統中,每個智能體都具有一定的感知、決策和通訊能力,其一致性問題是指多智能體網絡的個體按照設計的控制規則,相互傳遞信息,相互影響,隨著時間的推移,使得所有智能體的狀態或輸出趨于一致[8-9]。近年來,多智能體一致性問題的研究取得了許多成果[10-11]。文獻[12]對隨機多智能體系統的一致性控制方法進行了綜述。Ni和Cheng[13]針對固定和切換通訊拓撲結構的多智能體系統,提出帶有領導者的一致性協議。陳剛等[14]研究了受到未知干擾的多智能體系統的魯棒一致性控制方法。
由于帶寬、技術水平、通信成本等條件的限制,多智能體系統中的信息交互并不是每時每刻都在進行,因此,間歇通信的多智能體系統一致性問題越來越受到人們的關注。Wen等[15]研究了間歇通信下無領導者的高階線性多智能體的一致性。文獻[16]研究了間歇通信下異構線性多智能體系統的輸出包含問題。文獻[17]研究了在有向圖下具有間歇通信的連續/離散廣義線性多智能體系統的一致性問題。上述成果主要解決的是無領導者的間歇通信多智能體系統一致性問題。而具有領導者的多智能體分布式協調跟蹤控制不僅能夠節省控制能量和成本,還能使系統以更快的速率進行收斂。所以基于協調跟蹤控制的領導-跟隨一致性問題成為一個熱門話題[18]。在實際應用中,由于很多系統本質上都是非線性的[19-20]。因此,該文研究了間歇通信的非線性多智能體系統分布式協調跟蹤控制問題。
針對間歇通信的非線性多智能體系統,該文提出了一種新的分布式協調跟蹤控制方法,以保證非線性智能體的狀態能夠跟蹤領導者。同時,利用切換系統理論和LMI技術,得到了分布式協調跟蹤算法實現非線性領導-跟隨多智能體系統一致性跟蹤的充分條件。并進一步證明了當通信速率大于某一閾值時可以保證所設計的分布式協調跟蹤控制器實現間歇通信情況下的一致性跟蹤目標。

對于一個有向圖,有下列性質。

該文研究的多智能體系統由N個跟隨者和一個領導者組成,具有非線性動態的多智能體動力學方程為:
(1)
(2)

假設1:存在一個非負常數r使得下列式子成立:‖f(y,t)-f(z,t)‖≤r‖y-z‖,?y,z∈Rn,t≥0,則說明此式滿足Lipschitz條件。
在一些實際應用中,由于通信通道的不可靠性、物理設備的故障等,使得智能體之間的交流可能只在某些斷開的時間間隔中進行。該文考慮間歇通信情況,為實現跟隨者能夠協調跟蹤領導者的控制目標,提出一種間歇通信的分布式協調跟蹤控制器:
(3)
其中,Tp=[kρ,kρ+ρ),Tq=[kρ+δ,(k+1)ρ),c>0為耦合增益,K∈Rm×n是反饋控制增益矩陣,并且k∈Z,標量ρ>δ>0。

將新的分布式協調跟蹤控制器(3)作用于多智能體系統(1),得到間歇通信的閉環多智能體系統:
(4)
其中,i=1,2,…,N。
定義領導者與跟隨者的一致性跟蹤誤差為:ei=xi-x0,則由式(2)和式(4)可得:
(5)
其中,H=L+G。
本節,將給出分布式協調跟蹤控制器(3)的設計過程,實現系統(1)在強連通通信拓撲結構下的一致性跟蹤目標。
首先,給出分布式協調跟蹤控制器(3)的設計算法,即算法1:
(1)求解下列矩陣不等式(LMI)。
(6)

(2)求解下列LMI。
(7)
得到矩陣Q-1>0,常數τ>0。
(3)選擇耦合增益c>α/a(H),其中a(H)由引理1得到。
定義rk=δk/ρ為第k個時間間隔的通訊速率,進而給出主要結論。
證明:構建Lyapunov函數
其中,Ξ=diag{ξ1,ξ2,…,ξN},使得ξTL=0和ξTIN=1的正向量ξ=(ξ1,ξ2,…,ξN)T,正定矩陣S和Q為LMIs (6)和(7)的對稱正定解。
當t∈Tp時,
eT(t)(Ξ?S-1A+Ξ?ATS-1)e(t)+
2eT(t)(ΞcH?S-1BK)e(t)+
(8)
eT(t)(ΞcH?S-1BBTS-1)e(t)+
(9)
根據假設1和Young不等式得:
r‖eT(t)(Ξ?S-1)‖?‖e(t)‖≤
IN‖?‖e(t)‖≤
(10)
進而由式(10)可得:
(11)
結合引理2和算法1,整理(11)得:
(12)
由(6)及Schur補理論可得:
-βeT(t)[Ξ?S-1]e(t)
(13)
當t∈Tq時,
eT(t)(Ξ?QA+Ξ?ATQ)e(t)+
(14)
根據假設1和Young不等式得:
eT(t)(Ξ?QA+Ξ?ATQ)e(t)+
(15)
reT(t)[Ξ?Q]e(t)
(16)
當分布式協調跟蹤控制器(3)在切換時刻t=kρ和t=kρ+δ時,在(13)和(16)的基礎上可得:
V(ρ)<θe(ρ-δ0)V(δ)<θ2e-βδ0+τ(ρ-δ0)V(0)=
e-γ0V(0)
(17)
其中,γ0=βδ0-τ(ρ-δ0)-2lnθ。
(18)
其中,γi=βδi-τ(ρ-δi)-2lnθ>0,i=0,1,…,k,對于任意t>0,存在zρ (19) 因此定理1能夠使多智能體系統(1)實現一致性跟蹤目標。證畢。 定理1和算法1主要解決了多智能體系統(1)具有非線性動態情況下的一致性跟蹤問題,當非線性動態f(xi(t))=0和f(x0(t))=0時,間歇通信的分布式協調跟蹤控制協議為: (20) 其中,F=Rm×n為反饋控制增益矩陣。 分布式跟蹤控制協議(20)的設計算法,即算法2如下: (1)求解下列LMI: AS'+S'AT-α'BBT+β'S'<0 (21) (2)求解下列LMI: AQ'-1+Q'-1AT-2τ'Q'-1<0 (22) 得到矩陣Q'-1>0,其中常數τ'>0為正常數。 (3)選擇耦合增益c'>α'/a(H),其中a(H)由引理1得到。 下面給出解決非線性動態為零即線性多智能體系統一致性跟蹤問題的推論。 證明:此證明過程與定理1證明過程類似,在此不再贅述。 本節以非線性多單擺網絡系統作為研究對象,通過仿真實驗和對比分析,驗證基于間歇通信的分布式協調跟蹤控制方法的有效性。 考慮由5個直流電機驅動的單擺系統(如圖1所示)和一個領導者所構成的多單擺網絡系統,其通信拓撲結構如圖2所示。其中節點0代表領導者,其余則為跟隨者。多單擺網絡系統中跟隨者的運動模型如式(1)所示,i=1,…,N,N=5,A,B和f(xi)如下所示: 其中,u表示端子電壓,R和L分別表示電樞電路的電阻和電感,ia表示電樞電流,E表示直流電機的反電動勢,擺球的質量用m表示,l是擺桿的長度。KT和KE分別表示電機轉矩常數和反電動勢常數。 領導者的動態方程如式(2)所示,設定多單擺網絡系統的參數為: 其中,f(xi(t))和f(x0(t))滿足假設1中的Lipschitz條件。 假設通信持續時間δ=3.5,則每一個時間間隔為[5k,5k+3.5),k∈Ζ。控制參數τ=0.1,β=0.2。根據算法1及控制協議(3),得到反饋增益矩陣K=[-15.25,-16.62,-2.82],選擇c=40。在仿真中,考慮兩個時間間隔,即t=[5k,5k+3.5)和t=[5k+3.5,5k+5)。通信模式如圖3所示。 若Y=1說明系統中相鄰智能體之間正在進行通信,Y=0則說明系統中相鄰智能體之間通信中斷。 圖4~圖6為間歇通信設計的控制協議作用下的一致性跟蹤仿真結果,仿真結果驗證了該文所設計的分布式協調跟蹤控制器(3)能夠使間歇通信的非線性多單擺網絡系統(1)~(2)的角位移、角速度和電樞電流達到一致性跟蹤目標。 該文研究了間歇通信的非線性領導-跟隨的多智能體系統的分布式協調跟蹤問題,提出了一種新的基于間歇通信的一致性跟蹤控制協議,并給出了設計過程。同時,利用切換拓撲理論和LMI技術分析了多智能體系統的穩定性,以保證多智能體的狀態協調跟蹤領導者。由于現實生活中系統受到干擾及延時等綜合因素的影響,所以在之后的研究,會更加切合實際,考慮間歇通信的多智能體系統中存在時滯、干擾等情況,解決其分布式協調跟蹤控制問題。

3 仿真實驗
3.1 非線性多單擺網絡系統

3.2 結果有效性實驗
4 結束語