李 耿,秦 雯,王 婷,汪 輝, 沈謀全
(南京工業大學 電氣工程與控制科學學院,南京 211816)(*通信作者電子郵箱qinwen.wts@njtech.edu.cn)
近年來,多智能體系統的分布式協調控制問題引起了不同學科的研究人員的關注[1-3]。一致性問題作為合作控制的最基本問題之一,它要求所有的智能體通過相互交流,讓所有智能體的狀態趨于一致或者相同。很多研究者從各個角度對一致性問題進行了研究[4-9]。其中,基于領導-跟隨者模型的多智能體系統協調控制問題是主要的研究熱點之一。文獻[10]分別考慮了有無領導者情況下的多智能體系統一致性問題。文獻[11]利用分布式觀測器研究了領導-跟隨者的一致性問題。針對切換拓撲結構,文獻[12]研究了帶有時滯的多智能體系統的一致性問題。隨著深入研究,研究者們發現由于時間延遲的廣泛存在,網絡中的信息傳遞通常不是即時的?;谶@個考慮,文獻[13]提出了滯后一致性的概念。滯后一致性表示跟隨者的狀態向量落后于領導者一段時間,這使得多智能體系統在有限容量的網絡中運動并且不會堵塞。實際上,滯后一致性的現象可以模擬許多實際情況。文獻[14]得出了保證領導-跟隨者多智能體系統實現滯后一致的充分條件。文獻[15]基于相鄰智能體的局部信息,提出一種自適應反饋控制算法來實現二階非線性多智能體系統的滯后一致性。文獻[16]提出了利用牽制控制實現二階多智能體系統的滯后一致性。上述所有的結果都是關于具有相同的動力學模型的多智能體。然而實際應用中,一方面自然界個體和人造工程系統無論在功能上還是結構上都存在差異,智能體的動力學很可能是彼此不同的,比如由于動態系統不同的衰減系數或不同的質量,兩個二階智能體的動力學結構是相同的,但是參數卻可能是不同的。另一方面由于群體智能體的共同目的或者通信和執行能力的互異性,耦合智能體的動力學模型可能會不同[17-18],因此研究異構多智能體系統的群集控制具有重大的理論價值和應用前景[19-20]。近年來,越來越多的人關注一類異質多智能體系統——由一階和二階智能體組成的混合階多智能體系統的一致性問題[21-22]。和高階或者一般混合階多智能體系統的研究工作相比,混合階多智能體系統一致性研究的工具和手段不同。一方面,前者由于模型簡單,更容易得到比較直觀、簡單的理論;另一方面,由一階和二階智能體組成的混合階多智能體系統包含有廣泛研究結論的一階智能體系統和二階智能體系統作為特殊情形。因此,關于混合階多智能體系統一致性問題的研究具有一定的理論和實際意義。
受文獻[16,22]的啟發,本文研究領導-跟隨者異質多智能體系統的滯后一致性。文獻[16]研究了具有動態領導者的二階多智能體系統的滯后一致性問題,但是所有的智能體擁有相同的動力學模型。本文旨在將文獻[16]討論的結果擴展到由一階和二階智能體組成的混合階多智能體系統的情況。首先,針對由一階和二階動力學模型組成的異質多智能體系統,提出一種基于牽制控制的分布式一致性控制協議,來實現異質多智能體系統的滯后一致。通過模型轉換,將原始系統轉換為等效系統以便進行理論分析。其次,利用圖論和Lyapunov穩定性理論證明所設計的協議在固定拓撲結構下是可行的,并且給出了基于線性矩陣不等式形式的充分條件,保證了異質多智能體系統實現領導-跟隨者滯后一致性。然后,將得到的結果擴展到切換拓撲結構下的異質多智能體系統的情況。數值仿真驗證了所提方法的有效性。
本章介紹了圖論知識[23]并引入了模型。

符號說明 本文中,X=diag{x1,x2,…,xn}表示矩陣是以xi為對角元素的對角矩陣。R表示實數集合,Rn是n維歐幾里得空間,Rm×n表示m×n維的實數矩陣。Im和0m分別表示m維的單位矩陣和零矩陣。
本文針對智能體系統中個體在動力學上的差異性,將其分為一階和二階智能體,研究混合階多智能體系統的一致性問題。考慮由一個領導者和n個異構跟隨者組成的異質多智能體系統,動態領導者表示為:
(1)
其中x0(t)∈Rl和v0(t)∈Rl分別表示動態領導者的位置和速度。
下面給出由一階和二階智能體組成的混合階跟隨者。前m個智能體是二階的,后n-m個智能體是一階的。異質多智能體系統的方程為:

(2)
其中:xi(t)∈Rl和ui(t)∈Rl分別表示跟隨者i的位置和控制輸入;vi(t)∈Rl代表二階智能體的速度。
為方便理論分析,本文假設l=1。l>1時相關理論可以用克羅內克積進行推廣。
定義1 若存在常數τ>0, 使得:
則稱異質多智能體式(1)和(2)能夠實現領導-跟隨者滯后一致性。
本文研究的目的是基于牽制控制思想設計分布式控制協議,使得異質多智能體系統實現滯后一致性。
首先考慮在固定拓撲結構下,擁有動態領導者的異質多智能體系統的滯后一致性。設計基于鄰居信息的滯后一致性協議如下:
ui(t)=

(3)
其中:A=[aij]n×n表示固定拓撲圖G的鄰接矩陣;c1>0,c2>0是控制參數;(x0(t-τ)-xi(t))和(v0(t-τ)-vi(t))兩部分是為了使跟隨者與動態領導者之間分別實現位置和速度的滯后一致性。本文采用了牽制控制策略。當智能體i能接收到領導者的信息,則bi>0;否則bi=0。 通過協議式(3),帶有動態領導者的異質多智能體系統能夠達到滯后一致。
注1 本文采用了牽制控制思想,當第i個智能體的節點需要被牽制,則局部反饋增益bi>0。對于大型復雜網絡,通常需要通過對所有節點添加控制器來控制它,這樣一般是很難做到的,并且花費的價格高昂,而牽制控制可以有效改善這種情況。

將式(3)代入式(2),并整理可得:
(4)

引理1[24]線性矩陣不等式(Linear Matrix Inequality, LMI)為:
其中,Q(x)=QT(x),R(x)=RT(x),它等價于下面的任何一種情況:
1)Q(x)<0,R(x)-ST(x)Q-1(x)S(x)<0。
2)R(x)<0,Q(x)-ST(x)R-1(x)S(x)<0。
定理1 考慮帶有動態領導者式(1)的異質多智能體系統式(2),假設固定拓撲下的動態領導者是全局可達點。對于任意的初始狀態,如果存在常數c1>0,c2>0和正定矩陣P1滿足以下線性矩陣不等式:
(5)
其中E1=
則異質多智能體系統可以實現滯后一致性。

(6)
其中E1=
通過式(4),可將多智能體系統式(1)、(2)的一致性跟蹤控制問題的研究轉換為分析誤差方程式(6)的穩定性。
針對誤差系統式(6),選取Lyapunov函數V(t)=yT(t)P1y(t),其中P1是一個正定矩陣。
對V(t)求導得:
(E1y(t))TP1y(t)+yT(t)P1(E1y(t))=

考慮靜態領導者的情況,得到以下推論。
推論1 考慮具有靜態領導者(v0(t)=0)的異質多智能體系統式(2),假設靜態領導者在固定拓撲下是全局可達點。對于任意初始狀態,若存在常數c1>0,c2>0和一個正定矩陣P1滿足線性矩陣不等式(5),則帶有靜態領導者的異質多智能體系統式(2)在固定拓撲下能達到領導-跟隨者滯后一致。
注2 對于特殊情況v0(t)=0, 領導者是靜態的。推論1的證明過程與定理1的證明類似。在此略。

對于異質多智能體系統式(2)和動態領導者式(1),設計切換拓撲下基于鄰居信息的滯后一致性協議如下:
ui(t)=

(7)


根據式(2)和式(7),可以得到:

(8)

定理2 考慮切換拓撲下帶有動態領導者式(1)的異質多智能體系統式(2),假設每個拓撲下的領導者是全局可達點。對于任意的初始狀態,如果存在常數k1>0,k2>0和正定矩陣P2滿足如下線性矩陣不等式:
(9)
其中σ=1,2,…,N,并且:
則異質多智能體系統能實現滯后一致性。

(10)

經過從系統式(2)到方程組式(8)的轉化,并把系統式(8)轉換為與誤差向量y(t)有關的方程式(10),將對多智能體的一致性分析轉化為對誤差系統式(10)的穩定性分析。
在切換拓撲下,根據誤差系統式(10)選取Lyapunov函數V(t)=yT(t)P2y(t), 其中P2是正定矩陣。
對V(t)求導得:

推論2 考慮切換拓撲下具有靜態領導者(v0(t)=0)的異質多智能體系統式(2),假設靜態領導者在每個拓撲下是全局可達點。對于任意初始狀態,若存在常數k1>0,k2>0和一個正定矩陣P2滿足線性矩陣不等式(9),則帶有靜態領導者的異質多智能體系統式(2)在切換拓撲下達到領導-跟隨者的滯后一致。
注3 如果τ=0, 那么得出的結論與文獻[22]類似,即跟隨者可以與領導者達到完全的恒同一致。
在本章中,采用數值例子來驗證理論算法的有效性。
例1 考慮固定拓撲下帶有動態領導者式(1)的異質多智能體系統式(2)在一維空間的情況。


圖1 6個智能體之間的固定拓撲圖Fig. 1 Fixed topology graph between six agents
由圖1可以得到以下的鄰接矩陣A和B:

易證明,選擇參數c1=1,c2=1,τ=6可以滿足定理1的條件,并通過Matlab中LMI工具箱可以得到LMI式(5)的解如下正定矩陣:


圖2 固定拓撲下異質多智能體的位置軌跡Fig. 2 Position trajectory of heterogeneous multi-agent under fixed topology
圖2中的xi(t)(i=1,2,3)表示二階智能體的位置軌跡,x4(t)、x5(t)表示一階智能體的位置軌跡。從圖2可知,當時間到達60 s以后,跟隨者與領導者達到滯后一致。圖3表明滯后位置和速度誤差漸近收斂到0,也就是說,用設計的協議式(3)可以使異質多智能體系統在固定拓撲下實現領導-跟隨者滯后一致性。

圖3 固定拓撲下的滯后位置誤差和滯后速度誤差Fig. 3 Lag position error and lag velocity error under fixed topology
情況2 考慮1個領導者和8個跟隨者組成的多智能體系統,全局可達的領導者標記為0,二階智能體標記為1、2、3、4和5,一階智能體標記為6、7和8。
從圖4可知,8個跟隨者跟蹤上了領導者并且始終滯后領導者τ=6 s時間,即達到滯后一致性。

圖4 固定拓撲下8個智能體滯后跟蹤領導者的位置軌跡Fig. 4 Position trajectory of eight agents lag tracking leader under fixed topology
例2 考慮切換拓撲下帶有動態領導者式(1)的異質多智能體系統式(2)在一維空間的情況。


圖5 三種可能的拓撲圖Fig. 5 Three possible topologies
容易證明通過選擇k1=1,k2=1,τ=2可以滿足定理2的條件,并利用Matlab求得LMI式(9)的解:
其中正定矩陣P2是對應于3個切換拓撲結構時LMI的共同解。仿真結果如下:圖6表示了跟隨者的位置軌跡滯后領導者一段時間τ=2。圖7表明滯后位置和速度誤差漸近收斂到0,即用設計的協議式(7)可以使帶領導者的異質多智能體系統在切換拓撲下達到滯后一致。

圖6 切換拓撲下異質多智能體滯后跟蹤領導者的位置軌跡Fig. 6 Position trajectory of heterogeneous multi-agent lag tracking leader under switching topology
注4 本文考慮了更加符合實際應用的滯后一致性的情況。汽車行駛過程中,如果讓領頭的車輛先行,后面跟隨的車輛與領頭的車輛保持一定的滯后,這樣就可以緩解擁堵的情況。本文將文獻[21]中結論擴展到滯后一致性的情況,并在例子中擴大了智能體的規模,更有效地驗證了分布式控制。相比于文獻[21]讓所有跟隨者能獲得領導者的速度信息,本文只讓部分跟隨者獲得領導者的位置和速度信息。

圖7 切換拓撲下的滯后位置誤差和滯后速度誤差Fig. 7 Lag position error and lag velocity error under switching topology
情況2 考慮9個節點組成的多智能體系統。全局可達的領導者標記為0,二階智能體分別標記為1、2、3、4和5,一階智能體分別標記為6、7和8。

圖8 切換拓撲下8個多智能體滯后跟蹤領導者的位置軌跡Fig. 8 Position trajectory of eight agents lag tracking leader under switching topology
注5 由于智能體之間的信息傳輸中常存在通信時延,下面考慮通信時延為0.001 s,得到仿真結果如圖9所示。

圖9 帶有通信時滯的異質多智能體滯后跟蹤領導者的位置軌跡Fig. 9 Position trajectory of heterogeneous multi-agent lag tracking leader with delay in communication
從圖9可以看出,當系統存在通信時延時,采用本文的控制協議可以使多智能體實現領導-跟隨者滯后一致性。
針對異質多智能體系統的滯后一致性問題,本文提出了基于牽制控制思想的分布式一致性控制協議?;贚yapunov穩定性理論和圖論,給出了在固定拓撲和切換拓撲下實現領導-跟隨者滯后一致性的充分條件。數值仿真驗證了在固定拓撲和切換拓撲下的理論算法的有效性。本文考慮了動態領導者速度已知的情況,但是在更一般情況下,跟隨者不能獲得領導者的速度,另外,實際智能體之間的通信延時是不可避免的情況,在今后工作中,我們將設計分布式控制協議,考慮帶有通信時延和寬帶受限因素,研究領導者速度未知情況下多智能體系統滯后一致性。