王 丹,李偉勛,張麗瓊,劉 佳
(1.天津職業技術師范大學理學院,天津300222;2.天津職業技術師范大學自動化與電氣工程學院,天津300222)
近幾十年來,由于控制領域的快速發展,多智能體系統協同控制得到了各領域專家學者們的高度重視。多智能體系統協同控制應用有如下方面:一致性問題、同步、群集和蜂擁、編隊控制以及聚集問題。其中,一致性作為最基礎和最重要的問題,一直是控制領域研究的熱點。一致性問題,即隨著時間的演化,通過設計一個控制協議,使得復雜系統中所有智能體的狀態達到一致。Hu等[1]研究了耦合通訊時滯下的二階多智能體系統的領導跟隨一致性問題。由于現實生活中,很多系統不一定是線性系統,當非線性取0時,即為一般線性多智能體系統[2],因而它能退化成任意階的多智能體模型,故非線性系統的適用范圍更廣,且更具有一般性。如Shi等[3]提出非線性分布式控制協議,研究了非線性系統的領導跟隨一致性問題。
實際生活中,智能體的狀態不會全部達到一個相同的狀態,往往是同一組智能體的狀態相同,而不同組是另外一個值。Yu等[4]第一次提出分組一致性的相關概念,即相同子網的智能體達到相同的收斂狀態,而不同子網間的智能體相互獨立,并研究了一階多智能體具有有向拓撲圖的組一致性問題。組一致性作為一個新興的課題,其為常規一致性的特例,且適用范圍更廣,所以研究分組一致性十分必要。王強等[5]在連通二部圖的拓撲結構下,通過使用基于競爭的控制協議方法,分別研究了有時滯和無時滯下的一類多智能體系統的分組一致性問題;Cui等[6-7]研究了有向切換拓撲下二階多智能體系統的分組一致性跟蹤控制問題和通訊時滯下二階多智能體系統的分組一致性問題。
鑒于大多數文獻是基于鄰居智能體的相關信息構建的一致性協議,而在實際操作中,由于成本或技術的原因,系統的某些狀態變量并不是都可以直接檢測,故需要設計基于鄰域的分布式觀測器。所謂分布式,是指當一部分跟隨者和領導者之間無信息傳遞時,它們需要用分布式的方法從其鄰居那里得到領導者的信息。Hong等[8-9]構造了一階多智能體系統和二階多智能體系統的基于分布式觀測器設計的領導跟隨一致性的追蹤問題。針對智能體狀態不可測的問題,劉忠信等[10]通過設計基于觀測器的一致性算法,解決了一般線性系統的基于觀測器的一致性控制問題。上述研究大多基于線性系統,針對非線性部分,Xu等[11]通過設計基于觀測器的分布式非連續的一致性控制協議,研究了帶有自適應耦合參數的二階多智能體系統基于觀測器的領導跟隨一致性問題。Chu等[12]提出了一個非連續的觀測器協議,利用矩陣理論、交換系統理論以及平均方法研究了一般線性系統帶有Lipschitz非線性項的間歇通信非線性多智能體系統的一致性問題。
Han等[13]采用基于擾動觀測器的方法抑制由外部系統造成的擾動,研究了具有外生擾動的多智能體系統的包含控制問題,雖然它們在動力學方程中都不止含有1個領導者,但此研究對一般線性系統帶有干擾觀測器的包含控制一致性問題進行了探討,即一致性實現途徑是跟隨者的狀態移動到由領導者構成的凸包中。與文獻[13]不同,本文分別考慮線性和非線性系統基于分布式觀測器的分組一致性問題,即將智能體分為2組,每組有1個領導者,并通過設計相應的控制協議,用基于觀測器的方法觀測每組智能體中跟隨者智能體跟隨領導者智能體的跟蹤狀態軌跡。
由于多智能體系統在協同各智能之間體有信息傳遞,其之間的信息交互可以通過拓撲圖來描述[14],將每個智能體看作圖的一個節點,從而使得結果更為直觀。假設由n+m個智能體的加權有向圖G表示為G=(V,E,A)。其中,每一個頂點表示一個智能體。頂點集合V={v1,v2,…,vn+m},有向邊集合E?(vj,vi),每組智能體i的鄰居節點集合為N1i= {j∈V1:(i,j)∈E,j≠i},N2i={j∈V2:(i,j)∈E,j≠i},將它們寫成緊湊的形式得到Ni={j∈V:(i,j)∈E,j≠i}=N1i∪N2i。
非負加權鄰接矩陣A=[aij]n×n,aij>0。當且僅當(vj,vi)∈E,即表示頂點vj能接收到vi的信息,否則aij=0。
度矩陣定義為D=diag{d1(v1),d2(v2),…,dn+m(vn+m)}。式中:D為第i個跟隨者智能體與領導者智能體之間的連通矩陣。
平衡圖是指所有節點的入度與出度相等,即degin(vi)=degout(vi),頂點vi定義為
圖G的拉普拉斯矩陣定義為:L=D-A,Lij=
將n+m個智能體分2組。第1組:I1={1,2,…,n},V1={1,2,…,n}追蹤第1個領導者;第2組:I2={n+1,n+2,…,n+m},V2={n+1,n+2,…,n+m}追蹤第2個領導者。并且有I=I1∪I2,V=V1∪V2,E=E1∪E2。
定義1多智能體系統能夠實現組一致性跟蹤控制,如果滿足以下條件

假設12組之間入度平衡[14]的條件為

該條件保證了系統能達到分組漸近一致的條件,即不同組之間相互影響的權重之和為0。
假設2存在非負常數ρ1和ρ2,使得

假設3對于每一個跟隨者來說,都至少有一條路徑與領導者連通。
引理1[15]對于任意的向量a,b∈Rn以及正定矩陣Φ∈Rn×n,下列不等式成立

針對多智能體基于觀測器的分組一致性分析,本文從非線性系統和線性系統進行闡述。
1.2.1 非線性系統
針對非線性系統,本文考慮有n+m個跟隨者和2個領導者構成的多智能體系統的領導跟隨一致性問題。其中,領導者的動態方程為

式中:x*j、v*j、f分別為領導者的位置、速度和非線性項,x*j∈R,v*j∈R,f(x*j(t),v*j(t),t);f:R×R×R。
跟隨者的動態方程為

式中:xi∈R、vi∈R、f(xi(t),vi(t),t)分別為第i個智能體的位置、速度和非線性項;f:R×R×R。
針對非線性系統,由于部分跟隨者智能體得不到領導者智能體的信息,故需要設計分布式控制協議,使得每個跟隨者智能體利用其獲得鄰居智能體的信息,從而估計領導者的狀態。控制協議如下

式中:r、c為給定的常數;以所設計的控制協議的第1組為例,u*1為第1個領導者智能體的控制輸入;為第i個智能體與其鄰居智能體狀態誤差的累加部分;di(xi(t)-x*1(t))為第i個智能體與領導者智能體狀態誤差項為第i個智能體對領導者速度的觀測值與其速度的誤差;為第2組對第1組的影響。
觀測器下智能體的動態方程為

由于跟隨者智能體得不到領導者的速度信息,故無法設計各跟隨者與其領導者智能體之間的速度誤差項,只能通過速度觀測值誤差進而估計跟隨者與領導者的速度誤差,這是區分本文中分布式觀測器和分布式控制器設計的不同之處。
為了分析該二階非線性多智能體系統能實現基于觀測器的領導跟隨組一致性問題,定義狀態誤差ξ1i(t)=xi(t)-x*1(t),(i=1,2,…,n);ξ2i(t)=xi(t)-x*2(t),(i=n+1,n+2,…,n+m),則有ξi(t)=[ξT11(t),ξT12(t),…,ξT1n(t),ξT2,n+1(t),ξT2,n+2(t),…,ξT2,n+m(t)]T,(i=1,2,…,n+m)。
定義速度誤差η1i(t)=vi(t)-v*1(t),(i=1,2,…,n);η2i(t)=vi(t)-v*2(t),(i=n+1,n+2,…,n+m),則有ηi(t)=[ηT11(t),ηT12(t),…,ηT1n(t),ηT2,n+1(t),ηT2,n+2(t),…,ηT2,n+m(t)]T,(i=1,2,…,n+m)。
標記


則閉環系統的誤差方程可寫為

其中,

1.2.2 線性系統
針對線性系統,本文考慮有n+m個跟隨者和2個領導者構成的多智能體系統的領導跟隨一致性問題。其中,領導者的動態方程為
式中:x*j∈R和v*j∈R分別表示領導者的位置和速度。
跟隨者的動態方程為

式中:xi∈R和vi∈R分別為第i個智能體的位置和速度。
針對線性系統,設計如下的分布式控制協議

觀測器下智能體的動態方程為

以下的定理分別給出了基于觀測器的非線性系統以及線性系統分組一致性實現的條件。
定理1考慮到給定的多智能體系統(1)、(2),系統滿足所有的假設條件。在控制協議(3)和觀測器(4)下,所有的跟隨者能跟蹤上領導者,并且跟蹤誤差趨于0,即表示所構建的二階非線性多智能體系統能實現基于觀測器的分組一致性,如果以下條件成立

式中:

r、c為給定的常數;k∈R,k>1。
證明對于系統(1)、(2),選取Lyapunov函數為V=εTPε
對V沿著閉環系統的誤差方程(5)求導,可得

分別代入矩陣P、E、F計算得

由引理1得

令

則

式中:

如果有Q<0,則可進一步得到V˙<0。因此,誤差系統(5)能實現漸近穩定,即表示多智能體系統在狀態協議(3)下能達到基于觀測器的分組一致性。
定理2考慮到給定的多智能體系統(6)、(7),系統滿足所有的假設條件。在控制協議(8)和觀測器(9)下,所有的跟隨者能跟蹤上領導者,并且跟蹤誤差趨于0,即表示所構建的二階線性多智能體系統能實現基于觀測器的分組一致性,如果以下條件成立

式中:

r、c為給定的常數;k∈R,k>1。
線性系統多智能體基于觀測器的分組一致性證明和定理1類似,這里不再贅述。
在這一部分中給出了基于定理1和推論1的仿真實例。考慮了包含2個領導者和6個智能體的拓撲圖,令智能體①②③為第1組,智能體④⑤⑥為第2組,它們分別跟蹤領導者⑦和⑧。取r=0.4,c=0.2,針對所分的2組,選取不同領導者的控制輸入分別為u1=5+0.5sin(t),u2=1+0.8cos(t)。跟隨者的非線性項為f=-0.2sin(t)-0.6vi+2.25cos(2.5t)。
非線性系統狀態圖和誤差圖中各智能體的初始狀態分別為

多智能體系統的拓撲圖為固定拓撲,其拓撲圖如圖1所示。

圖1 多智能體系統的拓撲圖
由圖1可知,第1組的智能體①②能得到領導者⑦發出的信息,第2組的智能體④⑤能得到領導者⑧發出的信息,并且每組的領導者之間沒有信息交流。從而進一步得出系統拓撲結構的鄰接矩陣和跟隨者之間對應的拉普拉斯矩陣分別為

以下為通過Matlab仿真給出的基于觀測器下非線性系統多智能體的狀態軌跡圖以及其所對應的跟蹤誤差圖,如圖2—圖5所示。
由圖2、圖3可知,每組智能體分別跟蹤上了其對應的領導者。由圖4、圖5得到:位置誤差、速度誤差都可以在15 s內收斂到0,故該仿真實驗可以驗證本文所構建模型的合理性。

圖2 分組一致性位置狀態圖

圖3 分組一致性速度狀態圖

圖4 分組一致性位置跟蹤誤差軌跡圖

圖5 分組一致性速度跟蹤誤差軌跡圖
本文研究了基于觀測器的二階非線性多智能體系統的分組一致性問題,針對多智能體系統中領導者的速度信息不可測的問題,設計了分布式觀測器,即通過利用已知的、能觀測的跟隨者智能體的速度信息以及各跟隨者智能體速度觀測值與其速度的誤差,進而估計跟隨者與領導者的速度誤差。為了實現分組一致性跟蹤問題,基于觀測器的相對輸出信息,設計了分布式控制協議,通過構建合適的Lyapunov函數以及使用舒爾補等相關引理,分析了系統的穩定性,并由Matlab繪制出了非線性系統的狀態圖和誤差圖。結果表明,構建的模型既保證了觀測器誤差趨于0,也實現了分組一致性跟蹤問題。
由于實際的多智能體系統的網絡拓撲結構往往不是一成不變的,所以本文接下來將研究在拓撲結構為切換的情況下,基于觀測器的非線性多智能體系統的分組一致性問題。由于本文考慮的是二階系統并且智能體的維數是一維的,所以會進一步考慮如果系統是更高階或者智能體的狀態是高維的情況下,基于觀測器的多智能體系統的分組一致性實現的問題。