張 薇,余昭旭
(華東理工大學 信息科學與工程學院 自動化系,上海 200237)
多智能體系統因其在城市交通控制、無人機及機器人編隊等系統中[1,2]的廣泛應用受到了大量關注,而一致性問題是其中的研究熱點。早期的研究主要集中在低階確定性系統[3-7],但由于實際系統大部分為高階不確定性系統[8,9],故需引入神經網絡或模糊系統來處理系統的不確定性[10-12]。
反步法是處理具有下三角形式非線性系統的常用方法,但由于其容易造成“復雜性爆炸”問題[13],故引入動態面控制法來簡化計算[14-18]。由于傳統動態面法中邊界層誤差動態系統的未知非線性項沒有得到補償,控制性能會下降,故文獻[19]提出了一種新的非線性濾波器來改善控制性能。
此外,實際系統中大量存在的未知控制方向情況也給控制設計帶來了困難。目前,Nussbaum增益函數是解決控制方向未知問題最常用的方法[20],并已應用到多智能體系統中[21-23]。不過目前考慮的大多是仿射系統,而非仿射系統具有更一般的形式,可描述更為廣泛的實際系統。但具有未知控制方向的非仿射系統所具有的特性也會增大控制策略設計的難度。
本文的研究對象是有向拓撲圖下控制方向未知的非仿射非線性多智能體系統,并引入Nussbaum增益函數來處理由控制方向未知而帶來的問題;利用RBF神經網絡來處理系統的不確定項及耦合項;將新的非線性濾波器與反步法相結合來設計控制協議,最后通過一致性分析和仿真例子來驗證所提出的控制協議的有效性。
有向圖G={V,E,A} 表示智能體之間的信息交換,其中,V={v1,v2,…,vN} 是節點集合,E?V×V是邊集。定義節點vi的鄰居節點的集合為Ni={vi∈V|(vi,vj)∈E}。A=[aij]∈RN×N是鄰接矩陣,其中aij≥0。 如果vj∈Ni, 則權值aij>0, 否則aij=0。 通常認為智能體無法從自身獲得信息,即aii=0。 定義領導者的權值矩陣為B=diag{b1,b2,…,bN}, 若智能體i(i=1,2,…,N) 能從領導者獲得信息,則bi>0, 否則bi=0。 通常假定至少存在一個跟隨者與領導者有信息交流,即有b1+b2+…+bN>0。

f(Z)=WTΦ(Z)+ε(Z), ?Z∈ΩZ
(1)

引理1[24]假設RBF神經網絡的基函數向量為Φ(Zb)=[φ1(Zb),φ2(Zb),…,φl(Zb)]T,Zb=[z1,z2,…,zb]T, 為其輸入向量,則對任意的正整數a≤b, 有
(2)
考慮一類由標記為0的領導者和分別標記為1,2,…,N的跟隨者組成的多智能體系統,第i(i=1,2,…,N) 個跟隨者的動態系統描述如下

(3)

領導者的動態系統描述如下

(4)
其中,x0∈R表示領導者的狀態,y0∈R表示領導者的輸出,且f(x0,t) 為連續有界函數。
注1:非線性系統(3)同時具有非仿射及非下三角的系統結構,可用來描述許多的實際系統,如船舶操縱系統、單桿機械臂及化工過程等。
本文的控制目標是設計分布式自適應控制協議ui,使得在有向網絡拓撲下的多智能體系統中,各跟隨者(3)的輸出能與領導者(4)的輸出同步,并且能夠保證同步誤差在零點的小鄰域內。
為了實現以上控制目標,引入下列定義、假設和引理:

假設1[24]:有向圖G包含一個領導者作為根節點的生成樹。另外,第i個跟隨者只能獲得與其相鄰的智能體的狀態信息。
根據文獻[24],假設1表明通過設計適當的分布式控制協議,第i(i=1,2,…,N) 個跟隨者的輸出yi可以實現與領導者的輸出y0同步。

引理2[25]對于有向圖G及領導者的鄰接矩陣B,如果存在任意一個bi>0,那么L+B為非奇異矩陣。
引理3[25]對于有向網絡拓撲G的多智能體系統,令z1=[z1,1,z2,1,…,zN,1]T,y=[y1,y2,…,yN]T和y0=[y0,y0,…,y0]T, 則有下式成立
(5)
其中,同步誤差zi,1,i=1,2,…,N將在下文給出,且σmin(L+B) 為矩陣L+B的最小奇異值。
定義2[20]如果N(ζ)∶R→R是一個可微函數且具有如下特性,則稱其為Nussbaum函數
(6)
(7)

引理4[26]假設V(t) 和i(t)(i=1,2,…,N) 是定義在 [0,tf) 上的光滑函數,且對于任意t∈[0,tf), 都有V(t)≥0。 取Nussbaum函數為若有下列不等式成立

(8)


本節將針對由式(3)和式(4)組成的多智能體系統,采用反步法與改進的動態面結合的方法,給出分布式自適應神經網絡控制協議的設計及閉環系統的一致性分析。
首先,定義同步誤差zi,1
(9)
其中,aij和bi分別為鄰接矩陣A與B中的元素。
對于第m(1≤m≤ni-1) 步,定義誤差變量
zi,m+1=xi,m+1-si,m,ei,m=si,m-αi,m
(10)
其中,αi,m是待設計的虛擬控制函數,并將αi,m通過非線性濾波后可得到si,m。 類似于文獻[19],非線性濾波器設計為

(11)

(12)
其中,βi,m和λi,m均為正的調整參數。
步驟1 根據式(9),對其求導,可得

(13)

(14)

由引理1和引理5可得

(15)

構造虛擬控制函數αi,1為
(16)

(17)



(18)
步驟m(2≤m≤ni-1) 根據式(3)和式(10)~式(11)可得

(19)

及當3≤m≤ni-1時
(20)
(21)

類似于式(15),容易得到

(22)

構造虛擬控制函數為
(23)
并選取自適應率為
(24)


(25)

(26)

由式(26),關于zi,ni的動態系統可描述為

(27)


(28)

(29)

此時,實際控制協議可設計為

(30)
(31)
(32)
其中,pi,ni和ηi,ni皆為正的設計參數。
則由式(26)~式(32)可得

(33)
根據式(9)~式(11),可得邊界層誤差ei,m(m=1,2,…,ni-1) 的動態系統為
(34)

則在待定的緊集Ω上,對于m=1,2,…,ni-1, 一定存在正常數Mi,m, 使 |Bi,m|≤Mi,m成立。因此可得如下不等式

(35)

(36)


(37)



(38)

由式(38),并采用文獻[26]中類似的方法可得

(39)
根據引理4及式(39)可知,V(t) 有界,即存在正常數P0,使得V(t)≤P0, ?t≥0。 并根據V(t) 的定義可得
(40)
由引理3和式(40)可得,跟蹤誤差滿足不等式
(41)
根據式(39)~式(41)可知,跟隨者(3)和領導者(4)之間的所有跟蹤誤差為合作半全局一致最終有界,且可通過選擇合適的設計參數使跟蹤誤差保持在零點的小鄰域內。
基于以上的設計與分析,通過下面定理給出本文的主要結論。

注2:由式(39)~式(41)可以看出,跟蹤誤差的界在很大程度上取決于常數ψ和v的值的大小。為了獲得較小的跟蹤誤差,可以通過選擇合適的設計參數pi,m,ηi,m,μi,m,τi,m,βi,m,λi,m,ωi,m和κi,m使得ψ的值變大且v的值變小。
本節通過兩個仿真例子說明所提出控制方案的有效性及適用性。
例1:考慮由3個跟隨者和1個領導者組成的單桿機械臂系統[18]。圖1描述了各智能體之間的信息傳遞。選取領導者的動態方程為

(42)
跟隨者的動態方程可描述為
(43)


(44)
例1中各智能體之間的信息傳遞如圖1所示。

圖1 例1中跟隨者與領導者之間信息傳遞拓撲


在仿真過程中,設計參數可取為η1,1=17,μ1,1=0.01,ω1,1=0.5,p1,1=10,τ1,1=0.035,κ1,1=0.04,β1,1=0.01,λ1,1=74;η1,2=13,μ1,2=0.02,ω1,2=0.05,p1,2=25,τ1,2=0.01,κ1,2=0.04,β1,2=0.01,λ1,2=68,η1,3=16,μ1,3=0.7,ω1,3=0.07,p1,3=20;η2,1=17,μ2,1=0.6,ω2,1=0.7,p2,1=15,τ2,1=0.035,κ2,1=0.04,β2,1=0.01,λ2,1=75;η2,2=15,μ2,2=0.7,ω2,2=0.05,p2,2=25,τ2,2=0.01,κ2,2=0.04,β2,2=0.01,λ2,2=68,η2,3=16,μ2,3=0.5,ω2,3=0.07,p2,3=20;η3,1=15,μ3,1=0.6,ω3,1=0.05,p3,1=16,τ3,1=0.035,κ3,1=0.04,β3,1=0.01,λ3,1=75;η3,2=20,μ3,2=0.8,ω3,2=0.05,p3,2=10,τ3,2=0.01,κ3,2=0.04,β3,2=0.01,λ3,2=70,η3,3=16,μ3,3=0.7,ω3,3=0.5和p3,3=20。
根據系統(42)~系統(44)和上述參數來設計仿真,其結果如圖2~圖4所示。

圖2 例1中跟隨者輸出yi(i=1,2,3) 與領導者輸出y0

圖3 例1中跟隨者的控制輸入ui(i=1,2,3)

圖4 例1中改進動態面控制(MDSC)與傳統動態面控制(CDSC)的跟蹤誤差E(t)
根據圖2可看出,所設計的控制策略可以使3個跟隨者較好地跟蹤領導者的輸出,即跟隨者的輸出曲線能夠較好地跟蹤領導者的輸出曲線的變化而變化,且根據圖像可看出,其跟蹤誤差可以維持在較小的范圍內。圖3則為各個跟隨者的控制輸入信號的曲線圖。

例1中跟隨者輸出yi(i=1,2,3) 與領導者輸出y0的同步性能如圖2所示。
例1中各跟隨者的控制輸入信號ui(i=1,2,3) 如圖3所示。
例1中改進動態面控制法(MDSC)與傳統動態面控制法(CDSC)的一致性跟蹤誤差的對比如圖4所示。
例2:考慮一個具有3個跟隨者 (i=1,2,3) 和1個領導者(標為0)的非線性多智能體系統,其中,第1,2個跟隨者為二階非線性系統,其動態方程為

(45)
第3個跟隨者為三階非線性系統,其動態方程為

(46)
領導者的動態方程為

(47)
例2中各智能體之間信息傳遞如圖5所示。

圖5 例2中跟隨者與領導者之間信息傳遞拓撲


設計參數選取為η1,1=17,μ1,1=0.03,ω1,1=0.1,p1,1=10,τ1,1=0.01,κ1,1=0.04,β1,1=0.01,λ1,1=70;η1,2=1.3,μ1,2=0.02,ω1,2=0.07,p1,2=5;η2,1=15,μ2,1=0.2,ω2,1=0.5,p2,1=8,τ2,1=0.01,κ2,1=0.04,β2,1=0.01,λ2,1=75;η2,2=15,μ2,2=0.01,ω2,2=0.05,p2,2=15;η3,1=30,μ3,1=0.6,ω3,1=0.05,p3,1=16,τ3,1=0.01,κ3,1=0.04,β3,1=0.01,λ3,1=60;η3,2=1.6,μ3,2=0.8,ω3,2=0.5,p3,2=12,τ3,2=0.01,κ3,2=0.04,β3,2=0.01,λ3,2=68,η3,3=16,μ3,3=0.7,ω3,3=0.3和p3,3=5。
仿真結果如圖6~圖7所示。通過圖6可以看出,所提出的控制策略可以使跟隨者較好地跟蹤領導者的輸出。

圖6 例2中跟隨者輸出yi(i=1,2,3) 與領導者輸出y0

圖7 例2中跟隨者的控制輸入ui(i=1,2,3)
例2中跟隨者輸出yi(i=1,2,3) 與領導者輸出y0的同步性能如圖6所示。
例2中各跟隨者的控制輸入信號ui(i=1,2,3) 由圖7所示。
注3:由于系統(44)~系統(46)中考慮了非仿射及非下三角的系統結構和未知控制方向的影響,使得已有的一些控制策略[16-18,24,26]并不適用于這些系統。然而以上仿真結果表明,本文所提出的分布式自適應神經網絡控制協議能取得較好的輸出同步性能。
本文考慮了有向拓撲圖下具有未知控制方向的非仿射多智能體系統的輸出一致性問題。在設計控制策略的過程中,針對未知控制方向,引入了Nussbaum函數進行處理,而RBF神經網絡及其性質用于處理非下三角形式的系統函數的不確定項及耦合項。同時,提出一種改進的動態面控制法用于自適應神經網絡控制協議的設計,以改善傳統動態面控制方法的性能。一致性分析和仿真實例都表明了所提出的控制協議有效,即跟隨者能夠較好地跟蹤領導者的輸出曲線。下一步的研究將考慮基于切換拓撲圖下非仿射多智能體系統的分布式自適應控制問題。