茆漢國,張建德
南京工程學院 計算機工程學院,南京211167
隨著人工智能技術的火熱發展,多智能體系統的一致性問題受到了國內外學者們的廣泛關注[1],并且在機器人編隊控制、無人機協同控制、蟲類蜂擁、蜂群計算等領域有著廣泛的應用[2-5]。
在過去的幾十年中,學者們對一致性問題的研究取得了許多成果。其中,Vicsek等[6]就一群自驅粒子的相變問題提出了著名的Vicsek模型。之后,Jadbabaie等[7]運用圖論的方法就Vicsek模型的一致性行為給出了理論解釋。在Vicsek模型基礎之上,Cucker和Smale[8]又介紹并分析了一個含有N個粒子系統的蜂擁模型,簡稱C-S模型。Sun等[9-10]進一步探討了C-S模型中存在通訊時滯和隨機噪聲擾動的蜂擁問題。除了線性系統之外,文獻[11]研究了基于事件觸發的隨機非確定線性多智能體系統的指數同步問題。最近,文獻[12]討論了事件觸發機制下的多智能體領導跟隨一致性。
總體來說,在這些系統中[2-12]實現一致(或蜂擁)都是漸進穩定的,也就是收斂時間是趨于無窮大的。但是在實際運用中往往需要多智能體系統在有限時間內實現一致,比如要實現較高的控制精度。此外,有限時間一致性具有較高的抗干擾性和魯棒性。Wang等[13]較早地分析了動態多智能體網絡的有限時間一致性問題。Sun等[14-16]繼續討論了在噪聲環境下的有限時間一致性和蜂擁問題。同時,這些工作[13-16]都對實現一致性(或蜂擁)時間的上界進行了估計。
此外,一個隨之而來的問題是,對有限時間上界的估計高度依賴系統的初始狀態,也就是不同的初始條件可能產生不同的時間估計。在實際多智能體系統中,由于一些不確定性因素的影響,人們無法預先知道系統模型的初始狀態,這就對以往有限時間一致性問題又提出了挑戰。為了克服這個困難,Polyakov[17]突破性地介紹了一種新型非線性回饋控制技術,實現了閉環系統的固定時間穩定性,其最終實現穩定的有限時間上界估計與系統的初始狀態無關。最近,Chen等[18]討論了多智能體系統中的固定時間凸優化問題。Tian等[19]分析了二階多智能體系統中含有引導者-追隨者的固定時間一致性問題。文獻[20]對多智能體系統固定時間協同控制進行了概述。
無論是有限時間一致性(或蜂擁)問題,還是多智能體系統中的固定時間一致性問題,其控制協議中大多含有一個符號函數sign(?)。由于符號函數在0點處具有非連續性,在實際控制作用中當誤差趨于0的時候勢必產生震顫現象。如果震顫頻率過高,則會對系統本身造成一定程度的傷害。為了解決這一問題,本文設計了一個光滑連續的一致性協議,從而有效地避免了震顫現象的發生。具體地,本文旨在探索非震顫固定時間多智能體網絡的一致性問題,創新性如下:
(1)實現了多智能體網絡的固定時間一致性,同時對實現一致的時間上界進行了估計,其不再依賴于系統的初始狀態條件。
(2)設計了新穎的一致性控制策略,解決了傳統有限時間和固定時間一致性協議中存在震顫的問題,提高了系統的性能。
(3)通過運用Lyapunov穩定性理論,得到了實現固定時間一致性的充分條件,且通過數值仿真驗證了理論分析的有效性和可行性。
形式上,用一個圖G=(V,E)來表示N個智能體所構成的網絡。V={v1,v2,…,vN}為N個智能體構成的點集。E?V×V為圖G的邊集。圖G中的無向邊記為aij=aji=(vi,vj)=(vj,vi)∈E。如果智能體j與智能體i(i≠j)間存在一條連接,則aij=aji=1,否則aij=0。圖G的拉普拉斯矩陣記為L=[lij]∈RN×N,其中lij=-aji(i≠j),lii=-。圖中一系列的連接邊構成路徑。如果任意兩個智能體之間都存在一條路徑,則圖是連通的。‖x‖表示列向量x∈RN的2范數。
網絡中每個智能體的動力學方程為:
其中,xi∈RN為第i個智能體的狀態,ui為待設計的一致性控制協議。
為了明確得出本文的主要結果,下面先給出固定時間一致性的定義和相關必備的引理。
定義 稱系統(1)中各智能體狀態在固定時間內達到一致,如果存在不依賴于初始狀態的時間函數T,使得
這里,T也被稱作設定時間。
引理1[21]如果存在一個連續函數V(t):[0,∞)→[0,∞),使得V正定,且存在正實數c>0,0<ρ<1滿足V?(t)≤-cVρ(t),t≥t0,那么V1-ρ(t)≤V1-ρ(t0)-c(1-ρ)(t-t0),t0≤t≤t*,且V(t)=0,t≥t*,其中t*=t0+
引理2[22]如果存在一個連續的徑向無界函數V:Rn→R+∪{0},使得:
(1)V(x)=0?x=0;
(2)任意狀態x(t)滿足不等式:
D*V(x(t))≤-(αVl(x(t))+βVm(x(t)))k
其中,參數α,β,l,m,k>0,且lk<1,mk>1。D*V(x(t))為函數V(x(t))的右上界導數。那么,原點為全局固定時間穩定點,且設定時間
引理2給出了一個相對保守的設定時間估計。考慮以下情形:常數l、m滿足形式l=1-γ>1,可以得到更為精確的時間估計,見下述引理。
引理3[22]如果存在一個連續的徑向無界函數V:Rn→R+∪{0},使得:
(1)V(x)=0?x=0;
(2)任意狀態x(t)滿足不等式:
D*V(x(t))≤-αVl(x(t))-βVm(x(t))
其中,參數α,β>0,D*V(x(t))為函數V(x(t))的右上界導數。那么,原點為全局固定時間穩定點,且設定時間
引理4[23]如果y1,y2,…,yN≥0,那么
引理5[24]對一個連通無向圖G而言,其拉普拉斯矩陣L有以下性質:任意x=[x1,x2,…,xN]∈RN,有。可知L為半正定,0是其單特征值,對應N元特征列向量1(每個元素都是1)。不妨設L的特征值為0,λ2,…,λN,并滿足0<λ2≤…≤λN。此外,如果1Tx=0,那么xTLx=λ2xTx。λ2(L)也稱作拉普拉斯矩陣L的代數連通度。
為實現多智能體網絡的非震顫固定時間一致性,設計如下的一致性協議:
其中,k1>0,k2>0為控制增益,A=[aij]∈RN×N,B=[bij]∈RN×N為多智能體之間信息傳輸網絡的鄰接矩陣。p、q、r、s為正奇數,且滿足p<q,r>s。
注1受文獻[25]的啟發,本文設計了上述固定時間非震顫一致性協議(2)。與文獻[13-16,18-19]中的控制協議相比,本文所設計的控制協議(2)不再使用傳統的符號函數sign(?),即式(2)是光滑連續型的一致性協議,從而有效地避免了震顫現象的發生。
定理 無向連通多智能體網絡中的各智能體i在一致性協議(2)的作用下,N個智能體能在固定時間內達到平均一致狀態,且達到一致的時間上界滿足:
證明 考慮以下Lyapunov函數:
對上述Lyapunov函數求導,可得:
根據引理4,可得:
再根據引理5,可以得到:
其中,Lq和Ls分別為權圖和的Laplacian矩陣。λ2(Lq)和λ2(Ls)分別表示矩陣Lq和Ls的代數連通度。
那么有:
最后再由引理2可知,多智能體網絡(1)可在固定時間內實現一致,且設定時間:
證畢!
根據引理3,可直接得到以下推論:
推論1在一致性協議(2)的作用下,如果參數p、q、r、s滿足,且γ>1,那么無向連通多智能體網絡(1)可以在固定時間Tmax:=內實現一致性。
如果控制協議(2)僅含有第一項,那么利用引理1可推導出下述推論。
注2控制協議(2)中第一項的作用是初步實現有限時間多智能體網絡的一致性。但是從推論2可以看出,最終實現有限時間一致性的時間上界估計依賴于智能體系統的初始狀態。類似地,文獻[13-16]中對實現有限時間一致性時間上界的估計也高度依賴系統中各智能體的初始狀態。為了擺脫這一束縛,本文進一步在(2)中設計了第二項,其作用是實現固定時間一致性,即智能體系統(1)在控制協議(2)的作用下達到有限時間一致性的時間上界估計與系統的初始狀態無關。這樣,對實現有限時間一致性的時間上界估計就可以事先根據實際需要,通過選取合適的控制增益k1、k2和參數r、s、p、q的值來調節。這是文獻[13-16]所不及的,同時也是固定時間一致性與有限時間一致性的本質區別。另一方面,本文與文獻[18-19]都對實現固定時間一致性的時間上界進行了估計。因為本文和文獻[18-19]關于時間上界的估計式中的增益和參量選取都比較靈活,可根據現實需要進行適當選取,所以對估計值之間的比較并沒有特殊意義。本文與文獻[18-19]相比,其優點是本文所采取的控制策略是連續光滑型的,能夠有效地消除震顫現象。
這里通過一個數值例子來驗證理論結果的有效性和可行性。不妨設智能體網絡的規模為N=5,其拓撲如圖1所示。控制增益取k1=1,k2=2,參數p=1,q=3,r=5,s=3。各智能體初始狀態值xi(0)從區間[-10,10]中隨機選取。
圖1 多智能體網絡拓撲
由圖2可以發現,各個智能體狀態能夠在固定時間不超過2.5 s內達到一致。同時,圖3給出了控制協議(2)的演化軌跡。可以看出,這些曲線都是光滑的,不存在震顫現象。為了進一步驗證固定時間一致性能夠擺脫對系統初始狀態的依賴,本文隨機選取了6組不同的初始值進行模擬。圖4給出了完全誤差E(t)=‖ ‖e(t)軌跡。可以發現,對于任意的初始條件,多智能體網絡系統總能在2.5 s內趨于一致。
圖2 智能體x i(i=1,2,…,5)狀態變化軌跡
圖3 控制協議ui(i=1,2,…,5)的演化軌跡
圖4 完全誤差軌跡
本文研究了多智能體網絡的固定時間一致性問題。一方面,克服了傳統有限時間一致性問題對智能體系統初始狀態的依賴性。另一方面,所設計的控制協議不再含有符號函數,解決了傳統帶有符號函數一致性協議中的震顫問題,提高了多智能體網絡系統的性能。并且利用經典的Lyapunov第二方法得到了實現固定時間非震顫一致性的充分條件。在后續工作中可進一步考慮隨機噪聲和時滯所帶來的影響,以及時間與能量的關系問題。