羅俊芝,張雪飛,詹環(huán)
(陸軍裝甲兵學(xué)院基礎(chǔ)部,北京 100072)
多智能體系統(tǒng)是由多個智能體組成的集合,智能體之間以及智能體與環(huán)境之間通過通信、協(xié)商與協(xié)作來共同完成單個智能體所不能解決的問題。多智能體系統(tǒng)有著廣泛的應(yīng)用背景,比如航天器的編隊控制問題,水下多機器人系統(tǒng)的勘探任務(wù)分配問題等,都可以轉(zhuǎn)化為多智能體系統(tǒng)的控制問題。隨著科技的發(fā)展,一項復(fù)雜的任務(wù)可以通過多個結(jié)構(gòu)、功能都相對簡單的智能體來完成。因此,多智能體系統(tǒng)的控制研究已經(jīng)成為了一個熱門的研究方向。如文獻(xiàn)[1]對多智能體系統(tǒng)的隊形控制方法及應(yīng)用進行了綜述,給出隊形控制的研究概況;文獻(xiàn)[2]通過引入虛擬領(lǐng)導(dǎo)者產(chǎn)生期望軌跡的方法,研究了離散時變多智能體系統(tǒng)有限時間一致性控制;文獻(xiàn)[3]則基于脈沖控制,針對時延異構(gòu)多智能體編隊控制進行研究;文獻(xiàn)[4]則對無人機編隊形成與防碰撞進行研究,提出了基于信息一致性的無人機編隊形成時避免碰撞的控制策略;文獻(xiàn)[5]在研究了時變拓?fù)浣Y(jié)構(gòu)下,系統(tǒng)有Leader 領(lǐng)導(dǎo)下多智能體系統(tǒng)的跟蹤控制問題。文獻(xiàn)[6]研究了時變拓?fù)渚W(wǎng)絡(luò)結(jié)構(gòu)下的多無人機系統(tǒng)的一致性控制問題;文獻(xiàn)[7]研究了時變拓?fù)浣Y(jié)構(gòu)下的多無人機領(lǐng)航跟隨一致性和軌跡跟蹤問題;文獻(xiàn)[8]研究了具有時滯和時變系數(shù)的離散多智能體系統(tǒng)的一致性。盡管目前關(guān)于多智能體系統(tǒng)的研究成果頗多,但是大部分研究是在系統(tǒng)線性模型的基礎(chǔ)上展開的。由于多智能體系統(tǒng)的實際背景比較復(fù)雜,線性模型不能夠精確描述多智能體系統(tǒng)的模型,因此基于非線性模型的多智能體系統(tǒng)研究更有意義。目前已有一些研究成果對此進行了關(guān)注[9-16],如文獻(xiàn)[9]利用滑模控制研究非線性多智能體系統(tǒng)一致性控制問題;文獻(xiàn)[10]則針對非線性傳輸?shù)亩嘀悄荏w系統(tǒng)的自適應(yīng)一致性控制問題進行了研究;文獻(xiàn)[11]關(guān)注了脈沖控制下的非線性多智能體系統(tǒng)部分分量一致性問題。文獻(xiàn)[12]針對一類非線性多智能體系統(tǒng),研究了滿足預(yù)定性能的協(xié)同控制問題;文獻(xiàn)[13]研究了非線性多智能體系統(tǒng)的輸出調(diào)節(jié)問題,等等。該文基于多智能體系統(tǒng)的非線性模型,研究系統(tǒng)的一致性控制問題,考慮到智能體之間信息傳輸通過網(wǎng)絡(luò)進行,傳輸效果與網(wǎng)絡(luò)環(huán)境有很大關(guān)系,如果網(wǎng)絡(luò)環(huán)境不好,可能造成信息傳輸時滯存在較大差異,考慮到智能體之間信息傳輸?shù)膶嶋H情況,該文引入網(wǎng)絡(luò)時滯延遲值的概率分布模型,對非線性多智能體系統(tǒng)的一致性控制進行研究。
該文從系統(tǒng)的非線性模型入手,假設(shè)系統(tǒng)的各節(jié)點之間信息傳輸時存在時滯,并且假定已知網(wǎng)絡(luò)傳輸延遲值的隨機分布,也就是網(wǎng)絡(luò)傳輸時滯取定某些數(shù)值的概率分布已知,把多智能體系統(tǒng)進一步建模成非線性時滯系統(tǒng),給出一致性協(xié)議的設(shè)計方法,給出系統(tǒng)的一致性控制策略。最后通過數(shù)值仿真事例,驗證所提方法的可行性和有效性。
在給出系統(tǒng)模型之前,先給出文中用到的假設(shè)和引理。
假設(shè)假定非線性函數(shù)f(x)滿足下面的Lipschitz條件,也就是?x,y∈Rn,有:

其中,L為一正常數(shù)。
引 理若x∈Rn,P=PT∈Rn×n,H∈Rm×n,Rank(H)=l<n,則下面的條件是等價的:
1)xTPx<0,?x∈{x∶Hx=0,x≠0}。
2)存在σ∈R,使得P-σHTH<0。
3)?X∈Rn×n,使得P+XH+HTXT<0。
4)H⊥TPH⊥<0,其中,H⊥是H的核,也就是HH⊥=0。
假設(shè)多智能體系統(tǒng)有N個節(jié)點Agent 組成,借助復(fù)雜網(wǎng)絡(luò)的思想,用G=(V,E,A)表示這N個智能體構(gòu)成的拓?fù)浣Y(jié)構(gòu),其中V={v1,v2,…,vN} 表示頂點的集合,vi表示第i個Agent;E?V×V表示邊組成的集合;eij=(vi,vj) 表示從vi到vj的邊,權(quán)值定義為aij,A=[aij]表示鄰接矩陣,其中,aij≥0;L=[cij]表示鄰接矩陣對應(yīng)的Laplace 矩陣。
假設(shè)多智能體系統(tǒng)的第i個節(jié)點的內(nèi)部動力學(xué)模型表示為:

其中,xi(t)∈R2為系統(tǒng)狀態(tài)變量;f(xi(t))是非線性向量函數(shù),且滿足假設(shè)1;ui(t)為一致性控制策略,具體設(shè)計控制協(xié)議時可以根據(jù)給出的一致性充分條件得到。
一致性控制協(xié)議采用如下形式:

其中,i=1,2,…,N,α是智能體之間的耦合常數(shù),aij是鄰接矩陣A=[aij]n×n的元素,η(t)代表信息傳遞出現(xiàn)的時延函數(shù)。
把式(3)代入式(2),得:

對于給定的兩個常數(shù)η0和ηm(不妨假設(shè)η0≥ηm),定義:

考慮到特別大的網(wǎng)絡(luò)時延發(fā)生的概率非常小,所以總存在常 數(shù)ηM≥η0,使得Probη{η(t)∈(ηM,+∞)}=0,也就是時延大于ηM的概率為零,設(shè),并 令,從而存在 0 ≤β0≤1,滿足Prob{β(t)=1}=β0,Prob{β(t)=0}=1-β0。

其中,ξ=(ξ1,ξ2,…,ξN)T是A對應(yīng)Laplace 矩陣的特征向量,且ξT1N=1,ξTL=0。


在上述式(5)的模型基礎(chǔ)上,根據(jù)隨機控制和多智能體控制理論,研究系統(tǒng)的一致性控制策略,并給出其存在的充分條件。
定理對于給定的正常數(shù)η0>0、ηm>0、ηM>0 和β0>0,如果存在正定矩陣P>0和Qi≥0,使得下式成立:


則式(2)的系統(tǒng)在式(3)的控制協(xié)議下是漸近穩(wěn)定的。
證明:考慮式(5)誤差系統(tǒng)

若Mξ(t)=0,則:

如果(M⊥)TΩM⊥<0,由引理可以得到從而式(5)的誤差系統(tǒng)漸近穩(wěn)定。

為了討論方便,假設(shè)存在4 個Agent 節(jié)點,并且4 個節(jié)點之間的關(guān)系拓?fù)錇閷ΨQ拓?fù)洌? 個Agent 之間的彼此信息交互程度相同。取拓?fù)浣Y(jié)構(gòu)鄰接矩陣對應(yīng)的Laplace 矩陣為如下形式:

取α=0.5,β0=0.3,η0=0.2,ηm=0,ηM=0.8。
通過求解定理中的條件,可以得到:

取初始狀態(tài)量x0=(10,5,7,4),仿真曲線如圖1。

圖1 初始狀態(tài)為x0=(10,5,7,4)下系統(tǒng)的狀態(tài)變量

圖2 初始狀態(tài)為x0=(10,5,7,4)下系統(tǒng)的控制變量
通過仿真曲線可以看出,系統(tǒng)的4 個Agent 的狀態(tài)變量能趨于一致,這說明了文中所設(shè)計的一致性協(xié)議是有效的。驗證通過設(shè)計與狀態(tài)時延有關(guān)的控制協(xié)議,系統(tǒng)中同級Agent 的狀態(tài)最終能夠?qū)崿F(xiàn)一致性。
針對一類非線性系統(tǒng),首先在假定系統(tǒng)非線性模型滿足匹配條件的前提下,研究非智能體系統(tǒng)的一致性條件;其次,針對系統(tǒng)諸節(jié)點信息傳遞的隨機時滯的概率分布,把時滯落在某個區(qū)間的概率引入系統(tǒng)的模型中,進而借助復(fù)雜網(wǎng)絡(luò)和系統(tǒng)穩(wěn)定性理論,給出系統(tǒng)達(dá)到一致性的充分條件,其與此隨機時滯的概率相關(guān),考慮了時滯出現(xiàn)的概率對系統(tǒng)一致性的影響。通過仿真模擬,驗證所提控制協(xié)議的可行性和有效性。傳輸時滯的上下界的大小以及出現(xiàn)概率值的大小對于系統(tǒng)的一致性的影響,是下一步要開展的工作研究的重點,也更具挑戰(zhàn)性和實際意義。