張婷婷,張 偉
(上海理工大學 光電信息與計算機工程學院,上海200093)
近年來,隨著人工智能和分布式協(xié)調(diào)控制理論的發(fā)展,多智能體系統(tǒng)的協(xié)調(diào)控制也吸引了大批研究者的關(guān)注和研究。多智能體系統(tǒng)應(yīng)用于多領(lǐng)域,如分布式傳感器網(wǎng)絡(luò)[1]、編隊控制[2-4]、群集[5]、協(xié)同控制[6]和分布事件觸發(fā)[7-8]等。實現(xiàn)多智能體網(wǎng)絡(luò)協(xié)調(diào)控制,需要各個智能體狀態(tài)達到一致。因此,一致性問題是研究多智能體系統(tǒng)的基礎(chǔ)和核心。在保證多智能體系統(tǒng)的穩(wěn)定性前提下,提高系統(tǒng)的動態(tài)性能也具有一定的研究意義。
多智能體系統(tǒng)的動態(tài)性能,即多智能體的一致性收斂速度。提高收斂一致性,無疑能夠提高系統(tǒng)的通訊能力及性能。文獻[9]中,Olfati提出了一種超高速信息網(wǎng)絡(luò)的算法,該算法可以在小網(wǎng)絡(luò)上以驚人的速度達到多智能體一致性,并且驗證了收斂速度由通信的代數(shù)連通性決定,為研究快速一致性提供了有力的理論基礎(chǔ)。基于此理論,She[10]等人提出基于局部信息的多智能體系統(tǒng),引入PI控制器設(shè)計快速一致性算法,給出智能體快速收斂的充分條件。文獻[11]針對分布式控制與大系統(tǒng)的快速一致性,基于雙跳網(wǎng)絡(luò)提出快速一致性算法,使得多智能體系統(tǒng)的收斂速度更快。文獻[12-15]研究了二階以及高階系統(tǒng)的多智能體快速收斂一致性算法。由于通訊約束,智能體之間交互信息時產(chǎn)生時滯,研究者從網(wǎng)絡(luò)通訊拓撲圖著手,引入多跳網(wǎng)絡(luò)設(shè)計一致性算法,且利用頻域法分析系統(tǒng)收斂條[16-19]。文獻[20]分析了帶有時變時滯的多智能體一致性,引入小增益理論,基于頻域的角度分析系統(tǒng)的穩(wěn)定性。受文獻[13,20]的啟發(fā),本文從頻域的角度分析帶有時滯的快速一致性。雖然隨著網(wǎng)絡(luò)的發(fā)展,傳輸速度越來越快,但是智能體傳輸?shù)倪^程中,依舊會存在時滯,并且實際過程中的時滯可能是時變的,所以對研究時變時滯多智能體系統(tǒng)具有實際意義。
本文將時變時滯的二階多智能體網(wǎng)絡(luò)系統(tǒng)作為研究對象,基于頻域的角度分析二階時變時滯多智能體系統(tǒng),且時滯是具有上界的,任意變換的。本文研究結(jié)果為:通過一致性協(xié)議改進算法,基于頻域理論,小增益理論,矩陣論和圖論等,推導(dǎo)得到了使系統(tǒng)快速收斂一致性的充分條件;相較于已有的控制協(xié)議,本文改進的算法能夠使系統(tǒng)快速漸近收斂一致。
本文基于無向網(wǎng)絡(luò)拓撲圖,研究多智能體一致性問題。研究此類問題需要利用如下的圖論知識和一致性問題的描述。
假設(shè),用圖G=(V,ε,A)來表示所描述的多智能體網(wǎng)絡(luò)系統(tǒng)(Multi-Agent Systems,MAS)的無向拓撲圖。其中是節(jié)點集的N索引值,ε∈V×V為圖G的邊集。A=[aij]RN×N(R表示實數(shù)集)為圖G的鄰接矩陣,并且為非負元素。其中i,j∈V(i,j分別表示智能體i和智能體j)。當aij>0時,代表智能體i和智能體j之間有信息傳遞;而aij=0表示智能體i和智能體j之間沒有信息傳遞。考慮本文所研究的是無向圖,則鄰接矩陣A是對稱的。若在任意2個智能體i,j∈V之間存在一條 路 徑,則 稱 圖G為 連 通 圖。 令Ni=,表示智能體i的鄰居集。degi=表示智能體i的度,定義度矩陣D:=那么圖G的拉普拉斯矩陣LG=D-A。拉普拉斯矩陣描述節(jié)點與邊的關(guān)系,且LG=[lij]∈RN×N,其中:

由于系統(tǒng)的拓撲圖為無向圖且連通,則拉普拉斯矩陣是對稱且為正半定矩陣。若λi∈的特征值,則根據(jù)拉普拉斯矩陣的性質(zhì)可得:

假設(shè)有N個二階多智能體系統(tǒng),每個智能體的動態(tài)方程為:


其中,γ1>0;γ2>0;τij為每個智能體輸入時變時滯;考慮到圖G為無向圖且連通,則τij=τji,令若系統(tǒng)在一致性算法式(4)控制輸入下,使得智能體狀態(tài)達到一致性,則系統(tǒng)滿足如下條件:

為了提高體統(tǒng)的收斂速度,本文引入PI控制器,基于式(4)的控制輸入提出如下快速一致性算法:


設(shè)系統(tǒng)初始值為0,對式(7)進行拉普拉斯變換可得:

因此,系統(tǒng)的特征方程為:

為了保證系統(tǒng)的穩(wěn)定性和連通性,需使用如下引理。
引理1[21]當初始值為時,設(shè)則系統(tǒng)在一致性算法式(4)的控制輸入,使得智能體收斂一致滿足的條件為:

其中,τ*為時滯的上界。
引理2[22]記時滯算子υτk+?:=ξ(t)-ξ(t-τk-?),υτk:=ξ(t)-ξ(t-τk),υi:=υτk+?+υτk。 定義 算 子Δf:=(Δ(υ)-1)°(1/s),Δ(υ)=是以τm*為上界的誘導(dǎo)增益,記誘導(dǎo)增益為‖Δf‖∞,‘°’為合成符號,則有
基于引理1與引理2,定理1給出了系統(tǒng)在一致性算法式(6)的控制輸入情況下,使智能體狀態(tài)達到一致的穩(wěn)定條件。
定理1若連通拓撲圖是無向連通的,具有時滯的二階系統(tǒng)在快速一致性算法式(6)的控制協(xié)議下,使得智能體狀態(tài)達到一致,則滿足如下條件:

其中,ι為虛數(shù)單位。
證明 二階系統(tǒng)可由線性時不變系統(tǒng)和時變時滯算子表示,其線性時不變系統(tǒng)與時變時滯算子連接如圖1所示。

圖1 線性時不變系統(tǒng)與時變時滯算子連接圖Fig.1 Connection graph of linear time invariant systems and time varying delay operators
圖1中,X(s)表示系統(tǒng)的時不變系統(tǒng)矩陣,Δ(υ)為系統(tǒng)的時滯算子。
根據(jù)引理2,式(7)的狀態(tài)空間表達式為:

由于LG為對稱矩陣,引入酉矩陣U,則根據(jù)Laplace矩陣特性可得:

將式(14)進行Laplace矩陣變換,可得到:

根據(jù)引理2,式(15)可得:

由式(16)可推出式(17):

系統(tǒng)基于定理1的情況下,定理2為系統(tǒng)在一致性算法式(6)的控制輸入提供了快速收斂充分條件。
定理2 系統(tǒng)在一致性算法式(6)的控制協(xié)議下,使系統(tǒng)快速收斂一致的區(qū)間為?∈(0,δ),其中δ滿足:

證 明 由式(9)可得系統(tǒng)特征方程等價于下式:

根據(jù)拉普拉斯矩陣的性質(zhì)可知,LG的特征λ1=0,且Re(λi)>0,i=2,…,N,則式(18)等價于:



將式(23)取極限可得:

其中,μ為實數(shù)部分微分的極限值。當?>-τk時,ai<0,則μ<0。 由局部保號性定理知,存在去心領(lǐng)域內(nèi)當?=0時當<0,即單調(diào)遞減。若使系統(tǒng)達到快速一致性,則δ滿足ai|?=δ=ρ并使其達到最小值。將系統(tǒng)的根代入式(21)得:


為了驗證定理1和定理2的有效性,本文以環(huán)形網(wǎng)絡(luò)拓撲結(jié)構(gòu)為例進行驗證。通訊網(wǎng)絡(luò)拓撲圖G,共有8個智能體,如圖2所示。

圖2 系統(tǒng)網(wǎng)絡(luò)拓撲Fig.2 The system of network topology
由圖2的通訊網(wǎng)路拓撲圖可得系統(tǒng)的拉普拉斯矩陣為:

(1)時變時滯為τk=0.3713*et/(1+et)。 由定理2可計算δ=0.186,?∈(0,0.186)。 系統(tǒng)分別在控制算法式(4)和式(6)的控制輸入下進行仿真,其位移狀態(tài)變化量的仿真如圖3和圖4所示。
對仿真圖3和圖4分析得出,二階時變時滯多智能體系統(tǒng)在一致性算法式(4)和式(6)的控制輸入下,智能體的狀態(tài)可以達到一致。根據(jù)智能體達到一致性的最初時間τ0對比發(fā)現(xiàn),系統(tǒng)在一致性算法式(6)的控制輸入下,比系統(tǒng)在一致性算法式(4)控制輸入下收斂速度更快。

圖3 系統(tǒng)在一致性算法式(4)控制輸入下的仿真Fig.3 The simulation diagram of the system in control decision(4)is given

圖4 系統(tǒng)在一致性算法式(6)控制輸入下的仿真Fig.4 The simulation diagram of the system in control decision(6)is given
(2)時變時滯為τk=0.3713*et/(1+et)。 若令δ=0.3,?∈(0.18,0.3),系統(tǒng)在一致性算法式(6)控制輸入下,位移狀態(tài)變化量的仿真如圖5所示。τ0表示達到一致性的最初時間。當取δ=0.3>0.186時,系統(tǒng)在τ0=57.27s時達到一致性;在τk不變的情況下,系統(tǒng)在δ=0.3>0.186時達到一致性,但達到一致性的速度小于δ=0.186。 由此實例證實定理2的有效性。

圖5 系統(tǒng)在控制協(xié)議(4)的仿真Fig.5 The simulation diagram of the system in control decision(4)is given
(3)時變時滯為τk=0.5*et/(1+et)>τ*,取參數(shù)δ=0.186、?∈(0,0.186),系統(tǒng)在一致性算法式(4)和式(6)的控制輸入下的仿真如圖6和圖7所示。從圖中發(fā)現(xiàn),系統(tǒng)位移狀態(tài)變量是發(fā)散的,系統(tǒng)不能達到一致。而此時的τk的最小值大于τ*,導(dǎo)致系統(tǒng)的不穩(wěn)定。由此可說明,定理1是合理并且是有效的。

圖6 系統(tǒng)一致性算法式(4)控制輸入下的仿真Fig.6 The simulation diagram of the system in control decision(4)is given

圖7 一致性算法式(6)控制輸入下的仿真Fig.7 The simulation diagram of the system in control decision(6)is given
根據(jù)仿真實例,系統(tǒng)在一致性算法的控制下分析結(jié)果如下:
(1)二階時變時滯系統(tǒng)在時滯上界相同(其時滯上界為引理1計算所得),δ取值相同時,系統(tǒng)在改進后的一致性算法式(6)的控制輸入下,首次趨于一致性的時間比系統(tǒng)在已有的控制算法控制輸入下快,表明改進后的控制算法的有效性。
(2)二階時變時滯系統(tǒng)在時滯上界相同(其時滯上界為引理1計算所得),δ大于定理2所計算的值時,系統(tǒng)在改進后的一致性算法控制輸入情況下達到一致,但不是最快。
(3)二階時變時滯系統(tǒng)的時滯上界大于引理1計算出的時滯且δ取值相同時,系統(tǒng)在一致性算法式(4)和一致性算法式(6)控制輸入下都會發(fā)散。
綜上所述,證明了本文提出快速一致性算法的有效性。
本文基于傳統(tǒng)的一致性,提出快速一致性算法,結(jié)合圖論、控制理論和矩陣論,證明了改進后的控制協(xié)議的合理性和有效性。利用MATLAB驗證了時變時滯的二階多智能體的快速收斂一致性。本文的研究方向針對連續(xù)二階系統(tǒng),根據(jù)系統(tǒng)的復(fù)雜性,后續(xù)研究方向是將控制協(xié)議推廣到帶有時滯的離散系統(tǒng)和高階系統(tǒng)中。