范曉宇,賈新春?,李彬,謝云飛
(1.山西大學(xué)自動(dòng)化與軟件學(xué)院,山西 太原 030031;2.山西大學(xué)數(shù)學(xué)科學(xué)學(xué)院,山西 太原 030006)
近年來,多智能體系統(tǒng)獲得了迅速的發(fā)展,它可以刻畫許多自然現(xiàn)象[1]、移動(dòng)機(jī)器人[2]、分布式電力調(diào)度[3]和傳感器網(wǎng)絡(luò)[4]。一致性是多智能體系統(tǒng)協(xié)同控制的核心問題,受到了學(xué)界的廣泛關(guān)注[5-6]。然而,刻畫不同群體之間的交互關(guān)系并不僅有合作關(guān)系,同時(shí)考慮合作和對(duì)抗交互的二分一致性更具研究意義[7-8]。關(guān)于二分一致性研究已有不少工作,其中:文獻(xiàn)[9]針對(duì)異構(gòu)線性多智能體系統(tǒng)設(shè)計(jì)了一種二分固定時(shí)間補(bǔ)償器以實(shí)現(xiàn)輸出編隊(duì)-包圍追蹤控制目標(biāo);文獻(xiàn)[10]研究了多智能體系統(tǒng)的預(yù)設(shè)時(shí)間二分一致性的事件觸發(fā)控制;文獻(xiàn)[11]利用一個(gè)三選項(xiàng)決策機(jī)制研究了多智能體系統(tǒng)的二分一致性以避免不受約束的控制協(xié)議設(shè)計(jì)值;文獻(xiàn)[12]提出了一個(gè)針對(duì)網(wǎng)絡(luò)攻擊的二分追蹤一致性的安全反饋控制方案。
多智能體系統(tǒng)的拓?fù)鋱D是刻畫其信息交互的有效方式。由于有向通信拓?fù)湎? 個(gè)智能體之間的耦合權(quán)重大概率不同,因此針對(duì)于雙向權(quán)值不同的符號(hào)圖,一個(gè)被稱為“細(xì)節(jié)平衡結(jié)構(gòu)”的新的拓?fù)涓拍畋惶岢觯?3]。文獻(xiàn)[14]在此基礎(chǔ)上研究了有限時(shí)間一致性協(xié)議。文獻(xiàn)[15]研究了細(xì)節(jié)平衡對(duì)抗交互下多智能體系統(tǒng)的有限時(shí)間二分一致性。
回顧多智能體系統(tǒng)的一致性研究,采樣控制已是不可或缺的一個(gè)分支,針對(duì)單個(gè)智能體,多數(shù)研究僅考慮了單率采樣機(jī)制。為了避免單率采樣中采樣頻率高的數(shù)據(jù)等待采樣頻率低的數(shù)據(jù)導(dǎo)致部分?jǐn)?shù)據(jù)傳輸延遲、影響控制效果,多率采樣機(jī)制被作為一種較好的解決方案被提出。多率采樣機(jī)制可以針對(duì)智能體內(nèi)部對(duì)應(yīng)不同采樣頻率的傳感器及時(shí)地進(jìn)行數(shù)據(jù)采樣傳輸,使得控制更具實(shí)時(shí)性。在網(wǎng)絡(luò)化系統(tǒng)中,文獻(xiàn)[16]提出了一個(gè)新穎的匹配機(jī)制來使得多率觀測(cè)器和系統(tǒng)的多率采樣信息同步,解決了帶有輸入時(shí)延的一般網(wǎng)絡(luò)化系統(tǒng)在多率采樣下的鎮(zhèn)定問題??紤]到系統(tǒng)的輸出采用多率采樣,文獻(xiàn)[17]提出一個(gè)分散式事件觸發(fā)方法解決了網(wǎng)絡(luò)化系統(tǒng)的耗散控制問題。文獻(xiàn)[18]將多率采樣機(jī)制擴(kuò)展到了對(duì)多智能體系統(tǒng)的研究,采用動(dòng)態(tài)補(bǔ)償器的方法解決了異構(gòu)和同構(gòu)多智能體系統(tǒng)在多率采樣下的輸出和狀態(tài)一致性。文獻(xiàn)[19]在拒絕服務(wù)攻擊下,基于多率采樣機(jī)制實(shí)現(xiàn)了多智能體系統(tǒng)的安全一致性。
雖然多率采樣機(jī)制可以充分利用采樣數(shù)據(jù),更具實(shí)時(shí)性地完成多智能體系統(tǒng)的控制目標(biāo),但是隨著通信技術(shù)的成熟,控制動(dòng)作和信號(hào)傳輸都高度依賴于通信網(wǎng)絡(luò),而在系統(tǒng)狀態(tài)未發(fā)生較大變化時(shí),多率采樣數(shù)據(jù)并不需要高頻次的傳輸,從而導(dǎo)致通信資源的浪費(fèi),甚至有堵塞網(wǎng)絡(luò)的風(fēng)險(xiǎn)。為解決這一問題,事件觸發(fā)機(jī)制作為一個(gè)有效的方案被引入多智能體系統(tǒng)的控制中[20-21]。文獻(xiàn)[22]在切換拓?fù)湎卵芯苛硕嘀悄荏w系統(tǒng)的事件觸發(fā)二分一致性。為了進(jìn)一步降低事件觸發(fā)的頻次,一種動(dòng)態(tài)事件觸發(fā)機(jī)制在文獻(xiàn)[23]中被提出。通過引入一個(gè)內(nèi)部動(dòng)態(tài)變量,動(dòng)態(tài)事件觸發(fā)可以更有效地降低通信資源的消耗[24]。文獻(xiàn)[25]在引入內(nèi)部動(dòng)態(tài)變量的情況下,利用鄰居智能體觸發(fā)時(shí)刻廣播的狀態(tài)信息,設(shè)計(jì)一個(gè)基于事件的控制協(xié)議實(shí)現(xiàn)了一致性目標(biāo)。在考慮輸入飽和的情形下,文獻(xiàn)[26]研究了基于觀測(cè)器的動(dòng)態(tài)事件觸發(fā)二分一致性。
可以發(fā)現(xiàn),在針對(duì)多智能體系統(tǒng)的二分一致性研究中,較少有多率采樣機(jī)制下實(shí)現(xiàn)控制目標(biāo)的成果展現(xiàn),而且在多率采樣機(jī)制下引入動(dòng)態(tài)事件觸發(fā)機(jī)制,可以充分利用采樣數(shù)據(jù),同時(shí)在一致性誤差容許范圍內(nèi)避免文獻(xiàn)[18]中智能體之間冗余數(shù)據(jù)傳輸,并可根據(jù)系統(tǒng)狀態(tài)誤差變化動(dòng)態(tài)調(diào)整觸發(fā)閾值。基于上述分析,本文在細(xì)節(jié)平衡的拓?fù)浣Y(jié)構(gòu)下,研究多率采樣機(jī)制下多智能體系統(tǒng)的動(dòng)態(tài)事件觸發(fā)二分一致性。首先,在多智能體系統(tǒng)二分一致性的研究中引入多率采樣機(jī)制,構(gòu)造一個(gè)緩存器解決多率采樣時(shí)序的不匹配問題;其次,設(shè)計(jì)一類多率觀測(cè)器便于獲得系統(tǒng)的估計(jì)狀態(tài)以實(shí)現(xiàn)控制目標(biāo),通過引入動(dòng)態(tài)事件觸發(fā)機(jī)制,大幅減少事件觸發(fā)次數(shù);最后,基于觸發(fā)時(shí)刻的觀測(cè)器狀態(tài)信息設(shè)計(jì)分布式控制協(xié)議,實(shí)現(xiàn)多智能體系統(tǒng)的二分一致性,并排除芝諾行為。
符號(hào)圖G=(V,E,H),其 中:V={v1,v2,…,vN}是節(jié)點(diǎn)集;E ?V×V 是邊集;(vj,vi) ?E 表示存在一個(gè)邊從智能體j到智能體i;H=[hij] ?RN×N為鄰接矩陣。此外,hij>0,(vj,vi) ?E 表示智能體j和智能體i之間是 協(xié)同合 作的關(guān) 系,而hij<0,(vj,vi) ?E 表 示2 個(gè)智能體之間是對(duì)抗競爭的關(guān)系。若hij=0,則說明(vj,vi) ?E。而對(duì)于智能體i而言,其鄰居智能體可通過一個(gè)集合Ni={j|vj?V,(vj,vi) ?E,j≠i} 來表示。一個(gè)有向符號(hào)圖G 中如果存在一條路徑從任意節(jié)點(diǎn)vi到vj,并存在另一條路徑從vj到vi,則稱此圖是強(qiáng)連通圖。
圖G 的Laplacian 矩陣表示為:
定義1[7]如果對(duì)于圖 G 存在2 個(gè)子集 V1和V2滿足V1∪V2=V,同時(shí)V1∩V2=?,則稱此圖為結(jié)構(gòu)平衡圖,并且具有以下特性:hij≥ 0,?vi,vj?V1(V2)和hij≤0,?vi?V1,vj?V2。
定義2[13]如果存 在一些常數(shù)γi>0,i?{1,2,…,N} 使 得γihij=γjhji對(duì)于任意的i,j?{1,2,…,N}均成立,則稱有向符號(hào)圖 G 是細(xì)節(jié)平衡圖。存在一個(gè)正定對(duì)角矩陣Γ=diag{γ1,γ2,…,γN}使得LD=ΓL 為一個(gè)對(duì)稱矩陣。
假設(shè)1本文所研究的有向符號(hào)圖 G 是具有細(xì)節(jié)平衡結(jié)構(gòu)的結(jié)構(gòu)平衡強(qiáng)連通圖。
假設(shè)2假設(shè)矩陣對(duì)(A,B)是可鎮(zhèn)定的,矩陣對(duì)(A,C)是可觀測(cè)的。
引理1[5,7]對(duì)于一個(gè)結(jié)構(gòu)平衡的有向符號(hào)圖G,存在一個(gè)符號(hào)矩陣S=diag{s1,s2,…,sN},si?{1,-1}使得矩陣SHS中的所有元素均為非負(fù)的,即SHS>0。
引理2[7,13]假設(shè)一 個(gè)有向 符號(hào)圖 G 是帶有 細(xì)節(jié)平衡拓?fù)浣Y(jié)構(gòu)的結(jié)構(gòu)平衡圖,則相對(duì)應(yīng)的符號(hào)Laplacian 矩陣LD有一個(gè)非負(fù)向量[s1,s2,…,sN]T作為其相對(duì)于單一零特征值的特征向量,并且LD的特征值可重新排序?yàn)棣?(LD)≤λ2(LD)≤…≤λN(LD),其中,λ1(LD)=0 。
考慮一個(gè)由N個(gè)智能體組成的多智能體系統(tǒng),其中第i個(gè)智能體的動(dòng)力學(xué)描述如下:
其中:xi(t) ?Rn、yi(t) ?Rm、ui(t) ?Rp分別表示系統(tǒng)的狀態(tài)、輸 出、控制輸 入;A?Rn×n、B?Rn×p、C?Rm×n分別表示系統(tǒng)矩陣、輸入矩陣、輸出矩陣。
智能體對(duì)應(yīng)于不同系統(tǒng)特征的輸出狀態(tài)應(yīng)由不同的傳感器進(jìn)行多率采樣,類似于文獻(xiàn)[16,18]所研究的多率采樣機(jī)制,本文考慮多率采樣機(jī)制如下:假設(shè)智能體i的系統(tǒng)輸出的m個(gè)分量根據(jù)其所選傳感器組的采樣頻率不同分為r組子向量,即yi(t)=并且其中,均為整數(shù)。
如圖1 所示,一個(gè)智能體的不同的輸出分量有其不全相同的采樣頻率,表示第r個(gè)傳感器組的采樣時(shí)刻,其中?N 并且表示第r個(gè)傳感器組的采樣周期。采用一個(gè)緩存器來儲(chǔ)存不同傳感器組所采樣的輸出數(shù)據(jù),并通過零階保持機(jī)制來獲得單個(gè)智能體的緩存器組合輸出狀態(tài)數(shù)據(jù):

圖1 多率采樣機(jī)制下動(dòng)態(tài)事件觸發(fā)二分一致性控制框架Fig.1 The framework of dynamic event-triggered bipartite consensus control with a multi-rate sampling mechanism
通過以一個(gè)升序的方式重新排列智能體i的各傳感器組的采樣時(shí)刻,可以得到一個(gè)多率采樣時(shí)間序列緩存器中的數(shù)據(jù)在每一個(gè)采樣時(shí)刻更新,不同采樣周期的傳感器組在其多率采樣時(shí)刻將采樣數(shù)據(jù)送入緩存器,通過緩存器后,提供至多率觀測(cè)器的系統(tǒng)采樣數(shù)據(jù)為緩存器的組合輸出:
由式(3)可看出,多率采樣的時(shí)序不匹配問題得到解決,任意采樣周期不同的傳感器組數(shù)據(jù)均可轉(zhuǎn)換為一連續(xù)時(shí)間下的輸出yˉi(t)。
注1由式(2)及式(3)可以得出,傳感器組Sr所采樣的輸出變量在時(shí)刻到達(dá)緩存器,而緩存器的組合輸出狀態(tài)yˉi(t)只更新所對(duì)應(yīng)的第r個(gè)子向量,剩余的子向量均保持上一次更新的數(shù)據(jù)不變。因此,多率采樣機(jī)制可以利用更為實(shí)時(shí)的采樣數(shù)據(jù),同時(shí)還避免了整個(gè)采樣輸出變量的同時(shí)更新。
如圖1 所示,對(duì)于式(1)所示的多智能體系統(tǒng),構(gòu)造一組多率觀測(cè)器以實(shí)現(xiàn)對(duì)于系統(tǒng)狀態(tài)的觀測(cè)并提供連續(xù)數(shù)據(jù)以便于控制器的設(shè)計(jì),并由后續(xù)設(shè)計(jì)的動(dòng)態(tài)事件觸發(fā)機(jī)制確定其廣播狀態(tài)數(shù)據(jù)至通信網(wǎng)絡(luò)的事件時(shí)刻。
其中:R?Rn×m為待設(shè)計(jì)的觀測(cè)器增益矩陣,其設(shè)計(jì)要求A+RC是Hurwitz 的。
針對(duì)式(1)所示的多智能體系統(tǒng),提出多率采樣機(jī)制下具有細(xì)節(jié)平衡對(duì)抗交互的二分一致性控制協(xié)議如下:
為了實(shí)現(xiàn)動(dòng)態(tài)事件觸發(fā)機(jī)制的設(shè)計(jì),首先定義一個(gè)估計(jì)偏差向量判斷是否將智能體i的多率觀測(cè)器狀態(tài)廣播至通信網(wǎng)絡(luò)的時(shí)刻由下列觸發(fā)函數(shù)確定:
引理3對(duì)于給定的標(biāo)量?i(0)、μi和βi,動(dòng)態(tài)輔助參數(shù)?i(t)>0,i?{1,2,…,N}。
證明對(duì)于根據(jù)動(dòng)態(tài)輔助參數(shù)?i(t)的動(dòng)力學(xué)描述[見式(7)]可得:
因此,對(duì)于t?[0,∞),均有?i(t) >0 成立。
定義3若對(duì)任意的智能體i?{1,2,…,N},j?Ni,在任意的初始條件下,滿足:
則稱多智能體系統(tǒng)達(dá)到了二分一致性。
定理1若假設(shè)1 和假設(shè)2 成立,如果存在正定對(duì)稱矩陣Q>0 和2 個(gè)常數(shù)ρ1,ρ2>0 滿足:
則所構(gòu)造的多率觀測(cè)器可以有效地跟蹤智能體的狀態(tài)。進(jìn)一步地,式(1)所示多智能體系統(tǒng)可以通過所設(shè)計(jì)的控制協(xié)議[見式(5)]在引入動(dòng)態(tài)事件觸發(fā)機(jī)制[見式(6)]的基礎(chǔ)上實(shí)現(xiàn)二分一致性,且控制增益矩陣K=-BTP,而矩陣P可由下列代數(shù)黎卡提方程求解得出:
根據(jù)上述定義,可以推導(dǎo)得出:
基于上述分析,構(gòu)造一個(gè)李雅普諾夫函數(shù):
對(duì)其求導(dǎo)可得:
本節(jié)通過后續(xù)2 種情境的分析排除事件觸發(fā)過程中芝諾行為的發(fā)生。
情境1對(duì)于智能體i而言,在范圍內(nèi)沒有鄰居智能體 滿足條件觸發(fā),則由可得出:
綜上所述,芝諾行為被排除。
芝諾行為意味著系統(tǒng)需要在有限時(shí)間內(nèi)無限次地更新狀態(tài),這在實(shí)際應(yīng)用中是不可能的,通過上述分析可知,連續(xù)兩次事件觸發(fā)時(shí)刻之間的間隔與系統(tǒng)控制、動(dòng)態(tài)輔助參數(shù)、觀測(cè)器設(shè)計(jì)及多率采樣誤差有關(guān)。在相關(guān)應(yīng)用中,理論分析已確保芝諾行為不會(huì)發(fā)生,并可通過調(diào)節(jié)上述參數(shù),依托于場景特征,給出兩次觸發(fā)之間的間隔下界以滿足實(shí)際需求。
在本節(jié)中,通過一個(gè)包含3 種控制方案(多率采樣動(dòng)態(tài)事件觸發(fā)、多率采樣靜態(tài)事件觸發(fā)、單率采樣動(dòng)態(tài)事件觸發(fā))的仿真對(duì)比來驗(yàn)證所提控制協(xié)議的有效性??紤]一個(gè)由9 個(gè)智能體組成的多智能體系統(tǒng),其滿足細(xì)節(jié)平衡結(jié)構(gòu)的通信網(wǎng)絡(luò)拓?fù)淙鐖D2 所示(彩色效果見《計(jì)算機(jī)工程》官網(wǎng)HTML 版,下同)。

圖2 帶有細(xì)節(jié)平衡結(jié)構(gòu)的網(wǎng)絡(luò)拓?fù)銯ig.2 A network topology with a detail-balanced structure
智能體的系統(tǒng)矩陣、輸入矩陣和輸出矩陣分別表示如下:
基于鄰接矩陣,可得到相對(duì)應(yīng)的矩陣Γ為:
Γ=diag{2,1,4,1,2,3,5,1,2}
通過求解代數(shù)黎卡提方程[見式(12)]可以得到:
控制增益矩陣K可選為:
通過極點(diǎn)配置法可得到觀測(cè)器增益矩陣R為:
智能體初始狀態(tài)為:x1(0)=col{3,-2,3},x2(0)=col{2,3,3},x3(0)=col{1,5,2},x4(0)=col{-2,2,-3},x5(0)=col{-3,-4,-2},x6(0)=col{-1,1,-3},x7(0)=col{2,-1,-2},x8(0)=col{-2,4,1},x9(0)=col{1,1,1} 。為便于對(duì)比分析,3 種控制方案下系統(tǒng)狀態(tài)初值均一致。
取動(dòng)態(tài)事件觸發(fā)閾值參數(shù)的初值為靜態(tài)事件觸發(fā)機(jī)制下的閾值,其初始取值如下:?1(0)=10,?2(0)=15,?3(0)=28,?4(0)=13,?5(0)=19,?6(0)=12,?7(0)=10,?8(0)=20,?9(0)=15。顯然,在靜態(tài)事件觸發(fā)機(jī)制中,閾值保持不變,而在動(dòng)態(tài)事件觸發(fā)機(jī)制中,觸發(fā)閾值是時(shí)變的。各智能體相關(guān)的控制參數(shù)見表1。

表1 控制參數(shù)Table 1 Control parameters
多率采樣機(jī)制動(dòng)態(tài)事件觸發(fā)控制方案下多智能體系統(tǒng)的狀態(tài)軌跡如圖3 所示,其最終狀態(tài)實(shí)現(xiàn)二分一致性。各智能體的動(dòng)態(tài)事件觸發(fā)時(shí)刻在圖4 中展示。圖5 中顯示了動(dòng)態(tài)輔助參數(shù)的軌跡,可看出,隨著多智能體系統(tǒng)中智能體狀態(tài)及一致性誤差的變化,關(guān)于智能體是否觸發(fā)的這一參數(shù)會(huì)在一致性誤差較大時(shí)取相對(duì)應(yīng)的較大值以降低觸發(fā)次數(shù),隨著系統(tǒng)一致性的逐步實(shí)現(xiàn),這一參數(shù)會(huì)進(jìn)一步減小以保證更好的系統(tǒng)一致性能。

圖3 多率采樣動(dòng)態(tài)事件觸發(fā)控制下9 個(gè)智能體的狀態(tài)軌跡Fig.3 The states trajectories of nine agents under a dynamic event-triggered control with a multi-rate sampling mechanism

圖4 多率采樣機(jī)制下各智能體動(dòng)態(tài)事件觸發(fā)時(shí)刻Fig.4 The dynamic event-triggered instants of each agent with a multi-rate sampling mechanism

圖5 多率采樣機(jī)制下動(dòng)態(tài)事件觸發(fā)輔助參數(shù)狀態(tài)軌跡Fig.5 The state trajectories of dynamic event-triggered auxiliary parameters with a multi-rate sampling mechanism
圖6 給出了3 種控制方案下收斂性能對(duì)比,同時(shí)表2 給出了不同控制方案下平均事件觸發(fā)次數(shù)對(duì)比。分析可得,多率采樣機(jī)制可利用更為實(shí)時(shí)的系統(tǒng)數(shù)據(jù),控制目標(biāo)的實(shí)現(xiàn)更為迅速,并利用多率采樣下的動(dòng)態(tài)事件觸發(fā)機(jī)制,可在大幅降低觸發(fā)次數(shù)、減少通信負(fù)擔(dān)的同時(shí),保證更優(yōu)的系統(tǒng)一致性能。

表2 事件觸發(fā)次數(shù)對(duì)比Table 2 Comparison of event-triggered times 單位:次

圖6 3 種控制方案下收斂性能對(duì)比Fig.6 Comparison of convergence performance under three control schemes
本文研究多率采樣機(jī)制下多智能體系統(tǒng)的動(dòng)態(tài)事件觸發(fā)二分一致性。在解決多率采樣時(shí)序不匹配的問題后,設(shè)計(jì)一類多率觀測(cè)器便于獲得系統(tǒng)的估計(jì)狀態(tài)以構(gòu)造分布式動(dòng)態(tài)事件觸發(fā)控制協(xié)議。利用代數(shù)黎卡提方程和李雅普諾夫穩(wěn)定性理論證明系統(tǒng)可以在帶有細(xì)節(jié)平衡結(jié)構(gòu)的通信網(wǎng)絡(luò)中實(shí)現(xiàn)二分一致性并排除芝諾行為。仿真對(duì)比結(jié)果證明了所提控制協(xié)議的有效性。未來的工作將考慮通信網(wǎng)絡(luò)中存在惡意攻擊的情形,研究多率采樣機(jī)制下多智能體系統(tǒng)的動(dòng)態(tài)事件觸發(fā)二分一致性。