范曉宇,賈新春?,李彬,謝云飛
(1.山西大學(xué)自動化與軟件學(xué)院,山西 太原 030031;2.山西大學(xué)數(shù)學(xué)科學(xué)學(xué)院,山西 太原 030006)
近年來,多智能體系統(tǒng)獲得了迅速的發(fā)展,它可以刻畫許多自然現(xiàn)象[1]、移動機(jī)器人[2]、分布式電力調(diào)度[3]和傳感器網(wǎng)絡(luò)[4]。一致性是多智能體系統(tǒng)協(xié)同控制的核心問題,受到了學(xué)界的廣泛關(guān)注[5-6]。然而,刻畫不同群體之間的交互關(guān)系并不僅有合作關(guān)系,同時考慮合作和對抗交互的二分一致性更具研究意義[7-8]。關(guān)于二分一致性研究已有不少工作,其中:文獻(xiàn)[9]針對異構(gòu)線性多智能體系統(tǒng)設(shè)計了一種二分固定時間補(bǔ)償器以實現(xiàn)輸出編隊-包圍追蹤控制目標(biāo);文獻(xiàn)[10]研究了多智能體系統(tǒng)的預(yù)設(shè)時間二分一致性的事件觸發(fā)控制;文獻(xiàn)[11]利用一個三選項決策機(jī)制研究了多智能體系統(tǒng)的二分一致性以避免不受約束的控制協(xié)議設(shè)計值;文獻(xiàn)[12]提出了一個針對網(wǎng)絡(luò)攻擊的二分追蹤一致性的安全反饋控制方案。
多智能體系統(tǒng)的拓?fù)鋱D是刻畫其信息交互的有效方式。由于有向通信拓?fù)湎? 個智能體之間的耦合權(quán)重大概率不同,因此針對于雙向權(quán)值不同的符號圖,一個被稱為“細(xì)節(jié)平衡結(jié)構(gòu)”的新的拓?fù)涓拍畋惶岢觯?3]。文獻(xiàn)[14]在此基礎(chǔ)上研究了有限時間一致性協(xié)議。文獻(xiàn)[15]研究了細(xì)節(jié)平衡對抗交互下多智能體系統(tǒng)的有限時間二分一致性。
回顧多智能體系統(tǒng)的一致性研究,采樣控制已是不可或缺的一個分支,針對單個智能體,多數(shù)研究僅考慮了單率采樣機(jī)制。為了避免單率采樣中采樣頻率高的數(shù)據(jù)等待采樣頻率低的數(shù)據(jù)導(dǎo)致部分?jǐn)?shù)據(jù)傳輸延遲、影響控制效果,多率采樣機(jī)制被作為一種較好的解決方案被提出。多率采樣機(jī)制可以針對智能體內(nèi)部對應(yīng)不同采樣頻率的傳感器及時地進(jìn)行數(shù)據(jù)采樣傳輸,使得控制更具實時性。在網(wǎng)絡(luò)化系統(tǒng)中,文獻(xiàn)[16]提出了一個新穎的匹配機(jī)制來使得多率觀測器和系統(tǒng)的多率采樣信息同步,解決了帶有輸入時延的一般網(wǎng)絡(luò)化系統(tǒng)在多率采樣下的鎮(zhèn)定問題。考慮到系統(tǒng)的輸出采用多率采樣,文獻(xiàn)[17]提出一個分散式事件觸發(fā)方法解決了網(wǎng)絡(luò)化系統(tǒng)的耗散控制問題。文獻(xiàn)[18]將多率采樣機(jī)制擴(kuò)展到了對多智能體系統(tǒng)的研究,采用動態(tài)補(bǔ)償器的方法解決了異構(gòu)和同構(gòu)多智能體系統(tǒng)在多率采樣下的輸出和狀態(tài)一致性。文獻(xiàn)[19]在拒絕服務(wù)攻擊下,基于多率采樣機(jī)制實現(xiàn)了多智能體系統(tǒng)的安全一致性。
雖然多率采樣機(jī)制可以充分利用采樣數(shù)據(jù),更具實時性地完成多智能體系統(tǒng)的控制目標(biāo),但是隨著通信技術(shù)的成熟,控制動作和信號傳輸都高度依賴于通信網(wǎng)絡(luò),而在系統(tǒng)狀態(tài)未發(fā)生較大變化時,多率采樣數(shù)據(jù)并不需要高頻次的傳輸,從而導(dǎo)致通信資源的浪費,甚至有堵塞網(wǎng)絡(luò)的風(fēng)險。為解決這一問題,事件觸發(fā)機(jī)制作為一個有效的方案被引入多智能體系統(tǒng)的控制中[20-21]。文獻(xiàn)[22]在切換拓?fù)湎卵芯苛硕嘀悄荏w系統(tǒng)的事件觸發(fā)二分一致性。為了進(jìn)一步降低事件觸發(fā)的頻次,一種動態(tài)事件觸發(fā)機(jī)制在文獻(xiàn)[23]中被提出。通過引入一個內(nèi)部動態(tài)變量,動態(tài)事件觸發(fā)可以更有效地降低通信資源的消耗[24]。文獻(xiàn)[25]在引入內(nèi)部動態(tài)變量的情況下,利用鄰居智能體觸發(fā)時刻廣播的狀態(tài)信息,設(shè)計一個基于事件的控制協(xié)議實現(xiàn)了一致性目標(biāo)。在考慮輸入飽和的情形下,文獻(xiàn)[26]研究了基于觀測器的動態(tài)事件觸發(fā)二分一致性。
可以發(fā)現(xiàn),在針對多智能體系統(tǒng)的二分一致性研究中,較少有多率采樣機(jī)制下實現(xiàn)控制目標(biāo)的成果展現(xiàn),而且在多率采樣機(jī)制下引入動態(tài)事件觸發(fā)機(jī)制,可以充分利用采樣數(shù)據(jù),同時在一致性誤差容許范圍內(nèi)避免文獻(xiàn)[18]中智能體之間冗余數(shù)據(jù)傳輸,并可根據(jù)系統(tǒng)狀態(tài)誤差變化動態(tài)調(diào)整觸發(fā)閾值。基于上述分析,本文在細(xì)節(jié)平衡的拓?fù)浣Y(jié)構(gòu)下,研究多率采樣機(jī)制下多智能體系統(tǒng)的動態(tài)事件觸發(fā)二分一致性。首先,在多智能體系統(tǒng)二分一致性的研究中引入多率采樣機(jī)制,構(gòu)造一個緩存器解決多率采樣時序的不匹配問題;其次,設(shè)計一類多率觀測器便于獲得系統(tǒng)的估計狀態(tài)以實現(xiàn)控制目標(biāo),通過引入動態(tài)事件觸發(fā)機(jī)制,大幅減少事件觸發(fā)次數(shù);最后,基于觸發(fā)時刻的觀測器狀態(tài)信息設(shè)計分布式控制協(xié)議,實現(xiàn)多智能體系統(tǒng)的二分一致性,并排除芝諾行為。
符號圖G=(V,E,H),其 中:V={v1,v2,…,vN}是節(jié)點集;E ?V×V 是邊集;(vj,vi) ?E 表示存在一個邊從智能體j到智能體i;H=[hij] ?RN×N為鄰接矩陣。此外,hij>0,(vj,vi) ?E 表示智能體j和智能體i之間是 協(xié)同合 作的關(guān) 系,而hij<0,(vj,vi) ?E 表 示2 個智能體之間是對抗競爭的關(guān)系。若hij=0,則說明(vj,vi) ?E。而對于智能體i而言,其鄰居智能體可通過一個集合Ni={j|vj?V,(vj,vi) ?E,j≠i} 來表示。一個有向符號圖G 中如果存在一條路徑從任意節(jié)點vi到vj,并存在另一條路徑從vj到vi,則稱此圖是強(qiáng)連通圖。
圖G 的Laplacian 矩陣表示為:
定義1[7]如果對于圖 G 存在2 個子集 V1和V2滿足V1∪V2=V,同時V1∩V2=?,則稱此圖為結(jié)構(gòu)平衡圖,并且具有以下特性:hij≥ 0,?vi,vj?V1(V2)和hij≤0,?vi?V1,vj?V2。
定義2[13]如果存 在一些常數(shù)γi>0,i?{1,2,…,N} 使 得γihij=γjhji對于任意的i,j?{1,2,…,N}均成立,則稱有向符號圖 G 是細(xì)節(jié)平衡圖。存在一個正定對角矩陣Γ=diag{γ1,γ2,…,γN}使得LD=ΓL 為一個對稱矩陣。
假設(shè)1本文所研究的有向符號圖 G 是具有細(xì)節(jié)平衡結(jié)構(gòu)的結(jié)構(gòu)平衡強(qiáng)連通圖。
假設(shè)2假設(shè)矩陣對(A,B)是可鎮(zhèn)定的,矩陣對(A,C)是可觀測的。
引理1[5,7]對于一個結(jié)構(gòu)平衡的有向符號圖G,存在一個符號矩陣S=diag{s1,s2,…,sN},si?{1,-1}使得矩陣SHS中的所有元素均為非負(fù)的,即SHS>0。
引理2[7,13]假設(shè)一 個有向 符號圖 G 是帶有 細(xì)節(jié)平衡拓?fù)浣Y(jié)構(gòu)的結(jié)構(gòu)平衡圖,則相對應(yīng)的符號Laplacian 矩陣LD有一個非負(fù)向量[s1,s2,…,sN]T作為其相對于單一零特征值的特征向量,并且LD的特征值可重新排序為λ1(LD)≤λ2(LD)≤…≤λN(LD),其中,λ1(LD)=0 。
考慮一個由N個智能體組成的多智能體系統(tǒng),其中第i個智能體的動力學(xué)描述如下:
其中:xi(t) ?Rn、yi(t) ?Rm、ui(t) ?Rp分別表示系統(tǒng)的狀態(tài)、輸 出、控制輸 入;A?Rn×n、B?Rn×p、C?Rm×n分別表示系統(tǒng)矩陣、輸入矩陣、輸出矩陣。
智能體對應(yīng)于不同系統(tǒng)特征的輸出狀態(tài)應(yīng)由不同的傳感器進(jìn)行多率采樣,類似于文獻(xiàn)[16,18]所研究的多率采樣機(jī)制,本文考慮多率采樣機(jī)制如下:假設(shè)智能體i的系統(tǒng)輸出的m個分量根據(jù)其所選傳感器組的采樣頻率不同分為r組子向量,即yi(t)=并且其中,均為整數(shù)。
如圖1 所示,一個智能體的不同的輸出分量有其不全相同的采樣頻率,表示第r個傳感器組的采樣時刻,其中?N 并且表示第r個傳感器組的采樣周期。采用一個緩存器來儲存不同傳感器組所采樣的輸出數(shù)據(jù),并通過零階保持機(jī)制來獲得單個智能體的緩存器組合輸出狀態(tài)數(shù)據(jù):

圖1 多率采樣機(jī)制下動態(tài)事件觸發(fā)二分一致性控制框架Fig.1 The framework of dynamic event-triggered bipartite consensus control with a multi-rate sampling mechanism
通過以一個升序的方式重新排列智能體i的各傳感器組的采樣時刻,可以得到一個多率采樣時間序列緩存器中的數(shù)據(jù)在每一個采樣時刻更新,不同采樣周期的傳感器組在其多率采樣時刻將采樣數(shù)據(jù)送入緩存器,通過緩存器后,提供至多率觀測器的系統(tǒng)采樣數(shù)據(jù)為緩存器的組合輸出:
由式(3)可看出,多率采樣的時序不匹配問題得到解決,任意采樣周期不同的傳感器組數(shù)據(jù)均可轉(zhuǎn)換為一連續(xù)時間下的輸出yˉi(t)。
注1由式(2)及式(3)可以得出,傳感器組Sr所采樣的輸出變量在時刻到達(dá)緩存器,而緩存器的組合輸出狀態(tài)yˉi(t)只更新所對應(yīng)的第r個子向量,剩余的子向量均保持上一次更新的數(shù)據(jù)不變。因此,多率采樣機(jī)制可以利用更為實時的采樣數(shù)據(jù),同時還避免了整個采樣輸出變量的同時更新。
如圖1 所示,對于式(1)所示的多智能體系統(tǒng),構(gòu)造一組多率觀測器以實現(xiàn)對于系統(tǒng)狀態(tài)的觀測并提供連續(xù)數(shù)據(jù)以便于控制器的設(shè)計,并由后續(xù)設(shè)計的動態(tài)事件觸發(fā)機(jī)制確定其廣播狀態(tài)數(shù)據(jù)至通信網(wǎng)絡(luò)的事件時刻。
其中:R?Rn×m為待設(shè)計的觀測器增益矩陣,其設(shè)計要求A+RC是Hurwitz 的。
針對式(1)所示的多智能體系統(tǒng),提出多率采樣機(jī)制下具有細(xì)節(jié)平衡對抗交互的二分一致性控制協(xié)議如下:
為了實現(xiàn)動態(tài)事件觸發(fā)機(jī)制的設(shè)計,首先定義一個估計偏差向量判斷是否將智能體i的多率觀測器狀態(tài)廣播至通信網(wǎng)絡(luò)的時刻由下列觸發(fā)函數(shù)確定:
引理3對于給定的標(biāo)量?i(0)、μi和βi,動態(tài)輔助參數(shù)?i(t)>0,i?{1,2,…,N}。
證明對于根據(jù)動態(tài)輔助參數(shù)?i(t)的動力學(xué)描述[見式(7)]可得:
因此,對于t?[0,∞),均有?i(t) >0 成立。
定義3若對任意的智能體i?{1,2,…,N},j?Ni,在任意的初始條件下,滿足:
則稱多智能體系統(tǒng)達(dá)到了二分一致性。
定理1若假設(shè)1 和假設(shè)2 成立,如果存在正定對稱矩陣Q>0 和2 個常數(shù)ρ1,ρ2>0 滿足:
則所構(gòu)造的多率觀測器可以有效地跟蹤智能體的狀態(tài)。進(jìn)一步地,式(1)所示多智能體系統(tǒng)可以通過所設(shè)計的控制協(xié)議[見式(5)]在引入動態(tài)事件觸發(fā)機(jī)制[見式(6)]的基礎(chǔ)上實現(xiàn)二分一致性,且控制增益矩陣K=-BTP,而矩陣P可由下列代數(shù)黎卡提方程求解得出:
根據(jù)上述定義,可以推導(dǎo)得出:
基于上述分析,構(gòu)造一個李雅普諾夫函數(shù):
對其求導(dǎo)可得:
本節(jié)通過后續(xù)2 種情境的分析排除事件觸發(fā)過程中芝諾行為的發(fā)生。
情境1對于智能體i而言,在范圍內(nèi)沒有鄰居智能體 滿足條件觸發(fā),則由可得出:
綜上所述,芝諾行為被排除。
芝諾行為意味著系統(tǒng)需要在有限時間內(nèi)無限次地更新狀態(tài),這在實際應(yīng)用中是不可能的,通過上述分析可知,連續(xù)兩次事件觸發(fā)時刻之間的間隔與系統(tǒng)控制、動態(tài)輔助參數(shù)、觀測器設(shè)計及多率采樣誤差有關(guān)。在相關(guān)應(yīng)用中,理論分析已確保芝諾行為不會發(fā)生,并可通過調(diào)節(jié)上述參數(shù),依托于場景特征,給出兩次觸發(fā)之間的間隔下界以滿足實際需求。
在本節(jié)中,通過一個包含3 種控制方案(多率采樣動態(tài)事件觸發(fā)、多率采樣靜態(tài)事件觸發(fā)、單率采樣動態(tài)事件觸發(fā))的仿真對比來驗證所提控制協(xié)議的有效性。考慮一個由9 個智能體組成的多智能體系統(tǒng),其滿足細(xì)節(jié)平衡結(jié)構(gòu)的通信網(wǎng)絡(luò)拓?fù)淙鐖D2 所示(彩色效果見《計算機(jī)工程》官網(wǎng)HTML 版,下同)。

圖2 帶有細(xì)節(jié)平衡結(jié)構(gòu)的網(wǎng)絡(luò)拓?fù)銯ig.2 A network topology with a detail-balanced structure
智能體的系統(tǒng)矩陣、輸入矩陣和輸出矩陣分別表示如下:
基于鄰接矩陣,可得到相對應(yīng)的矩陣Γ為:
Γ=diag{2,1,4,1,2,3,5,1,2}
通過求解代數(shù)黎卡提方程[見式(12)]可以得到:
控制增益矩陣K可選為:
通過極點配置法可得到觀測器增益矩陣R為:
智能體初始狀態(tài)為:x1(0)=col{3,-2,3},x2(0)=col{2,3,3},x3(0)=col{1,5,2},x4(0)=col{-2,2,-3},x5(0)=col{-3,-4,-2},x6(0)=col{-1,1,-3},x7(0)=col{2,-1,-2},x8(0)=col{-2,4,1},x9(0)=col{1,1,1} 。為便于對比分析,3 種控制方案下系統(tǒng)狀態(tài)初值均一致。
取動態(tài)事件觸發(fā)閾值參數(shù)的初值為靜態(tài)事件觸發(fā)機(jī)制下的閾值,其初始取值如下:?1(0)=10,?2(0)=15,?3(0)=28,?4(0)=13,?5(0)=19,?6(0)=12,?7(0)=10,?8(0)=20,?9(0)=15。顯然,在靜態(tài)事件觸發(fā)機(jī)制中,閾值保持不變,而在動態(tài)事件觸發(fā)機(jī)制中,觸發(fā)閾值是時變的。各智能體相關(guān)的控制參數(shù)見表1。

表1 控制參數(shù)Table 1 Control parameters
多率采樣機(jī)制動態(tài)事件觸發(fā)控制方案下多智能體系統(tǒng)的狀態(tài)軌跡如圖3 所示,其最終狀態(tài)實現(xiàn)二分一致性。各智能體的動態(tài)事件觸發(fā)時刻在圖4 中展示。圖5 中顯示了動態(tài)輔助參數(shù)的軌跡,可看出,隨著多智能體系統(tǒng)中智能體狀態(tài)及一致性誤差的變化,關(guān)于智能體是否觸發(fā)的這一參數(shù)會在一致性誤差較大時取相對應(yīng)的較大值以降低觸發(fā)次數(shù),隨著系統(tǒng)一致性的逐步實現(xiàn),這一參數(shù)會進(jìn)一步減小以保證更好的系統(tǒng)一致性能。

圖3 多率采樣動態(tài)事件觸發(fā)控制下9 個智能體的狀態(tài)軌跡Fig.3 The states trajectories of nine agents under a dynamic event-triggered control with a multi-rate sampling mechanism

圖4 多率采樣機(jī)制下各智能體動態(tài)事件觸發(fā)時刻Fig.4 The dynamic event-triggered instants of each agent with a multi-rate sampling mechanism

圖5 多率采樣機(jī)制下動態(tài)事件觸發(fā)輔助參數(shù)狀態(tài)軌跡Fig.5 The state trajectories of dynamic event-triggered auxiliary parameters with a multi-rate sampling mechanism
圖6 給出了3 種控制方案下收斂性能對比,同時表2 給出了不同控制方案下平均事件觸發(fā)次數(shù)對比。分析可得,多率采樣機(jī)制可利用更為實時的系統(tǒng)數(shù)據(jù),控制目標(biāo)的實現(xiàn)更為迅速,并利用多率采樣下的動態(tài)事件觸發(fā)機(jī)制,可在大幅降低觸發(fā)次數(shù)、減少通信負(fù)擔(dān)的同時,保證更優(yōu)的系統(tǒng)一致性能。

表2 事件觸發(fā)次數(shù)對比Table 2 Comparison of event-triggered times 單位:次

圖6 3 種控制方案下收斂性能對比Fig.6 Comparison of convergence performance under three control schemes
本文研究多率采樣機(jī)制下多智能體系統(tǒng)的動態(tài)事件觸發(fā)二分一致性。在解決多率采樣時序不匹配的問題后,設(shè)計一類多率觀測器便于獲得系統(tǒng)的估計狀態(tài)以構(gòu)造分布式動態(tài)事件觸發(fā)控制協(xié)議。利用代數(shù)黎卡提方程和李雅普諾夫穩(wěn)定性理論證明系統(tǒng)可以在帶有細(xì)節(jié)平衡結(jié)構(gòu)的通信網(wǎng)絡(luò)中實現(xiàn)二分一致性并排除芝諾行為。仿真對比結(jié)果證明了所提控制協(xié)議的有效性。未來的工作將考慮通信網(wǎng)絡(luò)中存在惡意攻擊的情形,研究多率采樣機(jī)制下多智能體系統(tǒng)的動態(tài)事件觸發(fā)二分一致性。