賈新春,張媛,池小波,阮藝琳
(1.山西大學(xué) 自動(dòng)化與軟件學(xué)院,山西 太原 030013;2.山西大學(xué) 數(shù)學(xué)科學(xué)學(xué)院,山西 太原 030006)
一致性問(wèn)題是多智能體系統(tǒng)(MASs)協(xié)調(diào)控制的關(guān)鍵問(wèn)題之一,其目的是通過(guò)與鄰居節(jié)點(diǎn)交換信息使得所有智能體達(dá)到一個(gè)期望的狀態(tài)。MASs是由空間分布的多個(gè)智能體構(gòu)成。由于具有更好的魯棒性、靈活性和經(jīng)濟(jì)性等特點(diǎn),MASs被廣泛應(yīng)用于很多領(lǐng)域,如車(chē)輛系統(tǒng)[1]、無(wú)人機(jī)編隊(duì)控制[2]和智能電網(wǎng)[3]等。
考慮到多智能體系統(tǒng)之間是通過(guò)網(wǎng)絡(luò)來(lái)進(jìn)行信息交互,因此,一些關(guān)鍵問(wèn)題是不容忽視的,例如網(wǎng)絡(luò)誘導(dǎo)時(shí)延、丟包、量化和安全等,這些因素會(huì)使得系統(tǒng)性能下降甚至導(dǎo)致系統(tǒng)不穩(wěn)定[4]。近年來(lái),相關(guān)領(lǐng)域的研究者已經(jīng)提出了一些動(dòng)態(tài)補(bǔ)償方法來(lái)消除網(wǎng)絡(luò)誘導(dǎo)時(shí)延和數(shù)據(jù)包丟失等的影響[5-7]。文[5]研究了帶有通信時(shí)延的網(wǎng)絡(luò)化離散時(shí)間多智能體系統(tǒng)(DMASs)的分布式自適應(yīng)事件觸發(fā)預(yù)測(cè)控制問(wèn)題。考慮到研究對(duì)象為同構(gòu)MASs,故在文[5]中智能體i可以通過(guò)自身的系統(tǒng)矩陣和控制命令對(duì)其狀態(tài)進(jìn)行預(yù)測(cè),且基于接收到的鄰居信息來(lái)預(yù)測(cè)鄰居智能體的狀態(tài)。文[6]針對(duì)固定網(wǎng)絡(luò)誘導(dǎo)時(shí)延情形,提出了DoS攻擊下帶有量化信號(hào)的網(wǎng)絡(luò)化多智能體系統(tǒng)的云端預(yù)測(cè)控制,但并未考慮觀測(cè)器和控制器所用的控制輸入不一致問(wèn)題。文[7]利用一個(gè)比例積分預(yù)測(cè)控制策略來(lái)研究網(wǎng)絡(luò)化MASs控制問(wèn)題,其中假設(shè)雙邊網(wǎng)絡(luò)誘導(dǎo)時(shí)延的上界為兩側(cè)時(shí)延上界之和。基于以上研究和分析,如何提出一種有效的基于預(yù)測(cè)控制策略的MASs一致性控制方法仍是一個(gè)有待解決的問(wèn)題。
近些年來(lái),由于信息處理和動(dòng)態(tài)過(guò)程的緊密耦合,使得MASs在信息的傳輸過(guò)程中特別容易受到網(wǎng)絡(luò)攻擊的影響,進(jìn)而造成對(duì)系統(tǒng)的重大破壞,甚至不穩(wěn)定。因此,許多學(xué)者對(duì)安全問(wèn)題進(jìn)行了研究[8-11]。文[8]研究了改變網(wǎng)絡(luò)拓的網(wǎng)絡(luò)攻擊下非線性MASs的分布式事件觸發(fā)一致性。文[9]針對(duì)無(wú)領(lǐng)導(dǎo)者和領(lǐng)導(dǎo)者-跟隨者一致性問(wèn)題,給出了對(duì)DoS攻擊的頻率和持續(xù)時(shí)間的明確分析并提出了彈性協(xié)作事件觸發(fā)控制方案。文[10]研究了一類(lèi)具有網(wǎng)絡(luò)攻擊和有損傳感器的離散時(shí)間MASs基于觀測(cè)器的事件觸發(fā)一致控制問(wèn)題,其中考慮的典型網(wǎng)絡(luò)攻擊為欺騙攻擊。文[11]針對(duì)重放攻擊下的一類(lèi)信息物理系統(tǒng)(CPS)研究了安全分布式卡爾曼融合估計(jì)問(wèn)題。但是在實(shí)際的網(wǎng)絡(luò)系統(tǒng)中,攻擊的類(lèi)型不完全是簡(jiǎn)單的典型網(wǎng)絡(luò)攻擊,一般來(lái)說(shuō),惡意的網(wǎng)絡(luò)攻擊往往是更為復(fù)雜的、且由多個(gè)典型網(wǎng)絡(luò)攻擊在時(shí)間或空間上融合形成的。因此,在復(fù)合網(wǎng)絡(luò)攻擊下研究MASs的安全控制問(wèn)題具有很重要的理論價(jià)值。
考慮到時(shí)變網(wǎng)絡(luò)誘導(dǎo)時(shí)延和復(fù)合網(wǎng)絡(luò)攻擊共存的情形下,本文提出了一種新的云端預(yù)測(cè)控制策略,以保證在復(fù)合網(wǎng)絡(luò)攻擊和多率采樣機(jī)制下MASs的一致性。該策略可以通過(guò)使用最新接收的采樣數(shù)據(jù)來(lái)補(bǔ)償網(wǎng)絡(luò)引起的不確定性的影響并提高控制性能。本文的主要貢獻(xiàn)概括如下:
i)通過(guò)引入云端模擬攻擊機(jī)制來(lái)補(bǔ)償觀測(cè)器和控制器所用的控制輸入不一致情形,設(shè)計(jì)了一種新穎的云端預(yù)測(cè)控制策略,以補(bǔ)償網(wǎng)絡(luò)引起的時(shí)延和復(fù)合網(wǎng)絡(luò)攻擊。該控制器可以使用最新接收的采樣數(shù)據(jù)來(lái)使得所考慮的多智能體預(yù)測(cè)控制系統(tǒng)實(shí)現(xiàn)更好的控制性能。在預(yù)測(cè)控制中考慮了云控制框架,能大幅度降低計(jì)算量,節(jié)省網(wǎng)絡(luò)資源。
ii)相比于現(xiàn)存文獻(xiàn)中僅考慮單個(gè)典型的網(wǎng)絡(luò)攻擊情形,本文提出一種較符合實(shí)際情形的復(fù)合型網(wǎng)絡(luò)攻擊模型。
iii)在本文所設(shè)計(jì)的云端預(yù)測(cè)控制機(jī)制下,MASs的一個(gè)穩(wěn)定性判據(jù)被提出來(lái)確保智能體達(dá)到均方一致性。


本文考慮一個(gè)由N個(gè)智能體組成的DMASs,其中第i個(gè)智能體的動(dòng)力學(xué)方程可描述為:
(1)
yi(t)=Cxi(t),
(2)

αi(t)[Hui(t)+ui(t-θi(t))],
(3)


為了便于系統(tǒng)分析,本文給出如下的假設(shè):
假設(shè)1傳感器組是以一個(gè)常數(shù)為采樣周期按照時(shí)間驅(qū)動(dòng)的,控制器和估計(jì)器是事件驅(qū)動(dòng)的。智能體所使用的傳感器是不相同的,且滿足傳感器S1的采樣周期為T(mén)1=r1T0,傳感器S2的采樣周期為T(mén)2=r2T0,以此類(lèi)推。傳感器SN的采樣周期為T(mén)N=rNT0,其中T0是一個(gè)給定的正常數(shù),ri是正整數(shù)。
假設(shè)2矩陣對(duì)(A,B)可鎮(zhèn)定,且矩陣對(duì)(A,C)可觀測(cè)。


圖1 多智能體系統(tǒng)框架Fig.1 The framework of multi-agent system
本文的設(shè)計(jì)目標(biāo)是針對(duì)DMASs在多率采樣機(jī)制和時(shí)變時(shí)延下設(shè)計(jì)一個(gè)分布式預(yù)測(cè)控制律ui(t)使得如下的一致性被實(shí)現(xiàn):

(4)
本文采用N組采樣周期分別為T(mén)1、T2和TN的傳感器來(lái)對(duì)每一個(gè)智能體的輸出進(jìn)行采樣。以智能體i為例, 對(duì)應(yīng)的傳感器為Si, 輸出信號(hào)表示為yi(riT0k),k=0,1,2,…。從假設(shè)可以知道, 盡管系統(tǒng)的狀態(tài)不可測(cè), 但是智能體是可觀測(cè)的。所以每一個(gè)智能體僅使用自己的輸出信息對(duì)自己的狀態(tài)進(jìn)行估計(jì), 計(jì)算如下:

(5)


(6)
ei(t+1)=Aei(t)-LCei(t-di(t))。
(7)


(8)

(9)
其中
…

(10)

(11)


(12)
在第一步中,智能體端需要向預(yù)測(cè)控制云端發(fā)送ACK命令來(lái)告知智能體已收到新的數(shù)據(jù)。第二步:是對(duì)前向通道中的時(shí)延進(jìn)行預(yù)測(cè)補(bǔ)償,由于前向通道中有網(wǎng)絡(luò)攻擊的影響,在預(yù)測(cè)控制云端加入了一個(gè)模擬網(wǎng)絡(luò)攻擊的裝置。在這個(gè)裝置下前項(xiàng)通道中的預(yù)測(cè)可以表述為
…

(13)

(14)

(15)


(16)

(17)
對(duì)于單個(gè)的智能體系統(tǒng)來(lái)說(shuō),它的閉環(huán)系統(tǒng)模型為

(18)

x(t+1)=(IN?A+((IN-Λ(t))?In)(W?BK)x(t)-((IN-Λ(t))?In)W?BK)e(t)+
[(Λ(t)?In)(W?BHK)+(Λ(t)?In)(W?BK)]x(t-θ(t))-
[(Λ(t)?In)(W?BHK)+(Λ(t)?In)(W?BK)]e(t-θ(t)),
(19)
其中,
記一個(gè)均方狀態(tài)


(20)
則整個(gè)系統(tǒng)的閉環(huán)可以建模為
ξ(t+1)=(IN?A-((IN-Λ(t))?In)(W?BK))ξ(t)-((IN-Λ(t))?In)W?BKe(t)+
(Λ(t)?In)(W?(BK+BHK)){ξ(t-θ(t))-e(t-θ(t))}
(21)
增廣z(t+1)=[ξT(t+1)eT(t+1)], 則有
z(t+1)=Π1z(t)+Π2z(t-θ(t))+Π3z(t-d(t))
(22)

通過(guò)李亞普諾夫函數(shù)和LMI方法本節(jié)首先給出系統(tǒng)一致性的判據(jù)然后給出預(yù)測(cè)控制器的設(shè)計(jì)方法。首先取候選Lyapunov函數(shù)為
V(z(t))=V1(z(t))+V2(z(t))+V3(z(t)),
(23)
其中,
P1,Q1,Q2是正定Lyapunov矩陣, 在本文中可以設(shè)為如下形式P1=diag{P11,P11},Q1=diag{Q11,Q11},Q2=diag{Q22,Q22}。


(24)

(25)

證明對(duì)上述(23)所設(shè)計(jì)的Lyapunov候選函數(shù)關(guān)于時(shí)間求導(dǎo)可得
ΔV1(z(t))=zT(t+1)(IN?P1)z(t+1)-zT(t)(IN?P1)z(t),
(26)
ΔV2(z(t))=zT(t)(IN?Q1)z(t)-zT(t-tm)(IN?Q1)z(t-tm)+

(27)

zT(t)(IN?Q1)z(t+1)+zT(t)(IN?Q1)z(t))-
zT(t+1)(IN?Q2)z(t)-zT(t)(IN?Q2)z(t+1)+zT(t)(IN?Q2)z(t))-

(28)
通過(guò)Jesen不等式可將上式整理為



(29)

(30)
其中,

考慮如下的離散時(shí)間網(wǎng)絡(luò)化控制系統(tǒng):


信拓?fù)渌鶎?duì)應(yīng)的鄰接矩陣

度矩陣

通信拓?fù)湎孪到y(tǒng)的Laplace矩陣為

多智能體系統(tǒng)的初始條件為


觀測(cè)器增益矩陣
進(jìn)而可得在本文的閉環(huán)系統(tǒng)狀態(tài)的軌跡圖(圖2), 以及狀態(tài)誤差圖(圖3)。其中,emij(t)表示的是第i個(gè)智能體的第j個(gè)狀態(tài)與狀態(tài)平均值的誤差。由圖2可知所有智能體的第j個(gè)分量均達(dá)到了當(dāng)前時(shí)刻它們的狀態(tài)的平均值(j=1,2,3)。由圖3可得所有智能體的第j個(gè)分量與狀態(tài)平均值的誤差均趨于零。通過(guò)圖2和圖3中的結(jié)果分析可知,基于云端預(yù)測(cè)控制器(8)-(11)的多智能體系統(tǒng)(1)達(dá)到了一致性, 證明了本文所提設(shè)計(jì)方法的有效性。

圖2 狀態(tài)軌跡圖Fig.2 State locus diagram

圖3 狀態(tài)誤差圖Fig.3 State error diagram
本文研究了非理想網(wǎng)絡(luò)環(huán)境和復(fù)合網(wǎng)絡(luò)攻擊下DMASs的均方一致性的云端預(yù)測(cè)控制。與傳統(tǒng)的控制協(xié)議不同, 本文所設(shè)計(jì)云端預(yù)測(cè)控制協(xié)議不但可以對(duì)網(wǎng)絡(luò)誘導(dǎo)時(shí)延主動(dòng)補(bǔ)償, 而且可以節(jié)約網(wǎng)絡(luò)資源和減少計(jì)算量。給出了閉環(huán)系統(tǒng)均方一致性的的充分條件,并通過(guò)一個(gè)數(shù)值例子說(shuō)明了本文研究的方法對(duì)保證系統(tǒng)性能是有效的。針對(duì)異構(gòu)多智能體系統(tǒng)在非理想網(wǎng)絡(luò)環(huán)境和多率采樣機(jī)制下DMASs的一致性問(wèn)題是我們未來(lái)的研究方向。