王云燕,胡愛花
(江南大學理學院,江蘇無錫 214122)
(*通信作者電子郵箱aihuahu@jiangnan.edu.cn)
近年來,層狀結構的多智能體系統在萬維網、電網、社交網絡和基因網絡等現實世界的普遍應用成功吸引了眾多研究學者的關注。層狀網絡結構的多智能體系統可通過在層內設計局部控制策略實現系統的全局目標,從而顯著降低網絡模型設計問題的維數,此外系統模型為符合實際需要還可以設計成分散的形式,故層狀網絡結構的多智能體系統在各個領域(如控制方面)都得到了廣泛研究[1-5]。例如文獻[6]中將電力系統建模為由設備層和信息層組成的雙層多智能體系統,對電力系統阻尼控制器的性能進行了評估和優化;文獻[7]中通過構建節點到節點的通信框架,提出了一種精確協同控制策略來解決工業工廠多個子系統的分布式自適應一致性問題。
本文研究的是由領導層和跟隨者層組成的雙層結構的多智能體系統,以微電網群優化為例建模:領導層系統為多微電網區域優化自治,跟隨者層系統設計主動配電網交互優化策略。以多機械臂電機同步為例建模:領導層系統為多機械臂電機控制,跟隨者層設計單機械臂電機控制策略,諸如此類。多智能體系統滲入到現實生活的方方面面,而層狀網絡的多智能體系統又具有一定優越性,故研究雙層網絡結構的多智能體系統一致性有很強的理論價值和實際意義。
已有學者進行了雙層網絡結構多智能體系統相關的理論研究:文獻[8]中考慮了領導層和跟隨者層包含相同的有向通信拓撲,結合輸入時延和李雅普諾夫函數研究了隨機抽樣下雙層多智能體系統的均方點對點一致性問題;文獻[9]中針對領導層與跟隨者層相同的拓撲結構,采用周期采樣和事件觸發控制相結合實現了多智能體系統的一致控制;不同于文獻[8-9],文獻[10]在領導層和跟隨者層系統中給出異構的內部通信拓撲,在通信邊受攻擊的情形下分析了領導層智能體節點和跟隨者層智能體節點間的點對點一致性;文獻[11-15]中相應給出了切換、時延和間歇控制下的多智能體系統一致的理論結果。值得指出的是,文獻[8-15]中雙層網絡結構的多智能體系統相鄰智能體節點間關系均為友好合作的,然而現實系統中智能體間也會因為矛盾分歧而產生競爭對抗;同樣地,雙層網絡結構的多智能體系統中智能體之間的關系可能同時包含合作和競爭,用符號圖刻畫既包含友好合作也包含對抗競爭關系的多智能體系統,在一致性協議下,智能體的狀態最終趨于模值相同而符號相反的兩部分,概括為二分一致性問題。文獻[16]中研究了通信邊包含合作與競爭關系的多智能體系統的二分一致問題;文獻[17]中證明了當有向符號圖具有生成樹時,系統中智能體能達到區間二分一致;文獻[18]中研究了輸入飽和情形下多智能體系統的二分一致問題;另外,針對存在干擾、通信拓撲圖發生切換等情況,文獻[19-22]中給出了多智能體系統二分一致的相關結果;而文獻[16-22]中對單層多智能體系統進行研究,考慮到現實系統的多樣性和復雜性,本文圍繞二分一致問題針對雙層網絡結構的多智能體系統展開。
在實際應用中,由于通信環境的不穩定,多智能體系統會受到很多干擾,例如網絡攻擊。網絡攻擊會破壞智能體與智能體之間的通信鏈路,從而破壞系統的性能。文獻[23]中研究了受攻擊的網絡化控制系統并應用于電力系統;文獻[24]中基于智能體的分布式能量存儲系統給出了在網絡攻擊下的分布式控制方案;文獻[25]中研究了傳感器損耗和網絡攻擊下觀測器的事件觸發一致控制問題。因而研究網絡攻擊下的雙層網絡結構的多智能體系統的點對點二分一致問題具有一定的實際意義和理論價值。
基于以上討論,受已有成果的啟發,本文進一步研究雙層網絡結構的多智能體系統,其中跟隨者層系統智能體節點間包含對抗競爭關系。考慮領導層的初始通信拓撲圖為非負圖,跟隨者層的初始通信拓撲圖為符號圖,基于李雅普諾夫穩定性理論、圖論知識和線性矩陣不等式給出了在受網絡攻擊情形下領導層實現一致、雙層網絡結構的多智能體系統實現點對點二分一致的充分條件,并對雙層結構的多智能體系統進行數值仿真來驗證理論的正確性。
本文中所涉及的一些數學符號說明如下:Rn×n表示n×n階實矩陣集合;In表示n階單位矩陣;sgn(·)表示符號函數;符號?表示矩陣的克羅內克積;λmax(Q)表示矩陣Q的最大特征值,λmin(Q)表示矩陣Q的最小特征值;上標“T”表示矩陣的轉置;‖·‖表示向量的歐幾里得范數;矩陣P>0表示矩陣P是正定的。
本文研究一類包含領導層和跟隨者層的雙層網絡結構的多智能體系統,領導層和跟隨者層分別包含N個智能體,其中,領導層的智能體只可以接收其他相鄰的領導者智能體傳遞的信息,跟隨者層中的智能體既可以接收其他跟隨者智能體傳遞的信息也可以接收領導者智能體傳遞的信息。兩層系統部分對應節點間存在牽制關系。
以下用圖論知識[26]符號化雙層網絡結構的多智能體系統。令G1={V1,E1,A}表示領導層系統的通信拓撲,一個具有N個節點的有向非負圖,其中:V1=表示圖G1的節點集,節點的下標集合為W={1,2,…,N};E1={(j,i):aij>0}表示G1的邊集,aij表示邊(j,i)的權值;A=[aij]∈RN×N為G1的鄰接矩陣,aij≥0。若圖中任意兩節點和之間有路徑相連,則稱G1為連通圖。此外,若某個節點與系統中其他任一節點間都存在有向路徑,則稱圖G1包含有向生成樹且為根節點。令G2={V2,E2,B}表示跟隨者層系統的通信拓撲,一個具有N個節點的符號圖,其中:V2=表示圖G2的節點集;E2={(j,i):bij≠0}表示G2的邊集,bij表示邊(j,i)的權值;B=[bij]∈RN×N為G2的鄰接矩陣,bij>0 時表示智能體節點i和智能體節點j之間是正連接(為友好合作關系),bij<0 時表示智能體節點i和智能體節點j之間是負連接(為對抗競爭關系),bij=0 時表示智能體節點i和智能體節點j之間無連接。令圖G1和圖G2的拉普拉斯矩陣分別為RN×N,其中
注1 由于非負圖與符號圖的定義不同,所對應的拉普拉斯矩陣也不同??紤]到現實生活中事物之間聯系的多樣性和復雜性,研究包含符號圖的多智能體系統更具有實際意義。
定義1[27]若符號圖G2的節點集V2存在一組子集k=1,2,…,r,子集滿足條件:和=?(i≠j;i,j∈k),則稱構成了集合V2的一個劃分。
定義2[27]若符號圖G2中節點集V2存在一個二元劃分滿足且對于任意節點而對?vi∈bij≤0,則稱符號圖G2結構平衡,否則稱為結構不平衡。
引 理1[28]若符號圖G2結構平衡,則存在S=diag{σ1,σ2,…,σN}(σi=±1,i=1,2,…,N),使 矩 陣SBS中所有元素非負,其中當時,σi=1;而時σi=-1(q≠r;q,r∈{1,2})。
考慮由2N個智能體組成的雙層網絡結構的多智能體系統,其中領導層和跟隨者層分別有N個智能體,領導層中智能體節點的網絡模型描述為:

其中:i=1,2,…,N,xi(t) ∈Rn表示t時刻第i個領導者智能體的狀態,A∈Rn×n為常數矩陣,aij為智能體與智能體間的連接權重,c為耦合權值。
跟隨者層中智能體節點的網絡模型描述為:

其中:i=1,2,…,N,yi(t) ∈Rn表示t時刻第i個跟隨者智能體的狀態,bij為智能體與智能體間的連接權重,di表示領導層中第i個智能體與跟隨者層中第i個智能體間的牽制權值。
由于通信環境的不穩定,現實系統經常受到各種各樣的網絡攻擊,本文研究受攻擊的雙層網絡結構的多智能體系統的一致性問題。以下舉例說明:
圖1 可以看出系統在時刻ti(i=1,2,…)受到網絡攻擊,每次受攻擊的時長為τi(i=1,2,…)。受網絡攻擊時,雙層網絡結構的多智能體系統的智能體之間的連接邊斷開,不再進行信息傳遞,而在攻擊結束后多智能體系統重新恢復之前的拓撲結構進行交互。

圖1 網絡攻擊示意圖Fig.1 Schematic diagram of cyber-attack
受攻擊時領導層中智能體節點的網絡模型描述為:

同時,跟隨者層中智能體節點的網絡模型描述為:

對這個雙層網絡結構的多智能體系統作出如下假設:
假設1 雙層網絡結構的多智能體系統不受網絡攻擊時,領導層通信拓撲圖中包含有向生成樹。
假設2 雙層網絡結構的多智能體系統不受網絡攻擊時,跟隨者層中智能體節點存在以領導層中智能體節點為根節點的有向生成樹。
注2 考慮到研究的雙層網絡結構多智能體系統的智能體之間的信息傳遞方式,領導層的智能體只可以接收其他相鄰的領導者智能體傳遞的信息,跟隨者層中的智能體既可以接收其他跟隨者智能體傳遞的信息也可以接收領導者智能體傳遞的信息,借助圖論工具作出假設1 和假設2,具有一定的現實意義。
假設3 雙層網絡結構的多智能體系統不受網絡攻擊時,跟隨者層通信拓撲圖滿足結構平衡條件。
注3 對于大規模的拓撲結構,可采用文獻[29]中提出的信息分類機制對智能體節點先進行分層簡化,再根據定義2中結構平衡的定義來確定符號圖是否結構平衡。
假設4 雙層網絡結構的多智能體系統不受網絡攻擊時,跟隨者層系統連接邊的集合包含于領導層系統連接邊的集合。
注4 雙層多智能體系統相關文獻中研究的多為領導層和跟隨者層具有相同的拓撲結構,如文獻[8-9],為了拓寬這個限制,同時在文獻[10]的啟發下,本文假設跟隨者層系統連接邊的集合包含于領導層系統連接邊的集合,具有一定的現實可操作性。
假設5 對任意t0,t≥0,在區間為(t0,t)的時間間隔里多智能體系統受網絡攻擊的時間|E(t0,t) |滿足:|E(t0,t) |≤n0+其中n0>0,T>1。
注5 遭受網絡攻擊的時間過長,會造成多智能體系統癱瘓。考慮實際系統并不會長時間處于受攻擊的網絡環境中,給出了網絡攻擊時間的約束條件。
定義3對于任意初始條件,若領導層智能體節點間的狀態滿足:

其中i=2,3,…,N,則稱領導層多智能體系統實現一致。
定義4對于任意初始條件,若跟隨者層智能體節點的狀態滿足:

其中i=2,3,…,N,q∈{1,2},,則稱跟隨者層多智能體系統實現二分一致。
定義5對于任意初始條件,若領導者智能體和跟隨者智能體節點的狀態滿足:

其中i=1,2,…,N,q∈{1,2},則稱雙層網絡結構的多智能體系統實現點對點二分一致。
定義領導層多智能體系統節點間的誤差:

其中i=2,3,…,N。同樣地,定義兩層網絡結構的多智能體系統間對應智能體節點間的誤差:

不失一般性,不受網絡攻擊時,領導層多智能體系統模型(1)改寫成矩陣形式表示為:

跟隨者層多智能體系統模型(2)的矩陣形式表示為:

將式(7)求導代入式(10)可得領導層多智能體系統不受網絡攻擊時智能體節點誤差的動力學方程:

其中H=ψ1L1ψ2。對式(8)求導并代入式(10)、(11)可得雙層多智能體系統不受網絡攻擊時對應節點誤差的動力學方程:

根據式(3)、(4)、(7)、(8),可得多智能體系統受網絡攻擊時:

注6 領導層系統多智能體節點間實現一致,雙層網絡結構的多智能體系統節點間實現點對點二分一致的問題可轉化為證明對應誤差e(t),e~(t)隨時間趨于0。
引理2[30]若假設1成立,則存在正定矩陣Π∈R(N-1)×(N-1),使得ΠH+HTΠ>0。
引理3[30]若假設2成立,則存在正定矩陣∈RN×N,使得
定理1基于假設1,如果存在正定矩陣Π、P和常數c、T,矩陣P滿足線性矩陣不等式PA+ATP≤βP(β>0),常數c滿足不等式c>其中λ1=λmin((ΠH+HTΠ)Π-1),常數T滿足不等式T>,則領導層多智能體系統實現一致。
證明 選取李雅普諾夫函數:

領導層多智能體系統不受網絡攻擊時,對式(16)求導沿式(12)軌跡可得:

其中λ1>0。
對式(16)求導沿式(14)軌跡可得領導層多智能體系統受網絡攻擊時:

而函數V1(t)是連續的,在區間(t0,t)對積分可得其中表示區間(t0,t)不受網絡攻擊的時長,那么=(t0,t) -|E|,由假設5中的條件可得:

又定理中已知β+cλ1<0,從而t取足夠大時有=0,因此可知0,領導層系統智能體間可實現節點一致。 證畢。
定理2基于假設1~假設5,如果存在正定矩陣、P和常數c、γ、α、T,矩陣P滿足線性矩陣不等式PA+ATP≤βP(β>0),常 數α>0,常數c滿足不等式條件c>其中λ2和λ3分別為λ2=常數γ取常數T滿足T>則雙層網絡結構的多智能體系統實現點對點二分一致。
證明 構造李雅普諾夫函數:

對式(19)求導代入式(13)可得雙層結構多智能體系統不受網絡攻擊時:

其中λ2>0。
根據Young’s不等式:

其中λ3>0。
將式(22)代入式(21)可繼續簡化V˙2(t)表示為:

對式(19)求導代入式(15)可得雙層結構多智能體系統遭受網絡攻擊時:

對式(20)求導代入式(17)、(23)可得不受網絡攻擊時:

對式(20)求導代入式(18)、(24)可得受網絡攻擊時:

又因為函數V(t)連續,類似地,可得V(t)而,由T>可 得故t取足夠大時有0,從而=0,雙層網絡結構多智能體系統可實現節點間的點對點二分一致。 證畢。
考慮由12 個智能體構成的網絡,其中領導層和跟隨者層分別有6個智能體,初始拓撲結構如下:
根據圖2,領導層智能體節點間的通信拓撲為非負圖,跟隨者層智能體節點間的通信拓撲為符號圖,對應的鄰接矩陣分別為:

領導層的智能體1和智能體6與跟隨者層的智能體1和6之間有牽制關系,表示為D=diag{0.1,0,0,0,0,-0.1}。從圖2 中可以看出,跟隨者層智能體可分為兩組:={1,2,3},{4,5,6},由此取S=diag{1,1,1,-1,-1,-1}。

圖2 初始通信拓撲Fig.2 Initial communication topology
多智能體系統在二維空間上運動,不受網絡攻擊時假設領導層系統每個智能體滿足:

跟隨者層系統每個智能體滿足:

其中:xi(t)=(xi1(t),xi2(t))T,yi(t)=(yi1(t),yi2(t))T為二維向量,為簡單起見,取A=α=0.06,另外計算可得:



根據以上矩陣求得特征值:

又因為常數c滿足定理2中條件:

故取c=80;計算可得:β-cλ1+=-3.292、β-cλ2+=-0.86,由定理2中條件可得γ=max{β-cλ1+=-0.86;另外常數T滿足定理2 中條件:=3.4419,故取T=3.5。
以一維分量為例,領導層系統的智能體節點的狀態xi1(t)隨時間趨于一致,仿真結果如圖3 所示。領導層內智能體節點與第一個智能體節點的狀態誤差ei1(t)隨時間趨于0,仿真結果如圖4所示。

圖3 領導層智能體狀態軌跡Fig.3 State trajectories of agents in leaders’layer

圖4 領導層智能體誤差軌跡Fig.4 Error trajectories of agents in leaders’layer
從圖3和圖4可直觀地得到結論:領導者層多智能體系統實現了節點一致。
跟隨者層系統的智能體節點的狀態yi1(t)隨時間趨于模值相同符號相反的兩部分,仿真結果如圖5 所示。跟隨者層內其他智能體節點與第1 個節點的狀態誤差yi1(t) ±y11(t)隨時間趨于0,仿真結果如圖6所示。

圖5 跟隨者層智能體狀態軌跡Fig.5 State trajectories of agents in the followers’layer

圖6 跟隨者層智能體誤差軌跡Fig.6 Error trajectories of nodes in the followers’layer
從圖5和圖6可直觀地得到結論:跟隨者層多智能體系統達到節點二分一致。
另外,領導層智能體節點與對應跟隨者層智能體節點的狀態誤差=xi1(t) -σiyi1(t)隨時間趨于0,仿真結果如圖7所示。雙層網絡結構的多智能體系統實現了點對點二分一致。

圖7 對應智能體節點誤差軌跡Fig.7 Error trajectories of the corresponding agents
與文獻[8-10]相比,以上系統在跟隨者層拓撲結構中智能體節點間關系中增添了負連接,故圖5 中跟隨者層系統中智能體節點的狀態趨于模值相同符號相反的兩部分。同樣地,不同于文獻[10]智能體節點間均為友好合作關系,由定義4、定義5 中對二分一致性、點對點二分一致性的定義,相應地智能體狀態誤差定義也有所改變,如圖6~7所示。
注7 為簡單起見,仿真部分選取了包含12 個智能體的雙層網絡結構的多智能體系統進行分析,領導層和跟隨者層分別包含6 個智能體,滿足文中所提及的智能體初始狀態及一致性協議,在假設1~5 成立的條件下,由圖3~7 可以直觀地得出結論:雙層網絡結構的多智能體系統隨時間實現了領導層系統智能體節點一致,跟隨者層系統智能體節點二分一致,雙層系統點對點二分一致,驗證了理論結果的有效性。對于包含其他個數智能體的網絡拓撲結構,仍可得到類似的結果。
本文研究了遭受網絡攻擊下雙層網絡結構的多智能體系統的一致性問題,給出了網絡攻擊下領導層多智能體系統實現一致、雙層網絡結構的多智能體系統實現點對點二分一致的理論證明;同時給出網絡攻擊下領導層系統一致、跟隨者層系統二分一致和雙層結構的多智能體系統點對點二分一致的仿真結果。另外,由于通信網絡的復雜性,接下來將進一步研究包含時延、噪聲的雙層網絡結構的多智能體系統的一致性問題。