張忠藝,徐冬梅
(上海工程技術大學 電子電氣工程學院,上海 201620)
在過去的10 年中,網絡化控制系統在學術研究和工程領域中受到廣泛研究。網絡化控制系統的一個重要分類就是多智能體系統,是由多個具有感知、通信、計算和執行能力的智能體組成的系統,所有智能體通過網絡拓撲進行信息交互,從而完成復雜的任務。該領域的研究方向包括平均一致性、群集問題、編隊控制、區域覆蓋問題等[1-3]。
一致性是指通過設計合理的控制協議,所有智能體的狀態和速度都逐漸達到一個共同的值,這是多智能體系統協調控制的基礎。在實際系統中,智能體的資源,通信和執行能力通常受到限制,因此設計適當的控制協議,盡可能減少資源消耗非常重要。為了解決上述問題,傳統的處理方式是周期采樣控制,即事先確定好采樣時刻,而不是動態的根據智能體的狀態、時間確定,這種方式在一定程度上降低了計算和通信成本,具有局限性,當連續兩次采樣數據間僅有微小變化或者臨近收斂狀態時刻時,會造成不必要的資源浪費,從而縮短系統的使用壽命,而且基于周期采樣控制得到的大多數采樣數據都是多余的,對多智能體系統達到一致性沒有什么幫助,為了解決上述不足,事件觸發控制方法應運而生[4-5]。基于上述的優點,事件觸發控制被廣泛應用到多智能體一致性的研究中,其中主要分為集中式事件觸發和分布式事件觸發兩種算法。集中式事件觸發機制的本質就是為系統里的所有智能體設計一個共同的誤差和閾值,也就是共用相同的事件觸發條件。當系統的整體誤差達到設定的閾值時,所有智能體同時觸發一次事件,并且同時更新所有智能體的控制輸入,可以看出每個智能體的觸發時刻都是相同的,即共用一套觸發時刻序列[6]。然而分布式事件觸發機制的本質就是為系統里的每個智能體設計一個事件觸發條件,每個智能體自己判斷決定是否觸發一次事件,并且僅僅更新自己的控制輸入,至于鄰居的控制輸入則保持不變。可以看出分布式事件觸發機制中每個智能體都擁有一套特有的觸發時刻序列。與集中式事件觸發機制相比而言,分布式事件觸發機制可以有效地減少智能體之間的通訊交流,進一步減少了通信資源的消耗[7-9]。Zhu 等人通過事件觸發機制研究了二階多智能體系統的一致性問題[10];隨后研究學者們開始運用事件觸發機制來分析一般線性多智能體系統的一致性問題[11-12];Zhu等人考慮了一般線性多智能體系統在具有輸入時間延遲的情況下,對于每個智能體的控制輸入更新設置都是基于事件的,并且為了實現領導-跟隨一致性提出了一個必要條件和兩個充分條件[13];Wang等人研究了基于事件觸發機制的混合多智能體系統的一致性問題,即在離散時間和連續時間下的動態個體構成了一個混合多智能體群,同時也提出一個自觸發控制算法來避免對事件觸發條件的連續監測[14]。
在事件觸發控制中,觸發條件設計得是否合理往往取決于能否有效地避免Zeno 現象,Zeno 現象是指事件在有限時間內被觸發無數次,這在現實中是不可行的。因此周期事件觸發控制應運而生,其是一種結合周期采樣和事件觸發控制的機制,周期性的對事件觸發條件進行檢測,任意兩次觸發時刻的間隔存在一個正的下界,避免了Zeno 現象。Meng 等人研究了基于周期事件觸發機制的一階多智能體系統平均一致性問題,所提出的事件觸發條件需要在所有檢測時刻進行狀態信息更新。在此過程中,每個智能體需要接收其鄰居智能體的狀態信息,并將其自身的狀態信息發送給其鄰居智能體,從而導致了大量的通信次數和系統資源消耗[15]。
基于上述,本文研究了基于周期事件觸發機制的一階多智能體系統的平均一致性問題,設計一個新的事件觸發條件,使用事件觸發狀態作為閾值,縮小每個智能體在每個采樣瞬間都必須與其鄰居智能體通信的需求。因此,只有在事件發生的瞬間,一個智能體才會把其狀態信息傳遞給其鄰居,進而減少了控制輸入的更新次數,減少了資源消耗,并且采樣周期選擇范圍更小,提高采樣精確性。
在多智能體系統的協調控制中,通常假設每個智能體通過智能體之間的通信來獲得其它智能體的狀態信息,通信網絡可以用通信圖來表示。記G =(V,E,A)表示有n個智能體的無向通信圖,其中V={1,2,…,n} 表示n個智能體,E?V × V表示智能體之間的通信連接。如果vi vj∈E是一條邊,則智能體vi和vj是相鄰的,或者說智能體vj是vi的一個鄰居。類似的,智能體vi的鄰居Ni可以定義為Ni={j |vi vj∈E,j≠i},在無向圖G中,如果對于任意兩個智能體v1,v2總存在一條路徑從v1到v2且從v2到v1,就稱該無向圖為無向連通圖。
矩陣A =(aij)∈Rn×n是無向圖G的相鄰矩陣,表示各智能體之間的連接關系,定義為式(1):

根據智能體vi的度di定義圖G的度矩陣D,式(2):

度矩陣D是一個對角矩陣,其對角元素di是智能體vi的鄰居總數。在圖論中,一個重要工具是Laplacian 矩陣L,定義為:L =D- A。在無向圖G中,Laplacian 矩陣L是對稱且半正定矩陣,即L =LT≥0,因此其特征值都是非負數,記為0 ≤λ1≤λ2≤…≤λn,而且至少有一個特征值λ1=0,且其對應的特征向量是全1 向量,即=,其中1n =(1,1,…1)T,0n =(0,0,…0)T。如果圖G是無向連通圖,則λ2>0,記為0=λ1<λ2≤…≤λn,第二個特征值λ2又稱為圖的代數連通度,λn是Laplacian 矩陣L的最大特征值。
引理1[8]

其中λ2(L)和λn(L)分別是Laplacian 矩陣L的第二小特征值和最大特征值。
引理2[15]對于半正定矩陣A∈Rn×n,?a,b∈Rn,有,其中,Rn表示n維實向量構成的集合。
考慮具有n個智能體的系統,其中每個智能體都有能力進行計算,移動和相互通信。每個智能體的狀態遵循動態方程(4):

式中:xi(t)∈Rn表示第i個 智 能體的狀態,ui(t) 表示第i個智能體的控制輸入。
系統中智能體之間的通信拓撲結構可以由一個無向圖G =(V,E,A)來表示,在許多現有的關于一致性問題的著作中,一個簡單的控制律設計如式(5):

則系統的閉環控制方程(6)為:

寫成向量形式有,其中x =(x1,x2,…,xN)T是所有智能體的列向量,L是圖G的Laplacian 矩陣。如果圖G是連通的,則系統中的所有智能體狀態將逐漸收斂到每個智能體的初始狀態的平均值,即為。
基于周期事件觸發機制研究一階多智能體系統的平均一致性問題,其觸發原理流程圖如圖1 所示。

圖1 周期事件觸發控制Fig.1 Periodic event-triggered control
即預先設定一個固定采樣周期為h的采樣點,所有智能體的采樣時間是同步的,并且每個智能體僅在采樣點進行檢測,所以事件觸發時刻也就僅發生在采樣點上,因此該驅動機制保證了≥h,h >0,有效地避免了Zeno 行為,并且符合數字設備帶有采樣周期的特性。該機制減少相鄰智能體之間的通信,降低每個智能體的事件檢測能耗,并且保持了平均一致性。因此,在每個智能體上都配置了一個事件檢測器,用于確定何時應該使用采樣的本地信息來更新其自身及其鄰居的控制操作。采樣時刻設計如下:t =mh,m =0,1,… 在控制器設計中,采用了事件觸發方案,減少了資源消耗,進一步要求每個智能體只在指定的事件時間瞬間更新其控制輸入,,…。由于采用了周期采樣策略,事件只能在采樣時間瞬間發生,也就是0,1,…。其一致性協議(7):

系統的閉環控制方程(8)為:

系統的測量誤差為式(9):

測量誤差表示智能體i的最新事件觸發狀態與最新采樣狀態之間的差值。為了便于事件設計,定義列向量x(t)=(x1(t),…,xN(t) )T,e(t)=(e1(t),…,eN(t) )T,結合的定義,在內,系統的閉環控制方程(10)可以定義如下:

L是通信圖G的Laplacian 矩陣,上式的等式可以寫成這樣的緊湊形式(11):

因為控制輸入在兩個連續的采樣時間內為常數,可以得到式(12):

當智能體的測量誤差的絕對值達到預設定的閾值時,就會引起事件觸發,并且引起智能體控制器更新。提出事件觸發條件(13):

根據本文提出的事件觸發條件,可以看出這個閾值是非連續的,僅在事件觸發時刻更新,避免了對其鄰居狀態的連續測量,在實際中極大地減少了資源消耗。智能體i僅僅在自身的事件觸發時刻發送狀態和在鄰居的事件觸發時刻接收鄰居狀態時與其鄰居通信。如果事件觸發條件(13)不滿足時,那么智能體i不需要進行任何操作,忽略當前采樣狀態;如果滿足事件觸發條件(13)時,智能體i將執行控制輸入更新,并且發送自己的狀態信息給鄰居智能體,更新其控制輸入,同時重置測量誤差為0,即,事件觸發判斷條件得以再次滿足。
定義多智能體的平均狀態為式(14):

考慮圖G是無向連通圖,因為Laplacian 矩陣的特征值λ1=0 對應的特征向量為全1 向量,即=,將其應用在公式(11)和(14)得到多智能體的平均狀態的導數為式(15):

所以多智能體的平均狀態是不變的常數,且等于初始狀態的平均值,即式(16):

為了描述多智能體系統的平均一致性收斂性能,定義非一致向量σ(t),式(17):

當t→∞時,如果xi(t)→(i =1,2,…,n),則,所以多智能體系統是平均一致收斂的。
考慮一個無向連通圖G,現在將使用Lyapunov函數方法為多智能體系統設計出適當的事件。考慮如下Lyapunov函數(18):

定理1考慮一組具有動態方程(4)的n個智能體組成的系統,假設系統對應的通信圖G是無向連通圖時,若條件(19)成立,其中λn是Laplacian矩陣L的最大特征值,則采用一致性協議(7)的系統(4)在事件觸發條件(13)下,所有智能體狀態將漸進收斂至其初始平均狀態。

證明考慮函數(18)在t∈[mh,mh +h) 時間段內得到V(t) 的導數:

因為在t∈[mh,mh +h) 上,(t- mh) ≤h,再由引理1 得,式(20):

現在設是最新采樣時間mh之上或者之前的智能體i的最新事件觸發時刻,定義事件觸發狀態,則有式(21):

將(22)代入到(20)中,得:

由引理2 得式(24):

將不等式(24)代入(23)中,得式(25):

結合事件觸發條件(13)得到式(26):


因為這是個無向連通圖,E ={x∈Rn |(t)=0}=span{1n},由于Lasalle 不變定理可知,閉環控制方程(8)是漸進穩定的,所以多智能體系統是平均一致收斂的。
通過一些仿真實驗對得出的結論進行驗證。
考慮在固定無向連通圖下一個由4 個智能體組成的多智能體系統。圖2 是通信拓撲圖,其對應的拉普拉斯矩陣為:


圖2 通訊拓撲圖Fig.2 Communication topology
通過計算,矩陣L的最大特征值λn =4,為滿足條件(19),多智能體系統的檢測周期設置為h =0.002,每個智能體的事件觸發條件參數分別設置為:β1=0.06,β2=0.02,β3=β4=0.033。智能體的初始狀態設置為x0=[0.3-0.2 0.2-0.3]T。
在基于一致性協議(7)下,圖3 是多智能體狀態軌跡,可以看出所有多智能體的狀態隨著時間的推移會漸進收斂到一致,實現了平均一致性。

圖3 多智能體狀態軌跡Fig.3 The state trajectory of multi-agent
多智能體的事件觸發時刻,由于采用了周期事件觸發機制,可以看出智能體的觸發時刻是異步的,并且每個智能體的觸發時刻也是非周期的,如圖4所示。

圖4 多智能體事件觸發時刻Fig.4 Event-triggered times of multi-agent
多智能體非一致向量范數的變化曲線如圖5 所示,可以看出當t→∞時,0,可以看出所有智能體都趨于其初始狀態的平均值,實現了平均一致性。

圖5 非一致向量范數Fig.5 Norm of the disagreement vector
智能體1 的事件觸發條件曲線如圖6 所示,其它3 個智能體的事件觸發條件曲線與圖6 類似。在內,隨著測量誤差越來越大,當滿足觸發條件(13)的時候,一個事件觸發了,則當前采樣狀態成為新的觸發狀態,即,同時將測量誤差置于0。

圖6 智能體1 的事件觸發條件Fig.6 Event-triggered condition of agent 1
多智能體事件觸發次數見表1,可以看出在相同的系統中,相比較傳統使用的事件觸發條件,采用本文提出的事件觸發條件能顯著減少每個智能體的事件觸發次數,進而減少了控制輸入的更新次數和系統對資源的消耗。

表1 多智能體事件觸發次數Tab.1 Event-triggered number of multi-agent
本文針對一階多智能體系統,其通信拓撲結構為無向連通圖,通過引入了周期事件觸發機制及其一致性協議,避免了Zeno 現象,同時提出了一個新穎的事件觸發條件,其觸發條件的閾值是依賴于事件觸發狀態而不是采樣狀態,所以不用在每個采樣時刻對閾值進行更新,進而減少了智能體之間的通信次數和控制輸入的更新次數,在實際系統中極大地減少了資源消耗。今后將在二階動力學方程和線性動力學方程下繼續研究周期事件觸發機制。