李波,吳淑琴,谷明琴
(1.鄭州威科姆科技股份有限公司衛星定位應用工程技術研究中心,河南 鄭州 450000;2.中南大學 信息工程學院,湖南長沙 410083)
近年來,多智能體的分布式協調控制如編隊控制[1-2]、群集問題[3]、分布式傳感器網絡[4]、通信網絡的擁塞控制[5]等領域受到了極大的關注.Vicsek等提出了一個簡單的自驅動的粒子群相變和數值型復雜動力學的模型[6],Jadbabaie等用圖論對Vicsek模型在理論上進行了解釋[7];Olfati-Saber[2]和 Murray[8]介紹了網絡動力學一致性問題的理論框架;文獻[9]提出了分析多智能體系統的理論框架;Lin等分析了具有變拓撲和耦合時間延遲的多智能體網絡平均一致性問題[10],及二階多智能體網絡的一致性控制問題[11].與上述方法不同,本文研究了具有混合階多智能體離散動力學網絡的擬平均一致性問題,并提出一致性協議解決該問題.用Lyapunov函數和代數圖論分析系統的穩定性,實驗結果表明,該方法能夠有效解決混合階多智能體離散動力學網絡的擬平均一致性問題.
令G=(V,ε,A)為加權無向圖,其n階頂點集V={v1,v2,…,vn},邊集 ε =V × V,加權鄰接矩陣A=(aij),aij≥0.節點的下標屬于有限下標集I={1,2,…,n},G 的邊集記為 eij=(vi,vj).與邊相關聯的n×n階鄰接矩陣A的元素均為非負,如式(1)所示.

因而,如果圖G=(V,ε,A)是無向圖或平衡圖,那么A就是對稱矩陣.
集合 Ni={vj∈V∶(vi,vj)∈ε}表示為 vi的鄰集,節點集V的任一子集J稱為簇.簇J的鄰集定義為

節點vi的入度、出度定義為

對于鄰接元素為0-1的圖,degout(vi)=|Ni|.圖G的度矩陣等于對角陣Δ=[Δij].
式中:

圖G的Laplacian矩陣定義為

由定義知,如果圖G是平衡圖或無向圖,那么Laplacian矩陣的每行元素之和為零.因此,Laplacian矩陣有一個特征值為零,與零特征值所對應的右特征向量為

用Gsw(t)表示變拓撲無向或有向網絡,其中切換信號為 sw(t)∶[0,+ ∞)→{1,2,…,M},M∈Z+.Lsw表示變拓撲網絡的Laplacian矩陣.
引理1[8]令 G=(V,ε,A)為加權無向圖或有向圖,其Laplacian矩陣為L.無向圖G節點的最大出度,記為 dmax(G)=maxidegout(vi).那么,L(G)的所有特征值都位于所定義的圓盤內部:

定義1 令 χ∶Rn→R是n變量的函數 ξ1,ξ2,…,ξn,ξ(0)記為系統的初始狀態.動力學網絡中的χ-一致性問題是輸入ui計算x(ξ(0))的分布式方式,且僅依賴于節點vi自己和它鄰近的狀態.稱狀態反饋


假設多智能體系統是混合一、二階的異質多智能體系統.智能體的總個數為n,其中一階和二階智能體個數分別為n1、n2,每個二階智能體的動力學方程可以表示為差分方程形式:

式中:ξi(k)=[xi(k)vi(k)]T是二階智能體的狀態,ui(k)是控制輸入.矩陣A、B分別為:

每個一階智能體的動力學方程可以表示為差分方程形式:

式中:ξi(k)=xi(k).
定義2 離散時間的擬平均一致性問題:假設G=(V,ε,A)是強連通有向網絡或連通無向網絡.如果存在一個漸近的穩定平衡點ξ*,滿足:

提出下面的一致性協議解決混合階異質積分智能體網絡中的一致性問題.
定義3 對于定拓撲和變拓撲網絡,可以用一致性協議來解決擬平均一致性問題:

式中:aij是圖的鄰接矩陣的元素,步長ζ>0.
那么式(2)、(3)可以寫為統一的形式:


圖1是具有4個異質積分智能體的無向網絡拓撲結構(其中節點1、3是二階智能體,而節點2、4是一階智能體).那么對應于圖1的矩陣ˉM、?L、ˉL、ˉP可以寫為:



圖1 混合階智能體的無向網絡拓撲結構Fig.1 The topology of network with mixed order integrator agents
相應的系統動力學方程也變為


對于離散時間的變拓撲網絡結構,系統的動力學方程可以重新寫為

式中:ˉPsw表示隨著切換信號變化而變化的ˉP矩陣.
定理1 如果0<ζ<1/(Δmax(G)),則由一階和二階多智能體組成的多智能體系統網絡是無向連通的或有向平衡連通的,那么ˉP的特征值只有一個為1,而其他特征值的模均小于1.且

證明:


從以上推導可以得到下面的矩陣方程:




如果要得到|λi|≤1,只需要


從而可知,1是Pˉ的特征值.


由1)的證明可知,若0<ζ<1/(Δmax(G)),則Pˉ的特征值除一個為1以外,其余特征值的模均小于1.因此,因為JφS=SPˉ,可知S的第一列是,因為S-1Jf=S-1,可知S-1的第一行是.由于 SS-1=I,且滿足.從而可以得到證畢.
證明


定理3 令Gsw=(V,ε,A)為變拓撲連通加權無向圖或強連通平衡有向圖,當0<ζ<1/dmax(Gsw)(其中dmax(Gsw)表示變拓撲結構中網絡節點的最大度),利用協議(5)可以實現擬平均一致.
證明
由于0<ζ<1/dmax(Gsw),則由定理1可知,系統在k時刻的矩陣除了有一個特征值為1外,其余特征值的模嚴格小于1.

也成立,因此協議(5)可是實現擬平均一致.證畢.
定義位置的不一致函數:

圖2顯示了由6個節點組成的4種不同的無向網絡拓撲結構,其中節點1、5為二階智能體,節點2、3、4、6為一階智能體,且都具有0~1的權值.這4種網絡結構{Ga,Gb,Gc,Gd}都是連通的.圖 3 為一個有限狀態自動機,狀態集為{Ga,Gb,Gc,Gd}.混雜系統從狀態Ga開始,每經過一個時間間隔,按照圖3所示的狀態自動機變化到下一個狀態.

圖2 4種拓撲結構Fig.2 4 kinds of topology configurations

圖3 4個狀態的有限狀態自動機Fig.3 A finite automaton with four states
圖4~5顯示了變拓撲離散時間異質多智能體網絡一致性控制的仿真結果.


圖4 步長為0.33時變拓撲無向網絡下的仿真結果Fig.4 Simulation results in switching topology networkwith step 0.33

圖5 步長為0.34時變拓撲無向網絡下的仿真結果Fig.5 Simulation results in switching topology network with step 0.34
仿真研究中,狀態的初值為[3(2,-2)-1(-2,2) - 2 4]T,k=1,一致位置狀態分量為0.667,一致速度分量為零.步長分別取不同的值0.33和0.34.從圖 5 中可以看出當步長大于 0.33時,系統開始趨于發散.仿真結果證明了穩定性分析的正確性.
本文提出了離散時間多智能體系統上的擬平均一致性問題和協議,分析了一致性協議適用的條件,即如果多智能體系統的網絡拓撲結構是連通的且是平衡的,并且步長ζ不大于1/dmax(G),那么運用提出的一致性協議,可以使系統達到擬平均一致.并在Matlab中仿真了變拓撲無向網絡結構的多智能體系統,步長 ζ分別取0.33、0.34,以及相應的位置不一致函數V=‖δx(k)‖2的曲線.仿真結果證明了理論分析的有效性.
[1]FAX A,MURRAY R M.Information flow and cooperative control of vehicle formations[J].IEEE Transactions on Automatic Control,2004,49(9):1465-1476.
[2]OLFATI-SABER R,MURRAY R M.Distributed cooperative control of multiple vehicle formations using structural potential functions[C]//The 15th IFAC World Congress.Barcelona,Spain,2002:346-352.
[3]REYNOLDS C W.Flocks,herds,and schools:a distributed behavioral model[J].ACM SIGGRAPH Computer Graphics,1987,21(4):25-34.
[4]CORTES J,BULLO F.Coordination and geometric optimization via distributed dynamical systems[J].The SIAM Journal on Control and Optimization,2006,44(5):1543-1574.
[5]PAGANINI F,DOYLE J,LOW S.Scalable laws for stable network congestion control[C]//Proc of the Int Conf on Decision and Control.Los Angeles,USA,2001,1:185-190.
[6]VICSEK T,CZIROK A,BEN-JACOB E,et al.Novel type of phase transition in a system of self-driven particles[J].Physical Review Letters,1995,75(6):1226-1229.
[7]JADBABAIE A,LIN J,MORSE S A.Coordination of groups of mobile agents using nearest neighbor rules[J].IEEE Transactions on Automatic Control,2003,48(6):988-1001.
[8]OLFATI-SABER R,MURRAY R M.Consensus problems in networks of agents with switching topology and time-delays[J].IEEE Transactions on Automatic Control,2004,49(9):1520-1533.
[9]OLFATI-SABER R,FAX J A,MURRAY R M.Consensus and cooperation in networked multi-agent systems[J].Proceedings of IEEE,2007,195(1):215-233.
[10]LIN P,JIA Y M.Average-consensus in networks of multiagents with both switching topology and coupling time-delay[J].Physica A:Statistical Mechanics and its Applications,2008,348(1):303-313.
[11]LIN P,JIA Y M.Consensus control for networks of agents with double integrator dynamics[EB/OL].[2010-05-12].http://www.paper.edu.cn.
[12]LEE D J,SPONG M W.Agreement with non-uniform information delays[C]//Proceedings of the 2006 American Control Conference.Minneapolis,USA,2006:750-756.