莊昊,楊洪勇
(魯東大學 信息與電氣工程學院,山東 煙臺 264025)
聯合連通拓撲下的二階多自主體系統有限時間包容控制
莊昊,楊洪勇
(魯東大學 信息與電氣工程學院,山東 煙臺 264025)
針對具有多領航者的二階網絡化系統群集運動問題,提出了一種有限時間收斂的包容控制算法。在此基礎上,運用現代控制理論、代數圖論和矩陣論等分析工具對所提出的控制算法進行理論分析,得到了當通信拓撲為動態聯合連通時,二階網絡化系統在有限時間內實現群集運動的收斂條件。通過此包容控制算法,使得系統在靜態拓撲和聯合連通條件下均在有限時間內收斂到目標區域內。最后,應用系統仿真驗證了所得結論的正確性。
多領航者;群集運動;有限時間;聯合連通;包容控制
多智能體系統協調控制是近幾年迅速發展起來的復雜系統控制科學研究領域的熱點問題,它在無線傳感器網絡、移動機器人編隊控制、集群航天器深空探測等領域有廣泛的應用,受到許多研究學者的關注。
一致性問題是分布式協同控制的一個重要研究方向[1-3],多智能體系統通過系統中各智能體之間的信息交流達到各個智能體特定狀態的一致。包容控制是一種具有多領航者的類一致性問題,通過設計跟隨者的控制協議使得跟隨者最終收斂到領航者組成的目標區域內(領航者圍成的凸包)完成群體運動[4-9]。文獻[4]研究了一階系統的包容控制問題,并證明了當網絡拓撲連通時系統可以實現包容控制,但并未討論網絡拓撲在聯合聯通條件下的包容控制問題。文獻[5]研究了有向網絡中固定拓撲和切換拓撲兩種情況下一階系統的包容控制問題,并給出了系統收斂的充要條件,但未對二階系統進行說明。文獻[6]對動態領航者的二階系統進行研究,分別提出了連續漸近包容控制算法和離散漸近包容控制算法。文獻[7]研究了隨機切換拓撲下二階系統的包容控制問題,提出一種基于不可約馬爾可夫鏈信息拓撲的包容控制算法。文獻[8]研究了二階系統的分布式包容控制問題,并給出了系統收斂的充分必要條件。從以上文獻研究可知,雖然均能實現系統的包容控制要求,但是實現時間是不確定的。
在工業應用中,僅實現各個智能體特定狀態的漸近一致還不足以滿足工業生產需要,還需要系統在有限時間內達到收斂。在航天器編隊控制和機器人編隊對抗中,有限時間定理得到廣泛應用,由于連續有限時間控制的優點明顯,有限時間控制問題受到越來越多的關注。文獻[10]對有限時間控制問題進行了綜述,介紹了有限時間穩定性的常用判據和幾類典型系統的有限時間控制。文獻[9]研究了有限時間收斂和參數不確定性有向系統的姿態包容控制問題。文獻[11-14]指出,連續有限時間控制系統的驗證方法主要包括:齊次性方法和有限時間李雅普諾夫穩定性定理。
本文研究了靜態拓撲和動態拓撲下的二階多智能體系統能在有限時間內實現包容控制的問題,本文的創新點在于提出了動態聯合連通條件下具有多領航者的有限時間的包容控制算法,應用現代控制理論及矩陣論等理論工具研究了算法的有限時間收斂,在靜態拓撲和動態拓撲下均能達到有限時間收斂。


定義2[15]設拓撲圖G1,G2,…,Gm具有相同的頂點集V,其并集記為G1-m,它的節點集是V,邊集是所有圖G1,G2,…,Gm的邊的并集,它的第i個節點和第j個節點間的鏈接權重是圖第i個節點和第j個節點間所有的鏈接權重之和。如果它們的聯合圖G1-m是連通的,稱G1,G2,…,Gm為聯合連通。


假設二階多自主體系統由n個跟隨者和m個領航者組成,其動力學模型描述為

( 1 )
式中:xi(t)∈R表示第i個智能體在t時刻的位置,vi(t)∈R表示速度,ui(t)∈R表示控制輸入。跟隨者集合與領航者集合分別記為F={1,2,…,n}和L={n+1,n+2,…,n+m},本文考慮靜態領航者的情況,即vi(t)=0,i∈L。
本文的研究目標是設計一種控制器,使得系統能在有限時間內實現包容控制。考慮如下控制器:
( 2 )

設跟隨者之間通信拓撲圖為GF,由于跟隨者之間是雙向交流信息,所以GF為無向圖。具有領航者的多自主體系統的通信拓撲圖為G,系統的Laplacian矩陣如下:
( 3 )
式中:LF為n階方陣,是跟隨者的Laplacian矩陣;LFL為n×m階矩陣。
假設1 對任意一個跟隨者i,至少存在一個領航者j,使得從j到i存在一條通信路徑。

令領航者的位置集合為xL(t)=[xn+1(t) …xn+m(t)]T,領航者的速度集合為Γ={1,2,…,N},由定義1和引理2,t位于領航者圍成的凸包內。下面給出包容控制的定義。
定理 1 令跟隨者的位置集合為xF(t)=[x1(t) …xn(t)]T,跟隨者的速度集合為vF(t)=[v1(t) …vn(t)]T,控制器滿足李雅普諾夫第二定理,并且若在控制器的作用下有xF(t)→

證明 由系統動力學模型和控制器得:
( 4 )
令跟蹤方程:
( 5 )
根據跟蹤方程得:
( 6 )
令
( 7 )
所以方程(6)可表示為
( 8 )
構造李雅普諾夫函數V(t)=V1(t)+V2(t),
式中:

-wTsgn[φ1(y)]α1-wTsgn[φ2(w)]α2
wTsgn[φ1(y)]α1
得到:

假設原動力學方程可寫為
( 9 )
則有
由已知得:εr1α1=εr2α2=εk+r2,所以上式可寫為
本節討論多自主體系統在運動過程,出現通信拓撲不連通的情況。系統動力學模型和控制器不變,動力學模型為式(1),控制器為式(2)。在聯合連通條件下分析此系統。
考慮一組無窮有序的有界連續時間段[tr,tr+1),r=1,2,…,且t1=0,tr+1-tr≤T1,T1>0。假設每個時間段[tr,tr+1)中存在一組非重疊的有限子序列[tr,j,tr,j+1),j=1,2,…,mr,且系統拓撲在[tr,j,tr,j+1)內保持不變,其中tr,1=tr,tr,mr+1=tr+1,tr,j+1-tr,j≥T2,T2>0。令σ(t):[0,+)→Γ,Γ={1,2,…,N}為一個分段切換常函數,N為總拓撲數。系統在t時刻的信息拓撲圖記為Gσ(t),相應的Laplacian矩陣記為Lσ(t)。其中,由n個跟隨者構成的信息拓撲圖記為GFσ(t),相應的Laplacian矩陣記為LFσ(t)。
假設2 由n個跟隨者和m個領航者構成的網絡化系統拓撲在非重疊時間區間[tr,tr+1),r=1,2,…內為聯合連通的。
假設3 非重疊時間區間[tr,j,tr,j+1)?[tr,tr+1),j=1,2,…,mr內,網絡化系統存在一連通子集。連通子集中任意一個跟隨者i,至少與一個領航者j之間存在一條路徑。

根據Lσ的定義,存在一個正交矩陣Eσ∈Rn×n,使:
( 10 )
( 11 )
( 12 )
式中:
( 13 )
( 14 )
在動態切換拓撲下網絡化系統的Laplacian矩陣為
( 15 )

在每個時間段[tr,j,tr,j+1)內此多智能體系統可以被分成nσ個子系統,在每個時間段內的Laplacian矩陣為
( 16 )
由系統動力學模型和控制器得,在時間段[tr,j,tr,j+1)內:
( 17 )
令跟蹤方程:
( 18 )
根據跟蹤方程得出:
( 19 )
根據假設3、引理2、定理1得出,此二階多智能體系統在聯合連通條件下可以實現包容控制。
下面證明多智能體系統在聯合連通條件下可以實現有限時間收斂。令:
( 20 )
所以
( 21 )



4.1 靜態拓撲仿真
設系統中有5個跟隨者,跟隨者集合為F={1,2,3,4,5},要將這5個跟隨者控制到三角形區域內,假設系統信息拓撲圖如圖1所示,取如下系統矩陣:

圖1 跟隨者與領航者靜態拓撲圖Fig.1 The static topological graph of followers and leaders
令拓撲圖每個邊的權重均相等,假設為1。選取α1=0.8,α2=2α1/(α1+1),φ1(x)=3x,φ2(x)=3x。目標區域的3個頂點位置為:ξ6=[8 10]T,ξ7=[10 8]T,ξ8=[10 10]T,各跟隨者的初始位置為:ξ1(0)=[2 0]T,ξ2(0)=[4 0]T,ξ3(0)=[0 2]T,ξ4(0)=[0 4]T,ξ5(0)=[3 1]T。各跟隨者的初速度為:v1(0)=[2 6]T,v2(0)=[3 8]T,v3(0)=[4 6]T,v4(0)=[5 5]T,v5(0)=[6 3]T。

應用控制器1與控制器2的各個智能體的位置、速度與時間的關系如圖2~5。

圖2 控制器1跟隨者位置橫坐標與時間關系Fig.2 The relationship between the abscissa of followers’ position under the action of controller1 and time

圖3 控制器2跟隨者位置橫坐標與時間關系Fig.3 The relationship between the abscissa of followers’ position under the action of controller2 and time

圖4 控制器1跟隨者速度橫坐標與時間關系Fig.4 The relationship between the abscissa of followers’ speed under the action of controller1 and time

圖5 控制器2跟隨者速度橫坐標與時間關系Fig.5 The relationship between the abscissa of followers’ speed under the action of controller2 and time
分析圖2和圖3,跟隨者由最初的分散的狀態,在控制器1和控制器2的作用下,均在有限的時間內均收斂到領航者所圍成的區域內,但是可以明顯看出在控制器(1)的控制下,系統更快地實現了包容控制。
分析圖4和圖5,在控制器(1)的作用下跟隨者的速度在時間到達7s的時候速度全趨于0,表示智能體已經達到穩定狀態,表示跟隨者均收斂到領航者所圍成的區域內;在控制器2的作用下跟隨者的速度在時間到達17s的時候速度全趨于0;明顯地看出控制器1比控制器2更優。
由圖6可直觀地看出跟隨者的運動軌跡,5個跟隨者在控制器1的作用下,最終全都在有限時間內收斂到目標區域內。

圖6 控制器1跟隨者與領航者位置關系Fig.6 The positional relationship between followers and leaders under the action of controller1
傳統的控制策略雖然可以達到有限時間收斂,但是用時要比本文設計的控制器更長,綜上,本文設計的控制器能使系統更快地達到收斂,所以更有優勢。
4.2 動態拓撲仿真
設系統中有5個跟隨者,跟隨者集合為F={1,2,3,4,5},要將這5個跟隨者控制到三角形區域內,假定系統互連拓撲圖在時刻,k=0,1,… ,在拓撲圖G1~G3中隨機切換,取0.5 s ,令拓撲圖每個邊的權重均相等,假設為1。
目標區域的3個頂點位置為:p6=[8 10]T,p7=[10 8]T,p8=[10 10]T。各跟隨者的初始位置為:p1(0)=[2 0]T,p2(0)=[4 0]T,p3(0)=[0 2]T,p4(0)=[0 4]T,p5(0)=[3 1]T。各跟隨者的初速度為:q1(0)=[2 6]T,q2(0)=[3 8]T,q3(0)=[4 6]T,q4(0)=[5 5]T,q5(0)=[6 3]T。選取α1=0.8,α2=2α1/(α1+1),φ1(x)=2.1x,φ2(x)=2.1x。
基于圖7的拓撲圖以及上述初始條件,分別應用本文設計的控制器1,
和一種控制器2
進行仿真實驗。

圖7 跟隨者與領航者拓撲圖Fig.7 The topological graph of followers and leaders
應用控制器1和控制器2的各個智能體的位置、速度與時間的關系圖見圖8~12。

圖8 控制器1跟隨者位置橫坐標與時間關系Fig.8 The relationship between the abscissa of followers’ position under the action of controller1 and time

圖9 控制器2跟隨者位置橫坐標與時間關系Fig.9 The relationship between the abscissa of followers’ position under the action of controller2 and time

圖10 控制器1跟隨者速度縱坐標與時間關系Fig.10 The relationship between the ordinate of followers’ speed under the action of controller1 and time

圖11 控制器2跟隨者速度縱坐標與時間關系Fig.11 The relationship between the ordinate of followers’ speed under the action of controller2 and time

圖12 控制器1跟隨者與領航者位置關系Fig.12 The positional relationship between followers and leaders under the action of controller1
由此可知,傳統的控制策略雖然可以達到有限時間收斂,但是用時要比本文設計的控制器更長,并且運動軌跡和速度曲線不如本文設計的控制器的曲線平穩,綜上,本文設計的控制器比傳統策略更有優勢。
1)本文分別針對靜態拓撲和動態拓撲的二階多自主體系統提出一般性的包容控制算法,并運用現代控制理論及矩陣論等理論工具分析了該算法的有限時間收斂問題,給出了二階系統在動態聯合連通拓撲條件下的有限時間收斂條件,并給予仿真驗證。
2)本文研究的是連續條件下的有限時間收斂問題,為了貼近實際應用,下一步將繼續研究離散條件下的有限時間收斂問題。
3)通過本文設計的包容控制算法,可以使網絡化系統快速達到收斂,大大減少收斂時間,提高了系統收斂效率。
[1]楊洪勇, 郭雷, 張玉玲, 等. 復雜分數階多自主體系統的運動一致性[J]. 自動化學報, 2014, 40(3): 489-496.YANGHongyong,GUOLei,ZHANGYuling,etal.Movementconsensusofcomplexfractional-ordermulti-agentsystems[J].Actaautomaticasinica, 2014, 40(3): 489-496.
[2]王祥科, 李迅, 鄭志強. 多智能體系統編隊控制相關問題研究綜述[J]. 控制與決策, 2013, 28(11): 1601-1613.WANGXiangke,LIXun,ZHENGZhiqiang.Surveyofdevelopmentsonmulti-agentformationcontrolrelatedproblems[J].Controlanddecision, 2013, 28(11): 1601-1613.
[3]朱旭, 閆建國, 屈耀紅. 高階多智能體系統的一致性分析[J]. 電子學報, 2012, 40(12): 2466-2471.ZHUXu,YANJianguo,QUYaohong.Consensusanalysisforhigh-ordermulti-agentsystems[J].Actaelectronicasinica, 2012, 40(12): 2466-2471.
[4]夏紅. 多智能體系統群一致性與編隊控制研究[D]. 成都:電子科技大學, 2014.XIAHong.Researchongroupconsensusandformationcontrolofmulti-agentsystems[D].Chengdu:UniversityofElectronicScienceandTechnologyofChina, 2014.
[5]CAOYongcan,RENWei.Containmentcontrolwithmultiplestationaryordynamicleadersunderadirectedinteractiongraph[C]//Proceedingsofthe48thIEEEConferenceonDecisionandControl.Shanghai:IEEE, 2009: 3014-3019.
[6]LIUHuiyang,XIEGuangming,WANGLong.Necessaryandsufficientconditionsforcontainmentcontrolofnetworkedmulti-agentsystems[J].Automatica, 2012, 48(7): 1415-1422.
[7]LOUYoucheng,HONGYiguang.Targetcontainmentcontrolofmulti-agentsystemswithrandomswitchinginterconnectiontopologies[J].Automatica, 2012, 48(5): 879-885.
[8]張安慧, 陳健, 孔憲仁, 等. 二階系統包容控制算法及其收斂速度分析[J]. 哈爾濱工業大學學報, 2014, 46(9): 1-8.ZHANGAnhui,CHENJian,KONGXianren,etal.Containmentcontrolprotocolanditsconvergencespeedanalysisfordouble-integratordynamicssystems[J].JournalofHarbininstituteoftechnology, 2014, 46(9): 1-8.
[9]MENGZiyang,RENWei,YOUZheng.Distributedfinite-timeattitudecontainmentcontrolformultiplerigidbodies[J].Automatica, 2010, 46(12): 2092-2099.
[10]丁世宏, 李世華. 有限時間控制問題綜述[J]. 控制與決策, 2011, 26(2): 161-169.DINGShihong,LIShihua.Asurveyforfinite-timecontrolproblems[J].Controlanddecision, 2011, 26(2): 161-169.
[11] 王付永, 楊洪勇, 韓輔君. 多領航者網絡化系統的動態群集運動[J]. 電子學報, 2016, 44(7): 1751-1756.WANGFuyong,YANGHongyong,HANFujun.Flockingmotionofdynamicnetworkedsystemswithmultipleleaders[J].Actaelectronicasinica, 2016, 44(7): 1751-1756.
[12]XIAOFeng,WANGLong,CHENJie,etal.Finite-timeformationcontrolformulti-agentsystems[J].Automatica, 2009, 45(11): 2605-2611.
[13]肖秋云. 多智能體系統有限時間一致性若干問題研究[D]. 無錫: 江南大學, 2015.XIAOQiuyun.Finite-timeconsensusproblemsofmulti-agentsystems[D].Wuxi:JiangnanUniversity, 2015. (請核對英文標題)
[14]王付永, 楊洪勇, 翁燦. 復雜多智能體系統的最大一致性[J]. 計算機仿真, 2015, 32(6): 403-406.WANGFuyong,YANGHongyong,WENGCan.Maximumconsistenceofcomplexmulti-agentsystems[J].Computersimulation, 2015, 32(6): 403-406.
[15]LINPeng,JIAYingmin.Consensusofaclassofsecond-ordermulti-agentsystemswithtime-delayandjointly-connectedtopologies[J].IEEEtransactionsonautomaticcontrol, 2010, 55(3): 778-784.

莊昊,男,1992年生,碩士研究生,主要研究方向為多智能體編隊控制、通信技術。

楊洪勇,男,1967 年生,教授,主要研究方向為網絡應用技術、多智能體編隊控制、復雜網絡控制、非線性系統控制。發表學術論文80余篇,曾獲山東省軟科學優秀科研成果三等獎1項,煙臺市青年科技獎1項。
Finite-time containment control of second-ordermulti-agent systems with jointly connected topologies
ZHUANG Hao, YANG Hongyong
(School of Information and Electrical Engineering, Ludong University, Yantai 264025, China)
In this paper, we propose a containment control algorithm with finite-time convergence for a second-order networked system flocking with multiple leaders. By applying modern control theory, matrix theory, and algebraic graph theory, we theoretically analyzed our proposed control algorithm; by doing so, we identified the convergence conditions required for a second-order networked system to realize flocking within finite time when the communication topology applies a dynamic joint connection. Through our containment control algorithm, the networked systems converge to object regions in finite time given the circumstances of static and jointly connected topologies. Finally, we verified the effectiveness of our proposed system via simulation examples.
multiple leaders; flocking; finite time; jointly-connected; containment control
2016-05-16.
日期:2017-01-11.
國家自然科學基金項目(61273152);國家自然科學基金項目(61673200).
楊洪勇. E-mail: hyyang@yeah.net.
10.11992/tis.201605013
http://www.cnki.net/kcms/detail/23.1538.tp.20170111.1705.020.html
TP391
A
1673-4785(2017)02-0188-08
莊昊,楊洪勇. 聯合連通拓撲下的二階多自主體系統有限時間包容控制[J]. 智能系統學報, 2017, 12(2): 188-195.
英文引用格式:ZHUANG Hao,YANG Hongyong. Finite-time containment control of second-order multi-agent systems with jointly connected topologies[J]. CAAI transactions on intelligent systems, 2017, 12(2): 188-195.