孫小童 郭 戈 ,2,3 張鵬飛
多智能體一致性控制廣泛應用于移動機器人編隊任務[1]、集群航天器深空探測[2]等領域,是指通過設計基于信息交換的一致性協議,保證所有智能體的狀態達到一致[3?5].其主要問題包括領導者跟隨一致性[6]與無領導一致性[7].領導者跟隨一致性即選擇一個或多個智能體作為領導者,以實現一致跟蹤[8].現有相關工作已取得部分成果,但多屬于漸近穩定范疇.相比之下,有限時間一致性控制可得到有限的截止時間,且具有較強的抗干擾能力與較快的穩定速度[9].
文獻[10]引入非奇異終端滑??刂?建立一種能在有限時間內達到多智能體系統一致的一致跟蹤算法.文獻[11]采用李雅普諾夫方法進行一致性設計,實現多智能體系統有限時間收斂.文獻[12]研究了具有有界擾動的二階多智能體系統的自適應有限時間一致性問題,基于積分滑模面設計自適應算法克服擾動,實現有限時間一致性.
此外,文獻[13?15]通過輸出反饋對多智能體系統的有限時間一致性進行了研究.但上述結果的收斂時間依賴于初始條件,即初始條件越大,斂時間越長,且隨著初始條件趨于無窮,收斂時間無限增長.為此,固定時間穩定性的概念被提出[16],它要求在有限時間穩定性的基礎上,在任意初始條件下收斂時間的上界都應為常數.文獻[17]研究了多智能體系統的固定時間一致性問題,在固定時間一致性問題中,收斂時間與初始狀態無關.文獻[18?24]提出了幾種多智能體系統固定時間一致性算法,其中文獻[18]引入一種正弦補償函數來克服系統存在的奇異性.此外,由于擾動的存在,在實際應用中必須考慮存在內部不確定性和外部擾動的影響.固定時間一致性問題中的抗干擾問題得到廣泛關注.文獻[19]研究了具有輸入延時與不確定擾動的多智能體系統固定時間一致性問題.文獻[21]研究了具有不確定擾動的非線性多智能體系統固定時間一致性問題.文獻[22]考慮了具有外部擾動的二階多智能體系統的一致性問題,構造了一個擾動觀測器來估計外部擾動.早期工作中,多智能體系統分布式協同抗擾大都假設擾動或不確定性存在于控制輸入的同一通道中,為匹配擾動,然而很少關注具有非匹配擾動的多智能體系統的固定時間穩定問題.
針對具有非匹配擾動的多智能體系統固定時間一致性問題,文獻[25]考慮了具有擾動的二階多智能體系統的固定時間一致問題,提出了一種狀態觀測器.該觀測器只需要在固定時間內利用輸出信息就可對系統狀態進行估計.每個智能體的動力學分別由具有約束條件的匹配擾動和非匹配擾動組成.通過控制器和虛擬速度的設計,克服了各智能體之間存在的干擾,使多智能體系統能夠達到固定時間一致.但是這篇文章存在奇異性,對不連續函數進行了求導.我們基于這種情況進行了改進,引入正弦補償函數設計非奇異分布協議,避免系統的奇異性且克服非匹配擾動,使多智能體系統實現固定時間一致跟蹤.
第1 節,主要介紹了一些概念和引理.第2 節,提出了一種固定時間擾動觀測器.第3 節研究了固定時間控制及固定時間一致跟蹤的問題.第4 節,用一個仿真算例來證明理論結果的有效性.最后,第5 節做出了總結.
本文研究目標:利用一種非奇異控制協議,使多智能體系統實現固定時間一致跟蹤.
考慮如下多智能體系統,
其中xi∈R,vi∈R,ui∈R分別表示第i個智能體的位置、速度和輸入,fi∈R 是與控制輸入ui∈R在相同信道中的有界擾動,di∈R表示第i個智能體的非匹配擾動,i∈?N:={1,2,···,N}.參考模型可描述為
其中x0∈R,v0∈R,u0∈R 分別表示參考系統的位置,速度和輸入.多智能體系統(1)中引入一個領航者π0,其狀態ξ0=[x0,v0]T.定義一個非負對角陣B=diag{b1,b2,···,bn}表示智能體對ξ0的可訪問性,若ξ0可以被第i個智能體訪問,則bi=1,否則bi=0.
假設 1.在有向網絡拓撲中,至少有一個智能體可獲取領航者信息,即B≠0.
假設 2.智能體無法獲取領航者的輸入u0(t),但其上界可知.
假設 3.di為外部擾動,滿足
其中D >0,為已知常數.
假設 4.擾動fi的一階導數有界,且滿足,Li為其上界.
注 1.假設3 存在于實際中,如車輛、船舶或飛機等載體在行進過程中,所受阻力會隨速度增加而變大,當阻力到達某極限值后不再變化,如文獻[26]關于船舶阻尼系數的研究.存在多個文獻對此類擾動進行了研究如文獻[25].
注 2.在假設4 中,假設擾動一階導數是有界的,因為擾動不可能無限快地變化.
1.2.1 代數圖論
設N階加權圖g(A)={ν,ε,A}表示n個多智能體之間的通信拓撲,且每個智能體作為節點,其由節點集ν(g)={π1,π2,···,πn},邊集ε(g)?ν×ν,和加權鄰接矩陣A=[aij]∈RN×N(aij >0)組成.在加權圖g(A)中邊 (πi,πj)表示節點πi的狀態可以應用于節點πj,但節點πj的狀態不一定可以應用于節點πj.如果 (πi,πj)∈ε,節點πi稱為節點πj的鄰節點.πi的所有鄰節點可以用集合λj={i:(πi,πj)∈ε}來表示.當 (πi,πj)∈ε時,有向圖的加權鄰接矩陣定義為aij=1 ,對于其他情況aij=0,g的拉普拉斯矩陣表示為L=[lij]∈RN×N.若一個邊的子集形成一個生成樹,那一個圖就有一個有向生成樹.
1.2.2 重要引理
引理 1[27].設ξ1,ξ2,···,ξN≥0,則有
引理 2[28].考慮如下標量系統,
其中α>0,β >0,m,n,p,q是正奇數且m>n,p 若ε:=[q(m ?n)]/[n(q ?p)]≤1,穩定時間為 定義 1.在給定ui的情況下,對?ξi(0)和?i,j∈?N,存在正常數Tmax使得?t>Tmax,且ξi(t)=ξ0(t)則式(1)中的閉環系統實現固定時間一致跟蹤,其中ξi:=[xi,vi]T. 定義 2.固定時間收斂是指系統狀態從任意初始條件出發,都將在有限時間內收斂到平衡點,且收斂時間一致有界. 針對多智能體系統抗擾問題,通常采用滑模擾動觀測器來提高對不確定性和干擾的魯棒性.然而,在傳統的滑模擾動觀測器中,估計誤差漸近或有限時間收斂為零,當初始誤差較大,收斂時間可能很長.此外,滑模擾動觀測器中通常存在抖振問題.考慮到這兩個問題,本文設計固定時間擾動觀測器對擾動進行估計,且利用非奇異控制協議使多智能體系統實現固定時間一致跟蹤. 對多智能體系統(1)設計如下固定時間擾動觀測器,對其擾動fi進行估計. 對于多智能體系統(1),固定時間擾動觀測器如式(8)所示,定義為系統擾動的估計誤差,在固定時間內,固定時間擾動觀測器的估計誤差收斂到原點,即,通過假設4 可得收斂時間界限為 其中Mi=ki,3+Li,mi=ki,3?Li,h(ki,1)=1/ki,1+[2e/(miki,1)]1/3,e 為自然對數的底數,控制增益滿足ki,3>Li,ki,1h?1(ki,1)>Mi. 擾動fi經過固定時間擾動觀測器觀測后在下文中為已知數值. 注 3.在式(8)積分項中存在符號函數,因此,估計值是連續的,避免了抖振問題. 注 4.不等式(9)表明系統(8)的收斂時間由觀測器初值限制,與系統初始狀態無關. 本節研究單個系統固定時間控制問題,引入一種正弦補償函數,得到非奇異固定時間控制方法,為下節一致跟蹤問題提供理論基礎. 考慮任意子系統,定義z1=xi,z2=vi,d=di,f=fi則系統如下 其中z=[z1,z2]T∈R2表示系統的狀態向量,u∈R為控制輸入. 定義mχ,nχ,pχ,qχ為正奇數,且滿足mχ >nχ,p1 其中τ為正常數. 為避免奇異性問題,引入如下滑模面[18] 其中k(·):R→R+表示標量正函數 為書寫方便,下文將省略k(·)中的參數.當s=0時可得. 定義一種新的固定時間控制律 其中, 對于?ω >0存在 sinωx≤x. 定理 1.考慮二階系統,控制協議(14)使其狀態z=[z1,z2]T全局固定時間收斂,且收斂時間為 其中,Tχ:=nχ/[αχ(mχ ?nχ)]+qχ/[βχ(qχ ?pχ)](χ=1,2),θ(τ)表示與τ相關的最小時間區域. 證明.對s進行求導得到 定義u=u1+u2+u3+u4,其中u2,u3,u4用來克服擾動d與f,將在下文對其進行定義,將u代入式(16)可得 若z2≠0 則μτ(·)>0,為方便證明,將狀態空間z∈R{2分成兩個不同的}空間,如{圖1[18]所示,其中}. 圖1 系統的相位圖Fig.1 The phase plot of the system 若相位圖1 中任意位置都可以在Tmax內到達滑模面s=0 ,則全局收斂實現.當系統狀態(z1,z2)處于S1區域時,函數μτ(·)為1.據引理2,狀態(z1,z2)將到達滑動面s=0或在固定時間內進入S2區域,在S2中當z2≠0 時0<μτ <1.據式(20)及引理2 可得,滑動面s=0仍然是一個吸引域.在靠近z1軸時z2趨近于0,且,控制輸入(14)變為,當時,若則s>0 ,則s<0.因此z(t)將在固定時間θ(τ)內單調地越過S2進入S1(如圖1 所示).所以在時間t1 注 5.對于包括z1=0的非常小的z1=0,S2中的z2→0表示系統軌跡接近滑模面s=0,保證了固定時間收斂性,因此θ(τ)→0.由于對T2的保守估計,當τ足夠小時,忽略θ(τ)是有實踐意義的.參數約束條件m1/n1?p1/q1>1,p1/q1>1/2 可使ε1>1.因為可能存在ε2≤1,所以穩定時間(7)僅適用于計算短暫的T2. 注 6.對于多智能體系統固定時間一致控制問題,文獻[25]研究了存在非匹配擾動的情況,但其存在奇異性,對不連續函數進行了求導,我們引入文獻[18]中的方法避免了系統的奇異性,與文獻[18]相比我們通過改進滑模面克服了非匹配擾動. 為解決固定時間一致跟蹤問題,引入一種改進的非奇異分布式協議 其中滑模面si表示為 其中, m2>n2,p2 定理 2.考慮多智能體系統(1)和(2),如滿足假設1 和2,非奇異分布協議(22)可使多智能體系統實現固定時間一致跟蹤,其中,穩定時間T滿足 且 其中,χ=(1,2),θ(τ)表示最小時間間隔. 證明.1)當si≠0 時,將式(22)代入式(21)可得 將式(23)對時間求導并且將式(27)代入其中可得 2)當滑模面si=0 時,式(23)可化為 其中,i∈?N.構造一個Lyapunov 函數V3=,應用引理1 可得 若V3≠0,則為下列微分方程的解 與 1)中結果相同,對于?i∈?N,可以得到,穩定時間t1 因此ep在T 為將交互拓撲并入滑模面,定義新的滑動變量 定理 3.考慮多智能體系統(1)和(2),如滿足假設1 和2,非奇異分布協議(36)可使多智能體系統實現固定時間一致跟蹤,穩定時間T滿足 其中, 證明.定理2 與定理3 都是為多智能體系統(1)和(2)設計非奇異分布協議,使多智能體系統實現固定時間一致跟蹤.該定理的證明與定理2 的證明有同樣思路,證明過程本文不再贅述. 注 7.穩定時間(38)也依賴于交互拓撲屬性,即.此外,在滑動變量的定義中引入了交互拓撲,保證了轉換過程中的一致性. 本文在協議中引入連續的正弦補償函數消除了奇異性.此外,分布式控制協議(22)與(36)均可實現多智能體系統(1)和(2)的固定時間一致跟蹤,且截止時間與初始條件無關,相比協議(22),協議(36)更側重多智能體系統在實現一致跟蹤過程中的編隊效率,減小超調. 1)選擇系統參數α1,β1,α2,β2,m1,n1,m2,n2,p1,q1,p2,q2,τ. 2)定義系統狀態. 3)根據定義的系統狀態設計固定時間擾動觀測器. 4)根據所設計的固定時間擾動測器來設計固定時間一致控制協議. 5)根據設計的固定時間一致控制協議來設計固定時間一致跟蹤控制協議. 圖2 算法流程圖Fig.2 Algorithm flowchart 本章通過MATLAB/SIMULINK 仿真來驗證所提固定時間一致算法的有效性. 考慮一組智能體由1 個領導者和4 個跟隨者組成,其交互圖如圖3 所示.將虛擬領導者(2)的控制輸入設計為u0=?sin(x0)/(1+exp(?t))使得.定義智能體組初始狀態為x(0)=[?200,?50,50,150,200]T,v(0)=[?100,60,90,?80,100]T,擾動di=10 sin(0.1xi),fi=2 cos(xi(t)),根據引理2,為了使參數滿足約束條件m1/n1?p1/q1>1,p1/q1>1/2,將式(22)和式(36)中的參數賦值為α1=β1=α2=β2=4,m1=9,n1=5,p1=7,q1=9,m2=11 ,n2=9 ,p2=5 ,q2=7,τ=0.1. 圖3 交互拓撲圖geFig.3 The topology graph ge 仿真結果如下圖所示,圖4 與圖6 為多智能體系統在兩種控制協議下的位置軌跡,圖5 與圖7 為多智能體系統在兩種控制協議下的速度軌跡,由圖分析可得收斂時間小于最大收斂時間,在固定時間內多智能體系統達到了一致跟蹤的目標,驗證了定理2 和定理3 中控制協議的有效性. 圖4 協議(22)下的位置軌跡Fig.4 Position trajectory under protocol (22) 圖5 協議(22)下的速度軌跡Fig.5 Speed trajectory under protocol (22) 圖6 協議(36)下的位置軌跡Fig.6 Position trajectory under protocol (36) 圖7 協議(36)下的速度軌跡Fig.7 Speed trajectory under protocol (36) 本文研究了多智能體系統存在非匹配擾動的情況下,實現固定時間一致跟蹤問題.基于固定時間狀態觀測器與設計的算法,在存在非匹配干擾的情況下,實現多智能體系統固定時間一致跟蹤.由于多智能體系統中存在干擾,本文所引入固定時間擾動觀測器可以估計出系統匹配擾動,并設計相應的非奇異固定時間算法避免系統存在的奇異性且克服非匹配擾動,使多智能體系統實現固定時間一致跟蹤.最后,通過仿真算例驗證了算法的有效性.2 固定時間擾動觀測器設計
3 主要結論
3.1 非奇異固定時間控制
3.2 非奇異固定時間一致跟蹤
3.3 算法
4 系統仿真
5 結論