具有指定性能和全狀態約束的多智能體系統事件觸發控制

2019-09-15 23:58:32楊彬周琪曹亮魯仁全

自動化學報 2019年8期

楊彬周琪曹亮魯仁全

隨著工業和軍事應用的發展,愈來愈多的工作需要多個智能體協同完成,因此多智能體協同控制迅速成為學界的熱門課題[1?8].由于多智能體協同控制只需接收智能體之間的局部信息,從而大大降低了系統的通訊成本和能耗,且具有更好的靈活性和魯棒性,所以廣泛應用于多機器人協同控制、無人機編隊和傳感器網絡等領域.多智能體協同控制主要包括一致性問題[1?6]、集群問題[7]、編隊問題[8]等.其中一致性跟蹤問題作為協同控制的一項基本問題,受到了學者們的廣泛關注[1?5].

在多智能體系統中,每個智能體的微處理器一般會受到計算能力和通信帶寬的限制,因此如何在多智能體的一致性跟蹤控制過程中降低通訊成本、減小計算壓力成為了亟需解決的問題.針對這一問題,有學者在控制器中加入了事件觸發機制,并獲得了顯著的成果[9?12].但是,事件觸發機制可能發生奇諾現象,即觸發事件會在有限時間內被無數次觸發.為了解決這一問題,文獻[13]研究了幾種不同事件觸發機制的最小事件觸發時間間隔的基本性質.文獻[14]則結合自適應控制解決了事件觸發控制中輸入狀態穩定性的問題.將事件觸發機制加入到控制器設計中顯著降低了控制過程的能耗和成本,因此,事件觸發控制成為了多智能體一致性跟蹤控制的一種重要方法.

由于受到物理器件和運行條件的限制,系統通常需要對其狀態進行約束,否則將會導致系統不穩定、性能急劇下降等現象,甚至會造成重大的安全事故.因此,解決系統的狀態約束問題意義重大.全狀態約束作為一種常見的狀態約束形式,一直是控制領域的研究熱點與難點.文獻[3,15?16]均使用Barrier Lyapunov 函數對具有全狀態約束的系統進行了研究.文獻[15]研究了一類具有參數不確定性的非線性系統的全狀態約束問題,文獻[16]進一步研究了一類隨機非線性系統的全狀態約束問題,文獻[3]則研究了一類具有全狀態約束和未知擾動的多智能體一致性跟蹤問題.此外,系統在保證穩定運行的同時,通常還會對收斂速率,最大超調量,穩態誤差等性能指標提出要求.因此,在控制器的設計過程中結合指定性能具有重要意義[17?21].

基于以上討論,本文針對一類具有全狀態約束的非嚴格反饋多智能體系統一致性跟蹤控制問題進行了研究,改進了控制算法.與現有結果相比,本文的優勢在于考慮了指定性能,對跟蹤誤差進行了指定性能變換,從而獲得了更小的穩態誤差.此外,在控制器設計過程中加入了固定閾值的事件觸發機制,設計了一個基于事件觸發的自適應控制算法,降低了智能體之間的通訊成本以及控制成本.在控制算法的設計過程中,用徑向基函數神經網絡(Radial basis function neural networks,RBF NNs)對系統中的未知非線性函數進行處理,從而解決了控制器設計中不滿足匹配條件和未知非線性函數的問題.除此之外,在反步法中引入動態面技術,有效地避免了傳統反步法中“計算爆炸”的問題.

1 預備知識與問題描述

1.1 代數圖論

本文用圖論來描述智能體之間的通信拓撲.智能體之間的有向圖記為ζ=(V,E,A),其中,V=(1,2,···,N)是節點數,表示系統中含有N個智能體.E ?V×V為節點的邊,A=[ai,j]∈RN×N為鄰接矩陣.節點j到i的邊記為(Vj,Vi)∈E,表示智能體i能夠接收到智能體j的信息,智能體i的鄰居節點的集合定義為Ni={Vj|(Vj,Vi)∈E,i≠j}.對于鄰接矩陣A,如果節點j的信息能被節點i接收到,那么ai,j >0,否則ai,j=0.定義節點i的度為對角矩陣D=diag{d1,d2,···,dN}.有向圖ζ的拉普拉斯矩陣為L=D ?A.定義拓展圖其中=(0,1,2,···,N),0 表示領導者,同樣的,當節點i能夠接收領導者0 的信號時ai,0>0,否則ai,0<0.

引理1[22].如果存在一條路徑能夠從根節點到達所有其他節點,那么稱有向圖ζ具有一個生成樹.定義B=diag{a1,0,···,aN,0},其中節點0 稱為生成樹的根,則矩陣L+B是非奇異的.

1.2 系統描述

對于具有N個同構智能體的多智能體系統,第i個智能體可以用以下n階非嚴格反饋的非線性系統描述

其中,xi=[xi,1,xi,2,···,xi,n]T∈Rn表示第i個智能體的狀態向量,yi ∈R 和ui ∈R 分別表示第i個智能體的輸出和控制器輸入,fi,m(xi)和fi,n(xi)是未知光滑的非線性函數,i=1,2,···,N.

假設1[1].有向圖ζ具有一個生成樹.節點0 的期望軌跡yd是一個虛擬的領導者,且只能被部分智能體直接獲取.yd已知,yd及其n階導數都是連續且有界的.

定義1[23].如果對于任意一個先驗緊集?∈Rn,x(0)∈?,存在有界的ε >0 以及常數N(ε,x(0)),使得

則系統(1)的解是半全局一致最終有界的.

1.3 徑向基函數神經網絡

在本文中,RBF NNs 用于逼近系統中的非線性函數[24?25]

其中,S(Z)=[S1(Z),S2(Z),···,Sk(Z)]T表示基函數向量,k為RBF NNs 的節點數,W=[W1,W2,···,Wk]T∈Rk為權重向量.存在一個恒定的理想權重向量W?,使以下方程成立

其中,ιi=[ιi1,ιi2,···,ιiq]T和ωi(i=1,2,···,k),分別表示高斯函數的中心和寬度.

引理2[26].令

2 事件觸發自適應控制算法設計

本文使用反步法和動態面技術設計了一個事件觸發自適應控制算法使多智能體系統達到以下控制目標:1)所有智能體的輸出都能對期望軌跡進行跟蹤并滿足指定性能;2)系統中所有的信號都是半全局一致最終有界的.

定義以下坐標變換

指定性能可以用以下不等式進行描述:

其中,δmin和δmax是可調節的參數,性能函數μ(t)有界且嚴格單調遞減,其形式為μ(t)=(μ0?μ∞)e?vt+μ∞,式中,v,μ0和μ∞都是正實數,μ0=μ(0),選取適當的μ0,使得μ0>μ∞,

為了滿足指定性能,進行如下等效變換:

其導數為

定義自適應參數為

定義kbl為誤差si,l的約束,即|si,l|

引理3[27].對于任意正常數kbl,若滿足不等式|si,l|

引理4[4].定義s1=[s1,1,s2,1,···,sN,1]T,y=[y1,y2,···,yN]T,=[yd,yd,···,yd]T,其中,yd的個數為N.則有

引理5(Young′s 不等式)[26].對于?(x,y)∈Rn,有以下不等式成立

其中,p>0,a>1,b>1,(a ?1)(b ?1)=1.

事件觸發自適應控制算法的具體設計步驟如下:

步驟1.反步法第1 步選取的Barrier Lyapunov 函數為

由式(1)～(4),可得

其中,Zi,1=[xi,xj]T,δ(Zi,1)為逼近誤差且|δ(Zi,1)|≤

由引理2 和引理5,可得

設計反步法第1 步的虛擬控制信號αi,1和自適應律分別為

其中,pi,1,ci,1,σi,1都是正的設計參數.

將式(6)～(9)代入式(5),可得

步驟2.基于動態面技術[28],定義如下一階濾波器用于解決反步法的“計算爆炸”問題

其中,τi,2是正的設計參數,由λi,2=zi,2?αi,1可得則有

注1.由步驟1 推導出αi,1后,在下一步的虛擬控制信號設計過程中必須對其求導,并且在之后的每一步中都要對虛擬控制信號進行反復求導,從而產生“計算爆炸”問題.引入動態面技術將虛擬控制信號通過一階低通濾波器得到其估計值zi,2,在下一步設計過程中用估計值代替虛擬控制信號可以避免對其進行求導,簡化了控制器結構.

選取第m(m=2,3,···,n ?1)步的Barrier Lyapunov 函數為

由式(1),(2),(11),可得

由引理2 和引理5,可得

設計第m步的虛擬控制信號αi,m和自適應律分別為

其中,pi,m,ci,m,σi,m都是正的設計參數.基于遞歸的思想,將式(10),(13)～(16)代入式(12),可得

步驟3.與步驟2 相同,定義濾波器

其中,τi,m+1是正的設計參數,由λi,m+1=zi,m+1?αi,m,可得則有

選取第n步的Barrier Lyapunov 函數為

則Vi,n的導數為

由引理5 可得

自適應控制器設計為如下形式

事件觸發機制定義為如下形式

其中,ei(t)=wi(t)?ui(t)表示測量誤差,pi,n,ci,n,σi,n,?i,mi以及都是正的設計參數,且mi <事件觸發時刻定義為tk,k ∈Z+.即當式(22)條件被觸發時,控制信號將更新為ui(tk+1),當t ∈[tk,tk+1)時,控制信號為wi(tk)保持不變.于是存在一個連續的時變常數?(t),滿足?(tk)=0,?(tk+1)=±1,|?(t)|≤1,?t ∈[tk,tk+1),使得wi(t)=ui(t)+?(t)mi.參考文獻[14]可得

由引理5 可得

由引理3 可得

其中,

定理1.在假設1 成立的條件下,考慮虛擬控制信號(8),(15),(19),自適應律(9),(16),(20)及事件觸發自適應控制器(18),(21),(22),能夠保證式(1)所描述的多智能體系統滿足以下條件:1)系統中所有的信號都是半全局一致最終有界的;2)跟蹤誤差收斂于原點的有界鄰域內且滿足指定性能.此外,事件觸發的時間間隔{tk+1?tk}存在一個下界t?,t?>0.即該事件觸發自適應控制器不會發生奇諾現象.

證明.Lyapunov 函數定義為

由式(27)可得其導數為

則式(28)可以寫為

則所有的信號都是半全局一致最終有界的,由式(29),得基于引理4,可得

由式(30)可知,通過選擇合適的設計參數可以使跟蹤誤差收斂于以原點為中心的有界鄰域內.

由ei(t)=wi(t)?ui(t),?t ∈[tk,tk+1),可得

3 仿真實例

考慮有向拓撲圖下由4 個跟隨者和1 個虛擬領導者組成的多智能體系統,如圖1 所示.其中第i個子系統的動態模型為

圖1 通信拓撲圖Fig.1 Communication topology

作為虛擬領導者的期望軌跡為yd=0.5 sint.設計的性能函數為μ(t)=0.97e?0.3t+0.03.數值仿真程序中設計參數的值分別設置為ci,1=ci,2=80,σi,1=σi,2=0.001,pi,1=pi,2=10,τi,2=0.02,δmin=0.999,δmax=1,kb1=kb2=2,=8,mi=0.6,?i=1.5.初始值設置為:xi,1(0)=[0.2,0.3,0.3,0.4],xi,2(0)=[1.0,?1.5,1.2,?0.6],=0,zi,2(0)=0.1.

圖2 參考信號yd 和輸出信號yiFig.2 Reference signal yd and output yi

圖3 具有指定性能的跟蹤誤差Fig.3 Tracking errors with prescribed performance

圖4 不具有指定性能的跟蹤誤差Fig.4 Tracking errors without prescribed performance

圖5 控制信號uiFig.5 Control signal ui

圖6 u1, u2的事件觸發時間間隔Fig.6 Time interval of event-triggered for u1, u2

圖7 u3, u4的事件觸發時間間隔Fig.7 Time interval of event-triggered for u3, u4

圖2～7 為仿真結果,圖2 表示虛擬領導者的期望軌跡yd和每個跟隨者的輸出信號yi的響應曲線,由圖可以看出各跟隨者在較短的時間內實現了對期望軌跡的跟蹤,表明本文提出的控制算法快速實現了多智能體的一致性跟蹤.圖3 和圖4 分別表示具有指定性能的跟蹤誤差和不具有指定性能的跟蹤誤差,雖然跟蹤誤差均能快速收斂于以原點為中心的有界鄰域內,但通過對比可得,在不具有指定性能的條件下,穩態誤差接近0.03,而具有指定性能時穩態誤差小于0.003,因此通過指定性能變換可以顯著減小多智能體一致性跟蹤控制的穩態誤差.控制器輸入ui由圖5 表示,控制器輸入的數值除了在起始階段的瞬間有較大的波動,在其余時間均小于7,表明該控制器性能良好,能耗較低.圖6 和圖7 是ui的事件觸發時間間隔和事件觸發次數,橫坐標為事件觸發時間,縱坐標為事件觸發的時間間隔.控制器u1,u2,u3,u4在40 s 內的事件觸發次數分別為1 400,399,1 055,386,表明事件觸發控制器具有減少控制信號更新次數和降低控制成本的優點,且沒有發生奇諾現象.

4 結論

本文研究了一類具有全狀態約束的非嚴格反饋多智能體一致性跟蹤問題.在控制算法設計過程中考慮了指定性能,獲得了期望的穩態誤差.此外,還設計了一個固定閾值的事件觸發機制,降低了智能體之間的通訊成本和計算壓力.本文給出了控制算法的詳細推導過程和穩定性證明過程.最后通過仿真結果驗證了本文所設計的控制算法的有效性.在未來的研究中,我們將考慮更為復雜的應用環境,提高多智能體系統的抗干擾能力.