張建強,楊凱軍,歐陽凌叢
(陜西科技大學電氣與控制工程學院,陜西 西安 710021)
多智能體編隊控制問題如今已經得到非常廣泛的關注,其目的是制定控制協議,利用相鄰智能體之間的信息交換,使得多智能體系統跟蹤并保持參考編隊隊形。目前,多智能體系統編隊控制在合作監視[1]、航空航天[2]、自主水下機器人[3]、多機器人[4]等領域已經得到廣泛的應用。
為了解決非線性編隊跟蹤問題,已有多種控制技術應用于多智能體系統,如自適應滑模、神經網絡、模糊邏輯系統等。文獻[5-6]提出一種基于自適應滑模的編隊控制算法,通過設計滑模面來處理系統中存在的非線性項。文獻[7-8]提出基于神經網絡的自適應控制算法,使用神經網絡逼近未知動力學,解決非線性多智能體系統的編隊問題。神經網絡可以通過學習和調整權重來適應系統的非線性特性和復雜動態,從而提高控制精度,但其計算通常涉及大量的矩陣運算和迭代優化,耗費大量計算時間,導致運算實時性較差。模糊邏輯系統同樣可以處理控制系統存在的未知非線性項[9-11],該類方法能以任意精度逼近致密集上的任意光滑函數,但是受到模糊規則的限制,其在控制精度方面不及神經網絡。但是在運算實時性方面,模糊控制的基本計算是基于一組預定義的模糊規則,這些規則可以通過簡單的模糊邏輯運算進行評估,運算相對較快[12]。因此,本文采用模糊控制來處理多智能體系統中的不確定性問題。
在很多工業系統中,通常要求受控系統能夠達到預定的瞬態和穩態性能,且盡量避免由輸入飽和所帶來的系統控制性能下降問題,因此,在控制器的設計過程中關注規定性能和輸入飽和尤為重要。為了便于控制器的設計,通常將具有規定性能的系統從約束形式轉化為無約束形式,然后利用新系統設計編隊控制律。文獻[13-14]分別考慮在匹配和不匹配干擾下具有規定性能的多智能體系統的一致性問題[13]和具有規定性能的時變編隊跟蹤問題[14],并最終保證了閉環系統在瞬態和穩態下的性能。文獻[15-16]研究具有輸入飽和的非線性多智能體系統協同控制問題,并在設計過程中引入飽和補償系統來抵消輸入飽和的影響。然而,很少有文獻同時考慮到性能約束以及輸入飽和問題。
在實際應用場景中,智能體的通信資源往往有限。因此,為了解決控制器信號頻發問題,進一步減少網絡通信負擔,事件觸發控制得到極大關注。事件觸發機制的原理在于當系統穩定時通過設計事件觸發條件,當且僅當此條件被滿足時控制信號才會觸發更新。文獻[17-19]分別針對一階系統、二階系統和n階非嚴格反饋系統設計事件觸發控制策略,大幅降低了控制器信號的更新頻率,節約了通信資源。此外,文獻[20-21]研究了多智能體系統動態事件觸發控制問題,動態事件觸發機制存在一個動態變量,相對于固定閾值,動態變量可以自適應地發生變化,從而使得觸發閾值不再是一個固定值,更加節省通信資源。因此,在多智能體編隊跟蹤問題中,考慮動態事件觸發機制很有必要。
本文研究具有規定性能和輸入飽和的非仿射純反饋多智能體系統編隊跟蹤問題,結合模糊邏輯系統,提出一種有限時間動態事件觸發編隊控制算法。本文的主要工作如下:
1)提出一種基于動態閾值的事件觸發機制。與文獻[11,15,17]中通過引入事件觸發機制來代替連續控制器從而節省通信資源的方案相比,基于動態閾值的事件觸發機制由于具備更高的靈活性,因此能更大程度地節省能耗。
2)設計基于有限時間規定性能的輸入飽和控制機制。相比于文獻[13-14]僅考慮規定性能問題以及文獻[15-16]僅考慮輸入飽和問題,本文所研究的問題更加接近實際,受控系統在達到預定性能的同時能防止輸入飽和所造成的影響。
3)設計多智能體系統模糊控制機制。與文獻[7-8]中所采用的神經網絡控制相比,模糊控制具有計算量小、便于理解等優點。此外,本文所考慮的系統模型為非仿射非線性純反饋多智能體系統,由于非仿射非線性項的存在,使得控制策略的設計難度更大。
本節將通過圖論知識來描述智能體之間的通信關系。用無向圖G=(v,ε,A)來表示所有智能體之間的通信拓撲,其中,ν為所有頂點的集合,ε為邊組成的集合,A為鄰接矩陣。通信拓撲圖中的頂點代表每個跟隨者智能體的位置,邊表示智能體之間的信息交換,鄰接矩陣A=[aij]?RN×N,aij表示智能體i與智能體j之間的通信權值,當通信拓撲連接方式為無向圖時,aij=aji。如果(i,j)?ε,那么aij=0,如果(i,j)?ε,那么aij=1,這里(i,j)?ε表示智能體j可以傳遞自身的狀態信息給智能體i,則節點i的鄰居頂點集合可表示為Ni={j?ν:(i,j) ?ε}。此外,定義無向通信拓撲的拉普拉斯矩陣為L=D-A,D=diag(di)?RN×N稱為節點vi的入度矩陣,其中定義領導者與跟隨者的連接矩陣為B=diag{b1,b2,…,bn},當跟隨者智能體i能夠接收到領導者智能體的信息時,bi>0,否則,bi=0。
考慮一類非仿射非線性純反饋多智能體系統,其中第i個跟隨者的動力學模型可以描述為:
其中:uo>0和uω>0分別表 示不對 稱輸入飽和ui(vi(t))的上界和下界。
此外,領導者的動力學模型可以表示為:
其中:xr(t)表示領導者的狀態;fr(xr(t))表示領導者動力學的非線性項;yr(t)表示領導者信號。
本文的控制目標是通過設計控制律,使得非仿射非線性多智能體系統能夠在保證規定性能和避免輸入飽和的情況下形成預期編隊,并保持與領導者行為的一致性。領導者與跟隨者智能體滿足如下定義。
定義1[13]根據多智能體系統的描述[式(1)和式(3)],如果對于任意的初始值,設計控制協議使得成立,則稱其 能夠形成預期編隊。其中:i=1,2,…,N;ζ1>0和ζ2>0是2 個正常數;Td是與系統初始狀態無關的穩定時間;ιi表示編隊過程中第i個跟隨者與領導者之間的相對位置。
為了實現上述目標,本文進行如下假設:
假設1圖G包含一個生成樹,其根節點表示領導者智能體,且至少有一個跟隨者智能體可以從領導者智能體處接收信息。
假設2[22]領導者信號yr(t)和其導數(t)是有界光滑函數,并且存在2個未知常數Γ0和Γ1,使得
假設3[23]非仿射函數f(?)連續可微,定義其偏導數為:
對于所有有界偏導數f(?),存在2 個未知的正常數使得
因此,根據中值定理,有:
本節將為系統建立具有規定性能的控制方案,包括有限時間性能函數和誤差轉換模型。
1.3.1 性能函數
選擇有限時間性能函數為:
其中:ρi和0 <ci<1 是所設計的正常數;0 <Ti<∞是設定系統達到穩定時的時間。值得注意的是,式(6)中定義的性能函數βi(t)在時間Ti處收斂,如圖1 所示,圖中虛線為規定性能函數。

圖1 規定性能函數Fig.1 Prescribed performance function
引理1[22]如果在式(6)中構造一個光滑函數βi(t),那么它滿足以下性質:
1)如果0 ≤t<Ti,那么βi(t)從ρi嚴格遞減到ρici;如果t≥Ti,那么βi(t)保持常數ρici。
2)對于t?[0,∞)(t)連續可微,k=1,2,…,m。
3)對于t?[0,∞),0 ≤-Tici成立。
1.3.2 轉換后的編隊誤差模型
本文的控制目標是設計一種控制方案,使得非線性系統式(1)和式(3)的編隊誤差嚴格地在如下的范圍內變化:
為了解決帶有約束的編隊跟蹤控制問題,需將編隊誤差從式(7)中的帶約束形式轉換為無約束形式。首先定義調制誤差(t),并引入誤差變換為:
其中:si表示誤差映射。
可求得si的導數為:
為了進一步減少不必要的資源浪費,本文為非線性多智能體系統設計動態事件觸發機制,描述如下:
其中:zi(t)=ξi(t)-vi(t)代表測量誤差;是一個正常數是動態事件觸發機制的更新時間;λi(0)>0和l>0是設計參數。
需要注意的是:
1)本文采用觸發信號代替控制器中的連續信號,動態事件觸發機制作用于控制器與執行器之間,可以有效減少事件觸發的次數,大幅節省資源。對于參數λi(t),從 式(10)中可以 進一步得到λi(t)=λi(t0)exp(-l(t-t0))。設t0=0,λi(0)>0,l>0,則λi(t)>0。λi(t)的這個性質對于后續的證明過程起到至關重要的作用。
2)本文設計動態事件觸發機制旨在更大程度地節省控制資源,通過在靜態事件觸發機制右側添加一個非負的輔助動態變量λi(t)來擴大閾值函數,如式(10)所示,此動態變量呈現出指數遞減的趨勢,在開始進行編隊時,測量誤差較大,所對應的閾值函數也較大,有效避免了事件頻繁觸發;隨著編隊的形成,測量誤差減小,此時對應的閾值函數也減小,使得控制器信號有效更新,其合理性在式(50)中通過Lyapunov 穩定性方法得到驗證。文獻[11,15,17]中的事件觸發機制可以看作本文方法的一種特殊情況,即當本文事件觸發機制中的輔助動態變量為0時,可以近似為上述文獻中所提出的方法。因此,相比于其他文獻中的靜態事件觸發機制,本文方法能夠進一步降低控制器的觸發頻率,節省更多資源,更適用于解決通信資源有限的問題。
在許多實際的控制系統中經常存在不確定性,這將嚴重降低系統的性能和穩定性。為了減少不確定非線性項所帶來的影響,本文利用模糊邏輯系統來近似處理緊集Ω上的一些未知的連續函數。
模糊邏輯系統通常由4 個部分組成,即模糊器、知識庫、模糊推理機和去模糊器。
知識庫由一組模糊If-then 規則組成,如下:
R?:IFχ1是,…,χn是,則y是G?,?=1,2,…,L其中:χ=[χ1,χ2,…,χn]T和y分別表示模糊系統的輸入與輸出;L代表模糊規則的數量為模糊集。通過應用單點模糊化、乘積推理和中心平均去模糊化,模糊邏輯系統可以表示為:
引理2[16]對于定義在緊集Ω上的任意連續函數F(χ),存在模糊邏輯系統式(13)使得:
其中:?是一個任意小的常數。
此外,最優參數Θ*表示為:
其中:Ω1和Ω2分別表示Θ和χ的緊集。則模糊近似誤差?為:
引理3[24]對于e?R和m>0,不等式0 ≤|e| -成立。
本文通過反步法設計多智能體系統的虛擬控制器和自適應律。為了實現控制目標,定義一個參數為:
由于系統中存在輸入飽和,因此設計如下輔助系統來消除輸入飽和所帶來的影響:
其中:pi>0 是所設計的一個參數。
圖2 所示為本文為第i個跟隨者設計控制器的過程,其中包含模糊邏輯系統、輸入補償器、微分跟蹤器和事件觸發機制,因此,編隊跟蹤控制器可以在系統中存在輸入飽和以及不確定性的情況下實現多智能體系統的預期編隊。

圖2 跟隨者的編隊跟蹤控制器Fig.2 Formation tracking controller for the follower
定義如下鄰域誤差以及坐標變換:其中:αi,k-1是虛擬控制信號。
控制器設計步驟如下:
步驟1考慮如下Lyapunov 候選函數:
未知函數Fi,1可利用模糊邏輯系統逼近,其形式為:
其中:χi,1=[xi,1,xj,1]T;?i,1>0 是一個常數。由young’s不等式和θi,j的定義,可得:
設計虛擬控制信號和自適應律為:
引入如下的微分跟蹤器來解決“計算爆炸”問題:
則虛擬控制信號的導數可估計為:
其中:τi,k和ζi,k是2 個正常數;qi,k是估計誤差,且存在正常數,滿足|qi,k|≤qˉi,k。
步驟2構造一個正定Lyapunov 函數為:
可求得Vi,2的導數為:
其中:?i,2用于跟蹤。同樣地,根據young’s 不等式可得:
設計虛擬控制信號和自適應律為:
步驟k(3 ≤k≤n-1)選擇如下的Lyapunov 候選函數:
步驟n由于存在輸入飽和,因此ei,n可進一步表示為:
其中:ηi為抗飽和參數。因此,ei,n導數為:
選擇Lyapunov 候選函數為:
可求得Vi,n的導數為:
其中:|m1| ≤1;|m2| ≤1。設計中 間連續 控制信號ξi(t)為:
其中:m3是一個正的常數。
由引理3、式(44)、式(45),可得:
將式(44)~式(48)代入式(42)并根據young’s 不等式,可得:
算法1描述了基于反步法設計的具有規定性能和輸入飽和的有限時間動態事件觸發編隊控制器的偽代碼。
算法1有限時間動態事件觸發編隊控制算法
本節將通過以下定理來證明非仿射非線性多智能體系統的穩定性。
定理1對于滿足假設1~假設3 的非仿射多智能體系統式(1),考慮控制律式(47)、參數自適應律式(48)、事件觸發機制式(10)和規定性能函數式(6),則可以保證多智能體系統式(1)中所有信號有界,并且編隊跟蹤誤差漸近收斂至0。
證明1考慮一個Lyapunov 候選函數為:
其中:V(0)是有界的是一個未知的有界正常數,因此V(t)是有界的。進而根據式(17)可得:
由式(8)可知,編隊誤差滿足:
此外,為了證明輔助系統參數的有界性,考慮如下Lyapunov 候選函數:
綜上所述,可以推導出多智能體系統式(1)中的所有信號都是有界的。此外,由于V(t)及其導數連續有界,根據Barbalat 引理,可得t趨于無窮時V(t)收斂至0,因此,由式(17)、式(28)、式(35)、式(42)及式(54)可得,編隊跟蹤誤差ei漸近收斂至0,并且嚴格地在預定范圍內變化,證畢。
接下來將通過如下定理來證明所設計的動態事件觸發機制不會出現Zeno 行為。
定理2對于滿足假設1~假設3 的一類非仿射多智能體系統式(1),設計控制律式(47)、參數自適應律式(48)、事件觸發機制式(10)和規定性能函數式(6),則可以保證事件觸發的時間間隔存在一個下界,即Zeno 行為被排除。
證明2對于動態事件觸發機制式(10),由zi(t)=ξi(t)-vi(t)可得:
根據ξi的定義,可以知道是有界的。因此,有這里的是一個正的常數。此外,由于:
根據上述分析,Zeno 行為被成功避免,證畢。
需要注意的是:
1)在控制器設計過程中,首先采用有限時間性能函數,相比于大多數有關規定性能的文獻,本文提出的規定性能函數式(6)可以在時間Ti內達到預定值;隨后利用模糊邏輯系統處理未知的非線性函數,這能有效放松一些現有文獻中對非線性函數的約束,同時,微分跟蹤器用于解決“計算爆炸”問題;最后通過Lyapunov 穩定性理論,證明所有智能體之間的編隊跟蹤誤差能夠漸近收斂至0。
2)對于編隊中可能存在的外部有界擾動問題,將會在控制器設計過程中考慮一個自適應參數[8],這個自適應參數能夠根據誤差變化進行自適應更新,從而補償外部擾動的影響。而對于執行器故障問題,擬采用自適應在線更新策略[25]來估計未知的執行器效率因子,通過為每個跟隨者設計在線自適應更新律來估計故障因子,從而起到容錯的作用。相對于其他經典方法,自適應控制在處理外部擾動方面具有更強的魯棒性和自適應能力以及不需要準確系統模型等優勢。
為了驗證所提算法的有效性,對包含1 個領導者智能體和5 個跟隨者智能體的多智能體系統進行數值仿真,圖3 所示為所有智能體之間的網絡通信拓撲,其中,0 代表領導者智能體,1~5 代表5 個跟隨者智能體。

圖3 多智能體系統的通信拓撲Fig.3 Communication topology of the multi-agent system
從通信拓撲中可以看到,領導者智能體與任何一個跟隨者智能體之間都存在一條有向路徑,所以滿足假設1。此外,根據圖3 可計算其拉普拉斯矩陣為:
領導者與跟隨者的連接矩陣為:
第i個跟隨者的動力學模型如下:
其中:i=1,…,5。非仿射非線性函數表示如下:
領導者模型表示為:
系統輸入飽和的上界和下界分別為uω=-30,uo=30。
所有智能體的初始狀態選擇為:xr(0)=[0;0],x1,1(0)=[0.6;3],x2,1(0)=[-0.2;4],x3,1(0)=[-1.5;5],x4,1(0)=[-1.5;0.8],x5,1(0)=[-0.2;1.5],xi,2(0)=[0;0],i=1,…,5。
規定性能函數表示為:
控制器的設計參數選擇為:ci,1=30,ci,2=40,τi2,ζi=0.8,=0.4,pi=30,δi,1=0.1,δi,2=0.1,ri,1=ri,2==1,λi(0)=0.9,l=1.2=0.12。其中,i=1,…,5。
仿真結果如圖4~圖12 所示。圖4 所示為每個智能體的軌跡和形成過程,從中可以看到,所有跟隨者都能保持一定的隊形,以相同的速度跟隨領導者智能體。圖5 和圖6 所示分別為編隊誤差曲線以及規定性能函數(彩色效果見《計算機工程》官網HTML版),從中可以看出,編隊跟蹤誤差能夠在有限時間內漸近收斂至0,并且一直保持在預先定義的函數范圍內。圖7~圖11 所示為連續控制器與事件觸發控制器的控制曲線,從中可以看到,控制曲線一直維持在-30~30 之間。圖12 所示為各智能體的觸發時刻,從中可以看出,動態事件觸發控制有效地減少了控制器的更新次數。這些仿真結果驗證了本文所提算法的有效性。

圖4 多智能體系統軌跡Fig.4 Multi-agent system trajectories

圖5 多智能體系統水平方向上的編隊跟蹤誤差Fig.5 Formation tracking error of multi-agent system in horizontal direction

圖6 多智能體系統豎直方向上的編隊跟蹤誤差Fig.6 Formation tracking error of multi-agent system in vertical direction

圖7 控制器ξ1(t)與事件觸發控制器u1(t)Fig.7 Controller ξ1(t) and event-triggered controller u1(t)

圖8 控制器ξ2(t)與事件觸發控制器u2(t)Fig.8 Controller ξ2(t) and event-triggered controller u2(t)

圖9 控制器ξ3(t)與事件觸發控制器u3(t)Fig.9 Controller ξ3(t) and event-triggered controller u3(t)

圖10 控制器ξ4(t)與事件觸發控制器u4(t)Fig.10 Controller ξ4(t) and event-triggered controller u4(t)

圖11 控制器ξ5(t)與事件觸發控制器u5(t)Fig.11 Controller ξ5(t) and event-triggered controller u5(t)

圖12 各智能體觸發時刻Fig.12 Trigger time of each agent
對于具有輸入飽和的多智能體編隊控制問題,從控制信號絕對值的積分(IAU)、未飽和區域的控制器曲線峰值和調節時間3 個方面來分析有無規定性能對運算成本的影響,結果如表1 所示。其中:IAU 可以衡量控制信號的能量消耗及幅值特性,IAU值越大,表示控制信號的幅值較大,意味著需要較大的控制力;未飽和區域峰值是指控制器曲線在飽和閾值內的最大值。若考慮規定性能控制,很明顯可以看出,控制器所對應的IAU 值以及峰值的數據要小于沒有考慮規定性能時的值,并且調節時間也相對較短,這說明本文所考慮的基于有限時間規定性能的輸入飽和控制能夠節省控制資源,對減少運算成本起到積極作用。此外,由于本文中存在輸入飽和,為了處理輸入飽和的情況,設計額外算法來補償飽和效應,這可能會增加運算成本,但是能夠有效防止輸入飽和所帶來的不良影響。

表1 控制器有無規定性能時的對比Table 1 Comparison of controllers with and without prescribed performance
針對具有規定性能和輸入飽和的非仿射多智能體系統,本文提出一種有限時間動態事件觸發控制算法,以解決多智能體系統編隊跟蹤問題。采用反步法結合模糊控制以及微分跟蹤技術設計有限時間編隊控制律,通過設計動態事件觸發機制減少控制信號的更新頻率,并保證Zeno 行為不會發生。此外,引入動態補償器來應對輸入飽和所帶來的影響。利用Lyapunov 穩定性理論證明多智能體編隊跟蹤誤差會漸近收斂至0。仿真結果表明,本文所設計的控制器可以實現編隊控制目標,并且能夠有效節省通信資源,驗證了控制算法的有效性。本文所提控制算法主要解決了系統中的性能約束及輸入飽和問題,而在實際中還存在如外部擾動、執行器故障等許多突發情況,下一步將繼續完善控制算法,使其能夠適應各種突發情況。