王桐 邱劍彬 高會軍
在過去的20多年中,針對具有嚴格反饋結構的非線性系統的自適應反步控制設計問題得到了廣泛的研究[1-4].反步法(Backstepping)由Kanellakopoulos等于1991年在文獻[3]中首先提出,是針對不確定性系統,將Lyapunov函數的選取與控制器的設計相結合的一種回歸設計方法,通過從系統的最低階次微分方程開始,引入虛擬控制的概念,一步一步設計滿足要求的虛擬控制.上述文獻[1-4]主要研究了具有嚴格反饋結構非線性系統的自適應控制設計問題,降低了自適應參數的數量.然而,上述方法并不能解決系統中存在未知的非線性項的情況.通過引入模糊邏輯系統或神經網絡,文獻[5-8]研究了一類含有未知非線性函數系統的自適應模糊/神經網絡控制設計方法.針對一類最小相位非線性系統,文獻[5]基于可線性化的神經網絡結構提出了自適應神經網絡(Adaptive neural network,ANN)反步設計方法.文獻[6]通過結合二次Lyapunov-Krasovskii函數,解決了多輸入多輸出非線性時滯系統的跟蹤控制問題.而針對具有嚴格反饋結構的單輸入單輸出非線性系統,文獻[7]提出了基于動態面控制技術的自適應神經網絡控制方法,解決了反步法帶來的“維數爆炸”問題,降低了算法的計算復雜度.在此基礎上,文獻[8]將上述控制方法擴展到了一類具有純反饋結構的非線性時滯系統.同時,自適應反步法控制設計也被應用到了懸架控制[9]等實際例子當中.
考慮到各種隨機干擾和隨機擾動對非線性系統的影響,隨機非線性系統的控制問題也得到了深入的研究[10-12].文獻[10]解決了隨機非線性系統的穩定性問題,文獻[11]將該結果擴展到了一類互聯的隨機非線性大系統,文獻[12]通過結合隨機小增益定理和輸入到狀態實際穩定概念解決了一類含有未建模動態的隨機非線性系統的自適應反步控制設計問題.通過結合神經網絡文獻[13-14]分別研究了隨機嚴格反饋非線性時滯系統和隨機非線性互聯大系統的輸出反饋控制問題,得到了系統依概率穩定的結果.
另一方面,由于基于事件觸發機制的控制策略不僅帶來了諸如資源共享等優點,同時也可以充分利用有限的帶寬資源實現可靠性較高的控制需求.文獻[15]針對一般結構非線性系統的跟蹤問題研究了其在事件觸發機制條件下的穩定性,文獻[16]則結合小增益定理將該結果擴展到了含有未建模動態的非線性系統.文獻[17]提出了基于事件觸發機制的輸出反饋控制策略,解決了一類非線性系統的鎮定問題.在系統中存在未知非線性函數的情形下,文獻[18]結合模糊邏輯系統,針對離散非線性網絡化系統,研究了其基于事件觸發機制的H∞控制方法.文獻[19-20]則研究了一類具有隨機干擾的多智能體系統的一致性控制問題,文獻[21-22]則基于事件觸發機制分別研究了隨機系統的滑模控制問題和H∞控制問題.上述的結果均是針對非線性系統或者隨機線性系統,而非本文所研究的隨機非線性系統,且在事件觸發機制框架下針對控制方向未知的隨機非線性系統的自適應神經網絡控制問題的結果還未見報道.本文針對該類系統,提出了基于事件觸發機制的自適應神經網絡控制策略,通過引入Nussbaum增益函數克服了未知控制方向對系統性能的影響,保證了閉環系統的隨機穩定性,使得系統所有的信號半全局一致有界,在事件觸發設計框架下解決了隨機非線性系統中同時存在未知非線性項和未知控制方向的自適應神經網絡控制問題.
本文所考慮的為如下結構的隨機非線性系統

其中,為系統的狀態向量,y∈R和u∈R分別為系統的輸出和輸入,b為未知的常數,且存在已知正常數使得bmin≤|b|≤bmax,fi為未知的非線性光滑函數,gi(x)為不確定函數,記增量dω的協方差為σσTdt,即均值E{dωdωT}=σσTdt,其中函數矩陣σ是有界但不確定的.
針對隨機非線性系統(1),首先給出如下的假設.
假設1.非線性函數fi滿足局部Lipschitz條件,即|fi(X1)-fi(X2)|≤Li||X1-X2||,其中Li為正的常數,這里的|·|表示函數的絕對值,‖·‖表示向量的1-范數.
假設2.系統的隨機擾動協方差是有界的,且滿足如下等式.
引理1[23].給出定義在時間段[0,tf)上的光滑函數?(t)(詳細表達式為式(42)).并考慮特定的Nussbaum 增益函數N(?)=?2cos(?),針對隨機非線性系統(1),若存在正定的函數V(t,x)和正定常數C,D使得如下不等式成立

則E(V(t,x))和?(t)均在[0,tf)上保持有界,其中?為隨機非線性系統的無窮小算子,其定義如下:考慮隨機非線性系統dx=f(t,x)+hT(t,x)dω,針對V(t,x)的無窮小算子表達式為

證明.首先,設計函數W(t,x)為

可得

利用式(2)可得

由式(5)可得

結合W(t,x)的定義可知

值得注意的是,式 (8)中,對于s∈[0,t],e-C(t-s)滿足0<e-C(t-s)≤1.假設e-C(t-s)(N(?)+1)為 Nussbaum 型函數,則由Nussbaum 函數的性質可知,對于函數變量ξ,如下兩個不等式成立

可得EV(t,x)<0.然而,這與EV(t,x)≥0的事實相矛盾.因此,變量?和EV(t,x)<0在時間段[0,tf)上是有界的,EV(t,x)也因此是有界的.□
針對隨機非線性系統(1),將采用如下結構的徑向基神經網絡逼近系統中存在的未知非線性函數

其中,為輸入向量,θ=[θ1,θ2,···,θM]T為權重向量,M>1為網絡的節點個數,激活函數選取為如下結構

其中,μi為對應的神經元中心參數,η為寬度向量.由于徑向基神經網絡的逼近特性,上述神經網絡函數可以在一個緊集上以任意精度逼近任意的連續函數.

其中,ε為逼近誤差.
首先,利用假設1和徑向基神經網絡逼近針隨機非線性系統(1)中存在的未知非線性函數,即


設計濾波器為

設計濾波器結構為

結合式(16)和(17),可得:

需要注意的是,由于濾波器中存在未知參數變量?,因此在接下來的控制設計中利用如下的狀態觀測值.

選取向量K使得矩陣A為正定的赫爾維茨矩陣,即對于給定的正定對稱矩陣Q,存在正定對稱矩陣P使得如下等式成立

定義系統的濾波誤差變量

可得

針對濾波誤差系統(22),選取Lyapunov函數為

利用伊藤微分定理,可得如下不等式

利用Young's不等式,可得:

將上述不等式(25)~(27)代入式(24),可得:

由濾波器結構可得

本節主要利用自適應反步法設計隨機非線性系統(1)的控制器,首先給出如下的坐標變換

步驟1.由系統模型(1)可得

由式(16)可得

式(32)等價于

選取第一步的Lyapunov函數為

利用伊藤微分定理,可得

利用Young's不等式,可得

將不等式(37)~(40)代入式(36)可得

設計虛擬控制器α1和自適應律為

其中,c1>0,q>0為設計參數.
將虛擬控制器α1和自適應律代入式(41)可得

步驟2.由系統模型(1)可得

選取步驟2的Lyapunov函數為

利用伊藤微分定理,可得

利用Young's不等式,可得

將上述不等式代入式(52),可得

設計虛擬控制器α2和自適應律為

其中,c2>0為設計參數.
將虛擬控制器α2和自適應律代入式(52),可得

步驟 i.(i=3,···,n)同第一步和第二步所采用的技術方法類似,可設計虛擬控制器αi為

其中,ci>0為設計參數.
同時可得

在步驟n需要設計最終的控制器u,因此考慮如下不等式

接下來設計最終的基于事件觸發機制的自適應神經網絡輸出反饋控制器

由式(59)可得

其中,κ1(t)和κ2(t)為滿足如下條件的時變參數|κ1(t)|≤1,|κ2(t)|≤1.則控制器u(t)可以改寫為

將u(t)代入式(58)可得

由v(t)的定義可得

根據 tanh(·)函數如下的特性 0≤|x|-xtanh,可得如下不等式

最終可得

對于任意的t∈[tk,tk+1),由ρ(t)=v(t)-u(t)可得,

本文給出如下的數值仿真實例

其中,f1(x1)=0.5sin(x1),g1(x)=0.3sin(x1),f2(x)=0.5cos(x1)sin(x2),g2(x)=0.3cos(x1),b=-1.選取仿真運行時間為40秒,采樣周期為0.01秒,選取初始值為,選取設計參數為.仿真結果見圖1和圖2,圖1給出了系統和觀測器的輸出信號x1和,以及系統的跟蹤信號yr.圖2給出了傳統基于時間驅動的控制信號和本文所提出的基于事件觸發機制的控制信號.

圖1 系統的跟蹤和觀測性能Fig.1 Output tracking and observation performance

圖2 控制信號Fig.2 Control signals
本文研究了一類具有未知控制方向的隨機非線性系統的自適應神經網絡控制設計方法.利用神經網絡的逼近特性和Nussbaum增益函數解決了系統存在未知非線性函數和未知控制方向的問題,最后結合事件觸發機制算法,提出了基于事件觸發機制的自適應神經網絡反步控制算法.仿真結果表明閉環系統的信號均是半全局有界的.