孫強和, 童止戈
(空軍工程大學工程學院,西安 710038)
近年來,反推控制方法受到了國內外學者的廣泛關注[1],針對非線性SISO系統反推控制的研究取得了大量成果[2-4]。對于非線性 MIMO 系統,由于各狀態變量和輸入信號相互耦合,使得其分析和控制復雜得多。現有文獻對非線性MIMO系統的反推控制問題取得了少量研究成果[5-6],但其設計步驟仍類似SISO系統的設計過程,其每步設計都是相對標量系統進行的,不易簡單推廣到每個子系統都是多變量的系統設計過程中。事實上,大量的系統具有非線性和多變量特性,例如導彈、飛機等多變量非線性系統,其數學模型往往可以轉化為每個子系統都是向量的不確定嚴反饋非線性MIMO系統。因此,研究子系統為向量形式的多變量不確定非線性系統的控制問題具有現實意義和重要性[7-8]。
另一方面,盡管文獻[9]通過引入低通濾波器消除了傳統反推控制固有的“微分爆炸”問題,但由于低通濾波器的引入,使得其跟蹤誤差不再收斂到零,而是收斂到一個較小的殘集內,能否引入一種技術使跟蹤誤差的L∞性能指標被保證成為一個值得研究的內容。
基于以上分析,本文就一類子系統為向量形式的不確定嚴反饋非線性MIMO系統,提出一種改進的魯棒自適應反推控制方法。具體方案為在反推過程中通過引入一個低通濾波器,取消控制律中的微分項;并且應用RBF神經網絡在線逼近模型的不確定性;同時,在控制律設計中引入一個自適應魯棒控制項來補償神經網絡逼近誤差和未知外界干擾的影響,提高系統的魯棒性,使整個系統獲得更好的跟蹤控制性能。通過適當選擇設計參數及初始化誤差變量,使得跟蹤誤差的L∞性能指標被保證。最后,基于Lyapunov穩定性定理證明閉環系統的所有信號半全局一致終結有界。所設計的控制器無需控制增益矩陣可逆的條件,控制器結構簡單,可以直接應用于導彈、飛機等多變量非線性系統的控制。
考慮下面一類不確定嚴反饋非線性MIMO系統

為系統輸出。設

其中:fi0(·),gi0(·)為系統的名義值,滿足fi0(0)=0;Δfi(·),Δgi(·)為存在的不確定性。
控制目標:設計控制律u,消除系統不確定性和外界干擾對系統的影響,使輸出y=x1跟蹤期望指令信號x1c,且具有良好的過渡過程品質。
本文中使用RBF神經網絡在線逼近未知的非線性不確定函數項。其結構簡單,學習收斂速度快,能夠逼近任意非線性函數。給定任意一個光滑非線性函數f:ΩZ→Rp,則存在一個 RBF 基函數向量 ξ:Rq→Rl及理想權值矩陣 W*∈Rl×p,使得

其中:ε(Z)∈Rp為神經網絡的逼近誤差,‖ε(Z)‖≤εM,εM為系統的設計參數。理想權值矩陣W*取為在緊集ΩZ?Rq內使得‖ε(Z)‖最小的W,定義為

系統Σ的不確定非線性函數向量可表示為

根據式(5),系統不確定非線性函數向量可用RBF神經網絡在線逼近。

為了簡化設計,下面的推導過程將 fi0(·)、gi0(·)和di(·)分別簡寫為 fi0、gi0和 di。為完成控制器設計需做如下假設。
假設1 gi0(·)有界,即存在常數 bMi≥bmi>0,使得 bmi≤‖gi0(·)‖≤bMi。


改進的魯棒自適應反推控制器設計過程如下。
1)步驟1,考慮系統Σ的第1個子系統,定義誤差狀態向量

式中:e1=[e11,e12,…,e1m1]T,對其求導得


此時,不難選取第1個子系統的虛擬控制律和自適應律為


但是,在下述反推設計過程中,將使用x2c的微分信號,為了避免對它的解析運算,如果選擇

且保證x2c能漸近收斂到,則同樣可以保證e1收斂到0附近的某個鄰域中。故可考慮通過低通濾波器來獲得x2c和,有

式中τ2為濾波器時間常數。
2)步驟i,考慮系統Σ的第i個子系統,定義誤差狀態向量

式中:ei=[ei1,ei2,…,eimi]T,對其求導得

選取第i個子系統的虛擬控制律和自適應律為

步驟n:考慮系統Σ的第n個子系統,定義誤差狀態向量

式中,en=[en1,en2,…,enmn]T,對其求導得

選取第n個子系統的虛擬控制律和自適應律為


可見

故

其中:Ci+1(·)是某一連續函數。
由式(9)、式(13)、式(16)和式(17)可得ei動態值

應用文獻[10]中的引理可推導出

因此,

類似地,


定理考慮式(1)構成的閉環系統,定義Lyapunov能量函數

在滿足假設1~假設4的條件下,控制律選擇為式(23),則對于任意給定正常數p,若V(0)≤p,那么存在設計參數 ki,τi+1,ρi,σi1,σi2,Γi,γi,使閉環系統的所有信號半全局一致終結有界。通過適當選擇設計參數及初始化誤差變量,跟蹤誤差e1可收斂到原點的一個任意小鄰域內,且其L∞跟蹤性能被保證。
證明 V(t)對時間t的導數,并將式(11)、式(12)、式(18)、式(19)、式(24)和式(25)代入,整理得

由假設2和定理表述知,對于任意K0>0和p>0,集合

分別是R3和 R4i-1內的緊集。那么,Π×Πi也是R4i+2內的緊集。因此,‖Ci+1‖在集合Π×Πi內存在一個最大值Mi+1。利用Young’s不等式知,對于任意μ>0有



選擇設計參數

則式(37)可表示為


那么,

設式(11)、式(12)、式(18)、式(19)、式(24)和式(25)中估計參數初始值為0,即1,…,n。通過設置,n,使ei(0)=0。由式(8)、式(13)、式(14)、式(15)、式(17)、式(20)、式(21)和式(34)知 ei(0)=0,i=1,…,n,

由式(38)和式(39)可得

由上式和式(41)可得

因此,

上式表明,按式(37)適當選擇設計參數,使α0足夠大,可使跟蹤誤差e1的L∞跟蹤性能提高。
考慮如下非線性系統

初始狀態為 x1(0)=x2(0)=[0,-0.2]T,期望信號為 x1c=[x11c,x12c]T=[0.5(sin t+sin(0.5t)),yr2=sin t]T。
按式(38)選擇控制器參數k1=k2=10,Γ1=Γ2=diag[10],γ1= γ2=5,σ11= σ21=1,σ12=σ22=2,ρ1=ρ2=2,τ1= τ2=0.1。參數初始值為W^i(0)=0,φ^i(0)=0,i=1,2。神經網絡隱層節點數均選為21,高斯函數中心值在區間[-1,1]內均勻間隔取值,寬度均取為1。
仿真結果如圖1~圖4所示。

圖1 x11控制指令跟蹤過程Fig.1 x11control command tracking procedure

圖2 x12控制指令跟蹤過程Fig.2 x12control command tracking procedure

圖3 權值矩陣的L2范數Fig.3 L2norm of the NN weights:

圖4 控制律曲線Fig.4 Graph of control law
圖1 和圖2顯示輸出y能很好地跟蹤參考信號yr;圖3和圖4分別顯示神經網絡權值和控制信號的有界性。
本文就一類具有模型不確定性和未知外界干擾的嚴反饋非線性MIMO系統,提出了一種改進的魯棒自適應反推控制方法。該方法具有以下特點:1)通過引入低通濾波器消除了傳統反推設計方法中由于對虛擬控制反復求導而導致的復雜性問題;2)自適應魯棒控制項的引入補償了神經網絡逼近誤差和未知外界干擾的影響,提高了系統的魯棒性,使整個系統獲得了更好的跟蹤控制性能;3)通過適當選擇設計參數及初始化誤差變量,保證了跟蹤誤差的L∞性能指標。最后,通過Lyapunov穩定性定理證明了閉環系統的半全局穩定性,數值仿真驗證了方法的有效性。
[1] 徐湘元.反推技術及其在不確定系統中的應用[J].系統工程與電子技術,2006,31(11):2703-2709.
[2] GE S S,WANG C.Direct adaptive NN control of a class of nonlinear systems[J].IEEE Trans.on Neural Networks,2002,13(1):214-221.
[3] WANG C,HILL D J,GE S S,et al.An ISS-modular approach for adaptive neural control of pure-feedback systems[J].Automatica,2006,42(5):723-731.
[4] REN B B,GE S S,SU C Y,et al.Adaptive neural control for a class of uncertain nonlinear systems in pure-feedback form with hysteresis input[J].IEEE Trans.on Systems,Man,and Cybernetics-Part B:Cybernetics,2009,39(2):431-443.
[5] GE S S,WANG C.Adaptive neural control of uncertain MIMO nonlinear systems[J].IEEE Trans.on Neural Networks,2004,15(3):674-692.
[6] 錢厚斌,張天平.控制增益符號已知的MIMO非線性時滯系統自適應控制[J].電光與控制,2009,16(8):9-14,39.
[7] 胡云安,晉玉強,張友安,等.基于神經網絡的嚴反饋塊非線性系統的魯棒控制[J].控制與決策,2004,19(7):808-812.
[8] CHEN M,GE S S,EE HOW B V.Robust adaptive neural network control for a class of uncertain MIMO nonlinear systems with input nonlinearities[J].IEEE Trans.on neural networks,2010,21(5):796-812.
[9] SWAROOP D,HEDRICK J K,YIP P P,et al.Dynamic surface control for a class of nonlinear systems[J].IEEE Transactions on Automatic Control,2000,45(10):1893-1899.
[10] POLYCARPOU M M,IOANNOU P A.A robust adaptive nonlinear control design[J].Automatica,1996,32(3):423-427.