劉青,倪驍驊,郭祥東
(1.江蘇大學機械工程學院,江蘇鎮江 212013;2.鹽城工學院機械優集學院,江蘇鹽城 224051;3.安徽理工大學機械學院,安徽淮南 232001)
近年來,對非線性觀測器的研究進展較大,如:高增益觀測器,輸出延時觀測器[1-2],但是傳統的狀態觀測器需要對被觀測對象進行精確的建模[3]而且抗干擾能力較差[4]。文中采用基于改進的BP神經網絡的狀態觀測器逼近系統中未知的非線性部分,大大降低了對模型的依賴程度以
及狀態觀測器的復雜程度,并在神經網絡的權值自適應律中加入了誤差修正項以增強系統的抗干擾性能。
另外,雖然機械手一般都裝有高精度傳感器測量關節位置,但是測得的角速度信號一般容易受到外界的干擾,使得機械手在高速運動或者大負載運行時出現超調抖動和爬行現象[5-6],故將該觀測器與反演控制相結合,將估計速度代替實際速度,可以避免實際中對速度信號的測量。
考慮如下MIMO非線性系統:

式中:u∈Rn是系統的控制輸入;y∈Rl為系統的輸出;g(x,u)為系統中未知的非線性函數;x為被觀察的狀態變量;A為Hurwitz矩陣。
基本的狀態觀測器設計為:

式中:x^為狀態x的估計值;G為狀態觀測器的增益;g^(x,u)為g(x,u)的估計值,由于三層BP神經網絡可以以任意精度逼近任意的非線性函數,采用BP神經網絡對其進行逼近,則

式中:W與V分別為神經網絡輸入層與隱層的權值向量;ε為BP網絡的逼近誤差,x-=[x u],σ(·)為隱層神經元的傳遞函數,通常是一個Sigmoidal函數:

其中:Vi為權值矩陣V的第i行,)為的第i個元素。
假設理想權值W,V均有界且有:‖W‖F≤WM,‖V‖F≤VM,Sigmoidal函數也是有界的,即‖σ(Vx-)‖≤σM,那么g(x,u)可以通過下式來逼近的逼近可以表示為[7]:
定義狀態估計誤差為:x~=x-x^
由式(1)、(2)、(3)可得誤差狀態方程如下:

其中:

一旦神經網絡的結構確定之后,則應該定義適當的學習規則來訓練神經網絡。BP神經網絡結構簡單,并被廣泛地應用于分類、鑒定、觀測和控制問題中。文中基于改進的BP算法提出了一種新的學習規則,并通過Lyapunov直接法保證其穩定性。權值自適應律基于改進的BP算法,為保證其魯棒性,可以添加與觀測誤差有關的修正項。因此,考慮文獻[8],基于傳統BP算法的權值自適應律可表達如下:

式中:ρ1,ρ2>0為修正因子;J=(1/2)(yTy)為目標函數;η1,η2>0為BP算法的學習律。

那么,



其中m,m為隱層神經元個數。式(9)應用動態反向傳播的方法以及非線性動態系統來求解梯度以及。但是這會使觀測器變得非常復雜而且使得實時實現該方法變得非常困難。因此文中使用梯度的靜態近似值,即令=0,將BP算法進行改進如下:

由式(7)、(8)、(10)可知:式(5)權值自適應律可改寫如下:

于是有定理:對于式(1)所示的系統以及式(4)所示的神經網絡觀測器,如果神經網絡權值的自適應律設計為式(11),那么系統的,即狀態估計誤差,權值估計誤差以及輸出誤差均有界。
證明:由式(11)知:

定義Lyapunov函數為:



以及權值W,V和Sigmoidal函數的有界性,可得如下不等式:

利用不等式:

以及式(13)可得:

其中,λmin為矩陣Q的最小特征值,K1=‖l2‖/2。
假設ρ1≥,ρ2≥(1/‖C‖)
因此,由式(13)和(15)可知:



由式(16)知,在半徑為b的空間球體即

下面分析權值誤差的有界性:式(12)可改寫如下:


通過合理的選擇矩陣Ac以及學習律η1,η2以及修正系數ρ1,ρ2可以減小估計誤差的上限b,以使系統達到更高的精度。
針對雙關節機械手,其狀態方程可以表示為


為了應用Backstepping方法,將狀態觀測器表示如下:

G=[g1g2],gi∈R2,針對式(1)所示的被控對象,采用神經網絡狀態觀測器可以實現對角位移x1與角速度x2的逼近,因此可以采用估計值來代替實際值x1,x2,在控制中無需速度信號的測量。
對反演控制器進行設計:
第一步:引入新的誤差狀態向量:

其中x1d為機械手的期望運動軌跡;x2d為虛擬控制量。

故:

針對式(20)中的第一個子系統,Lyapunov函數定義為:

求導得:

若e2=0,則第一個子系統穩定。
第二步,設計控制律,使e2→0,由式(21)得

設計控制律為:


由于該控制系統是由神經網絡觀測器和反演控制器構成,因此Lyapunov函數表達如下:
L=L0+L1+L2
由前面分析可知:L=L0+L1+L2≤0,即控制系統穩定。

圖1 simulink主程序圖
Simulink框圖如圖1所示,圖2—3中虛線為采用神經網絡狀態觀測器時機械手的位移,實線為采用已知機械手精確模型且不含有神經網絡的狀態觀測器時機械手的位移。

圖2 關節1的觀測值與跟蹤結果

圖3 關節2的觀測值與跟蹤結果
通過比較由圖4可知,使用狀態觀測器后,系統的跟蹤性能略微下降,但是誤差能很快地收斂到0,仍具有很好的位置跟蹤性能。由圖5可知在使用狀態觀測器的情況下雖然開始時有略明顯波動,但同樣具有很快的響應速度。因此所設計的觀測器具有較好的收斂性能,該控制方法具有較強的跟蹤性能。

圖4 關節1的對比結果

圖5 關節2的對比結果
提出了針對MIMO非線性系統的神經網絡狀態觀測器,基于改進的BP算法以及誤差修正項來設計神經網絡權值的自適應律,并以此來保證狀態估計誤差的有界性。文中通過Lyapunov直接法分析了系統的穩定性,仿真結果表明了該算法的有效性。
[1]BALL A A,KHALIL H K.High-gain Observers in the Presence of Measurement Noise:A Nonlinear GainApproach[C]//47th IEEE Conference on Decision and Control,Cancun,Mexico,2008:2288-2293.
[2]SUN Leping.Stability Criteria for Delay Differential Equation[J].Journal of Shanghai Teachers University,1998,27(3):1-6.
[3]姜寅令,齊績.神經網絡型觀測器在二關節機械手中的應用[J].科學技術與工程,2011,11(6),1348-1350.
[4]ADBOLLUHI F,TULEBI H A,PUTEL R V.A Stable Neural Network Observer with Application to Flexible-joint Manipulators[C]//Proceedings of the 9thInternational Conference on Neral Information Processing,Stockholm,Sweden.2002:1910-1914.
[5]YOUNG H K,FRANK L,CHAOUKI T A.A Dynamic Recurrent Neural Network Based Adaptive Observer for a Class of Nonlinear Systems[J].Automatica,1997,33(8):1539-1543.
[6]閆茂德.僅利用位置測量信息的機械手魯棒滑模跟蹤控制[J].機械科學與技術,2011,20(4):531-534.
[7]姜寅令.滑模變結構控制方法在機器人軌跡跟蹤中的應用[D].大慶:東北石油大學,2011.
[8]LIU Jinkun.Radial Basis Function(RBF)Neural Network Control for Mechanical Systems[M].Beijing:Tsinghua U-niversity Press,2013:193-203.