摘要:為解決一類帶干擾的模型不確定倒立擺系統中存在的兩類未知項——未知函數和外界干擾,采用了基于Lyapunov函數穩定性的神經網絡控制方法設計控制器。控制器設計中利用擴展卡爾曼濾波(EKF)消除系統觀測噪聲,獲取系統狀態的估計值,進而利用徑向基函數(RBF)神經網絡良好的逼近性來近似設計的控制律中的未知項。最后在倒立擺系統中對設計的神經網絡控制器進行了仿真研究,仿真結果表明所設計的控制器能有效抑制外界干擾,在精確控制倒立擺的同時可以保證控制系統的穩定性和快速性。
關鍵詞:RBF神經網絡;EKF;倒立擺;控制
中圖分類號:TP183文獻標識碼:A文章編號:1009-3044(2011)04-0849-03
Research on Neural Networks Control of Inverted Pendulum Based on EKF
YU Chang-sheng1,2, SUN Shi-jie2
(1.Henan Polytechnic University, Jiaozuo 454000, China; 2.Yongcheng Vocational College, Yongcheng 476600, China)
Abstract: This work studies the problem of unknown functions and uncertain disturbance of a class of nonlinear inverted pendulum systems, the design of the adaptive neural network controller is based on the Lyapunov function stability. The extended Kalman filter (EKF) is used in the controller design to eliminate systematic observation noise, then to get the estimated value for the system state, and the radial basis function (RBF) neural network is used to approximate the unknown part of the control law. Finally, a nonlinear inverted pendulum simulation system is built up to assess the neural network controller,the results show that the designed controller can effectively suppress the interference, the control system can obtain high accuracy with stability and celerity.
Key words: RBF neural networks; EKF; inverted pendulum; adaptive control
倒立擺系統是一種非線性、多變量、強耦合、不穩定的實驗系統,常用來驗證模糊控制、神經網絡控制和預測控制等各種控制算法。[1]采用模糊控制的方法進行控制,無需精確的被控對象模型且規則設計簡便易用,但對于控制多變量的倒立擺會遇到模糊規則爆炸的問題。[2]采用神經網絡控制方法,系統逼近誤差小,但沒有考慮系統觀測噪聲的影響,控制精度不高。
本文提出一種基于EKF濾波的神經網絡控制算法,假定倒立擺系統模型參數未知及僅有擺角可測量。利用擴展卡爾曼濾波(EKF)消除系統噪聲和觀測噪聲,獲取系統狀態的估計值,再根據Lyapunov函數穩定性設計系統控制律及律,進而用徑向基函數(RBF)神經網絡良好的逼近性來近似設計的控制律中的未知項,完成神經網絡控制器設計。
1 倒立擺系統數學模型
本文采用一種電機驅動的單級倒立擺裝置進行仿真研究,其結構圖如圖1所示。
取控制端輸入電流Iα、倒立擺擺角θp及角速度為系統狀態向量,則系統動態方程可以表示為:
(1)
式中:。取,擺桿長度l=1m,擺桿質量m=1kg,齒輪系數N=10,Km=0.1Nm/A,Kb=0.1Vs/rad,控制端電阻Rα=1Ω,控制端電感Lα=100mH。將各參數代入(1)可得系統動態方程為:
(2)
在倒立擺系統中可測的輸出量為擺角θp,其觀測方程可以表示如下:
(3)
式中:H=[1 0 0] ,V為擺角量測噪聲。
2 神經網絡控制器的設計
本文考慮的非線性系統存在兩類未知項:未知函數和外界干擾,假設如式(2)的系統模型表示如下:
(4)
式中:f(x)為非線性環節,b為已知常數矩陣,u為控制輸入。
2.1 控制器系統結構
本文所設計的控制器利用擴展卡爾曼濾波(EKF)消除系統噪聲和觀測噪聲,獲取系統狀態的估計值,再根據Lyapunov函數穩定性設計系統控制律及律,進而用徑向基函數(RBF)神經網絡良好的逼近性來近似設計的控制律中的未知項,完成神經網絡控制器設計。整個控制器系統結構圖如圖2所示。
控制器采用擴展卡爾曼濾波器(EKF)來消除系統量測噪聲,獲取系統狀態估計值 。由式(4)可得:
(5)
由式(5)可得系統離散狀態方程為:
(6)
系統觀測方程為:
(7)
對式(6)、(7)采用如下擴展卡爾曼濾波方程即可得到倒立擺系統的狀態估計值:
(8)
2.2 控制律的設計
設xr為參考輸入,,rm為一已知輸入信號矩陣。定義:e=x-xr,則有:
(9)
存在如下形式的Lyapunov函數:
(10)
使得倒立擺系統滿足Lyapunov穩定性判據。其中:P為一對稱正定矩陣且滿足,Q為一自選的正定矩陣。
對式(9)進行穩定性分析,求導得:
(11)
令,代入式(8)則有:
(12)
將式(11)代入式(10)有:
(13)
對式(12),因為Q為一實對稱的正定矩陣,所以。故要使,只需,其中的未知非線性環節為F(x),故可選取RBF網絡逼近F(x),RBF神經網絡的結構如圖3所示。
神經網絡的輸入向量為系統狀態向量,輸出信號為,即為F(x)的逼近值。隱含層含有神經元6個,激發函數為高斯基函數。此時可取控制律u為:
(14)
式中:w為神經網絡權值,s(x)為神經網絡基函數。
2.3 自適應律的設計
考慮如下候選Lyapunov函數:
(15)
式中:w*為神經網絡權值w的理想值,r為一常數。
(16)
令。則對式(15)有:
(17)
要使,因為,,故可取自適應律為:
(18)
3 倒立擺神經網絡控制仿真
將設計的神經網絡控制器應用于建立的倒立擺系統模型,仿真工具采用Matlab,參數設置如下:擺桿長度l=1m,擺桿質量m=1kg,齒輪系數N=10,Km=0.1Nm/A ,Kb=0.1Vs/rad,控制端電阻Rα=1Ω,控制端電感Lα=100mH。EKF濾波時系統初值為:,量測噪聲服從標準高斯分布,測量精度為0.01°。給定擺角角度指令為xd1=1.2sin(2πt),神經網絡控制器使得倒立擺跟蹤給定的輸入正弦信號,仿真結果如下:
圖4 基于EKF濾波的倒立擺擺角θp位置跟蹤曲線圖5 基于EKF濾波的控制輸入信號u圖6 神經網絡控制的倒立擺擺角θp位置跟蹤曲線
圖4和圖5為基于EKF濾波的神經網絡控制時倒立擺擺角位置跟蹤曲線和控制輸入,圖6為含量測噪聲直接用神經網絡控制所得的倒立擺擺角位置跟蹤曲線。穩態時有無EKF濾波的角度跟蹤誤差方差分別如下:
表1 穩態時跟蹤誤差的方差
從表1可以看出,EKF濾波能有效抑制系統的量測噪聲,提高控制精度。仿真中可調參數一共有以下幾個:A矩陣的三個參數,選取時要保證穩定性;RBF網絡的中心及方差陣c和b,為了簡化控制,并沒有讓c和b調整,而是取一定值不變,根據結果進行手動調整,仿真時取;正定矩陣Q,Q的選取理論上是越大越好,但經過仿真發現當Q過大時會出現劇烈的振蕩發散,故Q也要合理取值,仿真時取。通過仿真調整,選取合適的參數后得到了較理想的仿真結果。由圖3可看出,系統的跟蹤誤差快速振蕩衰減,在t=2s就已經穩定,成功實現了跟蹤控制任務。
4 結束語
本文給出了一種基于EKF濾波的神經網絡控制系統的具體推導過程,并在倒立擺非線性系統中進行了仿真應用。此控制器的特點是:1)不要求被控系統有準確的數學模型;2)逼近的不是未知系統的非線性環節,而是所設計的控制律中的非線性部分;3)可以有效抑制系統的量測誤差,控制精度高;4)在分析中運用了李雅普諾夫穩定性判據及其綜合應用。在控制器的設計過程中,難點在于Lyapunov函數的選取及怎樣通過分析Lyapunov 穩定性來推導出控制律及律,故要選擇合適的算法能使律及控制律的表達式簡潔,得到較理想的控制器。仿真表明應用此控制器,既能有效地抑制系統觀測噪聲,同時又能快速準確地實現倒立擺擺角跟蹤,很好地完成控制任務。
參考文獻:
[1] 雍容,高巖.模糊神經網絡算法在倒立擺控制中的應用[J].控制理論與應用,2004,23(1):20222,32.
[2] 孫紅兵,李生權,王瑜.基于RBF網絡二級倒立擺系統PID控制[J].微計算信息,2007(6):72-75.
[3] Wang D,Huang J.Adaptive neural network control for a class of uncertain nonlinear systems in pure-feedback[J].Automatica,2002,38(8):1365-1372.
[4] Polycarpou M M.Stable adaptive neural control scheme for nonlinear systems[J].IEEE Trans Automatic Control,1996(41):447-451.
[5] Ye X,Jiang J.Adaptive nonlinear design without a prior knowledge of control directions[J].IEEE Trans Automatic Control,1998(43):1617-1621.
[6] Nussbaum R D.Some remarks on the conjecture in parameter adaptive control[J].System Control Letter,1993(3):243-246.
[7] Ryan E P.Nonlinear universal servo-mechanism[J].IEEE Trans Automatic Control,1994,39(4):753-761.