劉麗麗 左繼紅 吳軍 廖娟娟
(1.中南大學信息科學與工程學院長沙410083)(2.湖南鐵道職業技術學院株洲412001)
基于RBF-ARX模型的倒立擺系統的預測控制?
劉麗麗1,2左繼紅1,2吳軍1廖娟娟1
(1.中南大學信息科學與工程學院長沙410083)(2.湖南鐵道職業技術學院株洲412001)
針對倒立擺系統的高階次、非線性和強耦合特性,導致難以建立準確的數學模型,針對這個難題,提出了基于RBF-ARX模型的預測控制算法。該建模方法結合了線性自回歸模型和高斯徑向基函數的理論,通常用于構建非線性系統的模型。預測控制算法采取RBF-ARX模型多步向前預測輸出,并反饋到輸入端,根據參考軌跡進行校正,使誤差最小。該法首先構建倒立擺系統的RBF-ARX模型結構,然后辨識并優化模型參數。基于此模型采取預測控制算法控制倒立擺系統,最后通過仿真控制效果驗證了該方法的可行性和有效性。
倒立擺系統;RBF-ARX模型;預測控制
Class NumberTP391.9
倒立擺系統是一個多變量、高階次和強耦合非線性系統,一直是自動控制領域研究的熱點和難點問題[1]。可以用其驗證控制策略對非線性系統的控制效果,廣泛應用于自動化領域,對其研究具有重要的理論價值和工程參考價值。目前對倒立擺系統的研究主要集中在建模和控制策略方面。建模多采用拉格朗日法或牛頓-歐拉法,此類建模通過研究倒立擺系統運動機理,不考慮倒立擺運動過程中空氣阻力及各種摩擦力,利用物理、化學和數學知識,構建系統輸入-輸出狀態關系。這種建模方法忽視客觀存在的非線性因素,導致模型不夠精確。目前對倒立擺系統控制方法的研究有經典的PID控制,通過運動機理構建系統動力學模型,線性化處理得到系統狀態輸出方程,利用PID控制理論實現控制[2]。也有學者通過狀態輸出方程,采取狀態反饋理論和Kalman濾波相結合的方法[3],實現倒立擺系統的控制。采取模糊控制理論,根據倒立擺運動輸出定義模糊集合和隸屬函數等,并構建模糊規則[4],實現倒立擺系統的閉環模糊控制。采取神經網絡理論控制倒立擺系統[5]。
本文研究的倒立擺系統由固高公司生產,實驗平臺主要包括倒立擺本體、電控柜、運控卡、及PC機,系統框圖如圖1所示。

圖1倒立擺實驗平臺結構框圖
倒立擺本體主要包含:基座、交流伺服電機、同步帶、擺桿、角度編碼器和限位開關等。電控柜主要由I/O接口板、電源開關、指示燈等構成。PC機和固高運動控制卡構成控制平臺。倒立擺控制系統硬件框圖如圖2所示。運控卡控制伺服電機,通過同步帶控制小車在導軌上往返運動。光電編碼器1反饋小車的位移信息,光電編碼器2反饋擺桿的角度信息給運控卡。PC機讀取運控卡中實時數據信息,通過一定的控制策略得到電機的目標輸出扭矩,并發指令給運控卡,最終控制電機按照目標扭矩轉動,帶動小車運動,并保持擺桿處于平衡狀態。
3.1 RBF-ARX模型簡介
RBF-ARX模型是一個全局狀態下的非線性模型,它結合了線性自回歸(Auto-Regressive eXoge?nous,ARX)模型和高斯徑向基函數(Radial Basis Function,RBF),適用于非線性系統的建模,實際上是將非線性過程局部線性化處理,將非線性過程劃分成無數個局部線性區間,每個區間可用線性ARX模型表示。采用神經網絡RBF逼近非線性模型中依存于時變工作點的函數型系數,這樣RBF-ARX模型可以描述非線性系統在任意工作點處的動態非線性特征。
3.2 倒立擺系統的RBF-ARX模型結構
針對1輸入2輸出的倒立擺系統,其RBF-ARX模型結構如式(1)所示:

其中,

式(1)中y1(t)、y2(t)分別是小車的位移量和擺桿的角度,u(t-i)是電機輸出電壓,na,nb表示模型階次;m為非線性環節數。e1(t),e2(t)為白噪聲干擾項。

式(2)中Zk=(zk,1,zk,2,…,zk,nx)T;j=1,2;p,q,b=1,2;a=1;nx=dim{X(t-1)}為X(t-1)列向量的維數,λikj(k=1,…,m;i=y,u;j=1,2)是縮放比例因子:(k=1,2,…,m;j=1,2),Z(k=1,2,…,m;j=1)是RBF網絡的中心;||.||2代表矢量的2-范數。?0j,和(p,q,b=1,2;a=1)是依存于系統狀態變化的模型系數,和p,q,b=1,2; a=1;i=0,1,…,max(na,nb);k=0,1,…,m)為線性權系數。
式(2)中的X(t-1)的選擇主要取決于倒立擺系統非線性的因素,可以是輸出序列,或是輸入序列,或是二者組合。在倒立擺系統運行過程中,非線性因素主要表現在擺桿的角度上,故X(t-1)選擇式(3)所示的輸出信號y2(t)序列。

其中kd是系統的最大延時。
3.3 模型參數辨識
RBF-ARX模型參數辨識主要包括參數估算和階次選取。因經典的非線性參數辨識方法計算量大,故本文采用一種快速收斂的結構化非線性參數優化策略(SNPOM)[6]來離線估算。SNPOM采用線性LSM[7](線性最小二乘法)和LMM[8](列文伯格-馬夸爾特法)相結合辨識RBF-ARX的模型參數。
SNPOM離線估算的方法是把參數劃分成線性和非線性參數,在非線性子空間中尋優方法類似于LMM,在線性子空間尋優采用LSM。這種優化方法步驟如下:
1)分類參數
將模型參數分成線性參數

非線性參數

令:

模型(1)可化為

2)尋優問題
首先確定模型階次,m一般選取1或2。采用AIC信息準則方法確定na,nb:

式(8)中V為模型殘差,N為采集數據個數,d為非線性和線性參數個數之和。針對本文研究對象,線性參數個數為2(m+1)(2*na+nb+1),非線性參數個數為2m(1+nx)。循環計算使上式AIC最小時的na,nb,即為所求模型階次。
尋優目標函數定義為[1]


尋優問題就是計算

通過上述方法,可辨識得到倒立擺系統RBF-ARX模型的參數。實踐證明,該辨識方法具有收斂快速,精度高等顯著特點。
3.4 參數辨識結果分析
通過AIC方法計算得到na=5,nb=5,nX=3。采用SNPOM參數尋優法來優化參數,優化過程如圖2所示,從圖2可看出在11步時參數已經達到最優狀態,表明SNPOM法收斂速度快。

圖2RBF-ARX模型參數優化過程
為了檢驗RBF-ARX模型的建模精度,比較系統在全局區間運行時模型輸出與系統實際輸出,并計算兩者間的誤差及其相關函數。模型輸出誤差如圖3所示,誤差的相關函數如圖4所示。

圖3RBF-ARX模型預測輸出及誤差

圖4RBF-ARX模型預測誤差的相關函數
顯然,全局區間內RBF-ARX模型輸出與實際輸出之間的誤差比較小,近似白噪聲,表明該建模方法能較好描述系統在全局區間內的動態非線性特征。
4.1 控制器設計框圖
基于RBF-ARX模型設計系統預測控制器,采用閉環輸出預測控制算法,算法設計框圖如圖5所示。RBF-ARX模型局部處理成線性化的ARX模型。采取二次規劃策略計算控制器的最優預測輸出,并計算與系統實際輸出之間的誤差,并將誤差反饋給輸入端,并依據參考軌跡校正,使系統預測輸出接近參考軌跡,優化目標函數,計算出控制量用于控制系統[9]。

圖5RBF-ARX模型下預測控制器設計框圖
4.2 基于RBF-ARX模型的預測控制算法
基于RBF-ARX模型的預測控制算法,采用矢量和矩陣表示,先定義:

其中N為預測時域,Nu為控制時域,Yr(t)是期望輸出序列[10],定義


優化問題是

將式(12)帶入式(13),消去常數項,式(13)所示的優化問題可轉化成:

式(14)所示優化問題可以用二次規劃求解。實踐表明,若不考慮輸出,只考慮輸入限制,可以不使用二次規劃,并可得到控制量u(t)如下式[11]4.3預測控制結果分析

通過仿真實驗,檢驗預測控制算法的控制效果,為方便實際應用,盡量減少計算量,要求N和Nu盡可能小。設定采樣周期5ms,基于RBF-ARX模型預測控制器(RBF-ARX MPC)的預測時域長度N取5,控制時域長度Nu取2。仿真控制效果如圖6~10所示。

圖6基于RBF-ARX預測控制輸出y1效果
從圖6可看出基于RBF-ARX預測控制中y1在1s內穩定到參考輸出,響應迅速,穩定后誤差也比較小。圖7顯示基于RBF-ARX預測控制中輸出y2角度值,響應快,稍有震蕩和超調。

圖7基于RBF-ARX預測控制輸出y2效果

圖8基于RBF-ARX預測控制輸入u曲線圖
從圖8看出,預測控制輸入電壓u在很短時間內基本達到穩定狀態,證明基于RBF-ARX預測控制對倒立擺系統控制是可行的,并且控制效果優良。
為進一步驗證基于RBF-ARX模型預測控制的控制效果,比較倒立擺在穩擺階段局部和全局工作區間內的系統實際輸出與模型預測輸出,并計算兩者之間的局部誤差和全局的平均誤差。

圖9預測控制局部輸出誤差圖
如圖9,10,輸出y1模型輸出和實際輸出誤差在-0.035左右,除了控制算法外,也和倒立擺自身特性有關,倒立擺本體只有水平往返運動,擺桿才能獲得動能穩定在平衡位置處。輸出y2模型的預測輸出能很好地擬合系統的實際輸出值,穩態后誤差也比較小。總體來看,倒立擺運行區間基于RBF-ARX模型的預測控制輸出的誤差比較小,模型預測輸出能很好的吻合系統實際輸出,控制精度高。

圖10預測控制全局輸出誤差圖
針對不穩定、高階次、非線性和強耦合的倒立擺系統,提出了基于RBF-ARX模型的預測控制算法。根據系統輸入輸出情況構建RBF-ARX模型,并采用SNPOM分類離線辨識及優化模型參數,基于該模型設計了系統預測控制器。仿真結果表明,模型預測輸出能很好的擬合系統實際輸出,兩者之間的誤差也比較小,驗證了該方法在非線性系統建模和控制方面的可行性和有效性。
[1]J.A.K.Suykens,J.Vandewalle,B.De Moor,Optimal control by least squares support vector machines[J].Neural Net?works,2001,14:23-35.
[2]黃永宣.自動平衡倒置擺系統-一個有趣的經典控制理論教學實驗裝置[J].控制理論與應用,1987,4(3):92-95. HUANG Yongxuan.Automatic balance inversion sys?tem-an interesting teaching experimental device of classi?cal control theory[J].Control theory and application,1987,4(3):92-95.
[3]劉珊中,朱邦太,牛新聞.狀態反饋控制在二級倒立擺平衡系統中的應用[J].洛陽工學院學報,1999,14(1):36-40. LIU Shanzhong,ZHU Bangtai,NIU Xinwen.The applica?tion of state feedback control in double inverted pendulum system[J].Journal of Luoyang institute of technology,1999,14(1):36-40.
[4]李士勇.模糊控制神經控制和智能控制論[M].哈爾濱:哈爾濱工業大學出版社,1998:133-140. LI Shiyong.fuzzy control neural control and intelligent con?trol theory[M].Harbin:Press of Harbin institute of tech?nology,1998:133-140.
[5]蔣國飛,吳滄浦.基于Q學習算法和BP神經網絡的倒立擺控制[J].自動化學報,1998,24(5):662-666. JIANG Guofei,WU Cangpu.Inverted pendulum control based on q-learning algorithm and BP neural network[J]. Acta automatica sinica,1998,24(5):662-666.
[6]Hui Peng,Tohru Ozaki,Valerie Haggan-Ozaki,Yukihi?ro Toyoda.A Parameter Optimization Method for Radial Basis Function Type Models[C]//IEEE Transactions on Neural Networks,MARCH,2003:432-438.
[7]蘇迪前,饒立昌,柴天佑.自適應控制[M].沈陽:東北大學出版社,1993,12:23-35. SU Diqian,RAO Licang,CAI Tianyou.Adaptive control[M].Shenyang:Press of northeastern university,1993, 12:23-35.
[8]D.Marquart.An algorithm for least-squares estimation of nonlinear parameter[J].SIAM J Appl.Math.,1963,11(2):431-441.
[9]李翔,陳增強,袁著祉.基于神經網絡的非線性前饋補償廣義預測自校正控制器51[J].南開大學學報,1999,32(2):51-55. LI Xiang,CHEN Zengqiang,YUAN Zhuzhi.Generalized predictive self-tuning controller 51 of nonlinear feedfor?ward compensation based on neural network[J].Journal of Nankai university,1999,32(2):51-55.
[10]王磊,戴冠中.基于BP算法的自適應模糊控制系統研究[J].控制理論與應用,1996,13(6):797-801. WANG Lei,DAI Guanzhong.Researth of adaptive fuzzy control system based on BP algorithm[J].Control theory and application,1996,13(6):797-801.
[11]Q.Wei,W.P.Dayawansa,W.S.Levine,Nonliner controller for an inverted pendulum having restricted travel,Auto?matica,1995,31(6):841-850.
Predictive Control for An Inverted Pendulum System Based on RBF-ARX Mode
LIU Lili1,2ZUO Jihong1,2WU Jun1LIAO Juanjuan1
(1.School of Information Science and Engineering,Central South University,Changsha410083)(2.College of Hunan Railway Professional Technology,Zhuzhou412001)
The Inverted Pendulum System which is high order,nonlinear and coupled with each other makes it difficult to es?tablish accurate mathematical model,for the problem,the design of predictive control algorithm based on RBF-ARX model were discussed.This modeling method is a combination model based on the theory of linear autoregressive(Auto-Regressive eXogenous,ARX)model and Gauss radial basis function(Radial Basis Function)neural network(RBF),it is used to construct the model of nonlinear system usually.Predictive control algorithm uses RBF-ARX model to predict multi-step's output forward,and feedback to the input in order to minimize the error according to the reference trajectory correction.The structure of the Inverted Pendulum System's RBF-ARX model is built firstly,then the model's parameters are identified and optimized.Take predictive control algo?rithm to control the inverted pendulum system based on this model,the simulation results verify the feasibility and validity of the method.
inverted pendulum system,RBF-ARX model,predictive control
TP391.9
10.3969/j.issn.1672-9722.2017.07.020
2017年1月7日,
2017年2月19日
2015年度湖南省教育廳科學研究資助項目“四旋翼飛行器的建模及控制策略的研究”(編號:15C0903);2015年度國家自然科學基金“抗參數橫揺的欠驅動船舶航跡跟蹤控制研究”(編號:61403045)資助。
劉麗麗,女,碩士研究生,工程師,研究方向:控制科學與工程等。左繼紅,男,碩士研究生,講師,研究方向:控制科學與工程等。