崔 挺,嚴運兵,肖小城
(1.武漢科技大學汽車與交通工程學院,湖北 武漢,430081;2.奇瑞新能源汽車技術有限公司,安徽 蕪湖,241002)
倒立擺系統是一個典型的非線性、強耦合、多變量、不穩定的系統,是進行控制理論研究的典型實驗平臺。倒立擺系統控制是控制理論發展中的一個典型問題,其控制實驗可以驗證許多新的控制理論[1]。目前,通過倒立擺系統驗證過的許多控制方法在航天、機器人以及一般工業過程領域均有著廣泛的應用,如航天飛機的姿態控制、機器人行走過程中的平衡控制等,故倒立擺系統控制實驗已成為控制理論界學者研究的熱點。
對于控制系統而言,控制律的形成需要系統的狀態變量,而狀態變量需要通過量測裝置進行觀測,但量測裝置中存在著隨機干擾。LQG/LTR控制是一種現代多變量頻域的設計方法,它能有效處理有附加噪聲影響或狀態變量不能直接量測的線性系統控制問題,其良好的魯棒性和解耦特性使得該控制方法在魯棒控制系統設計中得到廣泛應用,有著很高的工程實用價值[2]。為此,本文以二級倒立擺系統為例,采用LQR狀態反饋與卡爾曼狀態估計相結合的方法,通過回路傳輸恢復技術(LTR)彌補LQG設計的不足,完成了LQG/LTR全狀態反饋控制器的設計,并運用MATLAB語言進行仿真分析,將其仿真結果與LQR控制器進行對比,以期驗證該設計方法的有效性。
線性二次型高斯(LQG)問題是指系統模型用狀態空間形式給出的線性系統,其性能指標為基于被控對象和控制輸入的二次型函數,所研究的干擾噪聲、量測噪聲均為獨立的高斯密度函數,且噪聲以相加的方式加入狀態空間模型之中。綜合線性二次型控制器(LQR)和卡爾曼濾波器的設計過程,就可設計出LQG動態控制器。
假設對象模型的狀態方程為

(1)

若這些信號均為零均值的高斯過程,則其統計特性為
E[w(t)wT(t)]=Ξ≥0
(2)
E[v(t)vT(t)]=Θ≥0
(3)
E[w(t)vT(t)]=0
(4)
LQG問題是尋找一個最優反饋控制律,使得最優控制指標函數式(5)取最小值。即:
(5)
式中:z(t)=Mx(t)為狀態變量x(t)的某種線性組合;Q為對稱半正定矩陣;R為對稱正定矩陣,即Q=QT≥0,R=RT>0。
LQG問題的求解,可分為最優狀態估計器Kf和最優狀態反饋控制律Kc,其控制系統結構如圖1所示。

圖1 LQG控制系統結構圖Fig.1 Structure of LQG control system
被控對象傳遞函數G(s)與控制系統傳遞函數Gc(s)分別為
G(s)=C(sI-A)-1B
Gc(s)=Kc(sI-A+BKc+KfC)-1Kf
(6)
根據分離原理,可將LQG控制器設計分為兩步:①選取Kf、Kc中的一個參數設計目標回路,使其滿足系統的設計要求;②調整另一個參數使整個閉環回路的性能恢復到目標回路的性能。
Kf=PfCTΘ-1
(7)
式中:Pf為濾波器Riccati方程,并滿足:
PfAT+APf-PfCTΘ-1CPf+ΓΞΓ=0
(8)

ATPc+PcA-PcBR-1BTPc+Q=0
(9)

MATLAB語言中的魯棒控制工具箱Kalman和LQR函數可用于解決Riccati方程[3]。
如果加權矩陣Q、R值選擇不當,采用卡爾曼濾波器方法與直接反饋獲得開環系統的傳遞函數會出現不同,解決問題的有效方法是在控制策略中引入LTR技術,這樣在LQG結構下的開環傳遞函數就會盡可能接近直接采用狀態反饋的傳遞函數。
在設計模型輸入端加入與任意正數q呈正比的虛擬過程噪聲,即
W=W0+qΣ,V=I
(10)
式中:W0為實際過程噪聲方差的估計值;Σ=ΣT≥0;q為恢復增益。
選擇合適的卡爾曼濾波器Kf,調節恢復增益q,使系統開環回路Gc(s)G(s)當q→∞時,在所考慮的頻率范圍內逼近目標回路Kc(sI-A)-1B曲線,即:
(sI-A)-1B=Kc(sI-A)-1B
(11)
這表明當恢復增益q→∞時,LQG控制器Gc所擁有的魯棒特性在被控對象的輸入端得到了恢復。但在實際應用中,q值不應該選擇過大,否則會引起截斷誤差,破壞系統的魯棒性。一般情況下,q=1010即可。
根據LQG/LTR理論,回路傳輸恢復后,系統能夠獲得對外界干擾和量測噪聲更好的魯棒性,具有增益欲度無窮大和不少于60°相位欲度。
二級倒立擺系統是目前應用相當廣泛的控制系統平臺,一個典型的二級倒立擺系統主要由機電裝置和控制裝置兩部分組成[4]。機電裝置由小車、下擺桿、上擺桿及連接軸等構成。圖2為二級倒立擺模型,其工作原理是,用一種控制輸入作用在小車上,使小車以一定的規律來回跑動,上下擺桿在垂直平面內左右擺動,以實現擺桿的動態平衡。假設系統中的每一根擺桿都是勻質剛體,則可忽略擺桿運動中的動摩擦。設定小車質量為m,下擺桿質量為M1,上擺桿質量為M2,下擺桿角位移為θ1,上擺桿角位移為θ2,小車與地面的摩擦系數為f,下擺桿長度為L,上、下擺桿轉動中心到擺桿中心的距離分別為l1、l2,擺桿按順時針旋轉為正。

圖2 二級倒立擺模型Fig.2 Model of double inverted pendulum
倒立擺在平衡位置時,θ1、θ2均取0,通過平衡位置線性化后,可得:
(1)小車運動方程為
(12)
(2)下擺桿運動方程為
(13)
(3)下擺桿運動方程為
(14)


(15)
其中:


倒立擺線性系統穩定性可通過計算系統矩陣A的特征值來判斷,如果特征值均處于s復平面的左半平面,則系統穩定。在MATLAB語言中,用函數eig(A)計算矩陣的特征值,經計算得線性定常系統特征值為[-11.829 -5.8745.874 11.829 0 0]T,系統顯然不穩定,需設計控制器使其穩定。
要設計最優控制器,首先保證系統是可控的。在MATLAB語言中采用rank(ctrb(A,B)),rank(obsv(A,C))求取系統可控性以及可觀性矩陣的秩。經計算,系統可控可觀。因此,上述系統可以采用LQG控制器進行控制,使系統閉環穩定。

在系統輸入端和輸出端分別加入外界干擾w(t)和量測噪聲v(t),由于w(t)和v(t)是白噪聲信號,可在仿真模塊中選擇白噪聲模塊,分別作為模型不確定性和輸出噪聲。假設這些噪聲都是零均值的Gauss過程,則選擇Kalman濾波器噪聲強度權函數為
Ξ=mI6×6,Θ=nI6×6
(16)
根據式(7)、式(8),利用MATLAB語言中的care函數求出Pf,再使用inv函數得到卡爾曼濾波器Kf。不斷調節m和n,使得卡爾曼濾波器回比函數GkF=C(sI-A)-1Kf的奇異值滿足魯棒性能要求。同時,不斷調節狀態變量Q、R值,使Gc(s)G(s)奇異值曲線在頻率范圍內足夠逼近卡爾曼回比函數GkF=C(sI-A)-1Kf的奇異值曲線,這樣整個系統的性能得到了保證。倒立擺系統仿真結構如圖3所示。
在仿真過程中,初始條件設定為x=[011000]T,LQG/LTR控制效果如圖4所示,LQR仿真效果如圖5所示。由圖4、圖5可看出,兩種控制方式都較好地跟蹤了輸入,采用LQG/LTR控制的各性能指標均優于LQR控制。即使有外界干擾和噪聲的情況下,小車位移和擺角均在2 s內達到穩定,超調比LQR控制明顯降低;LQR控制下的位移和擺角均圍繞0值附近范圍內波動。由此可以驗證,卡爾曼濾波器的引入明顯減少了外界干擾和測量噪聲對控制系統的影響。

圖3 控制系統仿真結構圖Fig.3 Simulation structure of control system

(a)小車位移 (b)下擺角角度 (c)上擺角角度
圖4LQG/LTR控制效果
Fig.4SimulationresultswithLQG/LRT

(a)小車位移 (b)下擺角角度 (c)上擺角角度
圖5LQR仿真效果
Fig.5SimulationresultswithLQR
(1)針對二級倒立擺擺動過程中外界干擾和傳感器量測噪聲的存在,采用魯棒控制理論中的LQG/LTR方法設計了帶有卡爾曼濾波器全狀態反饋的LQG控制器。
(2)對LQG控制器進行回路傳輸恢復后,得到LQG/LTR控制器,系統能夠獲得對外界干擾和量測噪聲更好的魯棒性,具有增益欲度無窮大和不少于60°相位欲度,滿足了系統控制要求。
(3)將LQG/LTR控制器與LQR控制器進行仿真對比發現,在二級倒立擺系統中LQG/LTR控制器有效解決了在外界干擾和量測噪聲等情況下出現的不穩定問題,并具有較好的魯棒性。
[1] 葉建斌,郭鴻武. 三級倒立擺的LQG最優控制應用研究[J].計算技術與自動化,2011,30(4):9-13.
[2] 章萌,章衛國,孫勇. 基于閉環準則的LQG/LTR飛行控制律優化設計[J].飛行力學,2011,29(5):49-53.
[3] 薛定宇. 控制系統計算機輔助設計[M]. 北京:清華大學出版社,2006:314-318.
[4] 王春民,欒卉,楊紅應. 倒立擺的設計與仿真[J].吉林大學學報:信息科學版,2009,27(3):242-247.
[5] 吳朔媚,柴忠良,宋宏偉. 基于倒立擺系統的最優控制理論研究[J].煤炭技術,2012,31(5):198-200.