趙艷東,葛素楠
(青島科技大學 自動化與電子工程學院,山東 青島 266042)
跟蹤問題的主要目標是抑制外部擾動對系統性能的影響并使系統輸出無靜差跟蹤外部參考輸入。目前,對于線性系統的跟蹤問題研究比較成熟,許多學者致力于研究非線性系統的跟蹤問題[1-2]。而雙線性系統是一類比較特殊的非線性系統,其數學模型的非線性部分通常為系統的狀態和輸入的二次型函數或者雙線性函數[3]。對于這種非線性系統,有學者將非線性過程進行精確反饋線性化[4-5],然后再對系統進行線性求解。但線性化的過程往往比較復雜,且運算過程需要消耗大量的時間,并且得到的線性系統與原來非線性相比誤差較大,魯棒性也沒有預期的好,反而造成系統新的不穩定性。
對于最優跟蹤問題,主要采用數值方法,例如:冪級數近似法[6]、Galerkin逐次逼近法[7]、利用逐次求解一個基于狀態的Riccati方程來求得最優解的迭代算法[8-9]和Riccati方程近似序列的方法[10]。但這些方法需要進行矩陣微分方程求解,導致計算量大大增加。
本文利用一種迭代求解的逐次逼近法,致力解決帶有時滯項的雙線性系統最優跟蹤問題。依據最優跟蹤控制求解規律將系統轉化成兩點邊值問題,同時不需要通過求解Riccati方程或 Hamilton-Jacobi-Bellman方程[6-9]得出控制律,而是將兩點邊值問題轉化為無窮的序列,通過截取近似的控制序列求出次優控制律,并針對控制律的物理不可實現性這一問題,設計了降維觀測器進行解決。通過仿真結果,可以看出此方法的有效性。
已知帶有時滯項的雙線性系統如下:




其中 Q∈Rn×n,R∈Rm×m,且都是正定矩陣。
設系統式(1)的輸出 y跟蹤參考輸入的期望軌線y?,并由如下穩定的外系統確定:

且 z∈Rp,∈Rr,K和 H 為相應維數的常量矩陣。 假設(A,B)為完全能控,(A,C)為完全能觀測,即(K,H)為完全能觀測。則輸出誤差為:

根據系統最優跟蹤控制的求解規律,系統式(1)依據二次性能指標式(3),得出了最優跟蹤控制中的兩點邊值問題,如下:

其中:

此時系統的最優跟蹤控制律為:

通過對式(6)進行分析,發現式中既含有時滯項又含有超前項,并且存在雙線性項,這時 λ(t)和 x(t)相互耦合,對于這類問題采用求解迭代的向量微分方程來解決這個問題。
引入式(5)來構造帶有兩點邊值問題的族:

邊界條件為:



其中伴隨向量序列gk(t)可以通過如下方程確定:


其中S=BR-1BT,F(t)的迭代形式如下:

對于未知矩陣P1、P2分別為下列矩陣方程的解:

則系統式(1)的最優跟蹤控制律為:

證明 設:

其中 g(t)∈Rn為待求的伴隨向量,P1、P2為未知常量矩陣,對式(17)兩邊分別求導可得出:

把系統式(1)和穩定的外系統式(4)代入到式(18),與式(6)相結合,得到伴隨向量的導數的形式:

同時得出:

從而也得出最優控制律:

在式(21)最優控制律當中,含有兩個常量矩陣P1、P2,這兩個矩陣量可以通過式(15)得到。這時將式(19)和式(20)構造成序列式(12)和式(13),通過迭代逐次逼近法分別解出序列式(12)和式(13),進一步解出最優控制律u*(t)的序列,即式(11)。
對于第k次優化問題,最優狀態軌線和最優跟蹤控制律分別為 xk(t)和 uk(t)。 令{xk(t)}和{gk(t)}為 Cauchy序列,由參考文獻[11]中的引理 1可知,{gk(t)}和{xk(t)}一致收斂于式(19)和式(20)的解,即:


對于式(23)中x(t)是精確解,相比式(11)的序列解要精確的多,效果更好。同時,對于具體系統M的選取可以根據一定的誤差標準確定。下面給出這種求解的算法:

在實際系統最優控制律的設計中,g∞(t)不可能求出。通常,求解序列式(13)的前M個解來近似其精確解,這樣便得到系統式(1)的第M階次優控制律:(5)求出 e(t)。
(3)令 M=k,將式(3)轉化為:此時求出JM。

(4)如果當

時將第M次的gM帶入到式(23)中,即可得到系統的次優控制律。
由于控制律含有外系統變量,從而控制律物理不可實現。為了解決這個問題,需要對外系統的狀態進行重構。




其中:


從而得到基于觀測器的動態跟蹤控制律:

由于控制式(30)含有參考輸入觀測器,且觀測器的系數矩陣是按極點要求選取的,所以這個控制律不是最優或次優控制律,如果選擇適當系數矩陣可以使控制律式(30)的控制效果接近次優控制律。

圖1 當 k=2,4,6,8時的系統輸出誤差 e(t)仿真曲線

圖2 當 k=2,4,6,8時的系統控制變量 u(t)仿真曲線

圖3 系統輸出變量曲線
考慮由式(1)描述的系統,其中:

根據參考輸入有外系統式(4)描述,各參數應為:

系統的性能指標參數應為:

選取控制精度ε=0.02,表1給出了迭代次數分別為k=2,3,4,6,9,10 系統的性能指標, 得知|(J10-J9)/J9|<ε,當k=10滿足精度要求,從而u10可作為系統的近似最優輸出跟蹤控制律。 圖 1、圖 2給出了當 k=2,4,6,8時的系統輸出誤差e(t)和控制變量u(t)的仿真曲線,可以看出隨著k的取值越大,得出的最優輸出跟蹤控制律越理想,誤差也越來越小。圖3給出了系統輸出的仿真曲線。

表1 當 k=2,3,4,6,9,10 時的性能指標的值
本文對這一類帶有時滯項的雙線性系統進行研究,討論了在無限時間二次型性能指標下的最優輸出跟蹤控制問題,利用了一種迭代逐次逼近法來解決出現的非線性兩點邊值問題。并引入了參考輸入觀測器來解決控制律的物理不可實現性。這種方法計算量小、容易實現。通過仿真結果可以看出這種方法的可行性。
[1]GRABBE M T,DAWSON D M.Application of optimal control theory to the trajectory tracking of rigid robot manipulators[J].Optimal Control Applications and Methods,1994,15(4):237-249.
[2]GARRARD W L, ENNS D F, SNELL S A.Nonlinear feedback control of highly manoeuvrable aircraft[J].Int J Control, 1992,56(4):799-812.
[3]TANG G Y,MA H,ZHANG B L.Successive-approximation approach of optimal control for bilinear discrete-time systems[J].IEE Proceedings of Control Theory and Applications, 2005,152(6):636-644.
[4]ZHANG Z H,WANG S Q,RONG G.Predictive function control based on global feedback linearization for MIMO bilinear system[J].Control Theory&Applications,2003,20(3):477-480.
[5]LIU R M, LIN J J,YU J S.A new method of robust control of bilinear system by state feedback[J].Journal of East China University of Science and Technology, 2000,26(5):499-501.
[6]BEARD R W,SARIDIS G N,WEN J T.Galerkin approximations of the generalized hamilton-jacobi-bellman equation[J].Automatica, 1997,33(12):2159-2177.
[7]HARRISON R F.Asymptotically optimal stabilising quadratic control of an inverted pendulum [J].IEE Proceedings:Control Theory and Applications, 2003,150(1):7-16.
[8]MCCAFFREY D,BANKS S P.Lagrangian manifolds and asymptotically optimal stabilizing feedback control[J].Systems and Control Letters, 2001,43(3):219-224.
[9]CIMEN T,BANKS S P.Nonlinear optimal tracking control with application to super-tankers for autopilot design[J].Automatica, 2004,40(11):1845-1863.
[10]TANG G Y.Suboptimal control for nonlinear systems:a successive approximation approach[J].Systems and Control Letters, 2005,54(5):429-434.