劉德玉 鄒坤霖 賀力克
1(湖南工業(yè)職業(yè)技術(shù)學院 湖南 長沙 410208)2(湖南大學機器人視覺感知與控制技術(shù)國家工程實訓室 湖南 長沙 410082)
自適應魯棒控制在控制領(lǐng)域的非線性系統(tǒng)中得到了廣泛的關(guān)注。為了獲得自適應和/或魯棒性能,將許多先進的控制方法相融合來設計非線性系統(tǒng)的控制器。
由于具有非線性函數(shù)逼近、學習和容錯能力,神經(jīng)網(wǎng)絡方法在非線性系統(tǒng)的建模和控制中得到了廣泛的應用[1]。已經(jīng)證明,多層神經(jīng)網(wǎng)絡可以盡可能精確地逼近任何連續(xù)函數(shù)[2-3]。基于其逼近性質(zhì),文獻[4-9]提出了基于自適應神經(jīng)網(wǎng)絡的非線性控制方案,其中神經(jīng)網(wǎng)絡用于逼近單輸入單輸出(SISO)系統(tǒng)中的未知函數(shù)。隨后,文獻[10-12]擴展了自適應控制方案以控制多輸入多輸出(MIMO)非線性系統(tǒng)。在這些方案中,神經(jīng)網(wǎng)絡通常用于逼近系統(tǒng)的不確定非線性,從而為非線性系統(tǒng)設計補償型自適應神經(jīng)網(wǎng)絡控制器;然后設計一個魯棒補償器消除逼近誤差和外部干擾的影響,該補償器可以是監(jiān)督控制[13]、變結(jié)構(gòu)控制[14]和/或H∞控制[15]。文獻[11,14-15]利用神經(jīng)網(wǎng)絡完全逼近變結(jié)構(gòu)的等效控制,然后應用H∞控制方法使閉環(huán)系統(tǒng)具有給定的跟蹤性能。
本文針對一類不確定非線性MIMO系統(tǒng),提出一種基于徑向基函數(shù)(RBF)神經(jīng)網(wǎng)絡的自適應魯棒反饋控制方案。控制方案包括RBF神經(jīng)網(wǎng)絡、滑模控制器和H∞最優(yōu)控制器。利用RBF神經(jīng)網(wǎng)絡逼近非線性系統(tǒng)未知的理想反饋控制律,通過滑模控制器消除RBF神經(jīng)網(wǎng)絡重構(gòu)誤差和逼近誤差。針對外部干擾,進行了H∞最優(yōu)控制器的設計。采用二次穩(wěn)定性方法,對參數(shù)不確定性進行獨立處理,降低了傳統(tǒng)魯棒控制算法的保守性。基于李雅普諾夫穩(wěn)定性定理,提出的智能魯棒控制器能夠保證閉環(huán)系統(tǒng)的穩(wěn)定性和一定的跟蹤性能。最后,通過質(zhì)量-彈簧-阻尼系統(tǒng)的仿真實例驗證了所提出控制方案的有效性。
考慮由下面的微分方程表示的n階非線性多輸入多輸出(MIMO)系統(tǒng)的廣義形式:
x(n)=f(X)+g(X)u+d(t)
(1)

假設1未知非線性矩陣g(X)是有界的且非奇異的,即g-1(X)存在。

如果系統(tǒng)動力學是精確已知的,并且假設外部干擾被忽略,即函數(shù)f(X)和g(X)是完全已知的且d(t)=0,則理想反饋控制律可以設計為:
式中:xd是具有n階可導的期望軌跡;e=xd-x是跟蹤誤差;系數(shù)k1,k2,…,kn應適當選擇使得多項式h(s)=sn+knsn-1+k2s+k1的所有根都在s平面的左半平面內(nèi)。
將式(2)代入式(1)可得到誤差動態(tài)方程:
e(n)+kne(n-1)+…+k1e=0
(3)

f(X)=f0(X)+Δf(X)
g(X)=g0(X)+Δg(X)
假設3假設標稱函數(shù)g0(X)已知,其他函數(shù)和參數(shù)均未知。
假設3是合理的,因為一般情況下,非線性系統(tǒng)如機械系統(tǒng)或化學系統(tǒng)的控制矩陣g(X)相對容易獲得可接受的精度;此外,g(X)的參數(shù)不確定性也已考慮。

本文提出一種基于RBF神經(jīng)網(wǎng)絡的自適應魯棒反饋控制方法,該方法由一個自適應RBF神經(jīng)網(wǎng)絡控制器和一個魯棒混合補償器組成,可以表示為:
u=un+uc
(4)
式中:un是RBF神經(jīng)網(wǎng)絡控制器;uc是混合補償器。
由于f(X)和g(X)中包含的不確定性,式(2)是未知的,并且不能直接應用于式(1)。本文設計RBF神經(jīng)網(wǎng)絡來估計式(2)中的未知控制律u*,即:
un=ΘTΦ(xe)
(5)

定義RBF神經(jīng)網(wǎng)絡的逼近誤差為:
ε(xe)=u*-Θ*TΦ(xe)
(7)
假設4假設存在一個函數(shù)κ(xe)>0,使得對于所有的1≤i≤m,有|εi(xe)|≤κ(xe)。
將式(4)和式(5)代入到式(1)中,可得:
g-1(X)[e(n)+kne(n-1)+…+k1e]=

定義跟蹤誤差的導數(shù)為:
式(9)對于時間的導數(shù)可以寫成狀態(tài)空間方程,其形式如下:
(10)
其中
且B=B0+ΔB。其中
假設5ΔB表示參數(shù)的不確定性,并具有以下結(jié)構(gòu):
ΔB=MFN
式中:M和N是具有適當維數(shù)的已知常數(shù)矩陣;F∈R2n×2n是未知Lebesgue可測矩陣。F邊界為:
FTF≤I2n×2n
引理1設X、Y和F是具有適當維數(shù)的實矩陣且FTF≤I2n×2n。此外,對于任意標量α>0,
XFY+YTFTXT≤αXXT+α-1YTY
為達到一定的跟蹤性能,式(4)中的補償器uc可以設計為:
uc=uw+uh
(11)
式中:uw是消除RBFNN重構(gòu)誤差和逼近誤差的滑模控制器;uh是H∞控制器,其任務是消除未知外部干擾的影響,同時實現(xiàn)特定的H∞跟蹤性能。
對于基于RBF神經(jīng)網(wǎng)絡的自適應魯棒反饋控制的設計,考慮采用式(4)所示的RBFNN控制器和魯棒補償器。假設存在一個矩陣P=PT>0,使得下面的不等式成立:

利用式(12)的矩陣P,選取自適應訓練律為平滑投影[2]。考慮到當DΘ>0,δ>0時,有Ω0={Θ:ΘTΘ≤DΘ},ΩΘ={Θ:ΘTΘ≤DΘ+δ}。定義平滑投影映射:

因此,RBF神經(jīng)網(wǎng)絡控制器的訓練規(guī)律可以定義為:
式中:Γ是學習率。

uw=uwr+uwa
(15)
式中:uwr和uwa分別是消除RBFNN重構(gòu)誤差ε(xe)和逼近誤差的滑模控制器。uwr和uwa定義為:
然后,混合控制器式(4)、式(5)、式(11)、式(15)-式(18)可以保證閉環(huán)系統(tǒng)的所有變量有界,并且可實現(xiàn)如下的H∞跟蹤性能:

證明:定義Lyapunov函數(shù)為:
取Lyapunov函數(shù)對時間的導數(shù),并代入式(10)和式(12),得:
(uwr-ε(xe))TBTPz+
考慮式(16)中的重構(gòu)誤差補償器uwr和假設2,可以得到:
(uwr-ε(xe))TBTPz≤
-κ(xe)|BTPz|+|ε(xe)||BTPz|≤0
(22)
根據(jù)式(18)中的H∞控制器uh,將式(22)和式(23)代入式(21)中,可得:
根據(jù)假設5,有:

對式(25)從t=0到t=T進行積分,可以得到:
(26)
由于V(T)≥0,上述不等式導致了如下的L2準則:

由于Q是正定矩陣,考慮λmin(Q)zTz≤zTQz可得:
(28)

(29)

本文將所提出的方法應用于控制質(zhì)量-彈簧-阻尼器機械系統(tǒng)中,以驗證所提出的智能魯棒控制方法的有效性,如圖1所示是一個質(zhì)量-彈簧-阻尼器機械系統(tǒng)。質(zhì)量-彈簧-阻尼器-機械系統(tǒng)的動力學方程可以表示為[11]:

定義:


圖1 質(zhì)量-彈簧-阻尼器系統(tǒng)



為了進行比較,將提出的自適應神經(jīng)網(wǎng)絡魯棒二次鎮(zhèn)定反饋控制(ANNRQSFC)方法與基于計算力矩方法(CTC)和文獻[11]提出的神經(jīng)網(wǎng)絡魯棒控制(NNRC)方法進行比較。文獻[11]中所用的神經(jīng)網(wǎng)絡與本文所描述的結(jié)構(gòu)相同。圖2(a)和圖2(b)分別給出了質(zhì)量塊1和質(zhì)量塊2的位置跟蹤結(jié)果;圖3(a)和圖3(b)給出了位置跟蹤誤差;圖4(a)和圖4(b)分別給出了質(zhì)量塊1和質(zhì)量塊2的速度跟蹤結(jié)果;圖5(a)和圖5(b)給出了速度跟蹤誤差。跟蹤誤差的均方誤差(MSE)如表1所示。

(a) 質(zhì)量塊1的位置跟蹤

(b) 質(zhì)量塊2的位置跟蹤圖2 位置跟蹤結(jié)果

(a) 質(zhì)量塊1的位置跟蹤誤差

(b) 質(zhì)量塊2的位置跟蹤誤差圖3 位置跟蹤誤差

(a) 質(zhì)量塊1的速度跟蹤

(b) 質(zhì)量塊2的速度跟蹤圖4 速度跟蹤結(jié)果

(a) 質(zhì)量塊1的速度跟蹤誤差

(b) 質(zhì)量塊2的速度跟蹤誤差圖5 速度跟蹤誤差

表1 跟蹤誤差的均方誤差 單位:m/s
根據(jù)圖3(a)-圖3(b)、圖5(a)-圖5(b)和表1,通過將所提出的控制方法與CTC和NNRC進行比較,可以看出由于CTC方法僅利用系統(tǒng)的標稱值進行控制器設計,受系統(tǒng)中的不確定性和外界干擾的影響較大,跟蹤效果也較差。NNRC和本文所提出的ANNRQSFC方法均采用神經(jīng)網(wǎng)絡對系統(tǒng)中的不確定性進行逼近,然后用魯棒補償項來消除神經(jīng)網(wǎng)絡逼近誤差和外界干擾的影響,跟蹤誤差顯著減小。而本文所提出的ANNRQSFC方法采用二次鎮(zhèn)定方法,減小了魯棒項設計時對于逼近誤差和外界干擾上界的依賴,從而得到比NNRC方法更好的跟蹤效果。圖2-圖5和表1也可以驗證在存在不確定性和外界干擾的情況下,本文方法可以獲得更好的性能。
針對具有不確定性和干擾的非線性MIMO系統(tǒng),提出一種基于自適應神經(jīng)網(wǎng)絡的魯棒反饋控制方案。該控制方法將神經(jīng)網(wǎng)絡與自適應魯棒補償器相結(jié)合,其中神經(jīng)網(wǎng)絡控制器作為主控制器,自適應魯棒補償器用于補償神經(jīng)網(wǎng)絡的逼近誤差和外部干擾。此外,采用二次鎮(zhèn)定方法減小了傳統(tǒng)魯棒控制算法的保守性,實現(xiàn)閉環(huán)系統(tǒng)的穩(wěn)定性和給定的跟蹤性能。仿真結(jié)果表明,本文方法在具有不確定性的非線性系統(tǒng)的控制上表現(xiàn)出很好的魯棒性和有效的控制性能,并具有良好的抗干擾能力。