陳佳曄,穆榮軍,白瑜亮,張 新,崔乃剛
(哈爾濱工業大學航天工程系,哈爾濱 150001)
近年來,由于重復使用運載器(Reusable launch vehicle, RLV)具有降低發射成本、全球快速可達、飛行安全可靠等優勢,在航空航天、軍用民用等領域內成為研究熱點。由于RLV的再入段具有速度變化范圍大、模型不確定性顯著、外部環境存在嚴重干擾以及多通道存在較強耦合等特點,使得RLV再入段控制系統設計面臨更大挑戰[1-2]。因此,設計對飛行環境、外界干擾以及模型不確定性都具有魯棒性的先進控制器對于提升RLV再入段飛行控制性能具有重要意義。
近期眾多學者對再入飛行器控制系統設計方法進行了研究,如增益調度[3]、軌跡線性化方法[4]、動態逆[5]、狀態Riccati方程[6]、反演控制[7]等。盡管這些線性和非線性控制方法能夠跟蹤再入段RLV的制導指令,但滑模控制方法在考慮到模型不確定性和外部干擾時,則更為有效[8]。為更好地解決RLV再入段存在干擾無法建模的問題,根據其特點設計相應的干擾觀測器,以提高系統的魯棒性。在文獻[8]中,設計了一種基于干擾觀測器的非線性動態逆控制方法,控制導彈縱向自動駕駛,相關研究中的主要問題是:基礎非線性干擾觀測器(Basic nonlinear disturbance observer,BNDO)只能估計時不變干擾,如果干擾隨時間變化,BNDO對干擾的估計值將存在偏差。目前,雖然有眾多非線性觀測器可供使用,例如擴展卡爾曼濾波器、粒子濾波器以及非線性序貫+迭代時域估計方法等,但粒子濾波器和滾動時域估計方法的計算量較大,需要的計算時間較長[11]。因此,設計一種計算簡單、能夠估計時變干擾的觀測器的需求非常迫切。
本文針對RLV再入飛行階段的復雜特性,根據奇異攝動理論及時標分離原則將RLV動力學方程分解為內、外環子系統,由于在該飛行階段存在模型不確定性和未建模的外部時變干擾,設計基于2型模糊神經系統結構的SLDO,用于觀測和估計干擾,與傳統的干擾觀測器相比,該方法具有更強的魯棒性和更高的計算效率,且可在未知干擾邊界時對干擾進行有效估計。通過仿真校驗,基于SLDO設計的RLV多元超螺旋滑模控制器,可準確地實現再入段姿態跟蹤,并快速收斂。
RLV的剛體6自由度動力學方程是由3自由度平動方程以及3自由度轉動方程組成。
3自由度平動方程如下所示:

(1)
(2)
(3)

(4)
(5)

(6)

3自由度轉動方程表示為:

(7)

(8)

(9)
(10)
(11)
(12)
式中:α為攻角,β為側滑角,σ為傾側角,ωx,ωy,ωz分別表示滾轉角、偏航角以及俯仰角角速度,Jij(i,j=x,y,z)為飛行器的慣量,Mx,My,Mz分別表示滾轉、偏航和俯仰力矩。

(13)
(14)
(15)
為了盡可能準確地描述RLV再入飛行段過程,需要考慮由于簡化模型和不同通道之間的耦合帶來的模型不確定性。因此,一個更加實際的面向控制的動力學模型如下:

(16)
(17)
y=Θ
(18)


控制力矩矢量M如下所示:
(19)
式中:Cl,Cm,Cn是空氣動力學力矩系數,通過三次多項式擬合方法,將它們隨α∈[-10°, 40°],Ma∈[0.4,7]的變化擬合為:
Cl=0.02-0.05Ma-1.2×10-3α+0.02Ma2-
7×10-4Maα+1×10-4α2-1.7×10-3Ma3+
1.5×10-4Ma2α-1.8×10-5Maα2-
4.42×10-7α3
Cm=0.45-0.24Ma-6×10-3α+0.05Ma2+
1.7×10-3Maα+3.32×10-5α2-2.9×
10-3Ma3-1.4×10-4Ma2α+1.37×10-6
Maα2+1.5×10-7α3
Cn=-8×10-4-0.05Ma-5×10-3α+
0.014Ma2-0.008Maα+3×10-4α2-
0.005Ma3+0.005Ma2α-1×10-3Maα2-
3×10-5α3
為了方便后文設計,將上述由式(16)~式(18)描述的姿態控制動力學模型寫為下列形式:
(20)


2.1.1基本非線性干擾觀測器
在第1節建立的面向控制系統動力學模型(20)中,干擾d(t)在實際情況下是不可測量的,需要對其進行估計,從而提高控制系統的魯棒性。文獻[9]中提出的BNDO如下所示:
(21)

(22)
(23)

2.1.2基于T2NFS的自學習干擾觀測器
本文所設計的自學習干擾觀測器形式如下:
(24)
式中:τc,τr和τn分別代表傳統估計律項、魯棒估計律項和T2NFS項。圖2為自學習干擾觀測器的結構圖。

圖2 自學習干擾觀測器(SLDO)示意圖Fig.2 Framework of the self-learning disturbance observer(SLDO)
傳統估計律項定義如下:
(25)

魯棒估計律項形式如下:
(26)
lrZ為正,即lrZ>0,lr代表魯棒增益向量。
1)2型神經模糊結構
區間2型TSK(Takagi-Sugeno-Kang)的if-then模糊規則Rij定義如下:


按照A2-C0模糊系統規則,激活值計算方法如下所示:
(27)
網絡輸出公式如下所示:
(28)


2)基于滑模控制理論的學習算法
將滑模面設計為如下形式:
s(τc)=τc
(29)
式中:τc為傳統估計律輸出值,采用滑模面作為學習誤差來訓練基于滑模控制理論的學習算法,過程如下所述。
T2NFS參數的適應規則:

(30)
(31)
ηsgn(s)
(32)
(33)
(34)


證.李雅普諾夫函數寫為如下形式:
(35)
根據文獻[10]可得:
(36)

(37)

由上述設計可以看出,在2型神經模糊結構中采用基于滑模控制理論的學習算法具有自適應能力,因此SLDO能夠在未知干擾的上界以及干擾對時間的一階導數的上界時對干擾進行估計。
根據奇異攝動理論及時標分離的原則,系統中的角速度與姿態信息變化快慢不同,將控制系統分為快慢回路,使控制系統能夠在存在模型不確定性以及外部干擾時,跟蹤指令姿態角Φd以及期望角速度ωd。
2.2.1外環控制器設計
對于子系統(16),設計實際控制ωd使得姿態角Φ能夠在考慮模型不確定性Δf的情況下,在有限時間內跟蹤制導指令Φd。
定義跟蹤誤差為:
eΦ=Φ-Φd=[eΦ1,eΦ2,eΦ3]T
(38)
eΦ的導數為:
(39)
為了使系統以較快的速度收斂到平衡點,設計新型滑模面如下:

(40)
其中,γΦ1≥1,0<γΦ2<1,kΦ>0。
對式(40)求導可得:
(41)
設計基于多元超螺旋算法的快速到達控制律如下所示:
(42)
然后,將式(42)代入式(41),設計連續虛擬控制律為:
(43)
2.2.2內環控制器設計
設計控制力矩M使ω能夠在考慮到模型不確定性ΔJ和外部干擾Δd時,跟蹤上期望指令ωd。
根據方程(17),可得如下方程:
(44)

內環多變量SLDO被設計為方程(48)和(51)。
(45)
輔助滑模變量如下:
sM=eω-wM
(46)
方程(46)對時間的導數為:
(47)

(48)
將式(48)代入式(47)可得:
(49)
采用類似外環控制器的設計方法設計內環系統控制器,定義快速滑模面:

(50)
式中:kω>0,常數γω1≥1,0<γω2<1。
應用與式(42)相似的控制律可得:
(51)
2.2.3穩定性證明

(52)
對于系統(52),定義如下李雅普諾夫候選函數:
(53)

根據文獻[11]中類似的證明過程,若取
可得:


可以得到結論:如果參數kΦ1,…,kΦ4都選擇合適,sΦ以及其導數能夠內收斂到零。
(54)
考慮到如下正定李雅普諾夫函數:
(55)
其導數可以被寫為:


針對系統(16)~(18),設置不確定性參數為ΔI=random(0,1)×10%I0,其中I0(kg·m2)為RLV再入段轉動慣量常數矩陣,其形式為I0=diag(56241,1×106,985392) kg·m2,外部時變干擾d(t)×105(N·m),其中
分別采用BNDO和SLDO兩種觀測器對干擾進行觀測,得出兩種觀測器估計值以及干擾估計誤差,如圖3所示。從圖3可以看出,對于階躍類常值的干擾,SLDO與BNDO對干擾的估計速度相近,都能夠比較快地估計出干擾值并且收斂至真值附近;對于隨時間變化的干擾值,SLDO的收斂速度比BNDO快,收斂效果也比BNDO好。仿真結果說明,SLDO可以有效地估計時變干擾,收斂速度和收斂效果都優于BNDO。

圖3 BNDO或SLDO對干擾觀測值Fig.3 Curves of estimation value from BNDO and SLDO
針對RLV再入段對控制系統進行仿真校驗,首先選取PID控制方法與本文所提出的控制方法進行對比分析,仿真結果如圖4~圖5所示。

圖4 PID控制系統以及所提出控制方法的跟蹤曲線Fig.4 Tracking curves of the PID control system and the proposed control system
圖4中曲線分別為PID控制系統以及本文所提出控制系統的攻角、側滑角以及傾側角跟蹤軌跡曲線,圖5為兩種控制方法輸出的誤差曲線。

圖5 PID控制系統以及所提出控制方法的姿態跟蹤誤差Fig.5 Tracking error of the PID control system and the proposed control system
從圖4~5可以看出,本文所提出控制系統對三個角的最大誤差分別為1.05°,0.2°,1°以內,而PID控制系統的三個角最大誤差分別為3.89°,2.3°,6.1° 以內,本文所提出的控制器在系統存在不確定性時的跟蹤誤差小于傳統PID控制器的跟蹤誤差,收斂速度快、收斂效果好。

圖6 有無SLDO的控制系統輸出曲線Fig.6 Curves of the outputs from control system with and without SLDO
其后,選取有無SLDO的控制系統進行仿真對比分析,圖6分別為有無SLDO情況下的控制系統輸出的姿態角Φ曲線,通過仿真結果可以看出,在存在未知時變干擾時,基于SLDO的控制系統與不含有SLDO的控制系統相比,精度更高、抖動更小、收斂速度更快、控制效果較好、滿足控制需求。
本文針對RLV再入段存在時變不確定干擾情況下的控制問題進行了研究。提出了自主學習干擾觀測器,該觀測器結合了基礎非線性干擾觀測器、傳統估計律、魯棒估計律以及T2NFS項,實現了在未知干擾邊界情況下對時變干擾的觀測和估計,并分析和證明了觀測器學習算法的穩定性。然后提出了由SLDO驅動的多元超螺旋滑模控制方法,根據干擾估計值調整控制器的參數,從而使控制器更具魯棒性,實現對姿態指令的跟蹤。以某型RLV再入段為研究對象,進行數值仿真,通過BNDO和SLDO的干擾觀測對比,校驗了SLDO對時變干擾的估計能力優于BNDO;通過PID控制系統與SLDO驅動的控制系統對比,校驗了在系統中存在時變干擾時,SLDO驅動的控制系統的收斂更快、收斂效果更好;通過對有無SLDO情況下的控制系統輸出對比,校驗了由SLDO驅動的多元超螺旋控制方法能夠有效估計外部干擾和模型不確定性,提高控制精度。