運載火箭推力故障下基于智能決策的在線軌跡重規劃方法

2021-12-08 08:07:22譚述君張立勇吳志剛

宇航學報 2021年10期

譚述君，何驍，張立勇，吳志剛

(1. 大連理工大學工業裝備結構分析國家重點實驗室，大連 116024；2.大連理工大學遼寧省空天飛行器前沿技術重點實驗室，大連 116024 3. 大連理工大學電子與信息工程學院，大連 116024)

0 引言

隨著航天科技的迅猛發展，人們對運載火箭的可靠性提出了越來越高的要求。發動機作為火箭動力裝置，是全箭飛行可靠性及安全性的決定性因素，其可靠性關乎整個飛行任務的成敗。在實際飛行任務中，運載火箭發動機故障等原因易造成推力下降，如果繼續沿用標稱彈道條件下的制導控制方案將難以完成任務，會導致飛行任務部分失敗或全部失敗。在世界航天史上，有很多由于發動機故障導致任務失敗的教訓，如俄羅斯聯盟-U曾因三級發動機燃料管堵塞而失去推力，最終發射貨運飛船任務失敗。隨著自適應制導技術[1-4]的發展，一些運載火箭在發動機故障情況下，通過調整飛行程序，仍能完成入軌。德爾塔4在發射第3顆GPS-2F 衛星任務中利用制導系統重新生成飛行軌跡，對上面級發動機故障時的推力下降進行了及時補償，充分利用剩余燃料成功地完成了衛星入軌。然而，如果故障引起的運載能力損失較大，即使延長飛行時間，依然不能將載荷送入目標軌道。

為了主動避免有效載荷的墜落，需要依據故障狀態在線重規劃救援軌道和飛行軌跡，使載荷進入救援軌道。近年來，箭載計算機計算性能的提高使得在線軌跡規劃成為可能[5-8]。對于推力下降故障下的在線救援問題，目前主要的思路是直接求解推力故障引起的目標軌道未定的軌跡重規劃問題，即優化一條軌跡使救援軌道與原目標軌道的誤差最小[9-10]。文獻[9]提出了一種在運載火箭推力下降故障下的自主救援策略和算法，結合入軌點地心角估計、凸優化、自適應配點法等，為重規劃問題提供一個好的初值，以提高在線計算效率和收斂性。文獻[10]為保證動力系統故障時的飛行安全，提出了一種基于凸優化的運載火箭在線軌跡優化算法，以得到一種高精度、高效率的在線軌跡優化方法。上述方法把最優救援軌道的決策和飛行軌跡優化兩個問題耦合在一起優化，由于救援軌道的未知，最優解的搜索空間很大，大大影響在線計算效率和穩定性。對于在線軌跡優化問題，不合理的初始值會導致優化問題的計算耗時長[11-12]。若能快速地決策出最優救援軌道，為后續在線軌跡優化提供合理的終端約束，那么在線軌跡優化問題的復雜度則會大大降低，從而整體上提高在線救援的計算效率。

最優救援軌道決策需要綜合考慮全箭動力學、故障信息以及軌跡規劃中的過程約束和終端約束，通過求解一個目標軌道未定的軌跡規劃問題得到[13-15]。其中涉及復雜的邏輯推理和眾多的約束條件，是一個典型的知識處理過程，比較適合采用機器學習的方法加以解決。徑向基神經網絡僅用少量的神經元，就具有映射多維非線性系統的能力，具有良好的函數逼近性能[16-19]。與標準前饋反向傳播網絡相比，徑向基神經網絡具有學習速度快、陷入局部極小收斂機會小等優點[20]。

因此，本文將推力故障下的軌跡重規劃問題轉化為最優救援軌道的在線智能決策和成熟的燃料最優軌跡規劃問題進行求解。以發生故障軌道平面內最大圓軌道作為最優救援軌道，提出推力下降故障情況下基于智能決策的在線軌跡重規劃方法。本文的組織結構如下：首先介紹推力下降故障情況下的軌跡重規劃問題；其次給出基于智能決策的在線軌跡規劃方法；然后是救援軌道決策模型的評估、在線軌跡優化的結果與討論；最后得出結論。

1 問題描述

以兩級運載火箭為研究對象，假設推力下降故障發生在二級飛行段[21]。此時大氣稀薄，可以忽略氣動力影響。定義地心慣性坐標系：原點在地心，X1軸在赤道平面內指向發射時刻本初子午線方向，Z1軸垂直赤道平面指向北極，Y1軸滿足右手定則。在地心慣性坐標系中建立火箭的上升段二級飛行動力學方程如下：

(1)

(2)

(3)

式中:r，v為運載火箭的位置、速度向量。μ為地球引力常數，m是火箭的總質量，Isp為火箭的發動機比沖。u=[ux,uy,uz]T為發動機的推力單位矢量分量，是可控的。當發動機發生故障，推力下降的比例是η，推力大小是(1-η)Tnom,Tnom是發動機標稱推力。推力下降故障情況下，發動機比沖不變，推進劑的秒耗量也下降η，總飛行時間可以超過標稱的飛行時間。下文所有計算都是以式(1)～(3)作為狀態方程，包含7個狀態量x=[rT,vT,m]T和3個控制量u=[ux,uy,uz]T。

假定發動機推力下降故障出現時刻為t0,運載火箭需要以t0時刻的狀態為起始點進行軌跡重規劃，因此起始點等式約束條件可表示為:

x(t0)=x0

(4)

式中:x0是起始點的狀態。軌道根數與終端狀態之間的非線性關系表示為:

[af,ef,if,Ωf,ωf]T=ψ(r(tf),v(tf))

(5)

其中:tf為終端時刻，af,ef,if,Ωf,ωf分別是終端軌道半長軸、偏心率、傾角、升交點赤經、近地點幅角。軌道傾角和升交點經度可用地心慣性坐標系下位置與速度表示如式(7)所示，半長軸、偏心率和近地點幅角如式(9)～(11)所示。

hf=r×(tf)v(tf)=[hx,hy,hz]T,

(6)

cosif=hz/hf,tanΩf=-hx/hy

(7)

(8)

(9)

(10)

(11)

其中:r×(tf)為矢量r(tf)對應的叉乘矩陣，v×(tf)為矢量v(tf)對應的叉乘矩陣。

定義最低安全軌道高度為hsafe，終端質量m(tf)和高度r(tf)應滿足：

m(tf)≥mf，r(tf)-R0≥hsafe

(12)

其中:mf表示剩余燃料耗盡后運載火箭與有效載荷的總質量，R0表示地球半徑。

推力下降故障的救援類型可分為以下三種，如圖1所示。①可飛入目標軌道。推力下降較小或推力故障的時刻較晚。②可飛入救援軌道。此時火箭的運載能力損失較大，不能將載荷送入目標軌道。通過在線救援軌道決策與飛行軌跡規劃，可將載荷送入救援軌道。③運載能力下降非常大，火箭可達的軌道低于安全軌道，任務失敗。安全軌道定義為以hsafe為軌道高度的圓軌道。文本研究的救援軌道的智能決策對應于第②種救援類型。

圖1 推力下降情況下的軌跡重規劃示意圖Fig.1 Schematic diagram of the trajectory re-planning in the case of thrust drop

發生推力下降故障時，為避免墜落，提升軌道高度是首要目標。同等近地點高度下將載荷送入圓軌道所需能量小于橢圓軌道，因此在當前軌道面內搜尋最大高度圓軌道，將其作為最優救援軌道[9]。此時，推力故障下的軌跡重規劃問題描述為半長軸最大(MTA: maximum terminal semi-major axis)優化問題：

(13)

可以看出，推力故障下的軌跡重規劃問題(MTA)中的目標軌道是未定的，這將導致搜索空間顯著增加，直接求解上述MTA優化問題存在計算效率低和不易收斂的困難。

2 最優救援軌道的決策模型

本文將推力故障下的軌跡重規劃問題(MTA)轉化為最優救援軌道的在線智能決策和成熟的燃料最優軌跡規劃問題進行求解，以提高在線計算效率，如圖2所示。在離線部分，遍歷不同推力下降故障狀態，基于動力學模型離線優化軌跡，建立“故障狀態-救援軌道”樣本集，以此為基礎離線訓練徑向基神經網絡，建立救援軌道決策模型。在線部分，將救援軌道決策模型遷移到在線應用，利用實際飛行的故障狀態作為輸入，在線決策出救援軌道。決策出的救援軌道作為終端約束，以此為基礎構建燃料最優軌跡規劃問題進行求解。

圖2 救援軌道決策策略Fig.2 Rescue orbit decision-making strategy

2.1 救援軌道決策模型的離線建立

在離線部分，基于動力學模型通過遍歷大量的故障情況建立運載火箭的“故障狀態-救援軌道”樣本集，在此基礎上建立用于救援軌道決策的徑向基神經網絡模型。動力學模型中復雜的非線性關系用機器學習模型逼近，進而在線應用決策出救援軌道。利用機器學習模型的快速“輸入-輸出”能力，避免了基于動力學模型在線優化的繁重計算。

2.1.1樣本集產生

發生故障前，如果運載火箭能準確跟蹤標稱彈道，那么推力下降的大小、發生推力故障的時刻足以描述所有故障模式。實際飛行中，由于存在噪聲干擾，火箭的位置、速度、質量在標稱彈道附近。因此，故障的特征是故障發生的時間、推力下降的大小、位置、速度、質量。

遍歷不同故障狀態，構建的MTA優化問題，采用自適應偽譜法[22-23]求解最優控制問題，如圖3所示。為了保證知識庫的豐富性，樣本集的產生需遍歷盡可能多的故障狀態。求解得到的“故障模式-救援軌道”數據集，可作為徑向基神經網絡訓練的樣本集。

圖3 樣本集產生流程圖Fig.3 Sample set generation flowchart

為了消除各維數據間數量級差別，避免因為輸入、輸出數據數量級差別較大而造成的預測誤差較大，需要對數據做歸一化處理。采用最大最小法對數據歸一化，將所有數據規范化到[-1,1]之間。

2.1.2救援軌道決策模型建立與訓練

徑向基神經網絡是一種局部逼近網絡，通常由輸入層、隱藏層、輸出層三層網絡構成，如圖4所示。隱藏層有多個神經元，每個神經元由徑向基函數構成，其基函數中心的維度取決于輸入變量的維度。具有足夠多隱層神經元的徑向基神經網絡能以任意精度逼近任意連續函數[24]。徑向基神經網絡的輸入的特征包括推力故障的時刻、推力下降的大小、位置、速度和質量，輸出的最優救援軌道根數包括軌道半長軸、傾角、升交點經度。

圖4 徑向基神經網絡Fig.4 Radial basis function neural network

隱藏單元由基函數激活，本文采用高斯基函數，第j個隱藏層的輸出為：

(14)

(15)

式中:wjk為第j個隱層神經元到第k輸出神經元的權重。為了達到合適的逼近精度，通過訓練來確定以下參數：隱藏層神經元的數量、每個隱藏層神經元基函數中心、徑向基函數輸出傳遞到求和層的權重。

正交最小二乘法(Orthogonal least squares,OLS)是由Chen等[25]提出的一種選擇RBF網絡數據中心的方法，訓練的網絡規模小，隱藏層采用少量的神經元節點就能映射非線性關系。OLS形式的徑向基神經網絡中神經元數量參數較少，神經元連接權重參數也少。因此遷移到在線應用的神經網絡模型占用的存儲空間較小，適合用于救援軌道決策。

(16)

(17)

(18)

(19)

M個矢量的能量總貢獻為:

(20)

若采用傳統的直接法,最優救援軌道是基于動力學模型優化求解獲得，而救援軌道決策模型把在線基于動力學模型優化的任務離線完成，分擔了在線最優救援軌道決策的計算負荷。

3 基于救援軌道決策的在線軌跡重規劃

本節提出的基于智能決策的在線軌跡優化過程如圖5所示。當運載火箭飛行中出現推力下降時，故障監測系統可以測到推力下降的時刻和大小。將當前故障狀態輸入到箭上裝訂的離線訓練好的救援軌道智能決策模型，可快速決策出救援圓軌道根數。決策出的軌道根數包括半長軸、軌道傾角和升交點赤經，作為在線軌跡規劃的終端約束，通過求解對應的燃料最優(MFC:minimum fuel consumption)軌跡規劃問題完成故障下的在線軌跡重規劃。

圖5 基于智能決策的在線軌跡重規劃Fig.5 Online trajectory replanning based on intelligent decision-making

由于圓軌道不存在近地點幅角的概念，軌跡優化問題的終端約束只有四個。基于動力學模型、約束在線構建燃料最少(MFC)優化問題：

(21)

采用徑向基神經網絡的救援軌道決策模型執行效率非常高，因此本節提出的基于智能決策的在線軌跡重規劃方法的計算效率主要取決與燃料最優軌跡規劃問題(MFC)的求解。MTA優化問題中的目標軌道是未定的，這將導致很難給定合理的初值，直接求解上述MTA優化問題存在計算效率低和不易收斂的困難。與MTA優化問題相比，MFC優化問題有許多成熟的軌跡設計方法，本文采用基于合理初值的自適應偽譜法在線求解。MFC優化問題的目標軌道根數是已知的，軌跡優化的初值較為合理，具有更好的收斂性和高效性，適合用于在線應用。

4 仿真校驗

在本節中，以運載火箭的整個二級飛行階段為研究對象，發射參數見表1。地球引力系數μ設為3.986×1014m3/s2，假設地球是一個均勻的球體，地球半徑R0等于6378.14 km。第二階段上升階段為真空環境，其中Isp是發動機比沖，g0是海平面重力加速度，等于9.8 m/s2。

表1 發射參數Table 1 Launcher parameters

表2給出了發射慣性坐標系中的第二階段初始狀態。發射慣性系原點為發射點，X0軸指向火箭水平面內發射方向，Y0軸沿地心與發射點的連線方向指向天空，Z0軸滿足右手定則。

目標軌道的近地點和遠地點高度分別為200 km和300 km。目標軌道的軌道要素見表3。安全軌道高度hsafe=160 km。

表2 二級的初始狀態Table 2 Initial states of second stage

本文的數值仿真都是在英特爾酷睿i7-7700 CPU 3.60 GHz電腦上進行的，MATLAB版本為2018b。

表3 目標軌道的軌道根數Table 3 Target orbital elements

4.1 救援軌道決策模型評估

依據2.1.1節樣本集的建立方法，建立各故障狀態的救援軌道根數的樣本集。樣本集建立的故障的狀態分布按發生時間0～375 s，步長為1 s；推力下降大小13%～40%，步長為1%。除去可進入目標軌道和救援軌道高度低于160 km的故障狀態，需要救援的故障狀態如圖6所示。圖6所示的故障區間用傳統的攝動制導、迭代制導無法將載荷送入目標軌道。

圖6 訓練集與測試集Fig.6 Training set and test set

推力下降的越大或推力發生的故障的時間越早，火箭運載能力的損失越大。在樣本集中，隨機抽取90%的數據作為訓練集，剩余10%的數據作為測試集。采用徑向基神經網絡來建立故障狀態到救援軌道的非線性映射。徑向基神經網絡訓練的擴散因子是1，最終訓練好的隱藏層神經元數量是50。測試集軌道根數誤差的分布圖如圖7～圖9所示。半長軸決策的絕對誤差在[-0.25,1.25] km區間，相對誤差在0.015%以內。軌道傾角、升交點赤經的絕對誤差在10-4度以內，最大相對誤差在10-5量級。

圖7 半長軸決策誤差分布Fig.7 Error distribution of semi-major axis decision

圖8 軌道傾角決策誤差分布Fig.8 Error distribution of inclination decision

圖9 升交點赤經決策誤差分布Fig.9 Error distribution of longitude of the ascending node decision

采用均方根誤差(Root mean square error,RMSE)來評估救援軌道半長軸決策的結果：

(22)

式中:N為測試集樣本個數，yi樣本集中半長軸，y′i為機器學習模型決策出的半長軸。

表4是不同機器學習模型的結果均方根誤差的對比。線性回歸得到的均方根誤差比非線性回歸方法的大，是因為故障狀態與救援軌道根數是非線性關系，適合用非線性的函數逼近方法。與其他幾種的機器模型相比，徑向基神經網絡模型的RMSE更小，意味著其在映射“故障狀態-救援軌道”具有更好函數逼近的效果。

表4 不同機器學習模型的RMSETable 4 RMSE of different machine learning models

4.2 推力下降情況下在線軌跡優化

救援軌道決策需要將離線訓練的徑向基神經網絡遷移到在線應用。以推力在104 s下降25%故障為例，分別采用直接求解MTA優化問題、本文提出的基于智能決策的在線軌跡重規劃方法(RBFNN+MFC)去在線求解軌跡，其中MTA問題和MFC問題都采用自適應偽譜法求解，結果如圖10～圖13所示。自適應偽譜法所采用的配點是正交Legendre多項式的零點。對于104 s下降25%故障，直接求解MTA問題數值方法的最終離散點是209，RBFNN+MFC問題數值方法的最終離散點是41。兩種在線軌跡優化方法都在104 s故障發生后調整了推力方向，延長飛行時間進入最優救援軌道。從圖10、表5可以看出MTA方法和RBFNN+MFC方法的入軌海拔高度都是186.5 km，說明智能決策模型給出了與最優救援軌道一致的結果。從圖13可以看出，標稱的推進劑是富余711.4 kg，發生故障后，為了使救援軌道的高度最優，MTA和RBFNN+MFC方法的燃料全部用完。

圖10 海拔高度曲線Fig.10 Curve of altitude

圖11 速度曲線Fig.11 Curve of velocity

圖12 發動機推力單位矢量分量Fig.12 Unit vector component of engine thrust

圖13 推進劑質量曲線Fig.13 Curve of propellant mass

表6給出了MATALB環境下計算時間。對于在線軌跡重規劃，直接求解MTA問題的計算時間是470 s，采用RBFNN+MFC方法的計算時間是0.7657 s，計算效率提高了兩個數量級以上。同時在線救援軌道決策的計算時間在0.0057 s以內，相對于MFC問題的計算時間(0.76 s)幾乎可以忽略，這與前面的分析是一致的。

表5 不同方法入軌的軌道根數Table 5 Orbital elements of injection point by different methods

表6 計算時間Table 6 Calculating time

5 結論

針對運載火箭推力下降故障問題，本文引入機器學習方法，提出了一種基于智能決策的在線軌跡重規劃方法，將原救援軌道未定的軌跡規劃問題轉化為最優救援軌道的在線智能決策和成熟的燃料最優軌跡規劃問題進行求解，顯著簡化了在線軌跡重規劃問題的求解。仿真結果顯示本文提出的方法與直接求解原軌跡重規劃問題相比，計算效率提高了兩個數量級以上，同時給出一致的最優救援軌跡，非常有利于在線救援軌跡的重規劃。

值得注意的是，如果救援軌道的半長軸決策結果是正誤差，推進劑不能支持火箭到達半長軸正誤差對應的軌道。因此在工程應用中，可適當降低半長軸決策結果作為燃料最優軌跡規劃問題的終端約束，以保證軌跡的存在性。