彭 坤 果琳麗 向開恒 王 平
(中國空間技術研究院 載人航天總體部,北京100094)
徐世杰
(北京航空航天大學 宇航學院,北京100191)
在進行無人月面勘探或載人登月任務時,都需要使著陸器實現月球表面軟著陸,以保證儀器設備以及航天員的安全.在典型的月球軟著陸過程中,從環(huán)月軌道下降到月球表面主要可分為2個階段:霍曼轉移段和動力下降段.其中,霍曼轉移段指著陸器從環(huán)月停泊軌道通過霍曼變軌進入環(huán)月橢圓軌道,并運行至近月點;動力下降段[1]指著陸器從近月點處開始發(fā)動機制動抵消水平速度,并最終以較小速度著陸月面.由于霍曼變軌速度增量較小,著陸器的大部分燃料都消耗在動力下降段,故有必要對動力下降段的著陸軌跡進行優(yōu)化設計以減少燃料消耗.
當前,求解月球軟著陸軌跡優(yōu)化這類最優(yōu)控制問題的方法有基于Pontryagin極大值原理的間接法以及基于參數化方法的直接法[2].王大軼等[3]和趙吉松等[4]分別用間接法搜索最優(yōu)月球軟著陸軌跡.由于間接法初值難以猜測,大部分學者均采用直接法進行月球軟著陸軌跡優(yōu)化研究.王劼等[5-6]、朱建豐等[7]和段佳佳等[8]分別用序列二次規(guī)劃(SQP,Sequential Quadratic Programming)方法、遺傳算法(GA,Genetic Algorithm)、自適應模擬退火遺傳算法以及蟻群算法對著陸軌跡進行優(yōu)化.孫軍偉等[9]直接將著陸軌道進行離散,采用SQP方法求解了月球軟著陸軌道優(yōu)化問題.彭祺擘等[10]、單永正等[11]和梁棟等[12]分別用高斯偽譜法、miser 3.2最優(yōu)控制軟件和李雅普諾夫直接法求解了月球定點軟著陸軌道優(yōu)化問題.為提高直接法的優(yōu)化速度,王明光等[13]和趙吉松等[14]分別基于偽光譜和廣義乘子法進行了月球軟著陸軌道快速優(yōu)化設計.直接法雖然不存在初值敏感問題,但其尋優(yōu)結果最優(yōu)性得不到保證.為保證尋優(yōu)結果的最優(yōu)性,同時避免初值敏感問題,文獻[15-16]采用混合法思想求解月球軟著陸軌跡優(yōu)化問題.混合法是將直接法和間接法結合起來的一種綜合方法.它一方面引入伴隨狀態(tài),利用伴隨方程來確定控制函數,另一方面又不直接求解兩點邊值問題,而通過參數優(yōu)化求解最優(yōu)控制問題.但文獻[15-16]的混合法求得的終端速度誤差較大.
本文基于混合法的思想將月面軟著陸軌跡優(yōu)化問題轉化為以伴隨變量初值和終端時刻為待優(yōu)化變量的最優(yōu)化問題,并應用全局優(yōu)化和局部收斂能力較好的隨機優(yōu)化算法——引導人工免疫算法(GAIA,Guiding Artificial Immune Algorithm)進行優(yōu)化.將GAIA混合法優(yōu)化結果與傳統間接法和直接法進行比對,從而驗證該優(yōu)化方法的優(yōu)化性能.
忽略動力下降段末段的不共面影響,將動力下降段近似為在同一個平面內飛行,建立如圖1所示二維坐標系描述月面著陸器的軟著陸飛行過程.該坐標系原點O為月心,極軸Ox指向動力下降起始位置.考慮動力下降飛行時間較短,忽略太陽和地球的第3天體引力攝動、月球非球形攝動和月球自轉速度.著陸器在軟著陸過程中只受月球引力FL和制動發(fā)動機推力Ft的作用.

圖1 月球軟著陸示意圖
著陸器的運動可由二維極坐標系下的位置速度攝動方程[5]來描述,并將著陸器質量作為狀態(tài)變量加入狀態(tài)方程中,其形式如式(1)所示:

式中,m為質量;μL為月心引力常數;w為比沖,m/s.
設初始狀態(tài)為環(huán)月停泊軌道近月點[3],終端狀態(tài)為著陸月面.設初始時刻t0=0,終端時刻tf可變,邊界條件數學表述如下:

式中,r0為近月點處的月心距;vθ0為近月點處的軌道速度;m0為著陸器動力下降前初始質量;rf為月球半徑.
為提高系統模型的收斂性,對其進行歸一化處理.設距離和質量參考量為r*=r0,m*=m0,則歸一化狀態(tài)方程為

相應的邊界條件為

最優(yōu)月球軟著陸軌跡為燃料消耗最少的飛行軌跡,即要求最終質量最大,其性能指標設置如下:

利用Pontryagin極大值原理可得月球軟著陸歸一化模型的哈密頓函數為

1)最優(yōu)推力方向角u為

2)伴隨方程為

由式(9)、式(10)以及式(4)可知,只要給出4個伴隨變量的初值,就可逐步推出下一時刻的最優(yōu)推力方向角和軟著陸狀態(tài)變量.為避免伴隨變量的初值猜測,混合法將4個伴隨變量初值λr(0),λvr(0),λvθ(0),λm(0)作為優(yōu)化變量,采用優(yōu)化算法對其進行優(yōu)化.同時,由于終端時間f自由,也需將其作為優(yōu)化變量.故混合法的優(yōu)化變量為

聯立式(4)和式(10)就可得到混合法優(yōu)化模型的狀態(tài)方程.其中,狀態(tài)變量θ可與其他變量解耦.為簡化優(yōu)化模型,狀態(tài)方程中暫時去掉極角θ和其伴隨變量的微分方程.
在優(yōu)化模型中,評價函數除考慮著陸器最終質量外,還需考慮終端約束的滿足情況.本文將終端狀態(tài)誤差以罰函數形式引入評價函數faff(X)中,其表達式如下:

式中,X=[λr(0),λvr(0),λvθ(0),λm(0),f]T;σ1,σ2,σ3為罰函數權重.
權重系數在尋優(yōu)過程中進行自適應調整,其表達式如下:

式中,β 為變化率系數,β∈[0,1];Tλ為初始參數;g為當前尋優(yōu)代數;gmax為最大代數.為加強罰函數前期約束功能,將權重系數值與1取最大值.
經過混合法處理,月球軟著陸軌跡優(yōu)化問題轉化為以伴隨變量和終端時間為優(yōu)化變量的高維非線性規(guī)劃問題.常用的非線性規(guī)劃問題求解方法為SQP,但其存在全局優(yōu)化性能不佳、對初始值敏感等問題.在隨機優(yōu)化算法方面,GA應用最廣,但也存在局部收斂和收斂速度慢等問題.本文采用全局優(yōu)化性能好和局部搜索能力強的GAIA對該非線性規(guī)劃問題進行求解.
人工免疫算法將免疫系統產生抗體的過程與尋優(yōu)過程一一對應,其算法流程如圖2所示.

圖2 人工免疫算法流程
1)親和度計算.設親和度如式(11)所示.
2)濃度和激勵度計算.激勵度計算公式[17]如下:

式中抗體濃度fden(XI)計算公式[17]如下:

式中 n,XI,fbff(XI,Xi)的含義見文獻[17].
3)免疫操作.對種群中優(yōu)質抗體進行選擇、克隆和變異,搜索最優(yōu)解.引導型變異計算公式[17]如下:

式中 XI,j,k,δ,Pr,Pm,Xbj,τ,G 的含義見文獻[17].選出最優(yōu)變異抗體AI替代所選優(yōu)質抗體XI.
4)種群刷新.設置淘汰機制,對種群中劣質抗體進行刪除,并生成相同個數的新抗體進行補足.
為便于尋優(yōu)結果的比較,選擇文獻[7]中的算例進行仿真.著陸器初始條件為r0=1 753 km,θ0=0°,vr0=0 m/s,vθ0=(9.65 × 10-4·r0)m/s,m0=600 kg.終端約束為 rf=1738 km,vrf=0 m/s,vθf=0 m/s.μL=4.902 75 × 1012m3/s2,設 Ft=λvθ(0) > 0,且.由橫截條件和伴隨方程可知,λm(tf)=0,˙λm<0,故λm(0)>0.由多次搜索結果可知λr(0)>0.由于伴隨變量的初值等比例放大或縮小不影響尋優(yōu)結果,可將4個伴隨變量初值設置在[-1,1]之間.故可設λvr(0)∈[0,1],λvr(0)∈[- 0.1,0],λvθ(0)∈[0,1],λm(0)∈[0,1].月球軟著陸的時間一般在600 s左右,設置f∈[0.5,0.7].
在GAIA參數設置中,令種群抗體個數n=300,gmax=60,τ=15,Pm=0.8,激勵度參數 a=2,G自適應調整.為保證搜索到全局最優(yōu)解,進行10次GAIA尋優(yōu),尋優(yōu)結果均收斂.將尋優(yōu)結果與間接法結果進行比對,驗證其是否為最優(yōu)解,如表1和圖3所示.1350 N,w=2 940 m/s.在罰函數法中,取 β =0.005,T2=0.1;直接令σ1=5σ2,σ3=σ2.
由月球軟著陸的優(yōu)化經驗[3]可知,初始推力方向角應約為180°,由式(10)可知,λvr(0)<0和

表1 GAIA混合法與間接法尋優(yōu)結果對比
由表1可知,GAIA混合法尋優(yōu)結果平均值的終端狀態(tài)誤差雖比間接法(基于Pontryagin極大值原理)的誤差大,但其誤差量級已經非常小,足夠滿足著陸器軟著陸的要求.同時其燃料消耗與間接法的結果相同,說明GAIA混合法的尋優(yōu)精度非常高.
圖3為GAIA混合法10次尋優(yōu)的最優(yōu)結果與間接法求解結果的對比圖.由圖3可看出,采用GAIA混合法和間接法得到的月心距、徑向速度、橫向速度和推力方向角變化曲線完全重合,GAIA混合法的尋優(yōu)結果即為理論最優(yōu)解.相比于間接法,GAIA混合法的猜測初值收斂區(qū)間更大,敏感度低.以λvr(0)的單個伴隨變量初值收斂區(qū)間[4]為例,其理論初值為0.481 2,間接法的收斂區(qū)間為[- 0.247 8,2.563 6];而 GAIA 混合法在[-30000,30000]范圍內均可收斂,即收斂區(qū)間至少涵蓋[-30 000,30 000],遠大于間接法的收斂區(qū)間.當軟著陸邊界條件和著陸器參數改變、理論初值未知時,GAIA混合法僅需修改仿真參數和調整初值取值范圍就可重新求得最優(yōu)軌跡,通用性強.

圖3 控制變量與狀態(tài)變量變化曲線
表2為GAIA混合法尋優(yōu)結果與基于十進制蟻群算法(DACA)[8]和基于自適應模擬退火遺傳算法(ASAGA)[7]的直接法尋優(yōu)結果的對比.由表2可看出,除月心距誤差略大外,GAIA混合法的其他終端誤差比DACA直接法和ASAGA直接法小一個量級;同時,GAIA混合法的燃料消耗比DACA直接法和ASAGA直接法少,這是因為混合法中的最優(yōu)控制律由間接法推導而來,相比于直接法來說更加接近理論上的最優(yōu)推力方向角(如圖3所示).由于GAIA混合法的待優(yōu)化變量較少,其平均尋優(yōu)時間比DACA直接法和ASAGA直接法小得多,因此GAIA混合法尋優(yōu)速度更快,如表2所示.

表2 GAIA混合法與DACA直接法及ASAGA直接法尋優(yōu)結果對比
本文通過Pontryagin極大值原理和自適應權重罰函數,將月球軟著陸軌跡優(yōu)化問題轉化為以伴隨變量初值和終端時間為優(yōu)化變量的非線性規(guī)劃問題;將全局優(yōu)化性能和局部搜索能力強的GAIA用于非線性規(guī)劃問題求解.仿真結果表明,相比于間接法,GAIA混合法初值收斂范圍大,易于求解,通用性好,且尋優(yōu)結果與理論最優(yōu)解相同.同時,與DACA直接法和ASAGA直接法相比,GAIA混合法尋優(yōu)結果最優(yōu)性更好,尋優(yōu)速度快.
References)
[1]Lee A Y.Fuel-efficient descent and landing guidance logic for a safe lunar touchdown[C]//AIAA Guidance,Navigation,and Control Conference.Reston,VA:American Institute of Aeronautics and Astronautics Inc,2011:4978 -4999
[2]Biegler L T.An overview of simultaneous strategies for dynamic optimization[J].Chemical Engineering and Processing:Process Intensification,2007,46(11):1043 -1053
[3]王大軼,李鐵壽,馬興瑞.月球最優(yōu)軟著陸兩點邊值問題的數值解法[J].航天控制,2000(3):44-49
Wang Dayi,Li Tieshou,Ma Xingrui.Numerical solution of TPBVP in optimal lunar soft landing[J].Aerospace Control,2000(3):44-49(in Chinese)
[4]趙吉松,谷良賢,潘雷.月球最優(yōu)軟著陸兩點邊值問題的數值解法[J].中國空間科學技術,2009,29(4):21 -27
Zhao Jisong,Gu Liangxian,Pan Lei.Numerical solution of TPBVP for optimal lunar soft landing[J].Chinese Space Science and Technology,2009,29(4):21 -27(in Chinese)
[5]王劼,崔乃剛,劉暾,等.定常推力登月飛行器最優(yōu)軟著陸軌道研究[J].高技術通訊,2003,13(4):39-42
Wang Jie,Cui Naigang,Liu Tun,et al.Study on soft-landing trajectories of constant-thrust-amplitude lunar probe[J].High Tech-nology Letters,2003,13(4):39 -42(in Chinese)
[6]王劼,李俊峰,崔乃剛,等.登月飛行器軟著陸軌道的遺傳算法優(yōu)化[J].清華大學學報:自然科學版,2003,43(8):1056-1059
Wang Jie,Li Junfeng,Cui Naigang,et al.Genetic algorithm optimization of lunar probe soft-landing trajectories[J].Journal of Tsinghua University:Science and Technology,2003,43(8):1056-1059(in Chinese)
[7]朱建豐,徐世杰.基于自適應模擬退火遺傳算法的月球軟著陸軌道優(yōu)化[J].航空學報,2007,28(4):806-812
Zhu Jianfeng,Xu Shijie.Optimization of lunar soft landing trajectory based on adaptive simulated annealing genetic algorithm[J].Acta Aeronautica et Astronautica Sinica,2007,28(4):806-812(in Chinese)
[8]段佳佳,徐世杰,朱建豐.基于蟻群算法的月球軟著陸軌跡優(yōu)化[J].宇航學報,2008,29(2):476 -481
Duan Jiajia,Xu Shijie,Zhu Jianfeng.Optimization of lunar soft landing trajectory based on ant colony algorithm[J].Journal of Astronautics,2008,29(2):476 -481(in Chinese)
[9]孫軍偉,喬棟,崔平遠.基于SQP方法的常推力月球軟著陸軌道優(yōu)化方法[J].宇航學報,2006,27(1):99-102
Sun Junwei,Qiao Dong,Cui Pingyuan.Study on the optimal trajectories of lunar soft-landing with fixed-thrust using SQP method[J].Journal of Astronautics,2006,27(1):99 - 102(in Chinese)
[10]彭祺擘,李海陽,沈紅新.基于高斯-偽譜法的月球定點著陸軌道快速優(yōu)化設計[J].宇航學報,2010,31(4):1012-1016
Peng Qibo,Li Haiyang,Shen Hongxin.Rapid lunar exact-landing trajectory optimization via gauss pseudospectral method[J].Journal of Astronautics,2010,31(4):1012 - 1016(in Chinese)
[11]單永正,段廣仁,張烽.月球精確定點軟著陸軌道設計及初始點選取[J].宇航學報,2009,30(6):2099 -2104
Shan Yongzheng,Duan Guangren,Zhang Feng.Orbit design of lunar precise fixed-point soft landing and selection of initial point[J].Journal of Astronautics,2009,30(6):2099 - 2104(in Chinese)
[12]梁棟,劉良棟,何英姿.月球精確軟著陸李雅普諾夫穩(wěn)定制導律[J].中國空間科學技術,2011,31(2):25 -31
Liang Dong,Liu Liangdong,He Yingzi.Guidance law for lunar pinpoint soft landing based on lyapunov stability theory[J].Chinese Space Science and Technology,2011,31(2):25 - 31(in Chinese)
[13]王明光,裴聽國,袁建平.基于偽光譜方法月球軟著陸軌道快速優(yōu)化設計[J].中國空間科學技術,2007,27(5):27-32
Wang Mingguang,PeiTingguo,Yuan Jianping.Legendre pseudospectral method for rapid lunar soft-landing trajectory optimization[J].Chinese Space Science and Technology,2007,27(5):27-32(in Chinese)
[14]趙吉松,谷良賢.基于廣義乘子法的月球軟著陸軌道快速優(yōu)化設計[J].科技導報,2008,26(20):50 -54
Zhao Jisong,Gu Liangxian.Rapid optimization of lunar soft landing trajectory based on generalized lagrange multiplier[J].Science& Technology Review,2008,26(20):50 -54(in Chinese)
[15]單永正,段廣仁.應用非線性規(guī)劃求解月球探測器軟著陸最優(yōu)控制問題[C]//第二十六屆中國控制會議論文集.北京:北京航空航天大學出版社,2007:485-487
Shan Yongzheng,Duan Guangren.Applying nonlinear programming to solve optimal control problem of lunar probe soft landing[C]//Proceeding of the 26th Chinese Control Conference,Beijing:Beihang University Press,2007:485 - 487(in Chinese)
[16]曹濤,董長虹.基于組合優(yōu)化策略的月球軟著陸最優(yōu)軌道設計[J].北京航空航天大學學報,2012,38(11):1537 -1541
Cao Tao,Dong Changhong.Optimization of lunar soft landing trajectory based on combinational algorithm[J].Journal of Beijing University of Aeronautics and Astronautics,2012,38(11):1537-1541(in Chinese)
[17]彭坤,徐世杰,果琳麗,等.基于人工免疫算法的地球-火星小推力轉移軌道優(yōu)化[J].中國空間科學技術,2012,32(5):61-68
Peng Kun,Xu Shijie,Guo Linli,et al.Optimization of Earth-Mars low-thrust trajectory based on artificial immune algorithm[J].Chinese Space Science and Technology,2012,32(5):61-68(in Chinese)