徐西寶,白成超,陳宇燊,唐浩楠
(1. 哈爾濱工業大學航天學院,哈爾濱 150001; 2. 北京宇航系統工程研究所,北京 100076)
人類探索深空的腳步從未停止,通過七十多年的不懈努力和奮斗,航天技術得到了快速發展,正逐步揭開其神秘的面紗。從早期的人造衛星到空間站建立,從月球探測到火星探測,再從小行星探測到土星/木星探測,無論是探測深度還是對象的尺度,其范圍都在逐步擴大。另一角度來看,探測目標也逐漸多元化,不再是簡單的到達,拍攝,亦或是登陸,更多的是體現對科學本質的探索,如地外水資源的發現和證明,地外大氣的演化以及地外生命的尋找等,甚至是建立地外基地,進行原位資源開采及利用。這些都說明了開展深空探測研究,是人類認識自我、認識未知宇宙,同時又服務于自身的必要途徑。
目前針對地外天體探測任務,主要還是集中在月球和火星,其中月球作為離地球最近的地外天體,從古至今都一直是大家關注的焦點,隨著阿波羅計劃等多個探月任務的成功實施,人類歷史上實現了多個第一,第一次登上月球、第一次采樣返回、第一次看到月球背面、第一次發現月球有永久陰影區等[1-2]。而火星作為人類可能最宜移居的星球,也吸引了多個機構的研究熱情,但受制于其距離地球較遠,探測難度較大,目前還只是有少數國家具備探測能力,且基本上所有著陸火星的巡視器均為美國研制,例如勇氣號、機遇好、好奇號等,同樣也實現了多個第一,第一次看見火星的地質地貌、第一次了解火星大氣、第一次長途巡視、第一次探測到火震等[3-4]。隨著探測任務的推進,勢必對月球及火星有更深入的了解和發現,到時候距離地外建設基地、構建星際網絡的期望就會更近一步。
但在實現對月球及火星的精確、安全探測過程中,仍有很多的技術及工程難題需要攻克,作為一個大系統工程,涉及多個子系統、多個環節、多個學科的交叉,以及多個團隊之間的協同,故難度大、約束多、可靠性要求高是需要直接面對的挑戰。這其中,作為對地外開展探測活動至關重要的一環,即軟著陸,其決定了整個探測任務的成敗,故開展精確魯棒的軟著陸制導技術研究是關鍵。
基于上述分析,本文將針對月球及火星探測任務及軟著陸制導技術的發展歷程進行整理和總結。首先分別對過往的探測任務進行回顧,分析在任務層面的變化;其次對軟著陸過程進行定義,并對軟著陸制導技術體系進行梳理;最后給出軟著陸制導技術的發展趨勢及關鍵問題。
針對月球探測,各國的基本探測路線大體是“探”、“登”、“駐”?!疤健笔峭ㄟ^飛越、環繞對月球的環境特征進行初步探測,了解月面特征等信息,為后續探測做準備;“登”是在“探”的基礎上進行硬著陸和軟著陸實驗,實現月球登陸;“駐”是在月球建立基地,并基于月球資源進行原位利用[5]。
通過對目前月球探測任務的梳理,如圖1所示,按時間可以將探測階段分為三期[6]:
1)第一階段1959~1976
第一階段主要參與者是美國和蘇聯,為奪取競爭空間優勢,二者均進行了大量的月球探測,掀起了第一次月球探測高峰。期間共進行了121次與月球相關的發射探測活動。通過對月球的在軌探測和巡視探測,獲得了大量高價值科學數據,如地質地貌,成分分析等,把人類對月球、地球和太陽系的認識提到了新的高度,并帶動了一系列新技術的創新,航天技術的成果民用化極大的改進了人們的生活,月球探測取得了劃時代的成就。
2)第二階段1976~1994
受冷戰緩和影響,美國和蘇聯對于探月熱情逐漸降低,所以該階段是月球探測的寧靜期。這一期間,蘇聯和美國主要是對第一階段的探測活動進行總結,對部分探測任務失敗和效率低的原因進行了分析,探索和提出了更好的探測思路和方案。這一階段也是對第一階段探測資料消化的階段,通過將相關技術推廣和民用化,將月球探測的成果轉化為豐厚的經濟效益。除此之外,世界各國將新的研究點逐漸向空間往返運輸能力建設以及復雜環境高魯棒性能的探測裝備研制轉變。
3)第三階段1994~至今
經過第二階段的積累和總結,隨著空間技術逐漸成熟,在空間應用和空間科學任務及空間軍事活動發展的需求的推動下,開啟了新一輪的月球探測。與第一次探測高潮注重發展空間技術不同,地外資源與能源的勘察、采集及利用是其主要目標,因為有價值的資源是發展的基礎支撐,不僅可以補充地球上日益減少的資源儲備,而且人類的探索必然逐步走向更深的宇宙空間,而月球上的這些資源可以為未來的深空探測提供保障。
相比于月球探測,由于距離地球更遠,大氣環境更復雜,火星探測難度更大,同時因其為距地球最近的行星,以及與地球相似的軌道,火星備受關注,也被認為是最有可能、最有條件載人登陸的行星[7]。回顧往年的探測歷程,人類對火星的探索從未停止,從冷戰開始,美國和蘇聯就開始了對火星的探索,希望通過對火星構成、地貌和大氣等環境特征的探測,提高對火星的了解并尋找地外生命。但是由于技術上的不足以及任務的復雜性,大多數探測均宣告失敗。直到后續技術的積累,以美國為代表的探火任務取得了歷史性突破,例如“勇氣號”“機遇號”“好奇號”,以及即將開展的Mars2020和ExoMars等,正逐步向人類展示火星的真實一面,并逐一解答例如是否有水、是否有生命、是否適合人類居住等多個疑惑。通過對火星探測的發展歷程進行分析,如圖2所示,可以得到如下啟示:
1)火星探測是未來行星探測的重點:各國的行星探測任務的首選目標都是火星,然后在其基礎上,再開展更遙遠的深空探測計劃。同時各航天大國均制訂了長遠而明確的火星探測任務,未來20多年大多數火星探測窗口均有發射計劃,2022~2024公布的火星探測任務就有四次。
2)火星探測與月球探測技術互補:從探測路線來看,火星和月球的探索過程都經歷了飛越、環繞、著陸、采樣返回這四個階段,這符合技術發展由易到難循序漸進的規律;從技術角度來看,火星和月球探測采用的大多數技術都是相通和類似的,技術發展的內在規律也類似,因此火星和月球探測的技術之間可以相互轉化利用。
3)火星探測注重“技術和科學”雙輪驅動:基于科學目標牽引,推動技術革新;技術積累成熟,開展科學研究。即第一階段解決技術問題,即實現遠距離和長時間的探索;第二階段開展科學研究,在第一階段的基礎上,開展更多有價值的科學探索。
由于月球沒有大氣,通常所說的月球軟著陸即為其動力下降階段。當探測器到達近月點后,著陸器發動機點火制動,開始動力下降。針對不同的月球軟著陸任務,會設計不同的軟著陸動力下降段以適應任務的需求,一般的階段劃分為減速制動段、接近段以及最終下降段。
減速制動段持續過程從近月點(通常15 km高度)開始,到離月球表面1~2 km處,軟著陸燃料大部分在此段消耗,因為其主要任務是抵消初始軌道速度和重力加速度帶來的速度,故減速制動段以燃料最優為主要指標。
接近段從月球表面1~2 km開始一直到著陸點上方約30 m高度處,此過程中將要消除干擾及偏差,對危險障礙進行精確識別,最后實現對安全著陸區的選址及定位。著陸器的接近段開始的時候需要調整著陸器的姿態以使傳感器保持足夠的視野,在下降過程中應當滿足相應的姿態角約束和高度角約束以及終端狀態約束。同時在避障時,著陸點重定位需考慮著陸器燃料消耗等約束,因此接近段以滿足約束條件為主要指標。
最終下降段一般是垂直下降段,為了實現平穩著陸,著陸器將以低速勻速緩慢下降,因此在最終下降段以控制穩定性為主要指標。
由于有大氣的影響,傳統火星著陸過程一般分為 3個階段:進入段、下降段和最終著陸段[8]。
進入段主要指探測器從接近段進入火星大氣到降落傘打開的過程?;鹦侵懫髟谂c軌道器分離之后,將會調整到一個特定的姿軌狀態開始在大氣層外的自由巡航。當其高度接近火星大氣層高度時(約125 km),開始大氣再入。在此過程中,需要不斷調整姿態以獲得合適的側傾角和攻角來調節側向力和升力,降低軌跡誤差,直到滿足降落傘展開條件。
下降段主要是指超音速傘降階段,即從著陸器降落傘打開到降落傘脫離結束。當著陸器經過大氣減速后,降落傘在拋掉整流罩之后開始展開,當到達距離火星表面約2~5 km時拋掉降落傘,開始最終著陸過程。
最終著陸段一般是指動力下降段和著陸緩沖段(包含動力反推緩沖)。動力下降過程將主要完成安全著陸區定位,消除偏差,以及避障和重規劃。在下降到一定高度時(30~200 m),火星車被釋放,并通過一定的緩沖措施最終著陸。
在制導過程中,制導系統不斷確定飛行器與目標或預定軌道之間的相對位置關系,并將制導信息發送給飛行器控制系統進行飛行控制。目前對月球軟著陸制導方法[9]的研究可以歸納為五類:建立月球垂線法、重力轉彎制導法、標稱軌跡制導方法、顯式制導方法和智能學習方法?;鹦擒浿憚恿ο陆刀沃茖Х椒╗10]大致可以分為三類:標稱軌跡制導方法、顯式制導方法和智能學習方法。在實現軟著陸的任務中,制導控制算法需要滿足以下要求[11]:燃耗最優或次優性,魯棒性,自主性,實時性以及避障性能。
建立月球垂線法的基本原理是著陸器以大于0的相對速度進入月球影響球,將以月球為焦點的做雙曲線運動。在到達制動點之前,調整探測器的姿態和速度,使其與月面基本垂直,推力方向盡可能與速度方向重合反向并指向月心,滿足著陸初始條件后,保持垂直姿態實施軟著陸。這時的制導過程基本是一種開環的方式。
這種方法需要預先選定著陸點,然后計算給出著陸方案,如果著陸過程中發生突發情況,比如發現預定區域存在障礙不適合降落,也無法重新規劃,探測任務就會失敗,因此這種方法在沒有高精度地圖的情況下應用比較有限。此外這種方法對入軌精度和中途軌道修正精度要求較高,給制導控制系統的設計帶來困難,隨著深空探測任務越來越復雜,這種方法的應用越來越局限。
重力轉彎制導方法的主要原理是控制發動機的推力方向,使其與著陸器的速度方向重合反向,利用發動機推力減速,在發動機推力和月球引力的作用下,逐漸將探測器在月面水平方向的速度減到零,速度逐漸指向月心,實現月球的垂直軟著陸。這種方法采取半開環半閉環的方式,在主制動段時主要目標是降低著陸器速度,采取開環制導方式,當著陸器與月面距離縮短到一定范圍時,將敏感器的測量信息引入反饋控制器,進行閉環制導,盡可能提高著陸的精度性和平穩性。
關于重力轉彎制導方法的研究主要存在于早期的無人月球著陸任務中:Citron等[12]同時對推力的大小和方向進行調節,對重力轉彎著陸過程進行改進,實現定點軟著陸;Mcinnes等[13]設計了非線性反饋制導控制律;文獻[14]結合極大值原理,設計了重力轉彎開關制導律,能實現燃料最優。
標稱軌跡制導方法由開環離線軌跡規劃和閉環在線軌跡控制兩部分組成,著陸器在著陸前需要離線規劃一條優化過的著陸飛行軌跡,著陸過程中按照該軌跡著陸,不斷測量著陸器的位置速度與規劃的軌跡之間的偏差,控制著陸器按規劃的方案飛行完成著陸。
4.3.1著陸軌跡優化
著陸軌跡優化問題的求解可以通過解析法和數值法兩種方法實現。解析法先建立關于系統狀態的狀態方程和最優條件,然后利用經典最優控制論求解,得到最優控制量及狀態量的表達式,通過這種方法可以獲得最優解的解析形式,但當系統復雜度高時,呈現強非線性,該類方法對解的最優性無法保障。而數值法則利用一定的插值逼近方法,將連續系統離散化,將其最優控制問題轉化為有限維參數優化問題,通過數值解法,得到一系列最優軌跡的標稱點,從而得到最優解的數值形式。相比于解析法,數值法更易于在強非線性環境下的應用,也是目前研究的主流方向,分為軌跡優化問題轉化和參數優化問題求解兩個階段[15]。
數值法中軌跡優化問題的轉化方法可以分為直接法和間接法[15]。直接法包括直接打靶法、配點法、微分包含法等,第一步采用參數化方法將連續空間最優控制問題的求解轉化為非線性規劃問題,再利用數值方法求解轉化后的非線性規劃問題,由此獲得最優軌跡。間接法包括各種偽譜方法,其基本思想是利用Pontryagin極大值原理,將最優控制問題轉化為哈密頓邊值問題(HBVP)。
利用上述的轉化方法,軌跡優化問題就轉化成了相應的參數優化問題,對參數優化問題求解即可得到優化軌跡。目前,對于參數優化問題的求解算法主要分為精確算法、現代啟示算法以及混合算法三類。精確算法包括梯度下降法、內點法、罰函數方法、動態規劃法、QP以及SQP等;現代啟示算法包括GA、群智能算法、模擬退火算法及神經網絡算法等;而混合優化算法將以上精確算法和現代啟示算法中的幾種參數化算法相結合以取長補短。
4.3.2著陸軌跡跟蹤制導律
著陸軌跡跟蹤的目標是對離線著陸軌跡優化得到的軌跡進行在線跟蹤,控制著陸器使其位置和速度與設定軌跡保持一致,實現近似最優的軟著陸。實際著陸過程中位置和速度與設定軌跡一致性越好,實際軌跡的最優性也更好,因此應設計合適的跟蹤制導律,使著陸器盡快到達預定軌跡并沿軌跡運動至目標點。
常用的標稱跟蹤的制導控制律有:多項式制導律、線性反饋制導律、非線性反饋制導律、H∞控制反饋制導律、滑??刂品答佒茖傻?。文獻[15]利用極大值原理給出了著陸軌跡最優性推導,同時基于人工神經網絡設計了閉環形式的制導律。Liaw等[16]利用滑模邊界層法,設計了能夠對著陸標稱軌跡進行跟蹤三維制導律;Liu等[17]基于H∞控制方法設計了魯棒性和抗干擾性較好的H∞控制反饋制導律;Li等[18]基于反步法設計了自適應跟蹤制導律,該跟蹤律能實現在線的故障診斷容錯控制。
4.3.3其它變體
除上述方法外,當實際軌跡和標稱軌跡之間的偏差較小時,標稱軌跡制導可擴展為攝動制導,攝動制導通過線性化,在標稱軌跡附近將軌道約束函數一階泰勒展開,然后利用線性化的結果求解控制量,線性化后的計算量大大減少且準確性也未降低。此外,也有學者利用曲線插值技術來生成軌跡,如文獻[19]利用樣條插值方法綜合全弧段數據來數值逼近有效的落月軌跡。
顯式制導方法又稱預測/校正制導方法,其核心是利用控制泛函的顯函數形式進行閉環制導解算。通常建立數學模型時需要對軟著陸模型進行簡化,得到軟著陸最優控制問題的解析表達式。常見的顯式制導律有迭代制導律、動力顯式制導律和燃耗次優制導律等。
迭代制導方式最早應用于土星IB和土星V的飛行上[20]。迭代制導方案根據飛行器速度、位置、縱向加速度和重力加速度的狀態以及期望的截止條件計算轉向指令;使用飛行器更新后狀態在每個制導周期中更新制導命令。迭代制導方案是一種路徑自適應制導方案,因為它在所有可能的飛行器擾動類型和程度下保持其優化性能,而不會損失精度。航天飛機的制導方案是動力顯式制導方法的成功應用的實例。Mchenry等[21]推導出了滿足大范圍機動約束的顯式制導方程和由制導解產生姿態轉向誤差的轉向方程,以及導航方程和由冗余測量值確定故障儀表的方程;Guo等[22]基于平坦地形及定量重力加速度假設,提出了一種基于Pontryagin極大值原理的相似的多項式制導律;Lu等[23]開發了一種單基線預測校正算法,該算法可應用于不同推力的著陸器。
一般情況下,GNC系統從動力下降段開始探測器根據傳器得到實時狀態和終端狀態進行解算,具有完全的自主性。顯式制導具有對抗大干擾的能力,制導末端精度幾乎不受干擾影響,具有一定的魯棒性。但是為滿足實時性要求,對搭載的GNC計算機有較快的運算速度和穩定的性能。由于最優控制問題數學建模時存在大量的假設和擾動偏差,因此顯式制導律的燃料消耗是次優的。
深度學習是一類新興的多層神經網絡學習算法[24]。深度強化學習具備較強的高維感知能力和具有策略性的決策能力,是一種端到端的優化學習方法,為解決類似航天器這樣的復雜非線性系統的軟著陸問題提供了思路。
近兩年,Carlos等[25]在假設狀態信息完備的情況下,對訓練深度人工神經網絡來表示精確著陸過程中的最優控制過程進行了詳細的研究,他們的系統能夠處理大量可能的初始狀態,同時仍能產生最優響應;Furfaro等[26]提出了一種基于深度學習的自主登月方法,這種方法可以用于狀態估計而不需要濾波器;此外,還提出了一種深度遞歸神經網絡結構,從行星動力下降階段的狀態序列預測最優燃料推力并利用長、短期記憶網絡對增加的網絡信息進行跟蹤,從而提高了輸出估計的精度[27]。Gaudet等[28]提出了一種基于深度強化學習的行星動力下降制導方法,該方法采用了策略梯度法來生成精確且省油的軌跡。文獻[29]提出了一種基于經典ZEM-ZEV的自適應反饋制導算法,使用深度強化學習來克服其局限性。文獻[30]提出了一種基于遞歸策略和價值函數逼近器的增強元學習自適應導引系統,該系統集成了制導和導航功能。
相較于傳統方法而言,深度強化學習具有全局搜索最優性。訓練好的智能體運行速度非???,具有非常好的實時性。此外,在GNC方面也有一定的優越性,例如動力學無縫銜接且無約束,不需要狀態反饋、控制約束易處理等。然而,并不是每一次訓練都能夠讓智能體損失函數收斂,并且訓練好的智能體在仿真測試過程中也有可能出現失誤,這在工程上是不被允許的。此外,如何能讓智能體在真實環境下表現得和仿真環境一樣好也是目前亟待解決的問題。
在軟著陸制導問題中,受發射能力及有效載荷質量限制,攜帶的燃料是有限的,常以燃料最省為優化指標進行求解。同時考慮到著陸器的動力學模型和機動能力邊界,需要在著陸軌跡優化的過程中考慮多種必要的狀態約束和路徑約束,其中包括推力約束,姿態約束,起始狀態約束,終端狀態約束,以及在復雜的地形環境下著陸還需要考慮障礙約束。而包含大量約束的最優控制問題一般存在嚴重的非線性和非凸形,求解起來十分困難且容易陷入局部最優,因此在建立最優控制問題模型的階段均對原始任務進行不同程度的線性化或凸化[31]。常用于軟著陸的約束優化方法有:二階錐優化、連續線性化等。
近年來,可變推力大小發動機的工程研究取得了一定的突破,同時各大工程傾向于在最終著陸段引入自主避障技術,因此障礙約束的處理方法和包含推力大小約束及障礙約束的制導方法對于提高探測器的避障能力至關重要。Acikmese等[32]提出了將非凸優化問題進行凸化轉化的思想,解決了以發動機推力幅值的上下界作為約束條件的燃耗最優問題。在此基礎上,Blackmore等[33]的研究已經擴展到尋找最小的著陸誤差軌跡的燃耗最優問題;Harris等[34]提出了一種處理半連續控制約束的方法,用于尋找一類混合整數非凸問題的全局最優解。Shen等[35]將靈敏度補償因子應用于燃耗最優著陸問題,得到了一種考慮不確定性和擾動的最優控制方法。Lu等[36]提出了一種優化燃料和保證足夠的制導裕度增強型阿波羅動力下降制導方法,該方法能適應多種任務。Cui等[37]提出了凸軌跡可以通過一種新型的和解析的軌跡曲率制導方法來構建;Bai等[38]提出了利用非凸函數對障礙物進行合并,將這些非凸障礙約束轉化為凸障礙約束的線性化方法。
如圖3所示,從技術的發展變化可以總結出軟著陸制導技術的發展趨勢呈現三個階段,也說明了隨著通用技術體系的發展,如人工智能等,對制導方法的性能優化與更新起到了關鍵作用。下面對每一個階段做簡要總結:
1)人為智能:固定軌跡制導
早期深空著陸任務著陸區相對平坦,其制導方法相對簡單,計算量小,如月球垂線法和重力轉彎法都是提前生成軟著陸軌跡。該類方法最大特點是簡單實用,但所規劃的軌道不是能量最優軌道,故常用于早期探測任務,以及對著陸精度要求不高的探測任務。
2)機器智能:基于優化制導
隨著最優控制和優化理論的發展以及搭載計算機性能的提升,軌跡優化逐漸成為制導技術的熱門選擇。對于離線設計的軌跡一般而言是最優的,但是這樣的方法靈活性較差,自主能力和避障能力都是有限的,不適用于環境復雜的著陸任務。顯式制導方法在線更新飛行的軌跡,有一定的自主性和較強的避障能力。
近年來,隨著路徑規劃技術的興起,RRT、PRM等基于采樣理論的算法得到了快速發展。該類方法能夠快速、有效地搜索高維空間,適用于復雜或動態環境下多自由度智能體路徑規劃求解。將基于采樣的方法融入制導體系對提高探測器的實時性,進一步降低算法計算量有著巨大的潛力。
3)人工智能:基于學習制導
基于優化的設計思路,其設計較為復雜,計算量大,對著陸器動力學及擾動建模精度要求較高,目前在線求解還很少應用。而強化學習技術的出現,給出了一個全新的軟著陸制導技術研究方向,既可以利用基于模型的強化學習方法來完成參數訓練,也可以僅基于數據實現著陸策略的學習,這將大大提高算法的通用性及魯棒性。當然目前基于學習的制導策略還存在其自身的問題,比如黑盒操作模式,不可解釋性等,這對于后續的任務應用提出了很大的挑戰。但是隨著有穩定性保障的深度強化學習研究的不斷深入,相信這會是未來的研究趨勢。
此外,制導方案的選擇很大程度上取決于著陸要求、任務目標和規劃方案的不同。而一個任務往往是由若干個子任務組成,故可以根據子問題進行具體分析,通過選擇不同的性能指標及約束定義運用到不同的子任務當中,最終實現整體任務的成功實現。
通過對上述三個階段發展的本質可以看出,智能化與制導技術的融合是未來的前沿,勢必會帶動更多的研究熱情,逐漸向著具備通用性、可解釋性、以及自主學習能力的智能軟著陸技術發展。與此同時,人類對于月球以及火星的探測目標已發生了轉變,更多的任務將集中在復雜極區著陸,甚至是探索從未到達過的永久陰影區,其任務難度之大,對精確軟著陸技術提出了更為嚴苛的要求。綜上分析,對于月球及火星軟著陸的發展,其趨勢總結如下:
1)算法輕量化,規劃實時化:從算法的復雜性發展過程可以看出,制導控制算法有著從簡單到復雜再到精煉的發展趨勢。早期深空探測任務受到星載計算機計算能力的限制,只能使用計算量小的制導算法盡量滿足著陸任務的需求,著陸過程甚至存在內存溢出這樣的風險。隨著計算機技術的發展,復雜性更高、性能更加優越的算法得以在實際工程中運用。未來的著陸任務為了滿足實時規劃避障的需求,必然需要更加輕量化的制導控制算法。
2)方案多樣化,技術通用化:隨著探測任務的增加,以及探測目標的復雜化,勢必會涉及到不同約束下的精確著陸問題。極區的復雜山地,黑暗的永久陰影區和常規的平坦區域都會對應不同的制導方案。加之對月球及火星開展探測活動的機構越來越多,可以預見軟著陸制導控制方案將越來越多元化。方案多樣化為不同的著陸任務提供了豐富的選擇,同時,多樣的方案能夠凸顯某些技術的共性,為技術的通用化打下了基礎,使得技術和任務的關系從一對一逐漸向一對多和多對多發展。
3)平臺智能化,環境自適應:著陸器作為開展地外探測任務的主體,對整個任務是非常重要的一環,精準的著陸會給后續任務帶來能量、時間、安全等全方位的支撐。隨著技術的發展,以及器件、處理能力的提升,其自主化程度顯著提升,可以預見隨著人工智能技術與航天的深入融合,必然將引導著陸器向完全智能化發展。同時隨著智能化程度的變化,不僅會增加對著陸環境的檢測精度及效率,同時會提升在線的解算及決策能力,結合之前多樣化的制導方案,通過不斷的學習,可以預見軟著陸能力逐漸向環境自適應發展。
現有的軟著陸技術在精度、穩定性、魯棒性等方面都存在不足,無法滿足未來密集、復雜探測任務新的能力要求。很難為后續月球/火星定點采樣返回,月面/火星表面大范圍巡視,地外基地建設,以及原位資源利用等任務提供有效保障,故基于上述回顧及分析,下面從三個層面淺析面臨的挑戰。
1)技術層關鍵問題
技術急需迭代創新,智能學習有望突破。傳統的給定軌道及優化思想實現的軟著陸制導,很大程度上依賴于先驗知識,比如模型、約束、環境等,缺乏對不同任務設計的通用性,同時容易受建模偏差、不確定擾動等因素影響,且相當一部分基于優化的方法難以在線使用。而隨著深度強化學習的興起,給智能化著陸制導提供了新的思路,可以從數據的角度去擺脫對模型的依賴,通過端到端的設計去簡化考慮擾動帶來的影響,完全依靠神經網絡實現學習,但因其黑盒的操作模式,存在著強不可解釋性,無法保證運行的可靠和收斂;同時,對于訓練數據的獲取,以及如何實現在有限數據樣本或者差異數據樣本條件下的魯棒學習等等都是值得后續研究的關鍵。綜上,如何讓傳統制導方法高效化、輕量化、通用化,以及如何讓學習制導方法可解釋、可證明、可泛化是技術層亟待解決的難題。
2)系統層關鍵問題
系統急需綜合優化,一體化設計勢在必行。軟著陸的成功與否,精度是否滿足要求,除了算法本身的性能,同時與導航、控制、結構等多個環境存在耦合關聯,準確的導航信息獲取、可靠的控制指令執行都是決定成敗的關鍵。目前系統之間多采取模塊化設計,通過接口來實現互聯,即使有提出一體化設計思路,但是在工程實踐方面還是很難完全保證,而對于之間的關聯還未有深入研究,什么類型的感知信息是最適合當前任務制導解算的,生成何種形式的制導指令是控制系統最佳的輸入,可否通過給定任務實現從選型到技術實現的自適應設計,從系統本身更有研究的價值。綜上,如何實現軟/硬件靈活設計、感知/制導/控制/通信一體化融合設計是系統層需要考慮的難題。
3)任務層關鍵問題
任務趨于定制化,組件模塊化、流程標準化的泛化設計尤為重要。除了已經開展的月球、火星軟著陸任務,后續還將會拓展到其它地外天體,環境的差異(大氣、密度分布、光照、輻射等)、干擾源的不同都會提出新的挑戰;同時,面對未來大密度開展的月球開發任務,比如復雜月背、極區、永久陰影區等未知區域的探測,對快速障礙檢測、自適應自主避障等方面都有由嚴格的要求;再者,高昂的任務成本,難以接受不靈活的設計方案,更加看重方案的通用性。綜上,如何基于任務出發,實現適應多種環境、約束條件下的成本可控、通用化、標準化的軟著陸制導系統是任務層考慮的關鍵。
本文對月球及火星探測任務進行了回顧,分別整理了到目前已經開展或即將開展的任務序列表,并就其任務發展的趨勢及變化進行了分析。同時,針對探測過程中關鍵的軟著陸過程進行了闡述,并總結整理了目前軟著陸制導技術的發展體系,最后著重分析了該技術的發展趨勢,以及制約其發展的關鍵問題。通過本文的梳理,意在為后續的探測發展以及學術研究提供可行的參考。