黃旭星,李爽,*,楊彬,孫盼,劉學文,劉新彥
1.南京航空航天大學 航天學院,南京 210016
2.北京控制工程研究所,北京 100190
隨著計算機硬件性能的突破和高效算法的不斷發展,近年來以機器學習為代表的新一代人工智能技術在眾多領域的應用都取得了極大的進展。與傳統技術相比,人工智能技術在精度、效率、實時性和預測性等方面擁有明顯的優勢,在高新技術領域特別是航天領域發揮越來越重要的作用,是引領未來的戰略性技術。美國國防高級研究計劃局(DARPA)2019年在《航空周刊(Aviation week)》刊文推廣人工智能技術在航空航天領域的認同和應用[1]。歐空局將于近期發射國際上首顆人工智能技術驗證衛星PhiLab,該衛星利用人工智能技術對地面觀測圖像進行預處理,提高圖像數據下傳效率[2]。國務院于2017年發布了《新一代人工智能發展規劃》,首次將人工智能技術的發展提高到國家戰略層面,要求到2025年在國防建設領域得到廣泛應用并達到世界領先水平。
人工智能技術在航天領域主要應用于環境未知或者局部信息未知的高動態環境中,根據實時感知信息進行推理并執行合理操作,最大限度地提高任務的滿意度。目前各航天大國都高度重視空間人工智能技術的研發,并已在深空探測、在軌操控、編隊飛行、空間碎片清除等方向取得多項研究成果[3-8]。這些航天任務對航天器的姿軌控精度有較高的需求,表明高精度的軌跡姿態控制技術是未來航天任務的關鍵技術之一。航天器的制導與控制屬于經典的閉環控制過程,包括測量、規劃、控制、執行以及健康管理等一系列環節[8]。規劃環節根據航天任務需求規劃航天器任務軌跡并生成相應的控制指令,控制環節根據這些指令輸出控制信號并由執行環節中的執行機構實施控制,測量環節利用傳感器監測實時狀態并反饋至規劃和控制環節,而健康管理環節則對航天器星上姿軌控系統的運行狀態進行實時監測。完整的姿軌閉環控制流程如圖1所示[9]。
圖1 姿軌閉環控制流程圖[9]Fig.1 Closed-loop control diagram of attitude and orbit[9]
傳統制導控制技術已在實際工程任務中獲得良好的控制效果,可保證一定精度的軌跡和姿態控制。然而,面向未來航天任務制導控制,系統的實時、魯棒和高精度需求,現有技術仍存在諸多缺陷和挑戰。一方面,隨著航天任務越來越復雜,空間環境與航天器動力學模型的強非線性以及參數的不確定性對精確控制的影響愈發嚴重[10-12]。目前難以離線建立高精度的動力學模型,利用傳統技術難以在不確定非線性環境中實現高精度的制導和控制。另一方面,航天任務對星上姿軌控系統的可靠性存在較高要求。姿軌控系統的傳感器和機構故障可能直接導致任務的失敗[13]。航天器需要具備實時故障診斷以及部分機構故障情況下正常進行制導與控制的能力。為提高航天器制導與控制性能,國內外專家學者在傳統控制架構下引入人工智能技術,提高航天器制導與控制的精度和效率,保證系統可靠性[3-4,6-7,14-15]。通過引入人工智能技術,對動力學系統進行逼近,實現智能軌跡姿態控制,提高航天器在不確定非線性環境影響下的軌跡規劃制導和姿態跟蹤控制精度,并在機構故障情況下仍可實現高精度的控制效果[10]。
本文對目前人工智能技術在航天器軌跡規劃和姿態控制中的研究和應用進行歸納和分析,總結適用于未來航天任務的智能姿軌控關鍵技術,為人工智能技術在航天器軌跡規劃和姿態控制中的研究提出發展建議。首先,針對當前航天任務的現狀,分析航天器姿軌控技術的需求;然后,針對模型不確定性以及姿軌控系統故障影響下的智能控制,分別介紹人工智能技術在姿軌控中的研究和應用現狀,梳理人工智能技術在航天器軌跡姿態控制中的關鍵技術,分析當前針對智能姿軌控的研究和應用所面臨的挑戰;最后,總結未來人工智能姿軌控技術的發展趨勢,并提出相應的發展建議。
傳統軌跡制導與姿態控制方法利用非線性規劃算法進行軌跡規劃制導,然后利用PID控制、滑模控制或自適應控制等技術實現高精度的姿態跟蹤[16]。然而,未來航天任務中各類非線性和不確定性因素的影響愈發顯著:① 隨著任務的開展,燃料的大量消耗以及航天器載荷位置、狀態發生變化,會導致衛星質量、質心位置等發生變化,該動力學模型為時變的強非線性模型;② 航天器搭載難以精確建模的撓性結構(例如天線、太陽能電池陣、太陽帆等),通過簡化模型進行近似與真實動力學模型間存在較大誤差[11];③ 空間環境中存在一些難以提前獲知并精確建模的攝動,如天體附近引力場模型、磁場環境、天體大氣、表面環境等[12],目前缺乏高精度的數據以及建模方法建立高保真度的動力學模型。常用的魯棒軌跡制導以及自適應控制技術難以基于不確定非線性模型實現高精度的軌跡規劃制導和姿態跟蹤控制。因此,近年來多項研究基于人工智能技術開展智能軌跡規劃和姿態控制研究,提高軌跡制導和姿態跟蹤的精度。這些智能制導與控制技術通過在傳統姿軌控架構中引入人工智能技術,直接取代或與傳統技術結合,生成相應的控制指令以及控制信號,其示意圖如圖2所示。利用人工智能技術逼近不確定非線性動力學模型,學習最優軌跡規劃和姿態控制策略,建立智能最優制導和控制算法,根據任務需求求解動力學模型,輸出最優控制時間以及機動策略,提高制導與控制精度和實時性。經過多年研究,目前已形成應用于軌跡制導的智能規劃技術以及應用于姿態控制的智能自適應控制技術[17-18]。
圖2 智能制導與控制示意圖Fig.2 Diagram of intelligent guidance and control
智能軌跡規劃制導技術可對任務軌跡進行離線或在線的智能規劃,然后根據實時的控制誤差對軌跡進行在線的智能重規劃,對航天器未來一段時間內的運行軌跡進行預測并輸出相應的控制指令。其中,人工智能技術根據任務需求以及航天器狀態,直接生成或配合常用規劃技術生成航天器的控制指令,這些指令包括航天器的發動機開關機以及姿態機動的指令。根據這些控制指令制定相應的控制指令,使航天器的運行狀態滿足航天任務需求。
當前智能軌跡規劃制導技術研究主要集中在3個方面,分別為航天器轉移軌跡智能規劃,航天器進入、下降和著陸(Entry, Descent and Landing, EDL)智能軌跡制導以及巡視器軌跡制導等。接下來總結介紹人工智能技術在這3個領域的研究和應用現狀。
1.1.1 轉移軌跡智能規劃技術
對于轉移軌跡的智能制導,最先開展離線智能規劃技術的研究。Izzo等[3-4]綜述了人工智能技術在航天器轉移軌跡規劃方面的研究現狀,提出自適應軌跡制導技術為未來航天任務的重要技術。Reiter等[19]針對空間對抗問題,基于強化學習技術建立脈沖機動優化策略,提高規避機動的可靠性。而隨著小推力系統的發展,更多研究聚焦于小推力轉移軌跡的智能規劃。Zhu和Luo[20]基于分類深度神經網絡和回歸深度神經網絡提出小推力轉移軌跡快速評估方法,用于判斷軌跡的可行性以及燃耗最優性。李海洋和寶音賀西[21]先利用不同的特征組合進行機器學習,對燃料最優小推力軌跡轉移的燃耗進行估計;然后利用訓練神經網絡學習具備多圈性、長時間性特征的時間最優小推力抬升軌跡[22];并基于深度神經網絡實現時間以及燃料最優小推力軌跡的快速、精確估計[23]。這些成果降低了多目標轉移軌跡任務的初始設計難度,可為未來深空探測任務軌道設計提供參考。Sullivan和Bosanac[24]針對多體系統轉移軌跡優化問題,基于深度強化學習技術完成時間最優小推力轉移軌跡的優化,獲得小推力控制策略。此外,針對太陽帆等姿軌耦合推進系統,Song和Gong[25]利用深層神經網絡建立軌道特征映射與轉移時間之間的映射,實現太陽帆航天器時間最優轉移軌跡的規劃和優化。
對于深空探測任務,為提高深空探測器的自主性,目前已發展多項在線智能規劃技術,使其具備實時的星上軌跡規劃能力。Li等[26]對深空轉移軌跡規劃技術的研究現狀進行了總結,并分析了利用人工智能技術對轉移軌跡進行優化的可行性。研究表明人工智能技術對于解決小推力軌跡優化問題有較大潛力。Witsberger和Longuski[27]基于遞歸神經網絡建立小推力引力輔助轉移軌跡規劃方法,利用進化算法輔助神經網絡的訓練,實現星上在線軌跡規劃。Cheng等[28]通過設計多尺度深度神經網絡合作策略,建立太陽帆航天器轉移軌跡的時間最優在線優化方法,同時解決了該網絡對較小輸入值識別困難的問題。Miller和Linares[29]針對逆行軌道間的軌跡轉移問題,基于強化學習技術設計近端策略優化算法求解最優小推力轉移軌跡。相比于傳統規劃方法,這些智能技術更能滿足實時性以及可用性的兩方面需求。
此外,針對動力學模型中存在不確定性的問題,目前研究主要根據航天器實時狀態對轉移軌跡進行重規劃,通過智能自適應制導提高航天器軌跡轉移精度。Bataleblu和Roshanian[30]針對空間發射系統(Space Launch System, SLS)魯棒上升軌跡的優化問題,結合拉丁超立方抽樣以及神經網絡建立隨機優化模型,對SLS的魯棒軌跡進行優化,提高SLS的可靠性、安全性。考慮到不確定性可通過在線識別的方式進行識別,多項研究利用不依賴模型的強化學習技術對模型參數進行自適應調整,提高軌跡規劃制導的精度和魯棒性[31]。王曉輝和李爽[32]采用模糊神經網絡對不確定性就進行分類和評估,然后利用分層任務網絡對轉移軌跡進行規劃和修復,提高了智能規劃的可靠性和靈活性。LaFarge等[33]研究平動點轉移軌跡的閉環制導方法,利用強化學習技術逼近動力學模型,減少星載計算機負擔。Arora和Dutta[34]針對小推力軌跡抬升問題,利用強化神經網絡實現軌跡的在線自適應調整,提高控制精度。這些研究表明強化學習技術可通過在線識別方式減少不確定性對軌跡魯棒性和精度的影響。
1.1.2 進入、下降和著陸智能制導技術
航天器EDL過程中動力學模型存在極大不確定性,可根據測量信息對EDL軌跡進行在線智能制導,提高規劃的精度和魯棒性。Furfaro等[35]以及Cheng等[36]針對月面自主著陸問題,分別利用深度遞歸神經網絡架構以及迭代深度強化學習算法對燃料最優軌跡進行規劃,提高進入制導精度。Furfaro和Linares[37]還基于強化學習技術對月面下降路徑點進行規劃,提高著陸精度。由于火星表面存在參數不完備的稀薄大氣,對精確EDL軌跡制導帶來更大的挑戰。Li和Jiang[38]針對未來火星EDL任務總結了自適應制導技術的發展趨勢,并分析人工智能技術的應用潛力。Zheng等[39]基于神經網絡發展火星進入軌跡的實時制導方法,相比傳統方法提高了軌跡制導精度。Li等[40-41]則利用徑向基(RBF)神經網絡對不確定性進行在線逼近,再利用二階滑模控制提高標稱軌跡的跟蹤效果,實現火星大氣進入的魯棒制導。Sánchez-Sánchez和Izzo[42]基于深度神經網絡研究最優狀態反饋問題,為行星實時最優制導著陸問題提供參考。該研究同時表明淺層網絡難以擬合復雜動力學模型。此外,與EDL任務類似,Johnson等[43]針對可重復使用運載火箭的上升制導問題,基于偽控制對沖方法的神經網絡提出了模型參考自適應控制器架構,該架構可同時適應力和力矩模型的誤差。陳書釗等[44]以及Nie等[45]也針對火箭的控制技術開展了研究,分別提出狀態預測神經網絡控制算法以及動態神經網絡自適應控制器,實現控制器參數的自適應調整以及火箭上升和下降的自適應制導控制,并具備良好的魯棒性和泛用性。
針對EDL過程中的參數不確定性,多項研究通過在線識別的方式提高軌跡的魯棒性。Gaudet和Furfaro[46]基于深度強化學習技術設計了智能制導控制算法,提高航天器對噪聲及系統不確定性的魯棒性。此外,Gaudet等[47]還利用強化學習技術建立自適應在線制導算法,滿足EDL任務實時性要求,實現燃耗最優的魯棒軌跡精確制導。Jiang等[48]通過整合火星再入與動力下降過程,利用自適應偽譜法同時進行最優再入與動力下降制導,并利用強化學習技術進行制導過程的切換,提高了軌跡制導的最優性、魯棒性和精度。以上研究表明強化學習技術也適用于考慮不確定性干擾的EDL軌跡制導規劃任務。
1.1.3 巡視器軌跡智能規劃技術
巡視探測作為深空探測的重要方式,其軌跡的智能制導技術也是當前研究熱點之一。Leitner等[49]通過設計全反應神經控制器,首次嘗試在機器人任務中利用神經網絡直接控制執行器和持續時間來優化位置和時間。針對選定的交會對接任務情形、給定的初始位置和邊界條件,利用神經控制器重現最優控制。Lan等[50]基于自適應動態規劃方法,利用動作神經網絡和批評神經網絡研究機器人的自主制導控制方法,使其實現目標跟蹤、同步和避障等多重功能。通過調整神經網絡的權值,獲得基于神經網絡的最優智能制導律。
綜上,目前基于人工智能技術的航天器軌跡規劃制導研究主要利用深度神經網絡對動力學環境中的強非線性進行識別和近似,并通過在線學習對參數不確定性進行在線識別。這些研究可歸納為2個主要的研究方向:① 強非線性和不確定性影響下魯棒軌跡的快速規劃研究;② 不確定性影響下軌跡自適應制導研究。
智能自適應控制技術通過對控制參數進行自適應調整,獲得比傳統控制技術更好的姿態跟蹤效果。智能控制技術根據控制指令以及航天器狀態,輸出執行機構所需的控制信號,這些信號包括姿軌控的軌控發動機和反應控制器(RCS)的開關機信號以及姿態機動的控制力矩陀螺的控制信號。人工智能技術的引入實現了對動力學模型不確定性的識別和逼近,提高了姿態跟蹤控制的精度以及魯棒性。
Murugesan[51]首先結合傳統自適應控制技術以及專家系統得到實時智能姿控架構。專家系統在實時約束下進行推理和決策,自適應調整控制參數,提高航天器姿態穩定性。
隨著以機器學習為代表的人工智能技術的發展,Gates等[52]針對存在不確定性的柔性衛星姿態控制問題,通過在線學習對前饋神經網絡進行訓練,構建穩定的控制序列使振動最小化,實現姿態自適應控制,最終達到完全穩定。在此基礎上,Hu和Xiao[53]同時還考慮外部干擾以及輸入飽和問題,結合PD控制及RBF神經網絡建立智能姿態控制器,提高姿態控制過程中航天器的穩定性。Cheng和Shu[54]利用深度神經網絡控制器代替傳統PID則控制器,實現對衛星姿態的自適應跟蹤。同時,他們還利用遺傳算法對深度神經網絡的節點權值進行優化,以減少訓練時間。以上研究表明,人工智能技術可通過結合或替代傳統姿態控制技術的方式提高姿態控制精度和魯棒性。
與軌跡智能規劃類似,由于參數不確定性難以離線建模,因此多項研究基于強化學習技術對不確定性進行在線識別逼近,實現智能自適應姿態控制,提高姿態跟蹤控制精度[55]。Berenji等[56]利用神經網絡及可微分的隸屬度函數構造模糊邏輯控制架構,實現航天飛機的自適應姿態控制。該架構可通過調整隸屬度函數自動適應新的控制要求,從而拓展該架構的適用范圍,實現在模糊規則下航天飛機的姿態魯棒控制。Schram等[55]與Van Buijtenen等[57]分別基于強化學習技術發展自適應姿態控制架構。這些控制架構利用評估單元估計姿態控制的效果并預測未來的控制性能,對控制系統的參數進行調整和更新,實現姿態自適應跟蹤控制。Huang等[58]則利用深度神經網絡對具有不確定性的參數進行估計,建立自適應魯棒控制器進行姿態控制。該研究利用李雅普諾夫理論證明控制器的穩定性,保證航天器在不確定性和外部干擾下的姿態跟蹤精度。針對多約束分布式航天器的軌道和姿態協同控制問題,Li等[59]利用自適應神經網絡逼近系統的不確定性,再利用積分李雅普諾夫函數建立反饋控制器,也基于李雅普諾夫理論證明了分布式航天器姿態協同跟蹤的穩定性。而Ma等[60]則針對非合作目標抓捕時組合體姿態的穩定問題,利用強化學習技術對組合體的參數進行在線識別,實現衛星姿態的重新穩定。該方法可獲得比傳統PD控制更高的姿態穩定性。以上研究表明強化學習技術對不確定性干擾下的航天器姿態自適應控制具有一定的普適性。
綜上,深度神經網絡的應用可實現非線性動力學模型的近似,而強化學習技術可對控制器參數進行在線調整,提高星上姿態跟蹤控制的穩定性和魯棒性。這些技術可通過與傳統控制器相結合或直接替換的方式提高姿態控制性能,目前暫無研究對比分析這兩種方式的優劣。
1.3.1 魯棒軌跡在線快速規劃技術
由于航天任務越來越復雜,空間環境與航天器自身動力學模型存在強非線性以及參數不確定性,航天器需要具備魯棒軌跡的快速在線規劃能力。深度學習技術可對強非線性模型進行高精度的逼近。基于深度學習技術對不確定性進行量化,建立智能不確定非線性動力學模型;同時對最優軌跡規劃策略進行學習和訓練,提高軌跡規劃的魯棒性和最優性。此外,訓練后的深度學習算法為解析形式,可實現星上運行,有效提高航天器軌跡的在線規劃效率,實現高精度魯棒軌跡的快速規劃,滿足航天任務需求。
1.3.2 在線自適應制導與控制技術
為了保證高精度的軌跡和姿態控制,航天器的軌跡制導和姿態控制技術需要在不確定性干擾下具備自適應軌跡規劃和姿態跟蹤能力。目前基于自適應規劃和控制算法的控制難以在衛星結構、模型和外部環境存在動態不確定的條件下實現高精度的軌跡和姿態控制,影響航天器軌跡和姿態的控制精度。而深度神經網絡技術不依賴固有模型,具備良好的泛化能力,可對強非線性環境實現較好的逼近效果。此外,強化學習可對動態環境中的不確定性進行在線識別,通過反饋控制對控制輸出進行實時調整,以實現高精度的智能自適應姿態控制,獲得更好的軌跡和姿態跟蹤效果。
在實際工程任務中,姿軌控系統的測量機構和執行機構使用頻率較高,容易發生故障[61]。測量機構通常由于長時間工作導致敏感器故障[62]。而執行機構故障則往往因為元件磨損和老化等導致發動機和反作用飛輪存在輸出誤差[63]。在實際任務中大部分故障無法提前預知,可能會在短時間內造成探測器姿態丟失,進而導致任務失敗[13,64]。傳統故障診斷方法依賴遙測數據進行故障檢測和識別,輔助地面操作人員完成故障診斷。然而,這些方法可檢測的機構數量有限,難以滿足多模式的診斷;且由于帶寬限制,無法顯示瞬態信息,不利于早期的故障檢測。為提高故障診斷的精度以及效率,多項研究構建基于人工智能技術的智能故障診斷系統。這些智能故障診斷系統的結構如圖3所示,通過在健康管理環節中加入人工智能技術,實現可靠快速故障診斷,降低地面監控的依賴,滿足高精度的姿軌控需求。
此外,為保證姿軌控系統故障時仍可完成軌跡制導和姿態控制,保障航天任務的正常開展,國內外還針對姿軌控系統的容錯控制技術進行研究。容錯控制技術能夠及時、有效地對故障做出響應,確保制導與控制的穩定性,同時將系統的性能保持在可接受范圍內,使系統具備處理系統不確定性以及外部干擾的能力[65]。傳統容錯控制技術需要高精度的航天器動力學模型或系統數據[66]。由于強非線性及參數不確定性,難以收集大量高精度的系統數據,無法滿足高精度容錯控制的需求。因此,國內外研究了基于人工智能技術建立智能容錯控制系統,這些系統的結構可歸納如圖3所示。通過利用人工智能技術的非線性逼近能力擬合動力學模型,對制導與控制的輸出行實時調整,進而實現高精度的智能容錯控制,提高姿軌控系統的魯棒性和控制精度,減少測量和執行機構故障所造成的影響。
圖3 智能故障診斷與容錯控制流程圖Fig.3 Diagram of intelligent fault diagnosis and fault tolerant control
航天器姿軌控系統的智能故障診斷技術可在強非線性環境中對航天器的狀態進行快速確定,并對預期或意外故障進行快速檢測和隔離。通過智能自適應故障調整重構,提高姿軌控系統故障條件下穩定的恢復能力和穩定性。當前研究目標為實現完全自主的智能故障診斷。
其中,專家系統已廣泛用于姿軌控系統執行機構的故障診斷,是最早應用于姿軌控系統的人工智能技術,多項成果已被應用于實際工程任務:
1) NASA馬歇爾飛行中心開發SPARTA嵌入式專家系統(SEES)對航天飛機主發動機進行故障診斷[67]。SEES使用正向鏈接策略,根據置信度對發動機狀態進行分析,具備識別早期故障以及實施補救行動的能力。
2) NASA開發了動力和姿態控制專家系統(PACES)對跟蹤和數據中繼衛星的故障進行診斷[68]。該系統基于動力與姿態控制子系統的操作模型,對可替代的構件或冗余層進行診斷,輔助操作人員完成故障診斷任務。
3) NASA艾姆斯研究中心基于高級專家系統開發了智能姿態控制系統(IACS)[69]。該架構可在大不確定性環境中,通過對姿軌控策略以及控制器參數的自調整,實現快速星上自主故障診斷,提高控制效率以及任務可靠性。
4) 美國哈里斯公司開發了故障查找專家系統(FFES)對可替換最低單元的系統進行故障診斷[70]。FFES通過對比當前狀態與標稱控制規劃,推理各元件的故障概率并進行排序,從而實現高精度的故障診斷。
5) NASA基于模型推理方法開發了定性故障診斷系統Livingstone進行故障檢測與隔離[71-72]。該系統最早在深空一號(DS-1)上進行驗證。改進的第2代系統Livingstone2也在X-37以及Earth Observing One(EO-1)任務中獲得成功應用。與第1代系統相比,第2代系統獨立于模型,可提高故障狀態下系統的恢復能力。
6) 航天器健康推理引擎(SHINE)是由NASA開發的一種多任務、可重復使用的專家系統,實現航天器的健康監測和故障診斷[73]。SHINE可實時使用多種知識用于檢測、診斷、仿真以及隨機建模并通過啟發式、經驗知識來快速隔離候選故障,利用更深的隨機推理詳細分析問題,減少了錯誤假設。
7) FAITH是Voyager計劃期間由JPL開發的診斷專家系統,該系統的重點是監測Voyager航天器的遙測數據[72]。FAITH能夠對遙測數據流進行檢測,并在必要時發出警報。
在實際工程任務中,動力學環境具有強非線性和不確定性,基于模型的專家系統難以精確診斷故障。為滿足不確定非線性環境中姿軌控系統的故障診斷,當前研究基于機器學習技術構建故障診斷系統,提高故障診斷的精度和可靠性。
基于機器學習技術的故障診斷研究最初僅針對單個機構、單一故障模式,用以驗證機器學習算法在該領域的可行性。考慮到神經網絡具有估計分類以及處理不確定性和參數變化的能力,Wu和Saif[74]利用非線性迭代神經網絡PID觀測器(INPID)實現航天器執行機構的故障診斷。INPID利用迭代學習保證節點參數更新過程的收斂性,可在不確定性和干擾下對早期故障和意外故障進行高精度魯棒建模,提高故障診斷過程的魯棒性。Talebi等[75]則利用故障場景下的非線性模型對系統狀態進行表征,基于神經網絡設計混合非線性模型(HNM)用于故障檢測和隔離。該模型可在無約束狀態下保證反作用飛輪故障診斷過程的穩定性。Li等[76]則針對傳統系統中的齒輪故障問題,利用深度學習算法進行齒輪的點蝕故障的診斷,并表征故障的后續發展趨勢,可有效控制系統的精度和魯棒性。然而,僅針對單個機構、單一模型進行故障診斷,存在過程冗雜、診斷效率低、實時性低等問題。
為提高航天器姿軌控系統的故障診斷性能,多機構、多模式的故障診斷方法逐漸成為研究焦點。Li等[77]基于Elman遞歸神經網絡(ERNN)對反作用飛輪的故障類型進行判斷。該架構對微小故障不敏感,能夠在噪聲環境中降低誤診率,獲得更好的故障檢測和隔離效果。部分研究同時考慮了測量機構和執行機構的故障診斷問題。Rauch和Schaechter[78]針對該問題,基于廣義回歸神經網絡(GRNN)建立了神經決策架構。該架構利用故障概率閾值確定系統狀態并完成多種故障的檢測和重構,輔助健康管理系統實現故障條件下的迅速反應。Talebi等[79]針對傳感器和執行機構故障診斷難問題,考慮狀態和傳感器的不確定性和擾動,利用低軌神經網絡進行故障識別,并證明控制系統的穩定性。李新[80]則基于BP神經網絡以及小波神經網絡構造4種不同結構的自適應魯棒故障診斷系統,實現了實時的在線檢測與診斷。此外,Lin和Ying[81]利用衛星在軌運行的實時數據,結合多元分析以及支持向量機技術建立多敏感器的故障診斷算法,實現不依賴模型的故障診斷,提高衛星的自主性。耿飛龍等[82]基于深度神經網絡提出異構陀螺的故障診斷算法,可對多種故障工況進行快速診斷,同時還對深度神經網絡的選擇策略進行了一定的分析。
對于具有強非線性的動力學系統,單個網絡難以同時滿足故障診斷的實時性和精確性需求。Huang等[83]利用雙層BP神經網絡架構分別對反作用飛輪進行故障監測和隔離。其中,第1層網絡輸出控制系統運行狀態。當控制系統出現故障時,進入第2層網絡進行故障識別,從而提高故障檢測的效率并保證診斷的精確性。
以控制性能退化為代表的緩變故障是未來姿軌控系統更常見的故障類型。為提高對緩變故障的診斷效果,多項研究結合人工智能技術以及模糊邏輯技術,利用模糊理論對故障程度進行描述和識別,提高緩變故障的診斷效果[84]。Pereira等[85]開發了模糊專家系統(FES)輔助ENVISAT衛星的決策支持系統對陀螺儀進行故障診斷。該系統通過集成經驗,可對故障的緊急程度和嚴重程度進行警報和具體描述,實現故障的短期監測和長期預測。Yang等[86]利用自組織模糊神經網絡(SFNN)對執行機構故障進行識別。該系統對不確定性和擾動不敏感,可實現魯棒的故障檢測效果,并根據檢測結果對控制策略進行重新配置。這些研究表明,模糊邏輯技術可對緩變故障進行有效的檢測。
綜上可知,對于多機構、多模式的姿軌控系統故障診斷,利用神經網絡技術可在強非線性模型下對系統狀態進行識別,提高故障診斷過程的穩定性。而模糊邏輯技術對緩變故障有良好的識別效果,將2種技術進行結合可實現瞬變和緩變故障的快速診斷,提高故障診斷過程的魯棒性。
當航天器姿軌控系統發生故障時,智能容錯控制技術可對軌跡制導和姿態控制的輸出進行調整,提高航天器在不確定非線性環境中的魯棒性,保證高精度的軌跡制導和姿態控制。目前基于智能容錯控制研究將姿軌控系統故障視為不確定性,并利用自適應控制技術對故障進行處理,通過航天器運行狀態智能自適應調整執行機構的控制信號,提高容錯控制的精度和魯棒性。
Liang等[87]針對飛輪的容錯控制問題設計了模糊全局滑模控制架構,抑制系統不確定性和外部干擾。該模糊控制架構屬于被動控制器,可用于提高姿態控制的精度和魯棒性。然而,該控制器只能處理有限的預期故障,可處理類型和容錯控制能力有限,保守性較強。
為提高容錯控制性能,多項研究通過主動容錯控制的方式構建控制器。Panagi和Polycarpou[88]利用線性參數化神經網絡(LPNNs)建立自適應分散自適應控制器。LPNNs可對故障條件下的動力學模型進行自適應近似,并結合自適應控制律中的死區修正和自適應邊界方法來提高系統的穩定性和魯棒性。更多研究則基于RBF神經網絡研究智能容錯控制技術。針對多模式故障以及連續故障的場景,Baldi等[89]基于該網絡建立主動容錯控制系統。當故障被正確識別后,該系統將會對故障進行補償,以減少其對衛星姿態的影響,并恢復任務所需的姿態指向,實現魯棒的姿態跟蹤。Chen和Tao[90]則針對具有未知死區和外部不確定擾動的姿態控制系統,基于RBF神經網絡建立閉環自適應容錯控制器。通過網絡對不確定性進行逼近,該系統具有較好的穩定性,可在未知死區、執行機構故障以及未知外部干擾的綜合作用下實現高精度的跟蹤控制。黃怡欣等[91]針對執行機構故障和不確定性干擾影響下的小行星繞飛航天器姿態魯棒控制問題,利用自適應迭代學習進行控制器參數整定,實現容錯控制。然后利用RBF神經網絡對系統非線性部分進行逼近,提高繞飛軌跡的魯棒性,并通過李雅普諾夫理論分析證明該自適應閉環控制系統的姿態跟蹤的穩定性,保證系統動態性能。此外,針對火星再入容錯控制問題,Huang等[83]基于結構自適應模型逆的RBF神經網絡設計了PID參數整定控制器,在考慮執行機構故障和觀測器參數不確定性的情況下,對參考模型和系統輸出之間的誤差進行自適應調整,保證姿態控制系統的動態性能。該系統可在機構冗余的條件下進行主動容錯控制,使航天器恢復故障前的性能,提高再入軌跡的魯棒性。王若男[92]同時考慮了傳感器和執行機構故障,并在模型不確定性和外部干擾的情況下,提出基于神經網絡的智能容錯控制算法,提高了控制系統的魯棒性。耿飛龍等[82]針對控制力矩陀螺的多種故障,基于深度神經網絡建立自適應容錯控制架構,可多個陀螺發生故障的場景下保持高精度的姿態穩定和控制。這些研究表明神經網絡技術可在不確定非線性環境以及機構故障的情況下實現高精度的容錯控制。
此外,Huo等[93]針對剛性航天器推進系統故障情況下的快速容錯控制問題,提出自適應模糊控制技術,實現有限時間約束下的容錯控制以及高精度跟蹤。該系統通過結合快速非奇異終端滑模面技術(FNTSMS)和容錯控制技術,實現對外部干擾、未知慣量矩陣以及推進器故障的非線性近似,提高航天器容錯控制性能。而有限時間內的控制收斂能力可保證系統故障和不確定性存在是實現高精度的姿態跟蹤。
根據研究可知,不確定非線性動力學環境對航天器姿軌控系統的智能自適應容錯控制存在較大影響。深度神經網絡可對系統的非線性動力學模型進行建模,并通過在線學習對不確定性進行在線識別,提高自適應容錯控制的魯棒性。
2.3.1 多機構、多模式快速故障診斷技術
為保證航天任務的正常開展,在衛星姿軌控系統發生故障時需要具備在動態不確定的空間環境中快速精確實施故障診斷的能力。未來航天器姿軌控系統的故障診斷問題為多機構、多模式故障診斷問題,由于姿軌控系統機構相互耦合,特定的故障表征可能源于不同的故障機構以及故障模式。因此,當前姿軌控系統對不同場景下的精確地故障診斷以及故障隔離技術有較高的要求。目前的故障診斷算法難以適應這種多機構、多模式的故障診斷,難以實現快速故障檢測并精確地隔離故障機構。而模糊邏輯可用于模型未知的復雜非線性系統,對多種模式具有較強的辨識能力和泛化能力,且可用于對緩變故障的診斷。此外,利用雙層神經網絡分別進行故障檢測和故障隔離,可兼顧快速檢測和精確隔離的故障診斷需求,與模糊邏輯相結合可獲得更好的控制效果。
2.3.2 魯棒自適應容錯控制技術
為保證衛星系統發生故障時,航天任務仍能正常開展,在動態不確定環境中,衛星姿軌控系統需要具備自適應容錯控制能力。目前的容錯控制技術無法保證在復雜動力學環境下具備魯棒的容錯控制效果。深度學習可用于辨識復雜的非線性系統,在控制系統中具有良好的軌跡規劃和姿態跟蹤能力。而強化神經網絡可對發生故障的系統進行在線的自適應調參,具備良好的容錯控制能力,與深度學習相結合可獲得良好的自適應容錯控制效果。
隨著空間技術的發展,衛星撓性結構和空間動力學環境都存在強非線性和不確定性,難以精確建模,對高精度的軌跡規劃制導、姿態跟蹤控制帶來影響。此外,姿軌控系統測量和執行機構不可避免發生故障,需要具備故障診斷以及魯棒的軌跡和姿態容錯控制能力。
人工智能技術已被應用于航天器制導和控制的研究當中,利用有限的星上資源在動態不確定環境下實現魯棒、精確的軌跡規劃制導和姿態跟蹤控制,部分研究已在工程任務中發揮重要作用。通過在姿軌控系統中引入人工智能技術,在不確定非線性環境中進行高精度和魯棒的軌跡規劃制導以及姿態跟蹤控制;在執行機構發生故障時快速精確地進行故障識別和重構,并實現魯棒的容錯控制,從而提高軌跡規劃和姿態的控制精度,保障航天任務的正常開展,是未來衛星自主智能軌跡姿態控制的發展趨勢。然而,目前人工智能技術在航天器軌跡和姿態控制中的研究及應用受到多方面的制約。
3.1.1 有效訓練樣本問題
當前以機器學習為代表的人工智能技術具有較強的非線性映射能力,可利用大量的真實數據對算法進行訓練,實現對非線性模型的高精度逼近和擬合。然而,航天任務成本高昂,難以開展大量任務獲得足夠的真實數據用于訓練機器學習算法。對于近地任務,雖然航天器在軌時間長且下傳數據量大,但標注困難,可用于訓練的有效樣本較少;對于深空任務,回傳地面的數據較少,不足以支持機器學習算法的訓練。其中,由于航天器姿軌控系統機構發生故障的概率較低,相關樣本少,無法進行訓練。此外,通過地面仿真生成的訓練樣本存在不確定性和誤差,基于這些樣本訓練所得算法難以滿足高精度的軌跡和姿態控制的需求。
3.1.2 星載計算能力問題
由智能姿軌控技術的發展趨勢可知,在線學習、強化神經網絡等技術可根據實時數據對算法參數進行在線調整,提高控制效果,是未來智能姿軌控的核心技術。然而,受制于航天器的質量、體積、能源、功耗、空間環境等因素,星載計算機的計算能力與地面計算機相比存在較大差距。由資料可知,目前最新的S698PM星載計算機主頻為600 MHz,運行內存20 Mb[94],與地面常用計算機的性能存在較大差距,難以運行在線學習、強化神經網絡等算法。
3.1.3 人工智能技術最優性問題
航天器執行任何航天任務都需要進行軌跡制導和姿態控制,而人工智能技術可用于幾乎所有航天任務當中。考慮到人工智能技術具有專用性,將特定算法用于特定的航天任務,可獲得更好的控制結果。然而,當前智能姿軌控技術的研究聚焦于將最新算法和技術應用于軌跡制導和姿態控制,并未考慮特定算法在不同類型航天任務中的最優性,如:具有不同隱含層數量的深度神經網絡擁有不同的姿態跟蹤精度;在線學習不適用于故障診斷等,可能會出現欠擬合或過擬合的現象。不考慮人工智能技術與航天任務之間的最優性問題難以實現最優控制效果。
3.1.4 工程實踐應用問題
由于航天器軌跡制導和姿態控制任務是航天器的關鍵任務,直接影響航天任務的實施。經過多年的發展,基于經典理論建立的姿軌控技術研究已趨于完善,多項技術已在實際工程任務中得到驗證。此外,考慮到航天器的成本較高,為保證航天任務的成功開展,航天器姿軌控所采用的技術具有一定的保守性,新技術的工程實踐難度較大。目前在姿軌控中實際應用的人工智能技術僅為專家系統,以機器學習為代表的新一代人工智能技術建立的軌跡和姿態控制系統尚處于理論研究階段,且理論研究已大幅領先工程實踐。部分智能姿軌控技術已從理論上分析其可行性,譬如利用神經網絡建立的自適應控制器,通過李雅普諾夫理論證明控制的穩定性,保證系統不確定性和擾動情況下的跟蹤精度[58-59,90]。然而,當前研究缺少在實際工程任務中的驗證,亟需證明這些技術在工程實踐的可行性及其應用價值。
人工智能技術可有效提高航天器軌跡規劃制導和姿態跟蹤控制效果。然而,目前存在多方面的因素制約其在航天器姿軌控中的研究和應用。這些制約可總結為:在硬件層面,是星上在線學習的應用與星載計算機算力之間的矛盾;在算法層面,是訓練樣本數量需求與高精度樣本數量之間的矛盾;在效果層面,是人工智能技術的最優性與航天任務的獨立性之間的矛盾;在工程層面,是星上姿軌控技術的保守性與人工智能技術的可靠性之間的矛盾。
因此,我們以智能軌跡和姿態控制的關鍵技術為基礎,以智能控制的發展趨勢為背景,以應對當前人工智能技術在航天器軌跡姿態控制中的挑戰為核心,提出應用于未來航天器智能軌跡和姿態控制的發展建議。
3.2.1 建立人工智能技術空間應用架構
目前,以深度神經網絡為代表的新一代人工智能技術主要通過“地面訓練、星上應用”的方式構建智能控制系統。該方式對于受模型不確定性影響較低的故障診斷技術是適用的。然而,智能制導、自適應控制以及自適應容錯控制等關鍵技術都需要在星上通過在線學習的方式對模型不確定性進行逼近,當前星載計算機性能難以實現算法的在線訓練,影響姿軌控技術的可靠性。因此,在綜合考慮航天器資源、性能的基礎上,利用傳統控制技術構建航天器姿軌控系統。然后,在受模型不確定性影響的環節中引入深度神經網絡,構建智能姿軌控架構。通過這種“傳統+人工智能技術”的方式可保證系統可靠性、提高軌跡規劃制導和姿態跟蹤控制精度,是發展智能姿軌控技術的有效模式。而深度神經網絡的訓練則通過“地面+星上”的方式開展。首先在地面利用高精度動力學模型對如深度神經網絡進行訓練,使控制器具備一定的跟蹤性能。然后選擇合適的在線學習算法對神經網絡的節點權值進行調整,進一步提高軌跡規劃和姿態的跟蹤精度,實現不確定性的在線逼近。
3.2.2 基于任務需求分析人工智能技術最優性
針對不同航天任務下的人工智能技術的最優性問題,需要根據任務的輸入輸出、數據特征等對比各人工智能技術的精度、效率等。為避免出現欠擬合以及過擬合的現象,需針對不同任務選擇最優人工智能技術,并對該技術的最優架構進行分析和選擇。其中,對于自主智能制導、智能自適應控制以及智能自適應容錯控制技術,強化學習深度神經網絡技術可對存在不確定性的非線性動力學模型進行擬合。對于多機構、多模式的智能故障診斷技術,需要同時對瞬變故障和緩變故障進行監測和隔離,可結合模糊邏輯和深度神經網絡進行故障診斷。另一方面,對于人工智能技術的最優架構問題,深度神經網絡的隱含層數量、節點數量和節點間的傳遞函數以及強化學習的獎勵函數也需要進行最優性分析。目前智能制導與控制技術最優架構缺乏相關理論支撐,需要通過仿真對比不同人工智能架構的擬合效果并進行分析,選擇最優人工智能技術架構。如針對小推力軌跡制導問題,分別利用具有不同數量隱含層以及節點的深度神經網絡對最優機動的時刻及大小進行擬合,通過對比擬合效果獲得最優架構[20]。該部分的仿真分析可利用地面仿真系統進行分析研究。
3.2.3 積累任務數據作為樣本并標注
針對真實訓練樣本缺乏的問題,應根據智能姿軌控的需求積累并標注有效樣本。對于未來軌跡姿態控制所面臨的動力學模型不確定性問題,應充分積累近地以及深空探測任務的真實數據以及高精度仿真所得的數據,將這些數據作為樣本構建地面數據庫。對于姿軌控系統機構故障問題,可通過地面數值、實物或半實物仿真生成不同執行機構、不同故障模式的故障場景,并對這些場景中各機構的工作狀況進行人為標注,將其作為訓練樣本并進行積累。此外,為獲得更多的訓練樣本,可應用遷移學習技術進行算法的訓練。首先,根據大量現有的高精度仿真數據樣本對模型進行訓練,然后引入數量較少的真實數據樣本,利用遷移學習識別樣本間的差異,建立新的模型,從而利用更少的樣本完成動力學模型以及故障診斷模型的訓練。
3.2.4 基于地面仿真測試系統驗證人工智能技術
為將人工智能技術實際應用于航天器的軌跡制導和姿態控制,同時考慮人工智能技術的可靠性驗證以及工程成本,需要構建高精度的地面仿真測試系統對人工智能技術進行驗證。地面仿真測試系統通過實物或半實物仿真,對航天器姿軌控架構進行高精度的模擬。將基于人工智能技術建立的智能姿軌控技術導入仿真系統,將期望的控制效果作為任務輸入,利用含隨機干擾的高精度模型進行仿真,同時引入隨機控制機構故障,記錄航天器的軌跡規劃和姿態控制效果。通過對比期望的航天器狀態與仿真所得狀態,完成基于人工智能技術建立的智能姿軌控架構的驗證。
其中,為模擬真實航天器狀態,模擬姿軌控系統的測量和執行機構都應該采用實物進行仿真,并通過額外的控制輸入對執行機構故障進行模擬。而控制器可采用擁有星載計算機相同性能的計算機進行仿真。此外,測量機構經過測量所得的航天器狀態可根據數值仿真進行模擬,以減少仿真測試系統構建的難度。
當前人工智能技術蓬勃發展,越來越多研究將人工智能技術應用于航天領域。考慮到未來航天任務中航天器動力學模型存在強非線性和參數不確定性以及姿軌控系統的長期運行狀態,可基于人工智能技術發展軌跡制導和姿態控制技術,構建智能姿軌控架構,提高軌跡規劃制導和姿態跟蹤控制的性能,滿足未來航天器高精度姿軌控的需求。根據研究現狀可知,國內外已針對自主智能姿軌控的各項關鍵技術開展研究工作,基于專家系統技術建立故障診斷系統已在實際工程任務中得到應用和驗證,以機器學習為代表的新一代人工智能技術目前也在研究當中。
然而,樣本、算力、最優性以及可靠性等4方面因素制約著新一代人工智能技術在實際工程任務中的應用。為此,可通過“傳統架構+人工智能技術”“地面+星上”的方式構建自主智能姿軌控架構,同時針對不同航天任務對人工智能技術的最優性進行分析,利用高精度的仿真數據和真實任務數據對機器學習算法進行訓練,然后利用地面仿真系統對自主智能姿軌控技術的性能進行驗證。