孫松濤,祝強軍,宋 斌
(上海宇航系統工程研究所,上海 201109)
兩航天器追逃問題是一個雙方對抗的控制策略問題。因航天器的動力學模型復雜,且雙方的對策目標相反,故此追逃問題的求解十分困難。在航天器追逃過程中,追逐航天器期望選擇使支付函數最小的控制策略,而逃逸航天器則期望選擇使支付函數最大的控制策略,此追逃過程可由微分對策表述。微分對策最早由ISAACS[1]提出。隨著研究的深入,BERKOVITZ等[2-3]給出了微分對策鞍點存在定理和最優控制策略存在的必要條件的嚴格推導。
雖然已知最優策略的必要條件,但針對此必要條件進行求解難度較大。此必要條件對應一個兩點邊值問題,該問題一般沒有解析解,只能運用數值算法,而數值算法各有優缺點。目前,已有的數值方法包括配點法[4]和多重打靶法[5]。配點法將微分方程在配點處近似成代數方程,從而求解滿足兩點邊值約束和代數方程約束的變量,進而求解兩點邊值問題。這種方法雖然收斂性好,但計算結果精度不高,計算過程中運算量大,且初值需要選擇。多重打靶法通過數值積分公式在眾多子區間上將一個微分方程離散成代數方程,在任意子區間上求解一個初值問題,通過不斷優化每個區間上的初始值,最終滿足兩點邊值條件。與配點法相比,多重打靶法計算速度快,計算精度較高,但對初值非常敏感,因此收斂性差。航天器追逃問題多對應復雜的動力學模型。由配點法和多重打靶法的表述可知,這2種方法的收斂性都與初值選擇有關,配點法雖對邊值問題收斂性較強,但因航天器追逃模型為較復雜的非線性模型,若隨機給出初值問題,則仍然不收斂。
本文為求解航天器追逃問題提供了一種新思路。采用半直接配點法求解此問題,避免了對兩點邊值問題的求解。研究思路來源于HORIE等[6-7]對導彈攔截問題的研究。該方法通過變換將微分對策問題轉化成最優控制問題。將最優控制問題構造成一個非線性規劃問題后,可運用序列二次規劃(SQP)算法進行求解。但HORIE等提出的方法并不能說明半直接配點法求解微分對策問題與原問題的等價性。本文在文獻[8]中證明了半直接配點法求解微分對策問題的等價性,為半直接配點法求解微分對策問題提供了理論依據。在求解兩航天器追逃問題的過程中,通過半直接變化將微分對策問題轉化成最優控制問題,采用Guass-Lobbato配點法對此問題進行數值求解,可提高數值方法的收斂性和穩定性。
本研究在地點為近地軌道附近,對抗雙方均為連續小推力,對策時間較短,且瞬時狀態信息完全已知的假設條件下,針對時間固定的追逃問題,以距離為支付建立對策模型,給出半直接配點法求解此追逃問題的數值方法。最終給出追逃雙方在對策條件下的最優策略和仿真算例,為航天器追逃問題提供了一種有效的求解方法。
針對兩航天器軌道追逃問題,建立動力學方程,以描述追逐航天器P與逃逸航天器E在追逃過程中的運動規律,即
(1)

兩航天器的位置關系如圖1所示。

圖1 兩航天器對策的坐標示意圖Fig.1 Coordinate schematic diagram of pursuer and evader
在式(1)中,追逐航天器P和逃逸航天器E的控制量滿足約束條件
式中:‖·‖2為歐氏范數。
此航天器追逃問題的支付函數為
式中:

為說明上述航天器追逃問題的一般求解方法,下節將給出此追逃問題最優策略存在的必要條件。
在一般的微分對策數值求解中,針對最優策略必要條件的求解是解決微分對策問題的關鍵。
(2)
根據微分對策原理[3],將Hamilton方程H定義為
H=HP+HE
(3)
式中:
為給出此追逃問題最優控制策略的必要條件,令
λP=[λ1Pλ2Pλ3Pλ4Pλ5Pλ6P]T
λE=[λ1Eλ2Eλ3Eλ4Eλ5Eλ6E]T
其中,λP和λE分別為協態向量,則式(3)可表示為
根據最優策略存在的必要條件[2],協態方程為
(4)
(5)
式(4),(5)相應的邊值條件為
(6)
(7)
(8)
顯然,最優策略的必要條件式(2),(4),(5),(6),(7)組成了一個兩點邊值問題,一般的兩點邊值問題可由多重打靶法求解[8]。
在半直接配點法中,將由最優策略必要條件得到的追逐或逃逸航天器的協態變量加入到狀態方程中,同時將對應航天器的最優控制量表達式代入對應的狀態方程并加入約束條件,進而將微分對策問題轉化為最優控制問題。在求解時,只需求解對應的支付函數最大或最小問題即可。相應的等價性證明參考文獻[8]。
半直接配點法將微分對策問題轉化為最優控制問題,這里將逃逸航天器對應的協態變量加入到微分方程中(對應的追逐航天器的半直接轉化過程同理),變換的方法簡述如下,令
(9)

由于協態變量λE加入到式(9)中,相應的終端約束方程Ψ定義為
則變換后的支付函數為

顯然,微分對策問題已被轉化為最優控制問題。接下來,將給出基于配點法求解轉化后最優問題的方法。
這里考慮計算的準確性[9],將采用五階Gauss-Lobbato配點法求解上述最優問題。為說明此方法,不妨設式(9)對應的微分方程為
(10)
根據配點法,在[ti,ti+1]區間上,需應用多項式近似式。由Gauss-Lobbato配點法[9]可知,除端點ti,ti+1外,其余3個配點tc1,tcm和tc2分別為

式中:Δti=ti+1-ti。



(11)
(12)
將式(11),(12)相加可得
49fc2+9fi+1)
(13)

i=1,2,…,N
(14)
i=1,2,…,N
(15)
式中:N為區間數。

為說明半直接配點法求解的特點,將給出不同的仿真實例。因空間站和大量的衛星存在于地球低軌道,故在仿真中,將原點軌道高度分別設為500 km和1 000 km,并選擇仿真時間均為500 s。對于同樣的仿真實例,采用基于必要條件的數值方法(如多重打靶法)進行求解,若迭代初值不準確,則很難得到收斂的解。

2個實例中,追逐航天器與逃逸航天器的初值見表1,兩航天器的單位質量加速度見表2,其中,g=9.8×10-3km/s2。

表1 相對坐標系下的初值

表2 兩航天器的單位質量加速度
為兼顧計算速度和計算準確性,選取10個子區間進行仿真。由子區間的選擇可知,需要求解的變量為293個。在數值仿真計算中,運用Gauss-Lobatto配點法,將微分方程代數化后用SNOPT求解器進行求解[10]。在仿真中,選用處理器型號為Xeon E3-1230V2,內存為8 GB的臺式機進行數值計算。設約束精度和優化允許誤差均為10-9。

在實例2(原點軌道高度為1 000 km)中,兩航天器軌跡和最優控制變量的變化曲線如圖3所示。

圖2 實例1:追逐和逃逸航天器的軌跡和最優控制變量Fig.2 Test case 1: trajectories and optimal control variables of pursuer and evader

圖3 實例2:追逐和逃逸航天器的軌跡和最優控制變量Fig.3 Test case 2: trajectories and optimal control variables of pursuer and evader
在圖3中,各子圖的表示方法同圖2。由圖3可知:追逐航天器可追上逃逸航天器。在仿真實例2中,根據數值計算結果可知:約束誤差為2.551 2×10-10,計算時間為17.58 s。
由圖2可知:在500 s的規定時間內,追逐航天器對逃逸航天器進行了成功攔截,追逐者和逃逸者的控制變量變化規律相似,兩者采用了近似的追逃策略。由圖3可知:追逐者和逃逸者的對策時間為500 s,在500 s內,追逐航天器對逃逸航天器進行了成功攔截。
本文采用半直接配點法求解了近地軌道的追逃問題,得到了收斂的解,半直接配點法將一個微分對策問題轉化成了一個最優控制問題,運用Gauss-Lobbato五階配點法,并結合序列二次規劃法,最終解決了一個非線性的數學規劃問題。半直接配點法求解微分對策問題時,可避免求解困難的兩點邊值問題。該算法具有收斂性好、應用簡單的特點。數值仿真實例驗證了這種求解方法的可行性。該方法提高了求解兩點邊值問題的收斂性,為求解含有雙方控制變量的微分對策問題提供了一種思路。