王志剛, 陳祥
(西北工業大學 航天學院, 陜西 西安 710072)
基于配點法的軌道在線優化方法研究
王志剛, 陳祥
(西北工業大學 航天學院, 陜西 西安 710072)
針對傳統軌道優化方法無法應用于軌道在線優化的問題,提出了三階辛普森配點法結合乘子法求解軌道在線優化問題的方法。首先建立變軌的最優化模型;然后,用三階辛普森配點法將該最優控制問題轉化為受約束的非線性規劃問題;最后,采用增廣拉格朗日乘子法對轉化得來的受約束的非線性規劃問題進行求解。仿真結果表明,所提出的方法可以得到高精度的軌道優化結果,并且對狀態量和控制量的初值選取不敏感,且仿真具有實時性,計算速度快,可以達到在線進行軌道優化的要求。
最優控制; 軌道優化; 在線優化; 配點法; 拉格朗日乘子法
傳統的軌道優化方法都不同程度地存在計算量過大或者軌道優化的求解對初值選取過于敏感等問題,這就導致只能在地面進行軌道優化計算,然后將數據存儲于機載計算機從而控制航天器的飛行,無法達到航天器在空間自主在線進行軌道最優規劃的目的。為了解決這一問題,本文采取了直接配點法和增廣拉格朗日乘子法相結合的方法來求解軌道優化問題,提出了一種在線優化的方法。目的是只要航天器通過定軌系統得到其當前的位置和速度信息,結合目標任務的要求,就能實時在線、快速地生成一條最優軌道。
三階辛普森配點法是一種將最優控制問題離散化求解的方法[1-2]。增廣拉格朗日乘子法是求解帶約束的非線性規劃問題的方法,計算速度快,不需要取無窮大的懲罰因子就可以得到問題的最優解,得到的最優解和采用極小值原理求解得到的理論最優解非常接近[3]。因此考慮將二者進行結合,來解決在線優化問題。
本文研究了應用三階辛普森配點進行在線軌道優化的方法。首先建立了軌道轉移的最優控制模型;然后采取配點法將軌道轉移最優化問題轉化為帶約束的非線性規劃問題,用增廣拉格朗日乘子法對該非線性規劃問題進行求解;最后進行了仿真,驗證了方法的正確性和解決在線優化問題的可行性。
1.1 無量綱動力學模型
視地球為理想均質的球體,且不考慮空間各種攝動的干擾。為了計算簡便,在地心慣性坐標系下建立如下空間飛行器進行軌道轉移的無量綱動力學模型[4]:
(1)
式中,x,y,z,vx,vy,vz分別為飛行器的位置和速度;r為飛行器的地心距;Ux,Uy,Uz分別為推力方向矢量的三個分量;G為發動機的推力;m為飛行器的質量。
空間飛行器軌道轉移采用常值連續推力工作方式,補充質量方程如下:
(2)
式中,ve為發動機燃料噴射速度,是無量綱的。
式(1)和式(2)組成了軌道轉移的狀態方程。
1.2 控制量和狀態量
狀態量為:
(3)
控制量為:
(4)
式中,φ為高低角;ψ為方位角。高低角的定義為推力矢量與赤道面的夾角,以推力矢量指向赤道面之上為負,限制范圍為[-π/2,π/2];方位角的定義為推力矢量在當地水平面的投影與地心-平春分點連線的夾角,順著地心-平春分點連線的正向看,該投影從左往右旋轉與地心-平春分點連線重合時,方位角為正,大小限制范圍為[-π,π]。
1.3 性能指標的選取
選取性能指標為軌道轉移過程中燃料消耗最少,可以表示為:
J=-m(tf)
(5)
1.4 約束條件
約束條件包含控制量約束和邊界條件約束,可以表示為:
-π/2≤φ≤π/2, -π≤ψ≤π
(6)
xt0=x0,G(xf)=0
(7)
(8)
可用三次Hermite多項式表示在該子區間內的任意一個狀態量:
x=C0+C1S+C2S2+C3S3
(9)
三次Hermite多項式的定義是:在區間[a,b]內,對于三次多項式式(10),p(a),p′(a),p(b)和p′(b)已知,那么整個區間[a,b]內的p(x)都是已知的。
p(x)=C0+C1x+C2x2+C3x3
(10)
式(9)的邊界條件為:
(11)
將式(11)帶入式(10)可以得到:
(12)
求解式(12)可以得到:
(13)
取子區間的中點,即S=0.5,將式(13)帶入式(9)可以得到:

(14)
(15)
其中:
fi=f(ti,xi,ui)
(16)
fi+1=f(ti+1,xi+1,ui+1)
(17)
三階辛普森方法將每個節點處的狀態量和控制量以及配點處的控制量作為優化的決策變量,配點選取為子區間的中點。即:
(18)
三階辛普森方法要求通過估計得到的配點處的導數值式(15)必須和式(14)代入狀態方程得到的配點處的導數值相等,這樣才能保證式(9)能夠很好地擬合最優狀態量的變化,這樣就得到了defect向量:

(19)
此時,最優控制問題就轉化為帶約束的非線性規劃問題。
采用三階辛普森配點法將軌道轉移的最優控制問題轉化為如式(20)所示的具有等式和不等式約束的非線性規劃問題:
(20)
目標函數為f(x)=-m(tf);不等式約束gi(x)為-π/2≤φ≤π/2和-π≤ψ≤π;等式約束hj(x)為變軌的初始點和終端點的邊界條件約束,以及由式(19)形成的Δ=0的約束。這樣,就把軌道轉移的最優化問題轉化為帶約束的非線性規劃問題。
本文采取增廣拉格朗日乘子法求解式(20)描述的問題,這種方法結合了罰函數法和古典拉格朗日乘子法,在罰因子適當大的情況下,借助于調節乘子向量逐次逼近原非線性規劃問題的最優解,具有快速求解優化問題的優點[5]。并且采用增廣拉格朗日乘子法求解優化問題得到的最優解和采用傳統的龐特里亞金極小值原理求解得到的理論最優解非常接近。
5.1 仿真參數
本文仿真算例是給定初始點和終端點的異面軌道交會。


表1 軌道交會邊界條件
發動機為兩臺490 N發動機組合,發動機噴射速度為ve=3 000 m/s,仿真狀態初始值和終端約束值如表1所示;控制量約束為:-π/2≤φ≤π/2和-π≤ψ≤π;性能指標為軌道轉移過程中燃料消耗最少。
仿真選取轉移軌道的26個時間節點,將整個軌道優化過程的時間等分為25段。
5.2 仿真結果
仿真是基于Visual C++6.0平臺,用HP XW4600工作站進行計算,計算機仿真時間消耗為282.6 s,軌道轉移時間為1 764.9 s,質量損失為576.6 kg。
本文的所有狀態變量和控制變量曲線均是由各個節點的狀態量和控制量通過復現連續的動力學過程得到的[6]。復現連續的動力學過程是一個求解連續方程的過程,計算量不大,相對于變軌計算時間來說,復現得到連續的狀態量和控制量所花費的時間基本可以忽略不計。變軌過程中狀態量的變化如圖1~圖3所示,控制量的變化如圖4所示。

圖1 位置隨時間的變化曲線

圖2 速度隨時間的變化曲線

圖3 質量隨時間的變化曲線

圖4 控制量隨時間的變化曲線
5.3 結果分析
由表1的數據可以看出,軌道轉移結束后,終端時刻飛行器的位置和速度的大小與理想值之間的偏差分別低于10 m和1 m/s,可見精度很高。由圖1~圖3可以看出,各個狀態量的變化是平緩的。由圖4可以看出,飛行過程中兩個控制量的大小均嚴格限制在所要求的范圍內,并且過程變化平緩,證明了發動機控制實現軌道轉移是可行的。
在調試過程中發現,本文采用的方法對除了允許誤差之外的其他初值(例如狀態變量初值、乘子向量初值等)是不敏感的,不同的初值計算得到的優化結果相差都基本保持在本文算例的精度之內,而且計算機時相差不大,這證明本文的算法具有很好的魯棒性。
本文研究了三階辛普森配點法結合乘子法來解決軌道優化問題,采用三階辛普森配點法將軌道轉移的最優控制問題轉化為帶約束的非線性規劃問題,并采取了增廣拉格朗日乘子法來求解帶約束的非線性規劃問題。將傳統的軌道優化問題轉化為靜態的參數規劃問題,避免了傳統軌道優化方法的缺點,如收斂速度慢和對初值猜測過于敏感等不利于在線優化等。仿真結果表明,采取這種方法解決軌道優化問題可以得到很精確的優化結果,對初值猜測不敏感,尋優能力強,計算速度快,適合用于在線優化,實時生成最優軌跡。
[1] Paul J,Bruce A.Optimal spacecraft trajectories using collocation and nonlinear programming[J].Journal of Guidance,Control,and Dynamics,1991,14 (15):981-985.
[2] Herman L A.Direct optimization using collocation based on high-order Gauss-Lobatto quadrature rules[J].Journal of Guidance,Control,and Dynamics,1996,19(3):592-599.
[3] 趙吉松,谷良賢.基于廣義乘子法的月球軟著陸軌道快速優化設計[J].科技導報,2008,26(20):50-54.
[4] 王小軍.航天飛行器最佳變軌策略研究[D].北京:中國運載火箭技術研究院,1995.
[5] 陳寶林.最優化理論與算法[M].北京:清華大學出版社,2005:405-413.
[6] 黃奕勇,張育林.配點法研究[J].彈道學報, 1998,10(3):40-43.
Researchofon-lineorbitoptimizationbasedondirectcollocationmethod
WANG Zhi-gang, CHEN Xiang
(College of Astronautics, NWPU, Xi’an 710072, China)
In order to settle the on-line orbit optimization problem, a method based on a direct collocation method is put forward. Firstly, a trajectory optimization control model is established. Secondly, the trajectory optimization model is dispersed into a discrete model by using the direct collocation method. Then, we change the optimization problem into a nonlinear programming problem. Finally, we solve the nonlinear programming problem by using the Lagrange multiplier method. The simulation results demonstrate that direct collocation method combined with the Lagrange multiplier method is not sensitive to the initial conditions we choose. The results also show that an accurate trajectry optimization result can be got by using this method in a short period. Therefore, direct collocation method is a viable one for us to settle the on-line optimization problem.
optimal control; orbit optimization; on-line optimization; collocation method; Lagrange multiplier method
2011-04-25;
2011-09-10
王志剛(1968-),男,陜西渭南人,教授,博士,研究方向為飛行器設計。
V412.4
A
1002-0853(2012)01-0053-04
(編輯:姚妙慧)