王慶海,陳 琦,王中原,尹秋霖
(南京理工大學(xué) 能源與動(dòng)力工程學(xué)院,江蘇 南京 210094)
軌跡優(yōu)化方法按照是否得到解析解被分為2大類:解析法和數(shù)值解法。解析法基于最優(yōu)控制原理,針對(duì)實(shí)際問題模型,根據(jù)極值條件和邊界條件推導(dǎo)出解析解。史金光等利用龐特里亞金極小值原理,設(shè)計(jì)了滑翔制導(dǎo)炮彈以最大射程為指標(biāo)的最優(yōu)控制參數(shù)。解析法對(duì)于簡(jiǎn)單系統(tǒng)較為有效,但難以求解復(fù)雜的多約束非線性優(yōu)化問題。數(shù)值解法通過某種離散方法,對(duì)時(shí)間、狀態(tài)和控制量進(jìn)行離散,將非線性最優(yōu)控制問題轉(zhuǎn)化為有限參數(shù)規(guī)劃問題,然后采用合適的參數(shù)規(guī)劃算法求出最優(yōu)解。直接打靶法是數(shù)值解法中最常用的一種。涂良輝等采用直接打靶法規(guī)劃再入飛行器無動(dòng)力跳躍軌跡。李瑜采用直接打靶法,對(duì)助推-滑翔導(dǎo)彈的最大射程和可達(dá)區(qū)域進(jìn)行了分析。直接打靶法只對(duì)控制量進(jìn)行離散,其優(yōu)化參數(shù)少,便于理解,但是直接打靶法需要使用高階積分算法求解狀態(tài)變量,計(jì)算量大,效率不高。根據(jù)FRABIEN的研究,直接打靶法對(duì)初始猜測(cè)敏感度很高。偽譜法是另一種最常用的數(shù)值解法。陳琦等針對(duì)滑翔制導(dǎo)炮彈,采用Gauss偽譜法離散彈道,以最短飛行時(shí)間為性能指標(biāo),利用序列二次規(guī)劃算法(SQP)規(guī)劃了滑翔段彈道。黃詰等通過Radau偽譜法離散導(dǎo)彈軌跡,分別取最大終端速度和最大落角為性能指標(biāo),采用SQP方法規(guī)劃出最優(yōu)攻擊軌跡。張科南等利用SQP方法,為高超聲速飛行器規(guī)劃了多約束突防彈道。偽譜離散與序列二次規(guī)劃法結(jié)合的偽譜法在求解非線性最優(yōu)化問題時(shí)十分有效,但其求解速度較慢。造成這一問題的主要原因是序列二次規(guī)劃方法在每一次迭代中不僅要更新Jacobian矩陣,還需要更新Hessian矩陣。
凸問題在數(shù)學(xué)上已經(jīng)被證明,使用內(nèi)點(diǎn)法可以保證在多項(xiàng)式時(shí)間內(nèi)獲得全局最優(yōu)解。由于這一固有的優(yōu)點(diǎn),近年來,利用凸優(yōu)化求解軌跡優(yōu)化問題成為研究熱點(diǎn)。陳嘉澍等采用Chebyshev偽譜法離散高超聲速飛行器動(dòng)態(tài)方程,結(jié)合無損凸化方法,將原問題轉(zhuǎn)化為標(biāo)準(zhǔn)二階錐規(guī)劃問題求解。ACIKMESE等以最小燃料消耗為指標(biāo),利用序列凸優(yōu)化方法規(guī)劃最優(yōu)火星著陸軌跡。同樣以火星著陸為研究背景,文獻(xiàn)[13-14]以最小著陸誤差為性能指標(biāo),利用凸優(yōu)化算法規(guī)劃著陸軌跡。王金波等利用翻轉(zhuǎn)Radau偽譜法離散一級(jí)火箭回收軌跡,將空心非凸推力約束轉(zhuǎn)換為二階錐約束,以燃料消耗量為性能指標(biāo),通過序列凸優(yōu)化方法得到最優(yōu)回收軌跡。文獻(xiàn)[16]采用梯形離散方法離散連續(xù)變量,利用序列凸優(yōu)化方法規(guī)劃了空地導(dǎo)彈的最大存速軌跡,但精度較差。ROH等采用梯形離散方法,離散導(dǎo)彈簡(jiǎn)化三自由度模型,將動(dòng)態(tài)方程線性凸化,采用帶L1懲罰的序列凸優(yōu)化算法(LPSCP)實(shí)現(xiàn)實(shí)時(shí)彈道規(guī)劃。
文獻(xiàn)[9]提出的(LPSCP)算法信賴域?qū)挾容^大,且恒定;算法中L1懲罰系數(shù)初值較大,且呈指數(shù)增長(zhǎng)。該算法在解決簡(jiǎn)單軌跡規(guī)劃問題時(shí)表現(xiàn)良好,但面對(duì)較復(fù)雜的彈道規(guī)劃問題時(shí)表現(xiàn)較差。較大的信賴域?qū)挾仍斐删€性近似精度低;指數(shù)增長(zhǎng)的懲罰系數(shù)會(huì)在迭代過程中引起浮點(diǎn)數(shù)計(jì)算誤差,尤其制導(dǎo)炮彈軌跡優(yōu)化問題中包含大量小數(shù)量級(jí)決策變量,嚴(yán)重時(shí)會(huì)導(dǎo)致無法求解。
基于上述考慮,本文提出一種改進(jìn)的L1懲罰序列凸規(guī)劃算法(ILPSCP),算法中采用指數(shù)衰減策略對(duì)相對(duì)信賴域?qū)挾冗M(jìn)行更新,并采用指數(shù)增長(zhǎng)帶上界的L1懲罰系數(shù)。仿真結(jié)果顯示:與傳統(tǒng)L1懲罰序列凸規(guī)劃算法(LPSCP)相比,本文提出的ILPSCP算法收斂速度更快,穩(wěn)定性更強(qiáng)。
本文以控制能量最優(yōu)為性能指標(biāo),規(guī)劃制導(dǎo)炮彈打擊固定目標(biāo)的滑翔彈道。為實(shí)現(xiàn)一定的打擊效能,要求落角不大于給定上界值,末速度應(yīng)不小于給定下界值。
本文對(duì)制導(dǎo)炮彈縱向二維平面內(nèi)方案彈道進(jìn)行規(guī)劃,對(duì)應(yīng)的動(dòng)態(tài)方程為

(1)
式中:為速度,為彈道傾角,為阻力,為升力。阻力和升力的計(jì)算公式為

式中:為特征面積,0為零升阻力系數(shù),為誘導(dǎo)阻力系數(shù),為升力系數(shù)導(dǎo)數(shù),為攻角。
假設(shè)制導(dǎo)炮彈在滑翔起控點(diǎn)速度為,起控點(diǎn)彈道傾角為,起控點(diǎn)坐標(biāo)為(,),目標(biāo)點(diǎn)坐標(biāo)為(,)。為實(shí)現(xiàn)較好的打擊效能,末速度約束下界為,落角約束上界為。
于是建立初始狀態(tài)約束為

(2)
末狀態(tài)約束:

(3)
考慮彈體穩(wěn)定性,攻角不能過大,建立控制量約束:
≤≤
(4)
參考文獻(xiàn)[5],以滑翔能量消耗最低為性能指標(biāo),對(duì)應(yīng)二維方案彈道的性能指標(biāo)函數(shù)為

需要注意的是,初始時(shí)間和終止時(shí)間是可變的,也是問題的決策變量。
綜上,制導(dǎo)炮彈滑翔軌跡最優(yōu)化問題模型為

為了方便后續(xù)公式推導(dǎo),本文先建立制導(dǎo)炮彈滑翔段控制能量最優(yōu)軌跡優(yōu)化模型對(duì)應(yīng)的一般化模型。一般化模型中狀態(tài)變量、控制變量以及狀態(tài)函數(shù)都以向量形式表示。
狀態(tài)向量∈×1,控制向量=×1,本文中=4,=1。狀態(tài)向量:
=()
控制向量為
=
于是動(dòng)態(tài)方程可以寫為

(5)
式中:∈×1為狀態(tài)函數(shù)向量。

目標(biāo)函數(shù)可以寫為

(6)
式中:()為控制向量的Euclidean范數(shù)。狀態(tài)向量、控制向量和時(shí)間變量的上下界約束可以寫為
≤≤
(7)
≤≤
(8)
≤≤
(9)
式中:L表示下邊界約束,U表示上邊界約束。
綜上,制導(dǎo)炮彈滑翔段控制能量最優(yōu)軌跡規(guī)劃模型對(duì)應(yīng)的一般化最優(yōu)化模型為

偽譜法采用全局多項(xiàng)式插值,相對(duì)于傳統(tǒng)的等距梯形離散方法,偽譜離散可以獲得更高的精度。Radau偽譜法使用階Radau勒讓德多項(xiàng)式的根為節(jié)點(diǎn),其節(jié)點(diǎn)是非對(duì)稱、非等間距的,采用它的根作為插值節(jié)點(diǎn)可以避免等距高階多項(xiàng)式插值經(jīng)常出現(xiàn)的龍格現(xiàn)象。相比Gauss偽譜離散,Radau偽譜離散沒有附加的積分約束,更為簡(jiǎn)潔。Radau多項(xiàng)式是階勒讓德多項(xiàng)式和-1階勒讓德多項(xiàng)式-1的差:
()=()--1(),∈[-1,1]
階Radau多項(xiàng)式有個(gè)根,這個(gè)根包含=-1,<1??梢钥闯?配置點(diǎn)包含初始點(diǎn),但不包含終止點(diǎn)。
定義∈[-1,1] 為偽譜時(shí)間,∈[,]為物理時(shí)間。偽譜時(shí)間和物理時(shí)間之間存在如下映射關(guān)系:

(10)
Radau偽譜法的節(jié)點(diǎn)包含階Radau多項(xiàng)式的個(gè)根和一個(gè)附加終止點(diǎn),共計(jì)+1個(gè)節(jié)點(diǎn)。
定義為第個(gè)節(jié)點(diǎn)對(duì)應(yīng)的拉格朗日多項(xiàng)式函數(shù)的基函數(shù),寫作:

于是,狀態(tài)向量的第個(gè)分量()可以用經(jīng)過這+1個(gè)節(jié)點(diǎn)的拉格朗日多項(xiàng)式函數(shù)來近似。

(11)
對(duì)式(11)兩邊求導(dǎo),可得:

于是第個(gè)狀態(tài)變量在第個(gè)配置點(diǎn)處微分的值為



(12)
式中:∈(+1)×為狀態(tài)矩陣,為第個(gè)狀態(tài)變量在第個(gè)離散節(jié)點(diǎn)的狀態(tài)。在這里定義控制矩陣為∈×,為第個(gè)控制變量在第個(gè)離散節(jié)點(diǎn)的控制量。∈×(+1)被稱為微分矩陣,其每一行對(duì)應(yīng)著相應(yīng)配置點(diǎn),每一列對(duì)應(yīng)著相應(yīng)拉格朗日基函數(shù)。
對(duì)式(10)兩邊求導(dǎo),并代入式(5)可得:

定義偽譜域函數(shù):

即:

離散形式為

(13)
式中:∈×。
=(,,,)
式中矩陣下標(biāo)對(duì)應(yīng)第個(gè)離散節(jié)點(diǎn)。結(jié)合式(12)和式(13)可得:
=(,,,)
(14)
由式(14)可知,本文研究的最優(yōu)化問題的決策變量包含:狀態(tài)變量、控制量、起始時(shí)間和結(jié)束時(shí)間。為了方便數(shù)值求解,需要根據(jù)標(biāo)準(zhǔn)數(shù)值規(guī)劃模型,將所有決策變量轉(zhuǎn)換成列向量。
定義決策變量列向量為
=((vec())(vec()))
式中:vec表示矩陣列變換操作,∈×1,為決策變量總數(shù)。
=(+1)++2
式中:(+1)對(duì)應(yīng)狀態(tài)決策變量總數(shù),對(duì)應(yīng)控制決策變量總數(shù),常數(shù)2對(duì)應(yīng)初末時(shí)間,為控制變量數(shù)目。
定義狀態(tài)函數(shù)列向量為∈×1:
()=vec(())
于是式(14)可以改寫為
=()
(15)
=(diag(,)()×(+2))

Radau偽譜法的離散求積公式為

式中:為被積函數(shù)在第個(gè)配置點(diǎn)的值;為對(duì)應(yīng)配置點(diǎn)的積分權(quán)系數(shù)。于是式(6)的離散形式為

式中:表示第個(gè)控制變量。引入輔助變量建立二階錐約束:

(16)


(17)


(18)


=
(19)
式中:∈(·)×,∈(·)×1。
彈道規(guī)劃問題中,決策變量分為狀態(tài)變量、控制變量和時(shí)間變量3個(gè)大類。每一個(gè)大類之間數(shù)量級(jí)相差較大,而大類之中決策變量的數(shù)量級(jí)也相差懸殊。本文采用比例縮放的思想,指定不同決策變量的縮放比例系數(shù)。比例縮放系數(shù)定義為決策變量上邊界值與下邊界值的差,即:

設(shè)定統(tǒng)一的相對(duì)信賴域?qū)挾?從而實(shí)現(xiàn)簡(jiǎn)單地調(diào)整一個(gè)相對(duì)信賴域?qū)挾?完成對(duì)所有決策變量信賴域?qū)挾鹊恼{(diào)整。
相對(duì)信賴域約束定義為

(20)
式中:相對(duì)信賴域?qū)挾葹橐粋€(gè)足夠小的數(shù)。
同理,定義相對(duì)誤差為

式(18)、式(20)的物理意義為:新軌跡點(diǎn)在原軌跡點(diǎn)附近,由于軌跡由軌跡點(diǎn)連接而成,即新軌跡在原軌跡附近,從變分學(xué)角度看,新軌跡在原軌跡的鄰域內(nèi)。
式(17)為線性目標(biāo)函數(shù),式(19)為線性等式約束方程,式(16)和式(20)為錐約束,于是式(16)~式(17)、式(19)~式(20)組成了標(biāo)準(zhǔn)凸優(yōu)化模型,稱該凸優(yōu)化模型為原子問題:

由文獻(xiàn)[9]可知,采用普通序列凸規(guī)劃算法(SCP)求解彈道規(guī)劃問題時(shí),其對(duì)初始預(yù)測(cè)十分敏感。如果不能提供合適的初始預(yù)測(cè),子問題的解空間將為空,無法求解。合適的初始預(yù)測(cè)依靠豐富的經(jīng)驗(yàn),當(dāng)問題較為復(fù)雜時(shí),經(jīng)驗(yàn)預(yù)測(cè)也難以適用。
L1懲罰序列凸規(guī)劃算法(LPSCP)成功解決了序列凸規(guī)劃算法(SCP)對(duì)初始預(yù)測(cè)敏感這個(gè)問題。LPSCP算法通過引入松弛輔助變量,,,,在原問題的基礎(chǔ)上建立L1懲罰子問題。子問題定義為

式中:∈(·)×1和∈(·)×1為一組用于松弛線性等式約束方程的輔助變量;∈×1和∈×1為一組用于松弛信賴域不等式約束的輔助變量;為違反等式約束的懲罰系數(shù),為違反信賴域不等式約束的懲罰系數(shù);=1,2,…,。
2個(gè)懲罰系數(shù)的獲得方式為

式中:為違反原子問題約束時(shí),隨著迭代次數(shù)呈指數(shù)增長(zhǎng)的總懲罰系數(shù),增長(zhǎng)速率由系數(shù)確定?!蔥0,1]為一個(gè)權(quán)系數(shù),代表對(duì)2種約束懲罰權(quán)重。越大,對(duì)違反動(dòng)態(tài)方程等式約束的懲罰越大,對(duì)違反信賴域不等式約束懲罰越少,反之同理。當(dāng)=1時(shí),代表只對(duì)動(dòng)態(tài)約束采取L1懲罰;當(dāng)=0時(shí),代表只對(duì)信賴域約束采取L1懲罰。的具體取值根據(jù)實(shí)際情況而定,本文研究的制導(dǎo)炮彈軌跡優(yōu)化問題動(dòng)態(tài)約束直接影響初始預(yù)測(cè)的敏感性,相比之下更為重要,所以懲罰權(quán)系數(shù)取值最好不小于0.5。傳統(tǒng)L1懲罰序列凸規(guī)劃(LPSCP)算法流程如圖1所示。

圖1 傳統(tǒng)LPSCP算法流程圖
從式(18)、式(20)可以看出,信賴域?qū)挾炔粌H影響線性近似的精度,還將決定每一次迭代優(yōu)化的最大收斂步長(zhǎng)。相對(duì)信賴域?qū)挾仍叫?則最大收斂步長(zhǎng)越小,但線性近似精度越高;相對(duì)信賴域?qū)挾仍酱?則迭代最大收斂步長(zhǎng)越大,但線性近似精度越低。傳統(tǒng)序列凸規(guī)劃算法使用固定信賴域?qū)挾?如果相對(duì)信賴域?qū)挾忍?則無法滿足線性近似條件,會(huì)導(dǎo)致算法失效。為了兼具收斂速度和近似精度,改進(jìn)的L1懲罰序列凸規(guī)劃(ILPSCP)算法采用指數(shù)衰減策略更新相對(duì)信賴域?qū)挾?
=max(×,)
式中:為初始相對(duì)信賴域?qū)挾?由于采用了指數(shù)衰減策略,可以取得適當(dāng)大一些,有利于前期迭代快速收斂;為衰減系數(shù),越大相對(duì)信賴域?qū)挾人p越慢,的取值一般在08~098之間;為迭代次數(shù);為相對(duì)信賴域?qū)挾认陆?。算法的終止條件為前后兩次迭代決策變量之間的相對(duì)差值不大于相對(duì)誤差容錯(cuò)系數(shù)。信賴域?qū)挾仍O(shè)置下界的原因在于相對(duì)信賴域?qū)挾缺仨毚笥诘扔谙鄬?duì)誤差容錯(cuò)系數(shù),即:
≥
否則當(dāng)<,會(huì)導(dǎo)致解的精度并未達(dá)到預(yù)期,迭代過程便提前結(jié)束。
理論上,當(dāng)總懲罰系數(shù)足夠大時(shí),子問題和子問題求得的解相同。然而在研究一個(gè)數(shù)值算法時(shí),有必要考慮計(jì)算機(jī)浮點(diǎn)數(shù)計(jì)算精度。計(jì)算機(jī)運(yùn)算中,數(shù)量級(jí)差距太大的數(shù)進(jìn)行運(yùn)算時(shí)可能會(huì)出現(xiàn)誤差,這對(duì)于決策變量本身數(shù)量級(jí)差距較大的彈道規(guī)劃問題是不利的,懲罰系數(shù)太大時(shí),將無法求解。如圖2所示,當(dāng)懲罰系數(shù)達(dá)到10時(shí),求得的所有的決策變量都在0附近,顯然不是期望的彈道,是無效解。

圖2 懲罰系數(shù)cex=107 時(shí)的仿真結(jié)果
綜合考慮,為懲罰系數(shù)設(shè)定一個(gè)上界,使懲罰系數(shù)滿足:
=min(×,)
改進(jìn)的L1懲罰序列凸規(guī)劃(ILPSCP)算法流程如圖3所示。

圖3 ILPSCP算法流程圖
本節(jié)以制導(dǎo)炮彈縱向平面內(nèi)滑翔段彈道規(guī)劃問題為例,分別采用傳統(tǒng)L1懲罰序列凸規(guī)劃算法(LPSCP)和本文提出的改進(jìn)L1懲罰序列凸規(guī)劃算法(ILPSCP)進(jìn)行仿真對(duì)比。為驗(yàn)證本文提出的ILPSCP算法的準(zhǔn)確性,使用非線性問題最優(yōu)化通用工具箱GPOPS2進(jìn)行仿真,作為參照組。
制導(dǎo)炮彈參數(shù)如表1所示。表2為各決策變量的上下邊界值。

表1 制導(dǎo)炮彈參數(shù)

表2 決策變量的上下邊界值
直接打靶法對(duì)初始預(yù)測(cè)敏感,需要遴選較好的初始預(yù)測(cè)才能求解,然而本文提出的ILPSCP算法具備強(qiáng)大的冷啟動(dòng)能力。正常情況下,彈道的始末端點(diǎn)坐標(biāo)預(yù)測(cè)值會(huì)選擇制導(dǎo)炮彈滑翔起點(diǎn)坐標(biāo)和目標(biāo)的坐標(biāo),這種初始預(yù)測(cè)經(jīng)過拉格朗日插值得到的初始預(yù)測(cè)彈道軌跡比較接近期望的最優(yōu)彈道軌跡,有利于算法的求解。表3為本文仿真使用的始末變量預(yù)測(cè)值,下標(biāo)“0”對(duì)應(yīng)變量起始值,下標(biāo)“f”對(duì)應(yīng)變量末值,下標(biāo)“g”表示預(yù)測(cè)值。為了驗(yàn)證ILPSCP算法的冷啟動(dòng)能力,表3提供的始末端點(diǎn)坐標(biāo)預(yù)測(cè)值極其惡劣,是2個(gè)重合的點(diǎn),并且這個(gè)重合點(diǎn)即不是制導(dǎo)炮彈滑翔起點(diǎn)坐標(biāo),也不是目標(biāo)坐標(biāo)。

表3 始末變量初始預(yù)測(cè)值
表4中為彈道規(guī)劃實(shí)例參數(shù),主要包含各狀態(tài)變量的初始點(diǎn)約束、終點(diǎn)約束以及規(guī)劃算法中需要的各參數(shù)。為保證制導(dǎo)炮彈在飛行末段具備一定的機(jī)動(dòng)能力,設(shè)置飛行速度下界為200 m/s;考慮到制導(dǎo)炮彈飛行穩(wěn)定性;攻角絕對(duì)值最大值為π/12;其他參數(shù)見表4。

表4 實(shí)例仿真參數(shù)表
仿真結(jié)果如圖4~圖9所示。圖4為飛行軌跡對(duì)比圖;圖5為飛行速度對(duì)比圖;圖6為飛行過程中彈道傾角對(duì)比圖;圖7為攻角曲線對(duì)比圖,也是該模型的控制曲線;圖8為本文提出的ILPSCP算法和傳統(tǒng)LPSCP算法的目標(biāo)函數(shù)收斂曲線對(duì)比圖;圖9為GPOPS2和ILPSCP算法解的節(jié)點(diǎn)分布圖。

圖4 飛行軌跡對(duì)比圖

圖5 速度曲線對(duì)比圖

圖6 彈道傾角曲線對(duì)比圖

圖7 攻角曲線對(duì)比圖

圖8 目標(biāo)函數(shù)收斂曲線圖

圖9 離散節(jié)點(diǎn)分布對(duì)比圖
圖4~圖7中,給出了傳統(tǒng)LPSCP算法第199次和第200次迭代的結(jié)果,可以看出,這兩組曲線都沒能和參照組曲線重合,即沒有收斂到最優(yōu)解。結(jié)合圖8可以看出,LPSCP算法對(duì)應(yīng)的目標(biāo)函數(shù),僅需20次迭代便趨于一個(gè)值附近,并在該值附近震蕩。但在經(jīng)過50次、100次甚至150次迭代之后,該目標(biāo)函數(shù)曲線仍然持續(xù)震蕩,難以收斂,最后在0.607和0.690之間持續(xù)跳變。可以預(yù)計(jì),即使進(jìn)行更多迭代仍然難以收斂。形成鮮明對(duì)比的是,圖8中ILPSCP算法對(duì)應(yīng)的目標(biāo)函數(shù)曲線在經(jīng)過30次迭代后便基本穩(wěn)定,之后變化量極小。
由圖4~圖7和圖9可以看出,ILPSCP算法的節(jié)點(diǎn)和GPOPS2的節(jié)點(diǎn)雖然不同,但I(xiàn)LPSCP算法規(guī)劃出的各變量曲線與參照組GPOPS2高度重合,這證明本文提出的ILPSCP算法是有效的。
本文的彈道規(guī)劃模型的性能指標(biāo)為攻角平方積分,可以發(fā)現(xiàn),圖7中LPSCP算法的2條攻角曲線的平方積分比其他2種算法的更小,從圖8中也可以看出,LPSCP算法的性能指標(biāo)小于ILPSCP算法,這與本文描述的ILPSCP算法優(yōu)于LPSCP算法這一觀點(diǎn)不符。出現(xiàn)這種現(xiàn)象的原因是:LPSCP算法使用固定相對(duì)信賴域=03,較大的信賴域?qū)挾葘?duì)于簡(jiǎn)單問題影響不大,但對(duì)于本文較復(fù)雜的彈道規(guī)劃問題,會(huì)造成線性近似假設(shè)條件不成立,近似誤差大。過大的線性近似誤差導(dǎo)致近似模型無法反映制導(dǎo)炮彈物理模型,所以,對(duì)于制導(dǎo)炮彈模型,圖7中LPSCP算法的攻角曲線和圖8中LPSCP算法的目標(biāo)函數(shù)曲線都是無效的。過大的線性近似誤差,也是導(dǎo)致LPSCP算法無法收斂的原因。采用=03的LPSCP算法在2個(gè)無效解之間跳變,而=03的ILPSCP算法收斂到最優(yōu)解,顯然ILPSCP算法比LPSCP算法更適合解復(fù)雜的彈道規(guī)劃問題。
LPSCP算法在=03時(shí)便因?yàn)樾刨囉驅(qū)挾冗^大無法求解,而ILPSCP算法在更大的初始相對(duì)信賴域?qū)挾惹闆r下,仍然能穩(wěn)定求解。增大后,ILPSCP算法收斂到指定精度(最優(yōu)解與=03時(shí)相同)所需迭代次數(shù),如表5所示。隨著初始相對(duì)信賴域的增大,所需迭代次數(shù)增加,但相比信賴域?qū)挾鹊脑鲩L(zhǎng)倍數(shù),其增長(zhǎng)幅度較小。相比于傳統(tǒng)的LPSCP算法,即使設(shè)置了更大的初始相對(duì)信賴域?qū)挾?ILPSCP算法仍然能快速穩(wěn)定收斂,這進(jìn)一步證明了ILPSCP算法的優(yōu)越性。

表5 不同δ0下ILPSCP算法迭代次數(shù)
本文推導(dǎo)了時(shí)間自由且以控制能量最優(yōu)為指標(biāo)的彈道規(guī)劃一般化模型,針對(duì)該模型采用偽譜離散和線性凸化完成凸優(yōu)化建模。針對(duì)傳統(tǒng)L1序列凸規(guī)劃算法(LPSCP)在解決復(fù)雜的初末時(shí)間自由、非線性強(qiáng)的彈道規(guī)劃問題時(shí)存在穩(wěn)定性較差等問題,本文提出了一種改進(jìn)的L1偽譜凸規(guī)劃算法(ILPSCP)。ILPSCP算法中引入指數(shù)衰減的相對(duì)信賴域?qū)挾群蛶辖绲腖1懲罰系數(shù)。仿真結(jié)果證明,ILPSCP算法收斂速度快,精度高,冷啟動(dòng)能力強(qiáng),很好地解決了傳統(tǒng)L1序列凸規(guī)劃算法(LPSCP)存在的問題。