雷 科, 林忠賢
(中國(guó)空空導(dǎo)彈研究院,河南 洛陽(yáng) 471009)
空中防區(qū)外精確打擊已成為目前高技術(shù)戰(zhàn)爭(zhēng)的一種重要作戰(zhàn)模式,并成為制約戰(zhàn)爭(zhēng)勝負(fù)的重要因素。在實(shí)施精確打擊的彈藥中,制導(dǎo)滑翔炸彈由于其低成本、精確打擊能力及防區(qū)外發(fā)射等特點(diǎn),受到各軍事大國(guó)的普遍重視[1]。
制導(dǎo)滑翔炸彈沒有動(dòng)力,主要采用大升阻比氣動(dòng)外形,依靠投放高度勢(shì)能和投放初速度動(dòng)能來實(shí)現(xiàn)較遠(yuǎn)的滑翔距離。滑翔制導(dǎo)炸彈采用怎樣的導(dǎo)引策略才能實(shí)現(xiàn)最遠(yuǎn)的滑翔距離,是一個(gè)具有現(xiàn)實(shí)意義的問題。
根據(jù)最優(yōu)控制理論,制導(dǎo)滑翔炸彈最優(yōu)滑翔距離問題應(yīng)該屬于多變量有約束的非線性系統(tǒng)最優(yōu)化問題。目前對(duì)于多變量有約束的優(yōu)化問題解法很多,適合于制導(dǎo)炸彈的方法有:梯度法、共軛梯度法、動(dòng)態(tài)規(guī)劃法、可行方向法、梯度投影法等[2]。
根據(jù)制導(dǎo)滑翔彈的特點(diǎn)采用動(dòng)態(tài)規(guī)劃法來進(jìn)行尋優(yōu)計(jì)算,它比常見的以最優(yōu)升阻比方法獲得遠(yuǎn)距離滑翔具有較好的效果。動(dòng)態(tài)規(guī)劃是一個(gè)發(fā)展成熟的理論,它與極大值原理一樣被稱為現(xiàn)代變分法,是處理控制變量存在有界閉集約束時(shí),確定最優(yōu)控制解的有效數(shù)學(xué)方法。它可以解決非線性多輸入輸出系統(tǒng)、時(shí)變系統(tǒng)的最優(yōu)控制問題。從本質(zhì)上講,動(dòng)態(tài)規(guī)劃是一種非線性規(guī)劃,其核心是貝爾曼的最優(yōu)原理[3]。
由于滑翔彈偏航控制通道主要消除航向制導(dǎo)誤差,俯仰控制通道保證炸彈的飛行距離滿足要求,末端主要對(duì)準(zhǔn)目標(biāo),同時(shí)增大俯仰角,以所需的俯仰角命中目標(biāo)。滑翔彈的性能優(yōu)劣主要取決于垂直面的制導(dǎo)性能。而最優(yōu)滑翔距離主要是通過俯仰通道的最優(yōu)控制來實(shí)現(xiàn)的,因此,為了簡(jiǎn)化制導(dǎo)炸彈最優(yōu)控制數(shù)學(xué)模型,本文只在垂直平面內(nèi)對(duì)炸彈最優(yōu)滑翔問題進(jìn)行分析。
炸彈在滑翔過程中受重力、氣動(dòng)力合力作用。在不考慮側(cè)滑情況下,制導(dǎo)滑翔炸彈在垂直平面內(nèi)受力情況如圖1所示。

圖1 制導(dǎo)滑翔炸彈受力示意圖Fig.1 The forces on the guided glide bomb
制導(dǎo)滑翔炸彈最遠(yuǎn)滑翔距離的要求還與末端著地角要求、制導(dǎo)精度要求、末速要求相互約束。
利用最優(yōu)控制理論,將制導(dǎo)滑翔炸彈滑翔彈道的優(yōu)化表述為一個(gè)非線性、時(shí)變、帶有控制約束和終端約束的最優(yōu)控制問題[4],其狀態(tài)方程為

式中:X=(x1,x2,x3,x4)T為狀態(tài)向量;U 為控制向量;t為時(shí)間(s);S為炸彈特征面積(m2);H為炸彈高度;m為炸彈質(zhì)量(kg);V為炸彈速度(m/s);ρ(H)為空氣密度(高度 H的函數(shù))(kg/m3);θ為炸彈彈道傾角(rad);β為炸彈俯仰角(rad);α為炸彈攻角(rad);Fx為炸彈阻力(N);Fy為炸彈升力(N)。
根據(jù)動(dòng)態(tài)規(guī)劃原理,選取攻角為控制量,即

容許控制為

過程約束

過程約束在程序中進(jìn)行了限制,當(dāng)超過過程約束時(shí),該控制下的最優(yōu)策略停止搜索。
終端約束為

制導(dǎo)炸彈滑翔距離作為性能指標(biāo),則性能指標(biāo)函數(shù)為

式中:tf為終端時(shí)間;t0為開始時(shí)間。
考慮到有約束終端求解比較困難,采用懲罰函數(shù)將終端約束以罰函數(shù)的形式放到性能指標(biāo)函數(shù)中,有終端約束最優(yōu)控制問題轉(zhuǎn)化為無終端約束的最優(yōu)控制問題[5],則性能指標(biāo)函數(shù)為

根據(jù)最優(yōu)控制原理,性能指標(biāo)的極大值與極小值可以采用相同的哈密頓函數(shù)來進(jìn)行求解[6],則最優(yōu)滑翔彈道的哈密頓函數(shù)為

動(dòng)態(tài)規(guī)劃的方法實(shí)質(zhì)上是引進(jìn)了最佳性原理,把一個(gè)多步最優(yōu)化問題轉(zhuǎn)換為多個(gè)一步最優(yōu)問題。動(dòng)態(tài)規(guī)劃原理[7]:如果 u*(0),u*(1),u*(2),…,u*(N-1)是最優(yōu)控制問題的一個(gè)最優(yōu)控制序列,那么u*(1),u*(2),…,u*(N-1)一定也是一個(gè)最優(yōu)序列,其初始狀態(tài)是 X(1)=f1(X(0),u*(0))。
如果 u*(0)已求出,求 u*(1),u*(2),…,u*(N-1)的問題構(gòu)成一個(gè)初始條件為X(1)的N-1步的最優(yōu)控制問題,如果性能指標(biāo)最小值記為(X(1)),這樣由最優(yōu)性原理有

目標(biāo)函數(shù)JN為

式中:N為由u*(0)到u*(N-1)的N步控制。從上述(X)到(X)之間的遞推關(guān)系,可以把N步控制的問題轉(zhuǎn)化為N個(gè)一步控制問題。
對(duì)終端有約束的最優(yōu)控制問題,動(dòng)態(tài)規(guī)劃常規(guī)的方法是由終端狀態(tài)逆向進(jìn)行搜索。制導(dǎo)炸彈如果也采用這種方法進(jìn)行求解,到最后同樣要回到初始狀態(tài)的特定值的約束,相當(dāng)于順序求解法的末端約束,而且編程較為困難。因此采用動(dòng)態(tài)規(guī)劃法的順序求解法進(jìn)行彈道的求解,較為直觀簡(jiǎn)單,也比較適合于本文問題的求解。但由于末端對(duì)著地角和末速有約束限制,直接用順序求解法無法求解,因此引入拐彎時(shí)間進(jìn)入動(dòng)態(tài)規(guī)劃,在拐彎時(shí)間Tturn之前,每階段的性能指標(biāo)函數(shù)采用J1的形式,即不考慮末端約束,以最遠(yuǎn)距離為唯一性能指標(biāo)。拐彎時(shí)間之后,性能指標(biāo)變?yōu)樵黾幽┒思s束的最終J2指標(biāo)形式,即

其中:s1、s2為懲罰因子。
根據(jù)動(dòng)態(tài)規(guī)劃原理,結(jié)合滑翔炸彈的運(yùn)動(dòng)特點(diǎn),采用的動(dòng)態(tài)規(guī)劃法如圖2所示。

圖2 動(dòng)態(tài)規(guī)劃算法示意圖Fig.2 Diagram of the dynamic programming algorithm
以時(shí)間為單位將制導(dǎo)炸彈劃分為N個(gè)階段,每個(gè)階段根據(jù)攻角的范圍,確定I個(gè)攻角策略。具體的計(jì)算步驟如下。
1)設(shè)定轉(zhuǎn)彎時(shí)間的取值范圍,Tturn∈[min TR,max TR]。
2)設(shè)定轉(zhuǎn)彎時(shí)間Tturn=min TR。
3)設(shè)定炸彈飛行仿真時(shí)間t=0,如果t<Tturn,則性能指標(biāo)按照J(rèn)1的形式計(jì)算,否則性能指標(biāo)按照J(rèn)2進(jìn)行,即
4)根據(jù)初始狀態(tài),計(jì)算第1階段I個(gè)策略下的彈道運(yùn)動(dòng)方程,將狀態(tài)數(shù)據(jù),,,,…和性能指標(biāo),,,,…,記錄下來,作為第2個(gè)策略計(jì)算的初始值。
8)采用4)相同的計(jì)算方法計(jì)算3,4,…,n階段的最優(yōu)控制,當(dāng)所有策略下都不滿足過程約束時(shí)停止搜索,搜索所有性能指標(biāo)J,其中最大的J指標(biāo)即為最遠(yuǎn)射程。最遠(yuǎn)射程對(duì)應(yīng)的即為最優(yōu)攻角序列。
9)Tturn=Tturn+1,如果 Tturn<max TR,轉(zhuǎn)到2)重新開始計(jì)算。如果Tturn>max TR,結(jié)束所有計(jì)算,對(duì)應(yīng)所有轉(zhuǎn)彎時(shí)間下的最優(yōu)性能指標(biāo)J為最優(yōu)控制序列。
由于簡(jiǎn)化的制導(dǎo)滑翔彈數(shù)學(xué)模型變量較少,較為適合采用動(dòng)態(tài)規(guī)劃算法。當(dāng)然每個(gè)階段時(shí)間的劃分不宜太短。如果太短,則總階段太長(zhǎng),會(huì)導(dǎo)致數(shù)據(jù)記錄量太大,總的計(jì)算時(shí)間太長(zhǎng)[8]。但如果每階段的時(shí)間太長(zhǎng),則所計(jì)算的精度不夠,不能計(jì)算出最優(yōu)攻角序列。經(jīng)過反復(fù)仿真分析發(fā)現(xiàn),本文的仿真步長(zhǎng)選取1 s可以獲得較好的效果。
為了驗(yàn)證以上動(dòng)態(tài)規(guī)劃法的有效性并與最優(yōu)升阻比進(jìn)行比較,本文根據(jù)某制導(dǎo)炸彈的氣動(dòng)數(shù)據(jù)進(jìn)行仿真驗(yàn)證。取初始狀態(tài)X(t0)=(190 0 0 10000)T,過程和末端速度約束范圍[Vmin,Vmax]=[160,300],單位為 m/s。過程和末端角度約束范圍[θmin,θmax]=[-80,30],單位為(°)。高度和射程單位為 m。拐彎時(shí)間根據(jù)初步估算在Tturn=[250,500]內(nèi)取值較為合理,單位為s。當(dāng)滿足條件|x4-Htf|<ε,或過程狀態(tài)超過約束時(shí)停止迭代。其中ε=10[9]。動(dòng)態(tài)規(guī)劃求解的最優(yōu)滑翔彈道的結(jié)果如表1所示。

表1 動(dòng)態(tài)規(guī)劃計(jì)算結(jié)果Table 1 The result of the dynamic programming calculation
根據(jù)表1的計(jì)算結(jié)果,可以看出,當(dāng)轉(zhuǎn)彎時(shí)間為360 s的時(shí)候,在滿足末端約束的條件下,射程達(dá)到最大的66 km。隨著拐彎時(shí)間的不斷后移,其末端速度和彈著角逐漸減小,到371 s時(shí),已經(jīng)不能滿足末端約束的要求。
在文獻(xiàn)[10]中對(duì)最優(yōu)滑翔的結(jié)論為:導(dǎo)彈在滑翔過程中采用最大升阻比進(jìn)行下滑,基本上就可以得到最大滑翔距離,因此,采用本方法與最大升阻比方法對(duì)10 km高度下,相同飛行速度在相同的末制導(dǎo)條件下計(jì)算結(jié)果進(jìn)行比較,其末端數(shù)據(jù)如表2所示。

表2 動(dòng)態(tài)規(guī)劃法和升阻比法的末端數(shù)據(jù)對(duì)比Table 2 The terminal data of dynamic programming algorithm and lift-drag ratio algorithm
從表2可以看出,在10 km高度,采用動(dòng)態(tài)規(guī)劃法計(jì)算的最優(yōu)射程比最優(yōu)攻角制導(dǎo)增加6 km以上,同時(shí)末端著地角可達(dá)到-45°,但末速比最優(yōu)升阻比減小了70 m/s,末端性能要優(yōu)于最優(yōu)升阻比制導(dǎo)。
動(dòng)態(tài)規(guī)劃與最大升阻比的彈道曲線如圖3所示。

圖3 動(dòng)態(tài)規(guī)劃與最優(yōu)升阻比彈道對(duì)比圖Fig.3 The trajectory of the dynamic programming algorithm and optimization lift-drag ratio algorithm
從圖3可以看出,從投放開始后,采用動(dòng)態(tài)規(guī)劃法就比最大升阻比法滑翔的高度要高,同時(shí)考慮到末速要比最大升阻比法低70 m/s,說明這種方法依靠速度損失增加了射程。同時(shí),動(dòng)態(tài)規(guī)劃法的拐彎高度和最優(yōu)升阻比相當(dāng),即在增加射程的同時(shí)保證了末端姿態(tài)調(diào)整的時(shí)間,從而保證著地角末端約束。
圖4為采用動(dòng)態(tài)規(guī)劃計(jì)算的過載曲線,該過載保證了導(dǎo)彈在整個(gè)彈道過程中滑翔距離最遠(yuǎn),在末端過載迅速減小調(diào)整姿態(tài),保證著地角滿足著地角約束。

圖4 動(dòng)態(tài)規(guī)劃計(jì)算的過載曲線Fig.4 The overlade curve of the dynamic programming algorithm
本文通過改進(jìn)的動(dòng)態(tài)規(guī)劃法對(duì)最優(yōu)滑翔距離制導(dǎo)問題進(jìn)行了研究,算法簡(jiǎn)單。基于某滑翔彈實(shí)際氣動(dòng)參數(shù)進(jìn)行仿真證明其效果良好,該算法比最優(yōu)升阻比制導(dǎo)方法投放距離遠(yuǎn)。研究結(jié)果對(duì)于分析制導(dǎo)炸彈飛行控制系統(tǒng)性能、滑翔飛行特性及進(jìn)行滑翔飛行方案制定、控制系統(tǒng)設(shè)計(jì)具有重要參考價(jià)值。
本文研究的結(jié)果,對(duì)亞音速正常式氣動(dòng)布局滑翔彈制導(dǎo)初步設(shè)計(jì)、彈道規(guī)劃和性能初步分析使用具有實(shí)際應(yīng)用意義。
[1]侯明善.防區(qū)外投放制導(dǎo)炸彈滑翔段垂直面最優(yōu)制導(dǎo)[J].兵工學(xué)報(bào),2007(5):12-16.
[2]黃國(guó)強(qiáng),南英.二級(jí)入軌空天飛機(jī)上升軌跡優(yōu)化[J].宇航學(xué)報(bào),2010(3):641-647.
[3]王曉陵.最優(yōu)化方法與最優(yōu)控制[M].哈爾濱:哈爾濱工程大學(xué)出版社,2007.
[4]牛蘊(yùn)軒.基于均勻設(shè)計(jì)的制導(dǎo)炸彈運(yùn)動(dòng)參數(shù)相應(yīng)面建模[J].火力與指揮控制,2011,36(7):171-173.
[5]童季賢.最優(yōu)控制的數(shù)學(xué)方法及應(yīng)用[M].成都:西南交通大學(xué)出版社,1994.
[6]孫明瑋,彭南楠,楊明.導(dǎo)彈最優(yōu)滑翔彈道的設(shè)計(jì)及存在的問題[J].飛行力學(xué),2006,24(1):26-29.
[7]李國(guó)勇.最優(yōu)控制理論及參數(shù)優(yōu)化[M].北京:國(guó)防工業(yè)出版社,2005.
[8]南英.航天器軌跡優(yōu)化的通用數(shù)值算法[J].飛行力學(xué),1996,14(3):20-26.
[9]張敏,戴通偉.戰(zhàn)機(jī)最速角度機(jī)動(dòng)攻擊導(dǎo)引指令生成算法[J].火力與指揮控制,2010(11):24-27.
[10]VINH N X.Optimal trajectories in atmospheric flight[M].Amsterdam:Elsevier Scientific Publishing company,1981.