劉慶國, 劉新學(xué), 夏 維, 郭會軍
(1. 火箭軍工程大學(xué)初級指揮學(xué)院, 陜西 西安 710025; 2. 中國人民解放軍31102部隊, 江蘇 南京 210018)
隨著軍事航天力量在戰(zhàn)爭中的作用日趨顯著,爭奪制天權(quán)已經(jīng)成為各軍事大國在作戰(zhàn)中的首要任務(wù)之一[1]。眾所周知,衛(wèi)星是軍事航天力量最重要的組成部分,天基武器在反衛(wèi)作戰(zhàn)中有著不可替代的優(yōu)越性:全球部署、機動性強、反應(yīng)時間短等[2-3]。多彈頭在軌武器平臺是一種攜帶多個子彈的天基動能反衛(wèi)星武器,單個該類型武器平臺具備打擊多個敵方衛(wèi)星的能力,所以能夠有效地減少發(fā)射成本,威懾能力更強。在此背景下,本文研究了多個多彈頭在軌武器平臺的目標分配優(yōu)化問題。
現(xiàn)有相關(guān)文獻包括飛行器在軌服務(wù)任務(wù)分配[4]、衛(wèi)星系統(tǒng)的多目標分配[5]等?,F(xiàn)有文獻在指標計算時大多考慮的是“單對單”問題,在此基礎(chǔ)上進行的目標分配優(yōu)化;部分文獻并未充分考慮能量的重要影響,而能量計算是造成計算量較大的關(guān)鍵所在。本文結(jié)合多彈頭在軌武器平臺“單對多”的武器特點,建立了基于遺傳算法(genetic algorithm, GA)的單個多彈頭在軌武器平臺攔截軌道優(yōu)化模型,為后續(xù)計算目標分配優(yōu)化的評價指標打下基礎(chǔ);在指標計算時將能量最優(yōu)作為評價指標之一;由于計算目標分配優(yōu)化時計算量較大,本文在離散粒子群算法(discrete particle swarm optimization, DPSO)[6-9]的基礎(chǔ)上引入禁忌搜索(taboo search, TS)[10]進行局部操作以提高算法性能,在此基礎(chǔ)上建立了基于DPSO-TS算法的目標分配優(yōu)化模型;仿真結(jié)果表明該算法能夠快速有效地解決多個多彈頭在軌武器平臺的目標分配優(yōu)化問題。
多彈頭在軌武器平臺實施打擊地過程為:在軌控/姿控發(fā)動機的作用下,攜帶子彈機動變軌,當調(diào)整到合適軌道后釋放第一個子彈(即子彈釋放后按照當前速度位置可以實現(xiàn)對目標衛(wèi)星的打擊),而后武器平臺再次機動變軌,準備釋放下一個子彈,以此類推。該小節(jié)為后續(xù)計算目標分配優(yōu)化的評價指標打下基礎(chǔ)。
在忽略各種攝動力的前提下,本文基于單脈沖攔截假設(shè),以總速度增量‖Δvall‖最小值作為單個多彈頭在軌武器平臺的攔截軌道優(yōu)化模型的目標函數(shù),表示為
(1)
式中,ti為武器平臺機動變軌時刻;n為攔截目標個數(shù)。其約束條件為
(2)
式中,Tmax為多彈頭在軌武器平臺攔截目標衛(wèi)星的時間上限;n為子段數(shù)目;Δvi為第i段軌道的速度增量;Δvmax為最大速度增量。
軌道消耗的燃料質(zhì)量表示為
(3)
式中,Δmi為第i段軌道消耗的燃料質(zhì)量;g0為重力加速度;mi為第i段軌道的起始時刻質(zhì)量。
利用GA對武器平臺機動時刻進行全局優(yōu)化搜索,進而通過求解Lambert問題(見圖1),得到單脈沖攔截的速度增量,單個多彈頭在軌武器平臺在原軌道運行時,點P1處的位置矢量和速度矢量分別為r1和v1,假設(shè)單個多彈頭在軌武器平臺在點P1處進行變軌,飛行Δt時間到達點P2,其在P1、P2處的位置矢量分別為r1、r2,速度矢量分別為v1、v2,則多單個彈頭在軌武器平臺在點P1處速度增量Δv的確定即為Lambert問題。Lambert問題的具體求解過程參考文獻[11]。
GA[12-13]的實現(xiàn)步驟如下:
步驟1對武器平臺機動時刻t1,t2,…,tn進行編碼,隨機產(chǎn)生50個染色體作為初始種群,設(shè)置交叉概率為Pc,變異概率Pm,最大迭代次數(shù)N。
步驟2適應(yīng)度函數(shù)為fitness=1/‖Δvall‖,計算種群個體的適應(yīng)度值及群體的適應(yīng)度值總和。

圖1 Lambert問題Fig.1 Lambert problem
步驟3利用輪盤賭(roulette wheel selection, RWS)方法進行選擇,輪盤中的區(qū)域大小與適應(yīng)度函數(shù)值成正比(見圖2),每轉(zhuǎn)動一輪,指針指向的作為繁殖后代的個體(R1,R2,…,Rk表示染色體1,2,…,k);本文采用單點交叉作為交叉方式:在選擇兩個交叉?zhèn)€體后,隨機選取交叉點,然后將兩個交叉體位于交叉點右側(cè)的基因進行交換;假設(shè)變異概率為Pm變異的具體操作為:產(chǎn)生(0,1)上的隨機數(shù)α,若α≤Pm,則改變隨機染色體上隨機位置的基因值。

圖2 輪盤賭Fig.2 Roulette wheel selection
步驟4重復(fù)執(zhí)行步驟2、步驟3,直到算法收斂或者達到最大迭代次數(shù)。
通過上述方法即可求解給定順序的‖Δvall‖,進而可以得到完成攔截所需的最少燃料質(zhì)量。
由于多彈頭在軌武器平臺的目標分配優(yōu)化問題中計算評價指標時(尤指評價指標(2))計算量較大,所以快速計算成為影響解決該問題的關(guān)鍵。本文的DPSO-TS算法是DPSO與TS相結(jié)合的一種混合算法。慣性權(quán)重是DPSO算法的一項重要參數(shù),其值越大則全局搜索能力越強,越小則局部搜索能力越強[14-15],本文在具有較強全局搜索能力DPSO算法的基礎(chǔ)上加入局部搜索能力較強的TS算法,進而提高算法性能,使算法能夠快速收斂。
假設(shè)有個多彈頭在軌武器平臺W=(W1,W2,…,WN),M個目標衛(wèi)星T=(T1,T2,…,TM),每個多彈頭在軌武器平臺攜帶K個子彈,定義目標分配矩陣XN×M[16-18]中各元素為
(4)
可以得到多彈頭在軌武器平臺目標分配問題[19-20]的數(shù)學(xué)描述為
maxf(X)=(f1,f2,…,fn)T
(5)
式中,(f1,f2,…,fn)為評價指標;K為多彈頭在軌武器平臺攜帶的子彈數(shù)目;mxi為第i個多彈頭在軌武器平臺消耗的燃料;mmax為單個多彈頭在軌武器平臺攜帶總?cè)剂?。約束條件的意義在于:單個武器平臺最多打擊K個目標衛(wèi)星;單個目標衛(wèi)星最多被一個子彈打擊;單個多彈頭在軌武器平臺消耗燃料不得多于攜帶總?cè)剂稀?/p>
對于數(shù)學(xué)描述中的優(yōu)化指標f(X)=(f1,f2,…,fn)T主要包括兩個方面:一是打擊目標衛(wèi)星的數(shù)目,二是完成打擊后所有多彈頭在軌武器平臺中單個武器平臺剩余燃料的最小值。
(1) 打擊目標數(shù)目
打擊的目標數(shù)目越多,對敵方的破壞越大,則以打擊目標數(shù)目作為評價指標,即
(6)
(2) 單個多彈頭在軌武器平臺剩余燃料的最小值
平臺剩余燃料為用來機動變軌的剩余燃料。該評價指標是在評價指標(1)的基礎(chǔ)上計算的,即評價指標(1)達到最大后再考慮該評價指標。單個多彈頭在軌武器平臺剩余的燃料越多,其在軌時間越長,對目標衛(wèi)星的在軌威懾時間越長。為了強調(diào)對所有目標衛(wèi)星的總體控制,則以單個多彈頭在軌武器平臺剩余的燃料最小值作為評價指標,即
f2(X)=min{mx1,mx2,…,mxn}
(7)
在計算評價指標(2)時,需要通過第1節(jié)單個多彈頭在軌武器平臺的攔截軌道優(yōu)化模型求解剩余燃料質(zhì)量。
通過上述分析,得到優(yōu)化指標f(X)為
(8)
式中,k1、k2為權(quán)重系數(shù),為了體現(xiàn)評價指標(2)是在評價指標(1)的基礎(chǔ)上計算的,本文用式(9)來約束k1、k2的取值。
(9)
式(9)的含義在于增加或者減少一個打擊目標(指標1)對評價指標的影響大于全部用來機動變軌燃料剩余(指標2)對于評價指標的影響,如果優(yōu)化結(jié)果f1對應(yīng)的打擊目標數(shù)目小于優(yōu)化結(jié)果f2,即使f1燃料全部剩余,其優(yōu)化指標值也將會小于f2。
(1) 粒子編碼
采用實數(shù)編碼方式,粒子長度為KN,K為多彈頭在軌武器平臺攜帶的子彈數(shù)目,N為多彈頭在軌武器平臺數(shù)目,其編碼方式如圖3所示。
(2) 粒子適應(yīng)度計算
采用式(8)作為粒子適應(yīng)度函數(shù)f(X)。
(3) 位置和速度更新公式
粒子的位置是由粒子的速度、個體極值和全局極值作用的結(jié)果,其位置和速度的更新公式為

(10)


(13)
式(11)表示粒子對自身飛行速度的思考,rand()表示區(qū)間(0,1)上的隨機數(shù),當rand()<ω時,即在[1,N]之間產(chǎn)生2個隨機數(shù)a和b,粒子產(chǎn)生a,b兩個位置并進行交換;式(12)表示粒子根據(jù)Pi調(diào)整位置,c1為兩者的交叉概率;式(13)表示粒子根據(jù)Pg調(diào)整位置,c2為兩者的交叉概率。式(12)和式(13)的位置產(chǎn)生方式和式(11)一致。
TS算法的計算是在每計算一步DPSO算法后進行的,TS算法的基本元素包含:初始解、適配值函數(shù)、鄰域、移動、候選集、禁忌表及其長度、特赦準則、多樣性搜索策略和終止條件等。各元素的具體含義參考文獻[10]?;赥S算法的局部操作流程如下:
步驟1設(shè)置參數(shù),算法初始化,包括禁忌長度LT,候選集大小MT以及最大迭代次數(shù)TMT。

步驟3根據(jù)集中性與多樣性搜索策略,生成當前解的鄰域,并且從鄰域中選取NT個粒子作為候選集Openlist(Y)。
步驟4根據(jù)計算的適度值fitT(Yi),判斷是否滿足特赦準則,若滿足,則用被解禁的候選解代替當前的Yi,并將Yi置入禁忌表;若不滿足,保持Yi不變。
步驟5從Openlist(Y)中選出未被禁忌表Tabulist(Z)所禁忌的當前最優(yōu)解,更新Tabulist(Z)。
步驟6判斷是否滿足禁忌搜索的終止條件,若滿足,則輸出PTbest;若不滿足,執(zhí)行步驟3。
依據(jù)上述內(nèi)容,基于DPSO-TS算法的目標分配優(yōu)化計算流程圖如圖4所示,具體流程如下:
步驟1設(shè)置參數(shù),設(shè)定粒子群的規(guī)模大小P,多彈頭在軌武器平臺的數(shù)目N,單個多彈頭在軌武器平臺的子彈數(shù)目K,最大迭代次數(shù)TM,以及ω、c1和c2。
步驟2初始化種群并計算各粒子的適應(yīng)度函數(shù)值f(X),記錄初始個體極值Pi和全局極值Pg。
步驟3利用式(10)更新粒子的位置,計算適應(yīng)度函數(shù)值f(X)并更新Pi和Pg。
步驟4TS算法初始化,包括候選集大小MT,最大迭代次數(shù)TMT以及禁忌長度LT。

步驟6根據(jù)多樣性與集中性搜索策略,生成解的鄰域,并且從鄰域中選取NT個粒子作為候選集Openlist(Y)。
步驟7判斷fitT(Yi)是否滿足特赦準則,若滿足,則用滿足的解代替當前的Yi,并將Yi置入禁忌表;若不滿足,保持Yi不變。
步驟8從Openlist(Y)中選出未被禁忌的當前最優(yōu)解,并更新Tabulist(Z)。



圖4 DPSO-TS算法的計算流程圖Fig.4 Calculating flow of DPSO-TS
本文給定3個多彈頭在軌武器平臺(A1、A2和A3)以及22顆目標衛(wèi)星(T1~T22)的軌道參數(shù)如表1所示。本文假設(shè)單個多彈頭在軌武器平臺的質(zhì)量為1 000 kg,攜帶燃料250 kg,Tmax為8小時,同時每個多彈頭在軌攔截器至少剩余50 kg燃料用來軌道保持;發(fā)動機比沖為300 s,發(fā)動機推力的最大值為480 N;粒子群的規(guī)模P=10,最大迭代次數(shù)TM=20,為了提高粒子群算法的全局搜索能力,設(shè)定慣性權(quán)重,認知系數(shù),社會系數(shù);在進行禁忌搜索時,從鄰域中隨機選取5個作為候選解,即NT=5;依據(jù)式(9),給定評價指標中的權(quán)系數(shù)k1,k2分別為0.996和0.004。

表1 武器平臺和目標衛(wèi)星的軌道參數(shù)
DPSO算法和DPSO-TS算法的算法性能如表2所示,兩者的收斂曲線以及兩者最優(yōu)解對比隨迭代次數(shù)的變化曲線分別如圖5~圖7所示,隨迭代時間的變化曲線分別如圖8~圖10所示。表2給出了圖5~圖10中的關(guān)鍵參數(shù),通過仿真結(jié)果可以看出,DPSO和DPSO-TS算法兩者運算得到的結(jié)果一致:兩者的優(yōu)化指標值均為9.372,多彈頭在軌武器平臺A1對應(yīng)的目標衛(wèi)星為T1、T12和T14,A2對應(yīng)的目標衛(wèi)星為T6、T9和T16,A3對應(yīng)的目標衛(wèi)星為T8、T19和T20;DPSO-TS算法迭代4次后終止計算并得到最優(yōu)解,迭代時間為392.852 s,DPSO算法在迭代8次后終止計算并得到最優(yōu)解,迭代時間為721.329 s。

表2 DPSO和DPSO-TS的算法性能比較

圖5 DPSO算法收斂曲線Fig.5 Convergence curve of DPSO algorithm

圖6 DPSO-TS算法收斂曲線Fig.6 Convergence curve of DPSO-TS algorithm

圖7 DPSO和DPSO-TS的算法收斂曲線對比圖Fig.7 Convergence curve comparison between DPSO and DPSO-TS

圖8 DPSO算法收斂曲線Fig.8 Convergence curve of DPSO algorithm
仿真結(jié)果表明DPSO-TS算法在保證優(yōu)化結(jié)果與DPSO算法一致的前提下,其完成計算的時間只是DPSO算法所用時間的54.5%,收斂速度更快,因此該方法能夠快速有效地解決多個多彈頭在軌武器平臺的目標分配優(yōu)化問題。

圖9 DPSO-TS算法收斂曲線Fig.9 Convergence c urve of DPSO-TS algorithm

圖10 DPSO和DPSO-TS的算法收斂曲線對比圖Fig.10 Convergence curve comparison between DPSO and DPSO-TS
考慮到多彈頭在軌武器平臺目標分配優(yōu)化時指標計算復(fù)雜的問題,本文將TS算法與DPSO算法相結(jié)合,以減少計算量;根據(jù)武器特點對粒子進行編碼;為了實現(xiàn)多個多彈頭在軌武器平臺能夠長期對目標衛(wèi)星的控制,將能量最優(yōu)作為評價之一。仿真結(jié)果表明本文采用的方法能夠快速有效地解決多彈頭在軌武器平臺目標分配優(yōu)化問題。
在計算評價指標時,實現(xiàn)單個多彈頭在軌武器平臺有限推力作用下的攔截軌道優(yōu)化將會是今后研究的重點之一;軌道保持是在軌武器平臺的一項關(guān)鍵能力,如何準確地給出軌道保持時間和所需燃料的關(guān)系也是今后研究的重點。本文著眼于解決問題實際,進一步完善了空間武器的相關(guān)理論研究,具有一定的理論研究和現(xiàn)實意義。
參考文獻:
[1] FERGUSSON J, WONG W W S. Military space power: a guide to the issues[M].Santa Bara: Praeger, 2010:1-3.
[2] 周文雅,劉恒,李順利,等.基于空間交會的天基反衛(wèi)作戰(zhàn)方案[J].上海航天,2009,12(3): 12-17.
ZHOU W Y, LIU H, LI S L, et al. Anti-satellite operation scheme based on space rendezvous [J]. Aerospace Shanghai, 2009,12(3):12-17.
[3] SHINAR J, OSHMAN Y, TURETSKY V. Integrated estimation guidance design for hit-to-kill accuracy [C]// Proc.of the American Control Conference, 2003: 402-407.
[4] 張琪新, 孫富春, 葉文, 等. 基于離散粒子群算法的航天器在軌服務(wù)任務(wù)分配問題研究[J]. 中國空間科學(xué)技術(shù), 2012, 39(2): 68-76.
ZHANG Q X, SUN F C, YE W, et al. On-orbit servicing task allocation for space-crafts using discrete particle swarm optimization algorithm [J]. Chinese Space Science and Technology, 2012, 39(2): 68-76.
[5] 黃勇, 李小將, 張東來, 等. 分布式衛(wèi)星系統(tǒng)在軌操作的多目標分配[J]. 宇航學(xué)報, 2013, 34(11): 1475-1482.
HUANG Y, LI X J, ZHANG D L, et al. A multi target assignment method for on-orbit operation of distributed satellites system [J]. Journal of Astronautics, 2013, 34(11): 1475-1482.
[6] ZOU C M. An improved particle swarm optimization [J]. Computer Knowledge & Technology, 2009, 380(16): 1-5.
[7] QIN Q D, CHENG S, ZHANG Q Y, et al. Particle swarm optimization with inter-swarm interactive learning strategy [J]. IEEE Trans. on Cybernetics, 2016, 46(10): 2238-2251.
[8] TAN G Z, BAO K, RICHARD M R. A composite particle swarm algorithm for global optimization of multimodal functions [J]. Journal of Central South University: Science and Technology, 2014, 21(6): 1871-1880.
[9] TRELEA I C. The particle swarm optimization algorithm: convergence analysis and parameter selection [J]. Information Processing Letters, 2003, 85(6): 317-325.
[10] 劉光遠, 賀一, 溫萬惠. 禁忌搜索算法及應(yīng)用[M]. 北京: 科學(xué)出版社, 2014: 35-54.
ZHAO G Y,HE Y,WEN W H. Taboo search and its application[M].Beijing: China Science Press, 2014: 35-54.
[11] 趙瑞安. 空間武器設(shè)計[M]. 北京: 中國宇航出版社, 2008: 155-181.
ZHAO R A. Space weapon design [M]. Beijing: China Astronautics Publishing House, 2008: 155-181.
[12] CHENG Y H, JIANG B, SUN J, et al. Low-thrust orbit transfer by combing genetic algorithm with refinedQ-law method[J]. Transactions of Nanjing University of Aeronautics & Astronautics, 2010, 27(4): 313-320.
[13] ZHANG X, CHENG Y H, JIANG B. Time-optimal coplanar orbit transfer using genetic-simplex algorithm [C]∥Proc.of the 3rd International Symposium on Systems and Control in Aeronautics& Astronautics, 2010: 12-16.
[14] WANG S Z, MENG B. Chaotic particle swarm optimization algorithm for support vector machine [C]// Proc.of the IEEE International Conference on Bio-Inspired Computing: Theories and Applications, 2010: 1654-1657.
[15] TATSUMI K, IBUKI T, TANINO T. A chaotic particle swarm optimization exploiting a virtual quartic objective function based on the personal and global best solutions [J]. Applied Mathematics and Computation,2013,219(17):8991-9011.
[16] LEE Z J, SU S F, LEE C Y. Efficiently solving general weapon-target assignment problem by genetic algorithm with greedy eugenics [J]. IEEE Trans. on Systems, Man, and Cybernetics, Part B: Cybernetics, 2003, 33(1): 113-121.
[17] ZBIGNIEW R B, ANTONY T, KETULA P. Effect-based weapon-target assignment with minimized collateral damage [J]. International Journal of Operational Research, 2016, 27(4): 624-641.
[18] MEKAWEY H I, ABDEL W M S, HASHEM M. Novel goal based weapon-target assignment doctrine [J]. Journal of Aerospace Computing, 2009, 27(6): 622-629.
[19] BHABANI S P M, EUIWHAN K, GUCK C B, et al. Weapon target assignment problem: multi-objective formulation, optimization, using MOPSO and TOPSIS [J]. International Journal of Intelligent Defense Support Systems, 2015, 5(3): 226-252.
[20] ONUR O. A mathematical approach to neuron marketing: a weapon-target assignment model [J]. International Journal of Academic Research in Business and Social Sciences,2016,6(1): 164-173.