趙彬, 周中良, 謝新輝, 李飛, 江建成
(1.空軍工程大學 航空航天工程學院, 陜西 西安 710038;2.空軍西安飛行學院 理訓系, 陜西 西安 710300)
?
基于RHC-GCPSO的末端規避軌跡最優控制方法
趙彬1, 周中良1, 謝新輝1, 李飛2, 江建成1
(1.空軍工程大學 航空航天工程學院, 陜西 西安 710038;2.空軍西安飛行學院 理訓系, 陜西 西安 710300)
針對傳統典型末端規避戰術實時性低、操作難度大和規避效果差等缺點,研究了一種實時指令控制的戰斗機末端規避戰術軌跡控制方法;分析了增大脫靶量的末端規避原理,在以導彈為原點的球坐標系下建立了導彈與戰斗機的相對運動模型;結合戰斗機動力學模型,建立了脫靶量末端規避數學模型;選取脫靶量為優化指標,建立了戰術軌跡最優控制指令模型;提出了滾動關聯粒子群算法并對該模型進行求解,得到了戰斗機的最優戰術機動控制指令;通過仿真,對比了滾動關聯粒子群與粒子群、混沌粒子群三種算法對最優控制指令模型求解的結果,驗證了該算法的優越性。
末端規避; 脫靶量; 控制指令; 滾動時域控制
末端規避是戰斗機通過戰術機動規避來襲導彈,阻止戰斗機被導彈命中,達到提高其生存率,實現“保己”的目的[1-2]。目前國內對于戰斗機末端防御來襲導彈攻擊的技術還不成熟,尤其是在實際訓練中沒有實踐,而當飛行員遇到此類問題時,只能通過自己的臨場發揮去處理。文獻[3-4]建立了戰斗機機動規避的微分動態規劃模型,并對該模型進行前、后向積分的推導求解,得到戰斗機機動規避的最優機動軌跡。文獻[5]探索性地研究了在兩枚導彈來襲的情況下戰斗機的末端規避問題,建立了戰斗機規避優化解算模型,提出了基于最速下降法對其進行優化解算的方法。文獻[6]針對未知來襲導彈導引律的情況,提出了一套新的方法研究最優的規避路徑。文獻[7]對無人機規避攻擊進行了研究,以威力勢為目標函數,將規避決策問題視為威力勢的增減問題。文獻[8-9]基于NMPC的思想,對戰斗機末端規避策略進行了閉環求解,得到了最優的規避軌跡。空戰中,如何在提升戰斗力的同時提高飛機在導彈威脅下的生存力成為了各國專家和飛行員較為關注的問題。為進一步提高規避效果,克服傳統典型末端規避戰術的實時性低、操作難度大和規避效果差等缺點,本文建立了導彈和戰斗機的交互模型,對大過載機動進行了定量分析與研究,并指出了典型末端規避機動戰術的缺點。以最大化脫靶量為性能指標,通過建立戰斗機最優規避控制模型,提出了基于滾動時域的灰色關聯混沌粒子群優化決策算法(RHC-GCPSO),對該最優控制模型進行了閉環實時解算,并通過仿真驗證了此方法的有效性。
導引律未知時,戰斗機末端規避軌跡設計問題本質上是兩端受約束的路徑引導問題,通常采用的解決方法是微分對策理論,這類問題過于復雜。本文假設導彈為PN制導,確定了導彈導引律,則可以將此問題看作為單邊最優控制問題[5]。
1.1地理坐標系下的運動模型
(1)導彈運動模型
(1)
式中:vm為導彈的速度;θm為導彈的俯仰角,導彈抬頭為正;φm為導彈的偏航角,逆時針為正;nmd和nmt分別為導彈的俯仰過載和偏航過載;Tm(t)和Dm分別為導彈的推力和所受的空氣阻力。
(2)戰斗機運動模型
(2)
式中:vf為戰斗機的速度;θf和φf分別為戰斗機的航跡俯仰角和航跡偏航角;αf,μf和ηf為控制量,分別為戰斗機的迎角、滾轉角和油門大小,且ηf∈[0,1];Lf為升力;Tfmax為戰斗機的最大推力;Df為空氣阻力;mf為戰斗機的質量。
1.2球坐標系下的相對運動模型
圖1給出了導彈和戰斗機的態勢幾何關系。圖中,M表示導彈,F表示戰斗機;Oxeyeze為“北-天-東”地理坐標系,Fxfyfzf為以F為原點的飛機坐標系;(u,υ)為相對俯仰角和相對偏航角,r為相對距離,h為相對高度差。

圖1 導彈與戰斗機的幾何關系圖Fig.1 The geometric relationship between missile and fighter
直角坐標系下M與F的相對運動模型為:
(3)
式中:xr,yr及zr分別為導彈與戰斗機的相對水平距離、相對高度和相對側向距離。
根據直角坐標系到球坐標系(以M為球心)的轉換原理,可以得到:
(4)
高度差為:
(5)
綜合式(4)和式(5)及戰斗機動力學模型,可得到增大脫靶量末端的規避模型為:
(6)
2.1最優控制模型
戰斗機規避時的戰術軌跡最優控制指令模型可以由下式描述[4,9]:
(7)

2.2性能指標
考慮導彈過載限制和戰斗機的飛行參數、控制量的限制,選定脫靶量為優化性能指標。脫靶量為接近速度為零時戰斗機與導彈之間的相對距離[4]。戰斗機在末端規避時,應使導彈脫靶量越大越好,因此可以選擇脫靶量為優化指標:
(8)
在終端時刻,可以認為導彈與戰斗機的相對速度vc等于零,即:
(9)
指令實時解算方法
本文引入了RHC[4]方法。在RHC的架構上,基于GAD[5]和CO對PSO算法[10]進行了改進,提出了RHC-GCPSO算法,該算法能夠大大提高計算效率,克服GAD-COPSO實時性不高等缺點。
3.1控制量的編碼
采用十進制對戰斗機的控制量u(t)=[αf,μf,ηf]T進行編碼,每個粒子的位置信息對應一個6位數的數字串,初始的控制量[αf1,μf1,ηf1]T分別對應C1,C2和C3,迭代后的控制量[αf2,μf2,ηf2]T分別對應C4,C5和C6。
根據戰斗機編碼的規則和PSO算法位置的更新公式,可以得到控制量與對應編碼的轉換公式。以μf為例,相應的轉換方程可以表示為:
(10)
式中:Δμfmax為最大滾轉角變化率;k為迭代次數(k=1,2,…,n)。同理,可以得到αf和ηf的轉換公式。
3.2飛行控制量的求解
由于ηf不能用角度來表示,可以用當前狀態的推力系數作為參考,故在對飛行控制量進行求解時對ηf不加限制,下面對控制量進行推導。由于:
(11)
(12)

(13)
將式(13)代入式(12),可得偏航角變化率的表達式為:
(14)
(15)
賦予αf,μf,φf,θf一定的初值,通過5階龍格-庫塔法就能夠解算出當前態勢下控制量αf,μf與姿態角φf,θf之間的關系,并由此可以建立當前態勢下αf,μf與φf,θf之間關系的數據庫,方便后期求解時調用。
3.3不可行解的拯救策略
為簡化計算方法,對不可行解進行拯救時考慮到戰斗機的控制約束范圍αfmin≤αf≤αfmax和μfmin≤μf≤μfmax,當αf和μf的可行解都為正時,設Π(u)為可行解,此時不可行域可以表示為:
(16)
拯救的粒子集合C(u)可以表示為:
(17)
將集合C(u)中的粒子加入到搜索空間內,增加粒子的活性,以便取得更加優異的全局最優解。在每次迭代中,對于不在可行域內的粒子需要作以下處理:
(1)判斷粒子Xi,若不在不可行域內,則進入更新極值;若在,則轉入下一步繼續處理;
(2)判斷Xi是否在拯救集合C(u)內,若在,則對其進行保留;反之舍棄。
下面通過數字仿真,驗證RHC-GCPSO算法的有效性。首先給定典型的作戰場景:敵方一枚中遠距半主動雷達制導空空導彈對我機進行攔截,并采用比例導引進行制導。初始態勢為:戰斗機初始參數:(xf0,yf0,zf0)=(10,5.5,2) km,vf0=350 m/s,(θf0,φf0)=(30°,20°) ;導彈初始參數:(xm0,ym0,zm0)=(0,4.5,0) km,vm0=1 200 m/s,(θm0,φm0)=(30°,20°);載機的控制量初值取[αf0,μf0,ηf0]=[5°,10°,0.8]。根據式(4)和式(5)可求得r0,u0,υ0,h0。
某型中遠距半主動雷達制導空空導彈的性能參數為:nmmax=40,K=3,τm=0.2 s,CD0=0.4,CL=2,Km=0.08,tmax=28 s。

設定仿真時間為30 s,戰斗機初始規避時刻為零時刻,最大可規避時間Tm=28 s,RHC時域窗口取為T=2 s。取粒子總數為60,慣性權值ω=0.5,最大迭代次數50,加速因子N1=N2=2。仿真結果如圖2~圖7所示。

圖2 基于PSO的運動軌跡Fig.2 The trajectories based on PSO

圖3 基于COPSO的運動軌跡Fig.3 The trajectories based on COPSO

圖4 基于RHC-GCPSO的運動軌跡Fig.4 The trajectories based on RHC-GCPSO

圖5 迎角的變化Fig.5 Variation of angle of attack

圖6 滾轉角的變化Fig.6 Variation of roll angle

圖7 油門桿的變化Fig.7 Variation of throttle lever
由圖2~圖4可以看出,基于PSO,COPSO及RHC-GCPSO三種優化算法求解的結果均表明戰斗機最終能夠完成規避任務,三種算法解算的終端脫靶量分別為36.05 m,55.16 m,75.89 m,完成規避的時間分別為22.5 s,23.3 s,24.5 s。規避軌跡呈現先爬升、后下降的變化趨勢,符合實際空戰情景。
由圖5和圖6可以看出,戰斗機的迎角指令呈現來回振蕩的變化趨勢,基于PSO算法解算的振蕩趨勢最大,其次為COPSO,RHC-GCPSO的振蕩最小;戰斗機的滾轉角變化曲線出現輕微振蕩,整體呈現向負方向增大的變化趨勢。
由圖7可以看出,三種算法得出的戰斗機油門桿指令均處于最大位置上,表明戰斗機一直以最大加力狀態在執行規避任務,這樣不斷提高載機的能量,也在不斷消耗著導彈的能量。
(1)本文研究的基于增大脫靶量的戰斗機末端規避軌跡最優控制方法是有效的,提出的基于RHC-GCPSO的算法經仿真驗證也是有效的。
(2)基于RHC-GCPSO的方法增加了粒子活性,擴大了可行域的解空間,與其他兩種算法比較,得到的終端脫靶量最大。
(3)由于RHC-GCPSO解算步驟最為繁瑣,在尋優進程中所消耗的時間最長,但其解算更為精確,更加貼近實際情況,規避效果更好,所得到的戰斗機控制指令更加真實。
[1]賈秋銳,孫媛媛,鐘詠兵.空空導彈發展趨勢[J].飛航導彈,2012(7):29-42.
[2]李飛.先進戰斗機規避決策與控制技術研究[D].西安:空軍工程大學,2014.
[3]Tal Shima.Cooperative evasion and pursuit for aircraft protection[R].Haifa,Israel:Technion Research and Development Foundation Limited,Israel Institute of Technology,2012.
[4]Tal Shima.Optimal cooperative pursuit and evasion strategies against a homing missile[J].Journal of Guidance,Control,and Dynamics,2011,34(2):414-425.
[5]Fumiaki Imado,Akeshi Kuroda.Engagement tactics for two missiles against an optimally maneuvering aircraft[J].Journal of Guidance,Control,and Dynamics,2011,34(2):574-582.
[6]胡安輝,鄭濤,朱石剛.未知導引律導彈攻擊情況下的規避路徑[J].彈箭與制導學報,2010,30(3):32-34.
[7]劉杰,張健,李世曉,等.基于三維空間的無人機規避攻擊導引設計[J].電光與控制,2014,21(4):34-37.
[8]李飛,于雷,周中良,等.戰斗機末端機動的非線性模型預測控制規避策略[J].國防科技大學學報,2014,36(3):83-90.
[9]于雷,付昭旺,李戰武,等.目標威脅規避約束下戰斗機引導控制優化方法[J].北京航空航天大學學報,2014,40(2):229-234.
[10]Janne Karelahti,Kai Virtanen,Tuomas Raivio.Near-optimal missile avoidance trajectories via receding horizon control[J].Journal of Guidance,Control,and Dynamics,2007,30(5):1287-1298.
(編輯:姚妙慧)
The model of terminal avoidance trajectory optimal control based on RHC-GCPSO
ZHAO Bin1, ZHOU Zhong-liang1, XIE Xin-hui1, LI Fei2, JIANG Jian-cheng1
(1.Aeronautics and Astronautics Engineering College, Air Force Engineering University, Xi’an 710038, China;2.Theory Training Department, Air Force Xi’an Flight College, Xi’an 710300, China)
For the poor real-time performance, difficult operation and bad effect of traditional terminal avoidance tactics, this paper studied a tactical track real-time control method of fighter. The terminal avoidance theory of increasing miss distance was analyzed and a relative motion model of missile and fighter was constructed with the missile as origin in the spherical coordinate system. According to aircraft dynamics model, a mathematical model of miss distance terminal avoidance was established, which was taken as state constraints. A tactical track optimization control command model was built up with the miss distance as the optimization index. The model was solved by Receding Horizon Control-Grey Chaos Particle Swarm Optimization (RHC-GCPSO) algorithm, thus getting the optimal tactical maneuvering control command of the fighter. The advantages of the algorithm were verified by comparing the particle swarm, chaos particle swarm and RHC-GCPSO in simulation.
terminal avoidance; miss distance; control command; receding horizon control
2015-11-09;
2016-03-15; 網絡出版時間:2016-04-22 09:52
國家自然科學基金資助(61472441)
趙彬(1991-),男,山東濟南人,碩士研究生,研究方向為武器系統總體技術與作戰運用。
TJ765.3
A
1002-0853(2016)04-0064-05