黃 偉,徐建城,吳華興
(1.西北工業(yè)大學(xué)電子信息學(xué)院,陜西 西安 710072; 2.空軍工程大學(xué)航空航天工程學(xué)院,陜西 西安 710038)
航空飛行器軌跡引導(dǎo)逆次優(yōu)控制算法
黃 偉1,徐建城1,吳華興2
(1.西北工業(yè)大學(xué)電子信息學(xué)院,陜西 西安 710072; 2.空軍工程大學(xué)航空航天工程學(xué)院,陜西 西安 710038)
針對(duì)目前航空飛行器軌跡引導(dǎo)算法僅適用于特定引導(dǎo)過程,且未考慮系統(tǒng)動(dòng)態(tài)性能要求的問題,提出了航空飛行器軌跡引導(dǎo)逆次優(yōu)控制算法。該方法通過建立飛行器與目標(biāo)相對(duì)運(yùn)動(dòng)的數(shù)學(xué)模型,以引導(dǎo)準(zhǔn)確性和控制經(jīng)濟(jì)性為性能指標(biāo),根據(jù)系統(tǒng)動(dòng)態(tài)性能要求計(jì)算時(shí)變權(quán)值系數(shù),逆向得出線性反饋控制器,從而得到具有給定動(dòng)態(tài)性能的次優(yōu)引導(dǎo)系統(tǒng)。應(yīng)用實(shí)例表明,該算法適用于包含多約束條件的航空飛行器引導(dǎo)過程,所得到的逆次優(yōu)控制器滿足引導(dǎo)準(zhǔn)確性、控制經(jīng)濟(jì)性和系統(tǒng)動(dòng)態(tài)性能等指標(biāo)要求。
航空飛行器;引導(dǎo)系統(tǒng);逆次優(yōu)控制;動(dòng)態(tài)特性
航空飛行器引導(dǎo)技術(shù)是衡量航空領(lǐng)域發(fā)展水平的重要標(biāo)志。隨著飛行器性能的不斷提升及作戰(zhàn)任務(wù)的多樣化,為發(fā)揮其最大的作戰(zhàn)效能,對(duì)引導(dǎo)的準(zhǔn)確性、控制的經(jīng)濟(jì)性以及所建立的引導(dǎo)系統(tǒng)的動(dòng)態(tài)性能要求越來越高。建立具有普適性并易于工程化的引導(dǎo)算法,滿足不同航空飛行器的作戰(zhàn)使用要求,具有重要的現(xiàn)實(shí)意義。
以引導(dǎo)準(zhǔn)確性和控制經(jīng)濟(jì)性為性能指標(biāo)的航空飛行器引導(dǎo)過程是多約束條件下的優(yōu)化問題,所建立的閉環(huán)引導(dǎo)系統(tǒng)必須滿足一定的動(dòng)態(tài)性能指標(biāo)要求[1]。國內(nèi)外相關(guān)學(xué)者對(duì)該問題進(jìn)行了深入研究,文獻(xiàn)[2]以引導(dǎo)時(shí)間為性能指標(biāo),建立了戰(zhàn)斗機(jī)遠(yuǎn)距引導(dǎo)算法,但所得到的時(shí)間最優(yōu)引導(dǎo)律缺乏普適性;文獻(xiàn)[3]應(yīng)用滑模技術(shù)得到了適用于跟蹤機(jī)動(dòng)目標(biāo)的導(dǎo)彈制導(dǎo)律,但終端約束僅包含彈目相對(duì)速度,不能保證攻擊的準(zhǔn)確性;文獻(xiàn)[4—6]針對(duì)戰(zhàn)斗機(jī)近距引導(dǎo)過程,提出了多約束條件下的最優(yōu)引導(dǎo)律,但所得到的控制器與性能指標(biāo)的匹配性缺乏理論支撐,且未考慮系統(tǒng)動(dòng)態(tài)性能要求;文獻(xiàn)[7]基于引導(dǎo)過程特點(diǎn)提出一種非線性最優(yōu)制導(dǎo)律,但其推導(dǎo)繁瑣、計(jì)算耗時(shí)長,工程實(shí)現(xiàn)困難。由此可見,該領(lǐng)域研究現(xiàn)狀所涉及的主要問題是:所提出的引導(dǎo)算法只適用于特定的引導(dǎo)過程,基于算法所得到的引導(dǎo)系統(tǒng)不具備給定的動(dòng)態(tài)特性,實(shí)用性不強(qiáng),工程實(shí)現(xiàn)困難。解決該問題的主要技術(shù)難點(diǎn)包括:如何建立滿足一般引導(dǎo)過程的系統(tǒng)狀態(tài)方程和性能指標(biāo)函數(shù);如何在難以準(zhǔn)確估計(jì)結(jié)束控制時(shí)刻的前提下,保證所得到的控制器與性能指標(biāo)的匹配性;如何使所得到的引導(dǎo)系統(tǒng)滿足給定的動(dòng)態(tài)性能指標(biāo)要求。針對(duì)上述問題,提出了航空飛行器軌跡引導(dǎo)逆次優(yōu)控制算法。
1.1 狀態(tài)方程的建立
建立滿足一般引導(dǎo)過程的系統(tǒng)狀態(tài)方程是飛行器引導(dǎo)系統(tǒng)設(shè)計(jì)的基礎(chǔ)。假設(shè)飛行器(戰(zhàn)斗機(jī)、導(dǎo)彈)各控制通道互不影響,僅在水平平面內(nèi)研究飛行器的引導(dǎo)過程,飛行器與目標(biāo)的相對(duì)運(yùn)動(dòng)關(guān)系如圖1所示。
圖1中,飛行器位于O點(diǎn),目標(biāo)位于M點(diǎn),目標(biāo)速度矢量水平分量為Vm,φm和θm分別為水平面內(nèi)目標(biāo)速度前置角和航向角,V為飛行器速度矢量水平分量,φ和θ分別為水平面內(nèi)飛行器速度前置角和航向角,ε為目標(biāo)線角。將速度矢量Vm和V投影到目標(biāo)線LOS及其法線上可得[5]
(1)
(2)
(3)
飛行器和目標(biāo)的加速度在目標(biāo)線法線上的分量分別為
(4)
(5)
由式(3)—式(5)可得
(6)
式(6)即為飛行器與目標(biāo)在水平面內(nèi)相對(duì)運(yùn)動(dòng)關(guān)系的數(shù)學(xué)模型。將飛行器和目標(biāo)在目標(biāo)線法線上的加速度作為引導(dǎo)系統(tǒng)的控制量和干擾量,并假設(shè)目標(biāo)不做機(jī)動(dòng)(jm=0),考慮到飛行器角度關(guān)系式φ=ε-θ,可得系統(tǒng)狀態(tài)方程為:
(7)
1.2 性能指標(biāo)函數(shù)的建立
性能指標(biāo)函數(shù)的建立是飛行器引導(dǎo)系統(tǒng)設(shè)計(jì)的難點(diǎn),不同的引導(dǎo)過程所要求的性能指標(biāo)不同,不同的引導(dǎo)階段性能指標(biāo)的側(cè)重點(diǎn)也不相同。一般情況下,性能指標(biāo)函數(shù)中包含多個(gè)約束條件。下面以戰(zhàn)斗機(jī)近距引導(dǎo)和SAR(Synthetic Aperture Radar, SAR)制導(dǎo)導(dǎo)彈末制導(dǎo)過程為例,說明建立性能指標(biāo)函數(shù)過程中應(yīng)著重考慮的因素。
戰(zhàn)斗機(jī)近距引導(dǎo)過程中,使用單一目標(biāo)線角速度約束的比例導(dǎo)引法和單一前置角約束的最佳前置法并不能保證引導(dǎo)的準(zhǔn)確性[5],原因在于:引導(dǎo)初始階段,戰(zhàn)斗機(jī)與目標(biāo)距離較遠(yuǎn),目標(biāo)線角速度數(shù)值非常小,以至于現(xiàn)有的測量手段無法量測,并且較小的目標(biāo)線角速度誤差將可能產(chǎn)生較大的引導(dǎo)誤差,由此,必須對(duì)前置角加以約束,這不僅可以保證引導(dǎo)初始階段的準(zhǔn)確性,還可以使戰(zhàn)斗機(jī)在引導(dǎo)結(jié)束時(shí)刻,相對(duì)目標(biāo)取得一定的角度占位優(yōu)勢,有利于形成武器發(fā)射條件;對(duì)于近距引導(dǎo)結(jié)束階段,為了將戰(zhàn)斗機(jī)準(zhǔn)確地引導(dǎo)至目標(biāo)附近,必須對(duì)目標(biāo)線角速度加以約束,以確保引導(dǎo)精度。所以,戰(zhàn)斗機(jī)近距引導(dǎo)過程中性能指標(biāo)的選取應(yīng)綜合考慮目標(biāo)線角速度誤差和前置角度誤差。
SAR導(dǎo)引頭末制導(dǎo)過程中,由于SAR自身的特點(diǎn),為了獲得所需的方位向分辨率,導(dǎo)彈飛行速度矢量方向與目標(biāo)線必須保持一定的前置角。此外,為了保證引導(dǎo)的準(zhǔn)確性,分析脫靶量可知,結(jié)束控制時(shí)刻目標(biāo)線角速度應(yīng)趨于零[8]。由此可見,SAR制導(dǎo)導(dǎo)彈末制導(dǎo)同戰(zhàn)斗機(jī)近距引導(dǎo)的性能指標(biāo)形式相同,都包含對(duì)目標(biāo)線角速度誤差和前置角度誤差的約束,不同之處在于:戰(zhàn)斗機(jī)近距引導(dǎo)的理想前置角是根據(jù)目標(biāo)線和前置點(diǎn)計(jì)算得到,而SAR末制導(dǎo)理想前置角則根據(jù)成像所需方位向分辨率計(jì)算得到。通過上述分析,可建立航空飛行器一般引導(dǎo)過程的二次型性能指標(biāo)函數(shù)
(8)
式(8)中,φ、ω、j分別為飛行器前置角、目標(biāo)線角速度、法線加速度,φT、ωT分別為飛行器理想前置角及理想目標(biāo)線角速度,q11、q22、r均為權(quán)值系數(shù),tk為結(jié)束控制時(shí)刻。應(yīng)該注意到,以前置角誤差和目標(biāo)線角速度誤差作為終端約束條件,并考慮控制經(jīng)濟(jì)性的性能指標(biāo)函數(shù)僅適用于一般引導(dǎo)過程,實(shí)際應(yīng)用過程中,可根據(jù)作戰(zhàn)使用的具體要求和飛行器自身特點(diǎn)建立相應(yīng)的性能指標(biāo)函數(shù)。
通過上述分析可知,引導(dǎo)最優(yōu)問題具有以下特點(diǎn):1) 狀態(tài)方程是一階線性時(shí)變的,時(shí)變系數(shù)基于引導(dǎo)過程中傳感器的量測;2) 由于目標(biāo)運(yùn)動(dòng)的隨機(jī)性,結(jié)束控制時(shí)刻難以準(zhǔn)確估計(jì);3) 閉環(huán)引導(dǎo)系統(tǒng)應(yīng)具有給定的動(dòng)態(tài)性能。根據(jù)以上特點(diǎn),提出一種逆次優(yōu)引導(dǎo)控制算法,該算法基于式(7)所表示的狀態(tài)方程和式(8)所表示的性能指標(biāo)函數(shù),結(jié)合系統(tǒng)動(dòng)態(tài)性能的具體指標(biāo)要求,計(jì)算性能指標(biāo)函數(shù)中的待定權(quán)值系數(shù),逆向得出次優(yōu)線性反饋控制器,從而使所建立的引導(dǎo)系統(tǒng)滿足引導(dǎo)的準(zhǔn)確性、控制的經(jīng)濟(jì)性,以及系統(tǒng)動(dòng)態(tài)性能等指標(biāo)要求。
將式(7)和式(8)轉(zhuǎn)化為標(biāo)準(zhǔn)形式
(9)
(10)
式(10)中,R(t)和Q(t)均為待定的性能指標(biāo)權(quán)值矩陣。不難證明,式(9)表示的系統(tǒng)狀態(tài)方程是能控的,根據(jù)最優(yōu)控制理論,最優(yōu)控制量為:
U(t)=-R-1(t)BT(t)P(t)ΔX(t)
(11)
P(t)滿足黎卡提方程及邊值條件
P(t)B(t)R-1(t)BT(t)P(t)P(tk)=Q(t)
(12)
顯然,當(dāng)P(t)對(duì)稱的情況下,若狀態(tài)變量維數(shù)為n,黎卡提方程包含n(n+1)/2個(gè)獨(dú)立的非線性微分方程,在理想條件下求解已十分困難,加之引導(dǎo)過程中飛行器與目標(biāo)運(yùn)動(dòng)狀態(tài)的劇烈變化,結(jié)束控制時(shí)刻tk的估計(jì)算法復(fù)雜[9-10],且存在較大的估計(jì)誤差,這將進(jìn)一步增加黎卡提方程求解的復(fù)雜性。為滿足工程化需求,針對(duì)這一問題文獻(xiàn)[11]指出:由于引導(dǎo)過程的每一時(shí)刻t都可能對(duì)應(yīng)結(jié)束時(shí)刻tk,即t→tk,P(t)存在穩(wěn)態(tài)解[11]
(13)
式(13)表示的P(t)求解方法給工程應(yīng)用帶來了極大的方便,所得到的控制量理論上是次優(yōu)的,但從作戰(zhàn)使用和工程實(shí)現(xiàn)角度考慮,則是最優(yōu)的。將式(13)代入式(11),可得次優(yōu)控制量為:
U(t)=-R-1(t)BT(t)Q(t)ΔX(t)
(14)
式(14)所表達(dá)的次優(yōu)控制量取決于權(quán)值矩陣R(t)和Q(t)所包含元素的比值,與元素的絕對(duì)數(shù)值無關(guān)。由此,令R(t)=I為單位陣。假設(shè)飛行器飛行控制系統(tǒng)無遲滯的響應(yīng)式(14),將式(14)代入式(9),次優(yōu)閉環(huán)引導(dǎo)系統(tǒng)狀態(tài)方程為:
+B(t)BT(t)Q(t)XT(t)
(15)
式(15)中,XT(t)=X(t)+ΔX(t)為理想狀態(tài)變量。假設(shè)引導(dǎo)過程中所有運(yùn)動(dòng)參數(shù)的量測都準(zhǔn)確理想,則A(t)和B(t)為已知。接下來將根據(jù)閉環(huán)引導(dǎo)系統(tǒng)給定的動(dòng)態(tài)性能指標(biāo)計(jì)算Q(t),對(duì)于簡單系統(tǒng),若給定動(dòng)態(tài)系統(tǒng)調(diào)節(jié)時(shí)間ts,通過對(duì)式(15)兩端積分可計(jì)算得到Q(t);對(duì)于慢變系數(shù)的復(fù)雜系統(tǒng),特征值對(duì)系統(tǒng)動(dòng)態(tài)性能具有主導(dǎo)作用,通過給定的系統(tǒng)特征值λi,可建立式(16)所表達(dá)的特征方程求解得出Q(t)。
det[λiI-A(t)+B(t)BT(t)Q(t)]=0
(16)
應(yīng)該注意到,根據(jù)系統(tǒng)不同的動(dòng)態(tài)性能指標(biāo)要求,求解Q(t)的方法是多樣的,所得到的Q(t)是隨引導(dǎo)過程時(shí)變的。將Q(t)代入式(14),可得次優(yōu)反饋控制量,進(jìn)而得到具有給定動(dòng)態(tài)性能的次優(yōu)引導(dǎo)系統(tǒng)。如果所得到的次優(yōu)控制量超出限制條件,即U(t)>Umax,則在容許區(qū)間內(nèi)調(diào)整系統(tǒng)動(dòng)態(tài)性能指標(biāo)的給定值,重新計(jì)算Q(t),所涉及的參數(shù)尋優(yōu)算法較為成熟。
上述的逆次優(yōu)控制算法適用于包含多約束條件的航空飛行器引導(dǎo)過程,所得到的逆次優(yōu)控制器綜合考慮了引導(dǎo)準(zhǔn)確性、控制經(jīng)濟(jì)性和系統(tǒng)動(dòng)態(tài)性能等指標(biāo)要求。由于權(quán)值矩陣Q(t)同時(shí)包含在控制量和性能指標(biāo)函數(shù)中,對(duì)于不同的系統(tǒng)動(dòng)態(tài)性能指標(biāo)要求所帶來的Q(t)的變化,并不會(huì)影響控制量對(duì)于性能指標(biāo)的最優(yōu)性,保證了控制器與性能指標(biāo)的匹配性。
下面以空空主動(dòng)雷達(dá)彈末制導(dǎo)過程為例,驗(yàn)證本文提出的逆次優(yōu)引導(dǎo)控制算法的有效性。在不考慮雷達(dá)導(dǎo)引頭動(dòng)力學(xué)誤差及隨機(jī)誤差的基礎(chǔ)上,假設(shè)末制導(dǎo)過程中目標(biāo)始終處于導(dǎo)引頭探測范圍之內(nèi),對(duì)導(dǎo)彈前置角無約束,性能指標(biāo)僅考慮脫靶量及控制經(jīng)濟(jì)性,控制量為飛行器水平面內(nèi)目標(biāo)線法向加速度。根據(jù)式(7)和式(8)建立水平面內(nèi)狀態(tài)方程及性能指標(biāo)函數(shù)分別為:
(17)
(18)
其中,q和r均為時(shí)變權(quán)值系數(shù),為保證制導(dǎo)的準(zhǔn)確性,有效減小脫靶量,式(18)中的理想目標(biāo)線角速度ωT=0。根據(jù)逆次優(yōu)控制算法,結(jié)合式(13)和式(14)可得次優(yōu)控制量為
(19)
由于控制量j與比值q/r有關(guān),令r=1。假設(shè)導(dǎo)彈自動(dòng)駕駛儀無遲滯的響應(yīng)式(19)的指令加速度。將式(19)代入式(17),可得閉環(huán)引導(dǎo)系統(tǒng)狀態(tài)方程為
(20)

(21)
由式(21)可得
(22)

(23)
(24)
式(24)所得到的次優(yōu)控制量與彈目初始距離R0、結(jié)束控制距離Rk、彈目徑向速度V及目標(biāo)線角速度ω有關(guān),與比例導(dǎo)引法j=NVω形式相同,不同之處在于比例系數(shù)的選取,稱為修正比例導(dǎo)引法。由此可知,比例導(dǎo)引作為最優(yōu)制導(dǎo)律的典型代表[12],理論上也是次優(yōu)的。在實(shí)際應(yīng)用過程中,修正比例導(dǎo)引法需要在導(dǎo)彈發(fā)射前裝訂R0及Rk,若R0?Rk,可簡化為j=3Vω。
下面對(duì)修正比例導(dǎo)引法進(jìn)行仿真驗(yàn)證,水平面內(nèi)導(dǎo)彈初始位置坐標(biāo)(0,0),初始速度為υx=0.5 km/s、υy=-0.5 km/s,導(dǎo)彈極限過載nmax=8,Rk=0.2 km時(shí)結(jié)束控制,導(dǎo)彈脫靶量h=10 m。目標(biāo)初始位置坐標(biāo)(20 km,5 km),初始速度為υxt=-0.3 km/s、υyt=0 km/s,仿真中目標(biāo)做過載恒定的側(cè)向S機(jī)動(dòng),航向角不斷減小。

本文提出了航空飛行器軌跡引導(dǎo)逆次優(yōu)控制算法,該算法通過建立飛行器與目標(biāo)相對(duì)運(yùn)動(dòng)的數(shù)學(xué)模型,以引導(dǎo)準(zhǔn)確性和控制經(jīng)濟(jì)性為性能指標(biāo),根據(jù)系統(tǒng)動(dòng)態(tài)性能要求計(jì)算時(shí)變權(quán)值系數(shù),逆向得出線性反饋控制器,從而得到具有給定動(dòng)態(tài)性能的次優(yōu)引導(dǎo)系統(tǒng)。應(yīng)用實(shí)例表明,該算法適用于包含多約束條件的航空飛行器引導(dǎo)過程,所得到的逆次優(yōu)控制器保證了引導(dǎo)準(zhǔn)確性、控制經(jīng)濟(jì)性和系統(tǒng)動(dòng)態(tài)性能等指標(biāo)要求,對(duì)于航空飛行器引導(dǎo)系統(tǒng)的綜合與設(shè)計(jì)具有一定的理論參考價(jià)值。
[1]WeissH,HexnerG.Stabilityofmodernguidancelawwithmodelmismatch[C]//ProceedingsofAmericanControlConferenceBoston,Massachusetts.AACC2004: 3634-3639.
[2]韓慶,魏賢智,張斌,等.遠(yuǎn)距引導(dǎo)戰(zhàn)斗機(jī)自動(dòng)攻擊控制律實(shí)現(xiàn)[J].電光與控制,2012,19(6):36-40.
[3]余家祥,楊秀庭,郭銳,等.基于滑模技術(shù)的艦艦導(dǎo)彈導(dǎo)引律設(shè)計(jì)[J].探測與控制學(xué)報(bào),2003,25(2):23-27.
[4]WattsDJ,StrogatzSH.Collectivedynamicsof'SmallWorld'networks[J].Nature, 1998,393(6684):440-442.
[5]于雷,李言俊,歐建軍.現(xiàn)代戰(zhàn)機(jī)最佳引導(dǎo)算法研究[J].航空學(xué)報(bào),2006,27(2):314-317.
[6]陳中起,張斌,杜永偉,等.近距引導(dǎo)戰(zhàn)斗機(jī)自動(dòng)攻擊控制律實(shí)現(xiàn)[J].火力與指揮控制,2012,37(5):148-151.
[7]俞利新,歐向陽,歐建軍,等.空對(duì)面導(dǎo)彈導(dǎo)引算法研究[J].彈箭與制導(dǎo)學(xué)報(bào),2004,24(3):268-270.
[8]郭建國, 周軍. 基于Nussbaum-type增益技術(shù)的末制導(dǎo)律設(shè)計(jì)[J]. 西北工業(yè)大學(xué)學(xué)報(bào), 2010, 28(5): 753-757.
[9]LeeYI,KimSH,TahkMJ.Optimalityoflineartime-varyingguidanceforimpactanglecontrol[J].IEEETransactionsonAerospaceandElectronicSystems, 2012, 48(3): 2802-2817.
[10]RyooCK,ChoH,TahkMJ.Time-to-goweightedoptimalguidancewithimpactangleconstraints[J].IEEETransactionsonControlSystemsTechnology, 2006, 14(3): 483-492.
[11]KhannaSK,MailerK.Aeronauticalradiocontrolsystem[M].Moscow:RadioTechnologyPress, 2003: 65-81.
[12]王輝, 王江, 郭濤, 等. 基于逆最優(yōu)問題的最優(yōu)制導(dǎo)律及特性分析[J]. 固體火箭技術(shù), 2014, 37(5): 587-593.
Inverse Suboptimal Control Algorithm for Trajectory Guidance of Aerial Vehicle
HUANG Wei1, XU Jiancheng1, WU Huaxing2
(1.Electronic and Information College, Northwestern Polytechnic University, Xi’an 710072,China; 2.Aeronautics and Astronautics Engineering College, Air Force Engineering University, Xi’an 710038, China)
Traditonal algorithm for trajectory guidance of aerial vehicle is only available to certain guidance process. Regardless of system dynamic performance, an inverse suboptimal control algorithm for trajectory guidance of aerial vehicle was proposed. By modeling relative motion between vehicle and target, using guidance accuracy and control economy as metrics, time-varying weight coefficient were calculated on the basis of system dynamic performance, and linear feedback controller was derived inversely, thus suboptimal guidance system with dynamic performance was built. An application case showed that the algorithm could be applied to guidance processes including multi-constraints and the derived suboptimal controller fulfilled the requirements of accuracy, economy and dynamic performance.
aero vehicle; guidance system; inverse suboptimal control; dynamic performance
2016-07-02
國家自然科學(xué)基金項(xiàng)目資助(61472441)
黃偉(1980—),男,黑龍江綏化人,博士研究生,副教授,研究方向:航空武器總體設(shè)計(jì)。E-mail:huangwei800519@163.com。
V249;TJ765.3
A
1008-1194(2017)01-0031-05