王思卓, 范世鵬, 林德福, 劉經緯
(1.北京理工大學 宇航學院, 北京 100081; 2.北京理工大學 中國- 阿聯酋智能無人系統“一帶一路”聯合實驗室, 北京 100081)
傳統的比例導引制導律形式簡單、易于實現,在工程上得到了廣泛的應用[1-2]。隨著現代戰爭的不斷發展,目標的防御性和機動性越來越強,因此要求導彈能夠在精確命中目標的同時滿足期望的終端落角[3-4]。如攔截導彈時能以較小的迎角直接與目標碰撞。打擊地面坦克、飛機機翼等目標時,能以適當的角度對其薄弱部位進行毀傷。針對此類機動目標,當目標機動能力較強時,在末制導段逃逸能力強[5],運動狀態變化劇烈,彈目視線角速率具有大幅振蕩的特性,且隨著彈目距離的接近發散更加嚴重,使脫靶量增大[6]。此外,高機動導彈末制導段彈目距離較近,目標運動估測誤差等微小擾動會對彈目視線角速率獲取產生較大的影響。因此有必要研究帶終端角度約束的強魯棒性制導律。
隨著現代控制理論的發展,多種控制方法被應用于導彈制導領域,如H∞控制[7-9]、李雅普諾夫函數方法[10-11]、滑模變結構控制[12-14]等。
滑模變結構控制具有高精度和強魯棒性的特點,因而廣泛應用于帶約束的制導律設計[15-16]。文獻[17]利用終端滑模(TSM)針對靜止目標設計了一種有限時間收斂的角度約束制導律。文獻[18]基于零化視線角速率的思想分析了終端碰撞角和彈目視線角的關系,并針對機動目標提出基于終端滑模的角度約束制導律。但終端滑模存在固有的奇異問題,容易導致系統發散。為解決該問題,文獻[19-20]提出基于非奇異終端滑模(NTSM)的角度約束制導律。NTSM雖解決了奇異問題,但其含有的不連續切換函數引起了高頻抖振現象,這將會激發系統的未建模高頻特性,導致系統制導性能變差,甚至破壞系統的穩定性[21]。為抑制高頻抖振,邊界層法、趨近律法、觀測器法等都是有效的解決方法。文獻[22]利用連續的飽和函數對符號函數進行近似處理,降低了抖振,但是該方法導致系統魯棒性隨著邊界層的增大而下降。為解決該問題,文獻[23]基于高階滑模算法設計了一種具有連續特性的二階滑模制導律,將Super-twisting算法作為滑模控制的趨近律,消除了制導律中的不連續項,從而削弱了抖振。但傳統Super-twisting算法存在系統狀態遠離平衡點時收斂速度慢、不能充分利用導彈過載能力的不足[24]。觀測器法是一種前饋擾動抑制的方法,其思想是在線估計系統的擾動并前饋到控制律中來實現對擾動的抑制。針對攻擊機動目標的制導問題,文獻[25]設計了一種高增益觀測器(HGO)對系統擾動進行估計。文獻[26]設計了一種H∞觀測器對目標加速度進行估計。但文獻[25-26]所設計的觀測器只是漸近收斂。為此,文獻[27]設計了一種擴張狀態觀測器(ESO)估計目標的加速度,且是有限時間收斂的,能有效克服目標機動帶給系統的干擾。但該觀測器需要目標加速度上界信息,而該信息一般不易獲得。
針對上述問題,本文基于自適應滑模擾動觀測器和Super-twisting算法設計了一種有限時間收斂的二階滑模制導律,在傳統Super-twisting算法的基礎上引入快速收斂項,提升了系統狀態遠離平衡點時的收斂速度,充分利用了導彈的過載能力,并有效地解決了抖振問題。針對攻擊高機動目標的情形,本文將目標加速度視為系統擾動,設計了一種自適應滑模擾動觀測器對系統的擾動進行在線估計。與前述幾種觀測器不同,本文通過對該觀測器的增益進行自適應處理,克服了傳統觀測器設計增益時對系統上界信息的依賴,所提算法能夠在保證控制精度的同時,有效地克服滑模控制中常見的高頻抖振現象,并以期望的終端落角命中目標。
在慣性坐標系下建立彈目相對運動關系,如圖1所示。圖1中,Oxy為地面慣性坐標系,r為彈目相對距離,q為彈目視線角,M和T分別表示導彈和目標,θM和θT分別為導彈的彈道傾角和目標的航跡角,vM和vT分別為導彈和目標的速度,aM和aT分別為導彈和目標的法向過載。規定圖1中所有角度逆時針為正。

圖1 彈目相對運動模型Fig.1 Relative motion model of missile and target
根據圖1中的彈目相對運動關系,得到導彈末制導階段的數學模型為
(1)
(2)
(3)
(4)
對(1)式和(2)式分別求1階導數,可得
(5)
(6)
式中:aMr、aTr分別為導彈和目標沿彈目視線方向的加速度,aMr=aMsin(q-θM),aTr=aTsin(q-θT);aMq、aTq分別為導彈和目標垂直于彈目視線方向的加速度,aMq=aMcos(q-θM),aTq=aTcos(q-θT)。對于大部分氣動力控制的戰術導彈,沿著速度方向的軸向加速度往往不可控,因此本文僅利用(6)式設計制導律。
假設導彈命中目標時,攻角近似為0°,則落角可以近似為命中時刻導彈的彈道傾角和目標航向角之差,如圖2所示。

圖2 導彈命中時刻落角示意圖Fig.2 Impact angle at the time of hitting the target
圖2中,θi為期望的落角,qf為命中時刻的彈目視線角,θMf和θTf分別為命中時刻導彈的彈道傾角和目標航向角,則有
θi=θTf-θMf
(7)
根據零化視線角速率的思想,在命中時刻,以下關系成立:
vMsin (θMf-qf)=vTsin (θTf-qf)
(8)
根據幾何關系,可以進一步得到:
vMsin (θTf-qf-θi)=vTsin (θTf-qf)
(9)
vMsin (θTf-qf)cosθi-vMcos (θTf-qf)sinθi=vTsin (θTf-qf)
(10)
(11)
整理可得:
(12)

(13)
q(tf)=qf
(14)
選擇系統的狀態變量為

(15)
對(6)式進行整理,可得帶落角約束的制導系統狀態方程:
(16)

為分析和證明方便,引入如下引理:
引理1[28]對于如下系統:
(17)

引理2[29]對于如下系統:
(18)
式中:c1、c2均為正常數;0<α1<1,α2>1。該系統的平衡點是有限時間穩定的,且收斂時間滿足:
(19)
引理3[30]考慮如下Super-twisting算法:
(20)
式中:k1、k2為待設計參數,則該算法是有限時間收斂的。該引理的證明可參考文獻[31]。
引理4[32]假設V(x)是定義在U?n上的C1光滑正定函數,如果對于任意β1>0和β2∈(0,1)都有定義在U?n的函數滿足:
(21)
則存在區域U0?n使得任意初值在U0?n內的V(x)都能在有限時間內到達V(x)≡0。另外,到達V(x)≡0的時間Tr滿足:
(22)
進一步地,對于任意常值參數c,l>0和0<κ<1,都有定義在U?n的函數V(x)滿足:
(23)
則存在區域U0?n使得任意初值在U0?n內的V(x)都能在有限時間內到達V(x)≡0。另外,到達V(x)≡0的時間Tr滿足:
(24)
引理5[33]考慮如下系統:
(25)

ua(t)=-[μa+σa(t)]sgn (ψa)
(26)
μa>0、σa(t)為自適應增益,滿足如下的自適應律:
(27)
(28)
ηa(t)=r0a+ra(t)
(29)
(30)
(31)

(32)
從而能夠保證有限時間內實現σa(t)>|a(t)|,使得滑動模態能夠持續。此外,自適應增益σa(t)和ηa(t)是有界的。
在參數δ0a、αa、qa給定的情況下,只需知道ρ1的階數,選擇足夠大的γa,即可通過選擇合適的εa使不等式(32)式成立,而無需知道ρ1的具體值。
對于滑模面ψa,等效控制輸入ueqa就是a(t)。根據自適應律(27)式~(31)式,σa將會不斷增大直至滑模運動開始發生,之后σa開始減小。因此它將收斂至一個安全的鄰域內,該鄰域保持在ueqa附近,且取決于參數εa和αa。該鄰域表示為
(33)
針對制導系統(16)式設計自適應滑模擾動觀測器。
考慮如下輔助變量:
e=z-x2
(34)
式中:z滿足如下動力學方程:

(35)
c1d>0,c2d>0,0<α1d<1,α2d>1。
考慮如下滑模面:
(36)
(35)式中的變量vz滿足如下動力學方程:
(37)
式中:μd>0;σd(t)>L1。則對系統擾動d的估計可由(38)式得到:
Δ=vz
(38)
證明對(34)式求導,可得

(39)
(39)式代入(36)式,可得
Sd=vz-d
(40)
對(40)式求1階導數,得
(41)
取如下李雅普諾夫方程:
(42)
則
(43)
由于Td>0且σd(t)>L1,則有
(44)
因此滑模面Sd將在有限時間內收斂至0。
此時,將Sd=0代入(36)式,可得
(45)
由引理2可知,e將在有限時間內收斂至0,收斂時間滿足:
(46)
系統擾動的估計誤差可由(47)式定義:
ed=Δ-d
(47)
式中:Δ是自適應滑模擾動觀測器的輸出量。
根據(38)式和(40)式可知ed=0。因此,觀測器(34)式~(38)式能夠在有限時間內準確跟蹤擾動d。
上述內容也說明當σd>L1時,所提出的擾動觀測器能夠在有限時間內對系統擾動d作出準確估計,但在實際問題中,L1的具體值很難獲取[33],因此采用自適應方法對該觀測器進行改進。
考慮(34)式~(38)式所設計的滑模擾動觀測器,增益σd將通過以下自適應律進行更新:
(48)
(49)
ηd(t)=r0d+rd(t)
(50)
(51)
(52)
(53)
因此,σd(t)>|L1|將在有限時間內實現,從而保證滑動模態能夠持續。此外,σd(t)和ηd(t)是有界的。

不等式(53)式只是充分條件。因此,并不需要設定L2的具體值,只要參數γd選取的足夠大,不等式(53)式即可成立。
根據(16)式,aM可進一步表示為aM=aeq+aaux,aeq為等效控制項,aaux為輔助控制項。
滑模控制可分為兩個階段:第1階段是趨近段,在該時間段內,系統狀態將在輔助控制項aaux的作用下從初始狀態收斂至滑模面上;第2階段是滑動段,在該段時間內系統狀態將在等效控制項aeq的作用下沿著滑模面滑動至平衡點,實現狀態收斂。
終端滑模控制采用非線性函數作為滑模面,能使系統狀態在有限時間內收斂,但是該方法存在奇異問題。為避免奇異問題,且獲得更高的控制精度,更快的收斂速度[34],本文采用非奇異終端滑模面進行制導律設計。設計滑模面為
(54)
式中:β為待設計參數,β>0;1<α<2。
對(54)式求1階導數,得
(55)
將(16)式代入(55)式,可得
(56)

(57)
Super-twisting算法是一種二階滑模算法,因其能有效削弱抖振、具有強魯棒性和高精度控制等優越的特性而在控制問題中被廣泛使用。但是傳統的超扭曲算法在系統狀態距離平衡點較遠時收斂速度較慢,而引理1給出的控制系統是指數收斂的,在遠離零點時收斂速度較快,結合二者的優點,設計一種快速Super-twisting算法:
(58)
將該算法作為滑模控制的趨近律,可設計輔助控制項為
(59)
根據(57)式和(59)式,可得制導系統的控制律為

(60)


證明下面分|s|≠0和s=0兩種情況對穩定性進行討論。
1)當|s|≠0時,定義如下李雅普諾夫函數:

(61)
該李雅普諾夫函數幾乎處處可微,僅在|s|=0處不可微[35]。
對(61)式求導并代入(58)式,可得
(62)
構造如下新向量:
ξT=[|s|1/2sgn (s),s,f]
(63)
則(61)式可改寫為如下形式:
V1=ξTAξ
(64)
式中:
(65)
函數V1是連續正定函數,且徑向無界。由于k1,k2,k3,k4>0,有
λmin{A}‖ξ‖2≤V1≤λmax{A}‖ξ‖2
(66)
式中:‖ξ‖2=s+s2+f2,‖·‖表示歐氏范數;λmin{A}和λmax{A}分別表示矩陣A的最小和最大特征值。
進一步由(65)式可得
(67)
因此,(62)式可改寫為
(68)
式中:
(69)
(70)

(71)
由(68)式可推知:
(72)
式中:λmin{A1}和λmin{A2}分別表示矩陣A1和A2的最小特征值。
由(67)式、(68)式和(72)式可得
(73)
(73)式可表示為
(74)

由引理4可知,V1將在有限時間內收斂至0,即s也將在有限時間收斂至0,且收斂時間滿足:
(75)
2)當s=0時,系統軌跡到達滑模面(54)式,(76)式成立:
(76)
對(76)式進行移項整理,可得
(77)
對于系統(76)式,選擇如下的李雅普諾夫函數:
(78)
對(78)式求導,可得
(79)
根據引理4可知,系統穩定,且彈目視線角將在有限時間內收斂至期望值。將x1=0代入(76)式可知,彈目視線角速率將在有限時間內收斂至0°/s。因此,定理1成立,證畢。
(60)式所設計的制導律具有如下優點:1)不需要提前知道目標的加速度上界,更有利于實際實施;2) 能保證系統狀態有限時間內收斂,且能夠充分利用導彈的過載能力,系統狀態在遠離零點時的收斂速度得到提升;3)不期望的高頻抖振現象得到有效抑制,有利于控制系統的實現。
為了驗證本文所提出的制導律的有效性,進行仿真分析。導彈和目標、自適應滑模擾動觀測器相關參數值、制導律設定分別如表1、表2和表3所示。

表1 導彈和目標相關參數值Table 1 Parameters of missile and target

表2 自適應滑模擾動觀測器相關參數Table 2 Parameters of adaptive sliding mode disturbance observer

表3 制導律相關參數Table 3 Parameters of guidance law
重力加速度取g=9.8 m/s2,導彈的最大加速度aMmax=30g。為充分驗證制導律的魯棒性,假設目標可能采取以下3種不同機動方式規避我方導彈攔截:

圖4 場景1仿真結果Fig.4 Simulation results of Scenario 1
1)場景1。目標做常值機動:aT=50 m/s2。
2)場景2。目標做正弦機動:aT=50sin (0.25πt)。
3)場景3。目標做特定機動:機動加速度如圖3所示。

圖3 目標特定機動方式Fig.3 Specific maneuver mode of target
針對這3種不同場景,利用制導律(60)式得出的仿真結果如圖4~圖6所示,圖4是場景1的仿真圖,圖5是場景2的仿真圖,圖6是場景3的仿真圖。

圖5 場景2仿真結果Fig.5 Simulation results of Scenario 2

圖6 場景3仿真結果Fig.6 Simulation results of Scenario 3
為說明制導律(60)式的魯棒性,選擇終端落角為30°,在3種場景下繪制導彈法向加速度與目標機動加速度的對比曲線,如圖7所示。

圖7 3種場景下加速度對比曲線Fig.7 Acceleration comparison under three scenarios
圖7表明,在制導過程末段,目標機動加速度與導彈過載加速度絕對值大小相當,此時目標機動加速度將給制導系統帶來較大干擾。
3種仿真場景下的脫靶量和實際終端落角分別如表4、表5、表6所示。
由于自適應滑模擾動觀測器能夠在線估計系統擾動,對于不同目標機動類型以及不同的終端落角角度約束,制導律(60)式均能夠完成高精度攔截任務,脫靶量均小于0.2 m,彈目視線角在3種場景下均能收斂到期望值,且誤差小于0.5°。彈目視線角速率在3種情況下均能收斂到0°/s。由于制導律(60)式是非光滑的連續信號,傳統滑模控制帶來的高頻抖振得到了很好的抑制,且由于引入了快速收斂項,其收斂速度得到了提升(見表7)。
為了進一步演示制導律(60)式的優勢,將其與傳統的Super-twisting非奇異終端滑模制導律(ST-NTSM)以及標準的NTSM進行對比仿真。為了描述方便,將(60)式的制導律命名為快速Super-twisting非奇異終端滑模制導律(FST-NTSM)。ST-NTSM[36]定義為

(80)
式中:Z2為擴張狀態觀測器(81)式的輸出量:
(81)
函數fal(E1,a,b)定義為
(82)
擴張狀態觀測器參數選取為:β01=50,β02=500,a=0.01,b=0.1。
NTSM[37]定義為
(83)
式中:α=9/7;β=1;K為符號增益,K=400。
選擇終端落角為30°,在場景2下對3種制導律進行對比仿真,仿真結果如圖8所示。

表4 場景1下的脫靶量和實際終端落角Table 4 Miss distance and actual terminal angle of Scenario 1

表5 場景2下的脫靶量和實際終端落角Table 5 Miss distance and actual terminal angle of Scenario 2

表6 場景3下的脫靶量和實際終端落角Table 6 Miss distance and actual terminal angle of Scenario 3

表7 彈目視線角收斂時間(2%誤差)Table 7 Convergence time of LOS angle (2% error)

圖8 3種制導律對比仿真結果Fig.8 Comparison of the three guidance laws
圖8(d)、圖8(e)表明,在3種制導律的導引下,彈目視線角均能收斂至30°且彈目視線角速率均能收斂至0°/s。由圖8(b)可以看出,NTSM的法向過載變化曲線中出現了不期望的高頻抖振,這將對執行機構產生極大的不利影響,且在一定程度上會激發系統的未建模部分。此外,NTSM中的增益K的選擇需要提前獲知目標機動信息的上界,而該信息在實際情況中往往很難獲得,從而限制了該制導律的實際應用范圍。而FST-NTSM由于采用了自適應滑模擾動觀測器對系統擾動進行估計并補償,因此不需要知道目標機動的上界,且發揮了Super-twisting算法的優勢,使得不希望出現的高頻抖振得到解決。由圖8和表7可以看出,NTSM、ST-NTSM的收斂速度相對較慢,而在對海作戰、攻擊艦載重要目標等作戰場景中,戰機稍縱即逝,需要導彈具有高敏捷性實現快速攻擊,即彈目視線角快速收斂至期望值。而FST-NTSM由于采用了快速Super-twisting算法作為趨近律,在末制導初期出現更長時間的過載飽和,這說明該段時間內導彈的過載能力得到了最大限度的利用,因此相較于NTSM收斂速度提升了29.3%,相較于ST-NTSM提升了30.8%。
本文基于滑模控制理論,研究了考慮目標機動干擾和落角約束的制導問題。選取的非奇異終端滑模面可有效避免奇異問題,并使系統狀態在有限時間內收斂,在傳統Super-twisting算法基礎上引入快速收斂項,使導彈的過載能力得到充分利用,提升了系統狀態的收斂速度。針對攻擊高機動目標的場景,設計了自適應滑模擾動觀測器對系統擾動進行在線估計,對觀測器增益進行自適應使其選取不依賴于系統擾動上界信息。在不同目標機動方式、不同終端落角約束等多種情況下,采用所提出的制導律均可精確命中目標,脫靶量均小于0.2 m,實際終端落角值均可收斂到期望落角值。本文提出的制導律與NTSM、ST-NTSM相比,在有效降低抖振的同時,能夠充分利用導彈的過載能力,加快系統狀態的收斂速度。
然而,本文僅在平面上進行分析,沒有考慮飛行器動力學,這可能會影響模型的準確性。后續研究將會考慮飛行器動力學等環節,使模型更加準確。