王 智,張 婕,熊 偉,王 鵬,李 強
(北京宇航系統工程研究所,北京 100076)
主動雷達探測技術在飛行器制導中占據著重要位置。在直角坐標系中建立飛行器與目標的相對運動方程,其狀態方程是線性的,但觀測方程是非線性的[1]。為了獲得制導律所需的精確可靠的相對運動狀態信息,需要在帶有觀測噪聲的有限測量信息中獲取位置信息、速度信息和加速度信息,即非線性系統的狀態估計問題。擴展卡爾曼濾波(Extended Kalman Filtered,EKF)方法作為一種非線性系統擴展的線性濾波方法,具有計算量小、易于實現等特點,在非線性系統的狀態估計等領域有著廣泛的應用。以線性二次型性能指標為基礎的最優控制問題具有計算簡單、便于調整等優點,由于線性二次型問題解出的控制規律可以通過狀態反饋實現最優閉環控制,成為當今控制工程領域里較為重要的設計方法之一。為改善導引彈道特性,提高飛行器導引準確度,本文對基于EKF的主動雷達尋的制導狀態估計與最優控制律進行研究。
由于目標機動未知,對目標機動的建模比較復雜。本文采用1階馬爾科夫過程來近似描述目標機動,目標加速度At滿足如下的微分方程[2]:
(1)
式中,λ為目標加速度的機動頻率,Wt為目標加速度的過程噪聲。
飛行器M與目標T之間的相對運動關系如圖1所示。

圖1 直角坐標系中飛行器與目標相對關系Fig.1 The relationship between flight vehicle and target in Cartesian coordinate system
圖1中,OXYZ為慣性坐標系,qε、qβ分別為視線高低角和方位角,R為飛行器與目標之間的斜距。
系統的狀態方程為[3-4]:

(2)
式中,x=[rx,ry,rz,vx,vy,vz,atx,aty,atz]T,為狀態變量;rx、ry和rz為飛行器與目標之間的相對位置在慣性坐標系中的三分量;
下標t代表目標,下標m代表飛行器,下同。rtx、rty和rtz為目標位置在慣性系中的三分量,rmx、rmy和rmz為飛行器位置在慣性系中的三分量。
vx、vy、vz為飛行器與目標之間的相對速度在慣性坐標系中的三分量。
vtx、vty和vtz為目標速度在慣性系中的三分量,vmx、vmy和vmz為飛行器速度在慣性系中三分量;atx、aty、atz為目標加速度在慣性坐標系中的三分量。

將式離散化后可得
x(k+1)=Φx(k)+Γu(k)+ω(k)
(3)
式中,
其中Δt為采樣周期。
動態噪聲向量ω(k)為高斯型白色隨機向量序列,即:

(4)
飛行器采用主動雷達導引頭對運動目標進行主動探測,觀測量為彈目距R、視線高低角qε和視線方位角qβ。實際測量中導引頭具有測量噪聲,測量值是真實狀態的非線性函數,并受到高斯白噪聲的干擾[5-6]。觀測模型為:
z(k)=h[x(k),k]+υ(k)
(5)
式中,h[x(k),k]代表測量值的真值,為

(6)
υ(k)為測量噪聲,是高斯型白色隨機向量序列,即:

(7)
且ω(k)與υ(k)相互獨立。
對于主動雷達導引頭,測量噪聲方差R1可以表示為:
(8)

對于主動雷達尋的制導,需要利用所測得的彈目距、目標方位角信息估計目標的運動參數。從模型上看,狀態方程是線性的,觀測方程是非線性的。對于非線性系統狀態估計問題,應用擴展卡爾曼濾波方法將其轉換為一個近似的線性濾波問題[7]。


(9)
令:
則觀測方程為:
z(k)=H(k)x(k)+y(k)+υ(k)
(10)
觀測矩陣H(k)由h的雅克比矩陣得到,即:
(11)
綜合式(6)和式(11),得到:
(12)
式中,
Λ32=0
對線性化后的模型式和式應用EKF進行狀態估計。
線性二次型問題解出的控制規律可以通過狀態反饋實現最優閉環控制,同時具有計算簡單、便于調整等優點。為使需用過載和脫靶量盡可能小,選取指標函數為:[8]
式中,tf為飛行器飛行時間。
根據龐特里亞金極小值原理[9],可得最優制導律為:
(13)
式中,
tgo=tf-t
式中,tgo為飛行器剩余飛行時間;N為導航比,需要根據飛行器制導系統通頻帶和剩余飛行時間綜合確定。
最優制導律所需的彈目相對運動信息通過濾波器狀態估計得到。
設制導初始時刻目標與飛行器之間的相對運動關系為:
rx(0)=3500m,ry(0)=1500m,rz(0)=1000m
vx(0)=-1100m/s,vy(0)=-150m/s,
vz(0)=-50m/s
atx(0)=10m/s2,aty(0)=10m/s2,
atz(0)=10m/s2

EKF中,狀態估計的初始值為:
rx(0|0)=3000m,ry(0|0)=1200m,
rz(0|0)=800m
vx(0|0)=-1000m/s,vy(0|0)=-120m/s,
vz(0|0)=-40m/s
atx(0|0)=8m/s2,aty(0|0)=6m/s2,
atz(0|0)=5m/s2
狀態方差陣的初始估計值為:
目標的跟蹤軌跡如圖2所示。跟蹤軌跡最終表明,軌跡趨于一致,驗證了基于EKF的狀態估計方法和基于線性二次型最優制導律的有效性。

圖2 EKF跟蹤軌跡與真實軌跡Fig.2 EKF tracking trajectory and real trajectory
狀態估計值與真實值之間的對比曲線見圖3~圖5,狀態估計值與真實值之間的偏差如圖6~圖8所示。可以看出,無論位置還是速度,最終都趨于收斂。

圖3 相對位置估計值與真實值Fig.3 Estimated and real values of relative position

圖4 相對速度估計值與真實值Fig.4 Estimated and real values of relative velocity

圖5 目標加速度估計值與真實值Fig.5 Estimated and real values of target acceleration

圖6 相對位置估計誤差Fig.6 Estimation error of relative position

圖7 相對速度估計誤差Fig.7 Estimation error of relative velocity

圖8 加速度估計誤差Fig.8 Estimation error of acceleration
本文利用擴展卡爾曼濾波器和線性二次型最優制導律設計了主動雷達尋的最優制導系統,并進行了目標機動情況下的仿真驗證。仿真結果表明,所設計的濾波器能夠較準確地進行狀態估計,狀態估計值用于線性二次型最優制導律,改善了飛行器的導引特性和制導精度。
參考文獻
[1] Williams D E, Richman J, Friedland B. Design of an integrated strapdown guidance and control system for a tactical missiles[C]. AIAA 1983-2169, 1983: 57-66.
[2] 李全運, 宋建梅.捷聯尋的制導系統濾波器設計[J].兵工學報, 2005, 26(2):215-219.
[3] 付夢印, 鄧志紅, 張繼偉. Kalman 濾波理論及其在導航系統中的應用 [M ]. 北京: 科學出版社, 2003.
[4] 周荻,慕春棣.被動式尋的導彈的運動跟蹤變結構制導[J]. 航空學報, 1998, 19(2):179-184.
[5] Ford J J, Coulter A S. Filtering for precision guidance: the extended kalman filter[R] .USA: Defense Science & Technology Organization, 2001.
[6] Song T, Speyer J. A stochastic analysis of a modified gain extended Kalman filter with applications to estimation with bearings only measurements[J]. IEEE Transactions on Automatic Control, 1985, 30(10): 940-949.
[7] Marins J L. An extended Kalman filter for quaternion-based attitude estimation[D]. Monterey, California: Naval Postgraduate School, 2000.
[8] 王建棟,羅喜霜,張天橋.用于復合制導的最優中制導律研究[J].彈道學報,2002,14(2):44-47.
[9] Hull D G, Speyer J L, Burris D B. Linear-quadratic guidance law for dual control of homing missiles[J]. Journal of Guidance, Control, and Dynamics, 1990, 13(1): 137-144.