馬 焱,趙捍東,黃 鑫
(中北大學機電工程學院,山西 太原030051)
基于粒子群優化支持向量機神經網絡的彈丸落點預報
馬 焱,趙捍東,黃 鑫
(中北大學機電工程學院,山西 太原030051)
針對目前彈丸落點預報方法預報時間較長和精度不高的問題,提出了基于粒子群(PSO)優化的支持向量機(SVM)神經網絡預測方法。該方法采用PSO優化算法優化SVM訓練參數,以獲得最優SVM神經網絡落點預測模型。在此基礎上,使用卡爾曼濾波處理外彈道數據形成神經網絡訓練數據,進行落點預報仿真測試。仿真結果表明,射程最大誤差為7.371 m,橫偏最大誤差為0.886 m;落點預報時間在35 ms之內,比數值積分法快了一個數量級,為彈丸落點預報的實際應用提供了一種途徑。
神經網絡;PSO算法;SVM;落點預測
現代戰爭中,實現精確打擊已是彈藥發展的重中之重,其中彈丸落點的準確預測是實現精確打擊的重要前提[1]。落點預測制導律要求在無控狀態下預報彈丸的實際落點,計算其與目標點的彈道偏差,據此下達控制指令以調節落點偏差,實現彈道修正,從而減小脫靶量[2]。采用落點預測制導律時,落點預報的精度直接關系到制導精度,因此快速并精確地落點預報對實現彈道修正,提高制導精度有十分重要的意義。
用數值解法進行彈丸落點的預測是經典的做法,然而數值解法是建立在現有外彈道方程基礎上的,落點預報精度過多依賴于彈載計算機的處理能力,且數值計算量大、解算時間長和迭代過程中易產生大的累積誤差,同時外彈道模型與實際飛行軌跡之間的偏差也會給落點預測帶來誤差。近些年來,人們提出了各種落點預報方法, 史金光等人[3]將卡爾曼濾波引入落點預報中,能降低隨機噪聲和累積誤差對預報精度的影響,但預報時間較長;曹營軍等人[4]利用改進型BP神經網絡算法預報落點,能有效避免累積誤差的產生,但是在解算時間和精度方面略有不足。本文針對此問題,利用SVM神經網絡良好的泛化能力和容錯能力,提出了基于PSO優化SVM神經網絡的彈丸落點預報方法。
1.1SVM理論
SVM是通過學習已知數據來總結數據之間的規律,學習過程并不需要任何有關數據的經驗,因此在處理非線性問題時具有很強的優勢[5]。
SVM適于解決小樣本、非線性回歸估計問題[6]。SVM的回歸模型描述如下[7-8]:
假設訓練樣本集為D={(xi,yi)/i=1,2,…,n},xi∈Rn,yi∈R。式中,n為樣本數,xi為輸入變量,yi為輸出變量。SVM回歸的基本思想是利用非線性函數將輸入空間數據映射到高維特征空間,并在該空間用函數f(x)=〈w,x〉+b(w為權值向量,其維數反應了特征空間的維數;b為偏置)進行線性回歸。
參數w和b通過最小化正則風險函數獲得 :
引入松弛變量式:
(1)
(2)

(3)

(4)
則回歸方程的表達式可描述為:
(5)
式(5)中,K(xi,x)是核函數。核函數的引入使得高維空間中的內積運算可以通過輸入空間中的函數來實現,避免了維數災害[9],常用的核函數有徑向基核函數,多項式核函數等等。由于徑向基核函數只有一個變量需確定,徑向基核函數構造的SVM訓練參數相對較少,較易確定,因而本文采用的是高斯徑向基函數,如式:
(6)
式(6)中,σ是核函數的參數。
懲罰因子C、不敏感損失函數ε以及核函數的參數σ決定了SVM回歸模型的性能:懲罰參數C決定對較大擬合偏差所采取的懲罰力度,C取值過大,可能會導致過學習,而取值過小可能導致欠學習。核函數的參數σ反映了訓練數據集的特性,決定了解的復雜性,影響學習機的泛化能力。損失函數ε表示對估計函數在誤差上的期望值,它的取值一定程度上決定了構造回歸函數的支持向量的個數。如何更好地選擇合適的參數是研究SVM的關鍵,本文提出利用PSO算法優化SVM的相關參數。
1.2SVM神經網絡結構
通過核隱式映射,將輸入空間X與輸出空間Y聯系起來了。非線性函數可以通過核特征空間中的線性學習器得到,其中相應的SVM的訓練網絡如圖1所示。

圖1 SVM神經網絡拓撲結構Fig.1 Topology of support vector machine neural network
1.3PSO優化算法
PSO優化算法是一種基于群體的智能尋優算法,源于對鳥群捕食行為的研究。PSO初始化為一群隨機粒子,每個粒子代表解空間的一個候選解,解的優劣程度由適應度函數決定,其中適應度函數根據優化目標定義。粒子們追隨當前的最優粒子在解空間中搜索,通過迭代找到最優解。在每一次迭代中,粒子通過跟蹤個體最優解pbest和全局最優解gbest來更新粒子的速度和位置,個體最優解是指粒子本身到當前時刻為止找到的最好解;全局最優解是指整個種群到當前時刻找到的最好解[7-9]。假設在一個Q維空間中搜索由n個粒子組成的群體,設第i個粒子的位置為D=(di1,di2,…,diQ),速度為V=(vi1,vi2,…,viQ)。第i個粒子的位置和速度根據下列方程變化:
(7)
式中,t為進化代數;rand為0到1之間的隨機數;ω為慣性權值,用于平衡全局搜索和局部搜索;β為約束因子,用于控制速度的權重;c1,c2是學習因子。
1.4 基于PSO優化算法的SVM優化過程
懲罰參數C、RBF核參數σ、不敏感損失參數ε的取值對SVM預測性能有著較大影響,為了獲取較高預測性能的SVM,則需得到較優的C、σ、ε參數組合。PSO優化算法對這些參數進行優化,優化過程描述為:
1)粒子初始化。由參數C、σ、ε組成一個粒子,并隨機產生一組粒子的初始位置和速度。確定粒子個數、慣性權重、加速系數、迭代次數。
3)對每個粒子,將其適應度值與其經歷過的最好位置pbest作比較,如果較好,則將其作為當前的最好位置pbest。
4)對每個粒子,將其適應度值與全局所經歷的最好位置gbest作比較,如果較好,則將gbest設置為最好粒子的當前位置。
5)根據式(7)更新粒子的速度和位置。
6)檢驗是否符合結束條件(迭代次數達到了給定的最大次數或達到最小誤差要求),如果符合,則停止迭代;否則轉至2)。
2.1 落點預報非線性方程
結合6D自由度剛體外彈道方程[10],建立彈丸落點與當前彈丸狀態參數的非線性方程,形式為:
A=f(B)
(8)
式(8)中,A為彈丸落點信息,即射程X和橫偏Z,B是當前彈丸狀態參數。為充分利用實測彈丸狀態參數,分別建立射程和橫偏關于彈丸狀態諸元的函數,形式為:
X=f1(x,y,z,vx,vy,vz,θ)
(9)
Z=f2(x,y,z,vx,vy,vz,β)
(10)
式(9)和式(10)中自變量均表示彈丸飛行狀態參數。x,y,z,vx,vy,vz是地面坐標系下的彈丸當前位置分量和速度分量,θ和β為俯仰角和偏航角,X和Z分別為射程和橫偏。
2.2 基于PSO優化SVM神經網絡的落點預報
由于SVM神經網絡具有極強的非線性映射能力,因而可用于彈丸落點預報。其落點預報實質是利用非線性函數將輸入空間彈丸飛行狀態參數映射到高維特征空間,并在該空間用SVM線性回歸方程進行線性組合,來逼近落點預報的非線性方程。采用濾波后的實測彈道參數訓練落點預報模型[11-12],調節網絡參數,得到最佳的加權線性組合g(·),可無限逼近f(·),即
g(·)=f(·)
完成任意當前彈丸飛行參數對彈丸落點信息的映射,最終得到落點預報的非線性函數,其形式為:
X=g1(x,y,z,vx,vy,vz,θ)
Z=g2(x,y,z,vx,vy,vz,β)
其中,射程和橫偏預報函數是相互獨立的兩個函數。
3.1 落點預報仿真
訓練樣本必須具有很強的代表性,本文以某加農炮為例,使用經典四階龍格庫塔法,以步長0.01 s解算6D自由度剛體外彈道方程,然后用卡爾曼濾波法處理彈道數據,濾波后的彈道數據作為備選彈丸飛行狀態數據。從射角6°到60°的范圍內,每隔2°提取一條彈道數據,并在彈丸發射5 s后每3 s采集一次飛行彈道參數,直至飛行結束前5 s結束采樣。按與式(9)和式(10)中自變量與因變量一一對應的形式,將彈道數據整合成神經網絡的訓練數據,共有訓練樣本有837組。首先從原始訓練樣本里把訓練集和測試集提取出來,然后進行一定的預處理,之后用訓練集對SVM進行訓練,得到基于PSO優化SVM的落點預報模型,再用該模型來預測測試集,得到模型的預測精度。
在實際應用時,這些輸入量數據可以通過彈載的GPS/慣性測量單元,或GPS/慣性測量單元/地磁測量單元獲得比較精確的值,數據獲取也較為容易。
3.1.1 數據歸一化
為保證訓練效果和預測精度,需對訓練數據進行歸一化處理。對于數列b(i),b(i+1),b(i+2),…,則歸一化處理的數列為x(i),x(i+1),x(i+2)…,其中
3.1.2 訓練樣本構建
如表1所示,對于一組連續的數列x(i),將x(i),x(i+1),x(i+2),…,x(k+i-1)作為輸入矢量,x(k+i)作為輸出值,從而建立訓練樣本。因而,SVM回歸模型的訓練樣本可描述為:
x(k+i)=f(x(i),x(i+1),…,x(k+i-1)
式中,k為輸入矢量的維數。

表1 訓練樣本構建
3.2 落點預報仿真結果分析
3.2.1 落點預報仿真結果
將未錄入訓練樣本的數據作為測試樣本,即訓練樣本數675組,測試樣本數162組。經測試后,得到圖2和圖3分別表示射程和橫偏的預測誤差量。
記錄每條彈道上預報落點信息,將其與經濾波后的實際落點比較,得到最大誤差。統計出射程和橫偏上的偏差值,經SVM神經網絡輸出的預報數據,射程最大預報誤差為7.371 8 m,橫偏最大預報誤差為0.886 1 m,誤差控制在了較小的范圍內。
為了說明本文方法優于傳統方法預報效果,取42°,45°,48°射角的彈道數據作研究對象,分別用數值積分法、改進型BP神經網絡法和本文提出的基于PSO優化SVM神經網絡預報彈丸落點。分別統計其落點解算信息,如表2所示。

圖2 射程預測誤差量Fig.2 Error of predicted range

圖3 橫偏預測誤差量Fig.3 Error of predicted transverse rage

射角/(°)數值積分法BP神經網絡PSO優化SVM射程/m橫偏/m解算時間/ms射程/m橫偏/m解算時間/ms射程/m橫偏/m解算時間/ms4210961573.31526.210764554.86144.310955572.75419.14521966697.221467.522225719.17760.5421959696.333931.4488410173.95441.98296.7157.73135.578405.4173.51815.3
3.2.2 落點預報仿真結果分析
由表2可知,本文方法在落點預測精度與解算時間上均有很大的優勢,滿足解算精度和快速性的要求。也就是說當輸入量為完備的(x,y,z,vx,vy,vz,θ,β)值時,在PSO優化SVM神經網絡中很好地形成了由當前彈丸飛行狀態信息到落點信息的非線性映射。
SVM神經網絡的預測精度之所以有這樣好的水準,其原因主要是由于SVM神經網絡采用了不同于一般神經網絡的經驗風險最小化,而是采用結構風險最小化的原則。即將網絡的訓練誤差作為優化問題的約束條件,而以置信區間為優化目標,同時兼顧了其學習能力和泛化能力。而不像一般神經網絡那樣存在學習能力和泛化能力的矛盾,即出現所謂“過擬合”問題。
實踐表明,使用一般神經網絡方法進行落點預報時,若神經網絡輸入層數據不完整,預報結果會產生較大誤差。同時,因神經網絡的性能依賴于訓練樣本,所以通用性不佳。
將離線訓練得到的落點預報模型預先裝入彈載計算機中,即PSO優化SVM神經網絡落點預報模型在裝入彈載計算機之前就已經訓練完成。彈丸在飛行過程的某個時刻,利用載入的預報模型直接計算落點信息所用的時間,即為PSO優化SVM神經網絡算法預報落點的時間,因而節省了大量的模型訓練時間,使其滿足快速解算的要求。
為了快速高精確地實現彈丸落點預報,本文提出了基于PSO優化的SVM神經網絡方法。該方法采用PSO優化算法優化SVM訓練參數,以獲得最優SVM神經網絡預測模型。然后在此基礎上,以某加農炮為例,使用經卡爾曼濾波處理后的數值積分法解算得到的6D自由度剛體外彈道數據,作為備選彈丸飛行狀態數據。從射角6°到60°的范圍內,每隔2°提取一條彈道數據,并在彈丸發射5s后每3s采集一次飛行彈道參數,直至飛行結束前5s結束采樣,將這些彈道數據整合成神經網絡的訓練數據,進行了仿真。仿真結果表明:PSO的SVM神經網絡逼近精度高,射程最大誤差為7.371 8m,橫偏最大誤差為0.886 1m;收斂速度較快,比數值積分法快了一個數量級,比BP神經網絡快了一倍。說明本文提出的方法對任意時刻彈丸飛行狀態進行的落點預報是有效的,為彈丸落點預報的實際應用提供了一種參考。
[1]李志鵬,趙捍東,張帥,等.基于改進型BP神經網絡的彈丸落點預測方法[J].彈箭與制導學報,2014,34(2): 75-78.
[2]黃鑫,趙捍東,李志鵬.基于插值型徑向基神經網絡的彈丸落點預報方法[J].探 測 與 控 制 學 報,2015,37(4):101-105.
[3]史金光,徐明友,王中原.卡爾曼濾波在彈道修正彈落點推算中的應用[J].彈道學報, 2008, 20(3):41-43.
[4]曹營軍,朱宗平,李立春,等.基于BP人工神經網絡的末修彈落點預測導引模式[J].彈箭與制導學報, 2011, 31(6):76-78.
[5]范磊,潘功配,歐陽的華,等.基于遺傳算法結合支持向量機的Mg/PTFE貧氧推進劑配方優化[J].推進技術,2012,33(4):620-624.
[6]史峰,王小川,郁磊,等.MATLAB神經網絡43個案例分析[M].北京:北京航空航天大學出版社,2010.
[7]劉偉,王建平,劉長虹,等.基于粒子群尋優的支持向量機番茄紅素含量預測[J].農業機械學報,2012,43(4):143-147.
[8]吳良海.基于粒子群優化支持向量機的石油需求預測[J].計算機仿真,2010,27(4):292-295.
[9]范磊,潘功配,歐陽的華,等.基于支持向量機的Mg/PTFE煙火藥燃燒特性預測[J].含能材料,2012,20(4):414-417.
[10]徐明友.高等外彈道學[M].北京:高等教育出版社,2003:46-57.
[11]VISHALCR,YAAKOVBS,PETERW.Projectileidentificationandimpactpointprediction[J].IEEETransactionsonAerospaceandElectronicSystems,2010,46(4):2004-2021.
[12]KRAMERKA,STUBBERUDSC.ImpactTimeandPointPredictedUsingaNeuralExtendedKalmanFilter[C]//Proceedingsofthe2005IntelligentSensors,SensorNetworksandInformationProcessingConference.Melboume:IEEE,2005.
Impact-point Prediction Based on Particle Swarm OptimizationSVM Neural Network
MA Yan, ZHAN Handong, HUANG Xin
(College of Mechatronics Engineering, North University of China, Taiyuan 030051, China)
Aiming at the problem of the shortage of predicting a projectile impact-point quickly and precisely ,this paper introduced the forecasting method based on Particle Swarm Optimization support vector machine neural network.In order to obtain the optimal support vector machine neural network prediction model of impact-point, particle swarm optimization algorithm is used to optimize the training parameters of support vector machine.And then ,integrated the exterior ballistic data using the Kalman filtering into the training data of neural network for the impact-point prediction simulation test.Simulation results show that the maximum range error of the method is 7.371m, and the maximum partial navigation error is 0.886m; The forecast time of impact-point is within 35ms which is faster than the numerical integration method in an order of magnitude.Therefore, this method provides a road for the practical application of the projectile impact point prediction.
neural network;particle swarm optimization algorithm;support vector machine;impact-point prediction.
2016-12-13
馬焱(1991—),男,湖北黃岡人,碩士研究生,研究方向:彈箭飛行控制。E-mail:1780942802@qq.com。
K875.8
A
1008-1194(2017)02-0124-05