趙捍東,李志鵬
(中北大學 機電工程學院,山西 太原030051)
彈丸落點的精確快速預報對實施彈道修正進而實現精確命中至關重要。然而在實際應用中面臨的問題是,彈載計算機處理能力有限,解算過程允許耗時較短,且彈載傳感器輸出數據較真實值有一定偏差,這就要求落點預報算法要有較好的實時性、準確性、容錯性。當前的預報方法中以數值積分法、濾波外推法等較為常見。數值積分法的實質在于使用龍格庫塔法對外彈道方程組進行求解,解算精度依賴彈載計算機的性能和解算步長、不易實時修正相關系數,而且彈丸飛行過程中受到隨機風、科氏力等諸多因素的影響[1-2],尤為突出的是數值積分法容錯機制不佳。濾波外推法是基于最小均方差理論的遞推預報方法,具有一定的容錯能力,但其理論基礎是建立在線性系統和高斯噪聲環境上的,用于飛行彈道這一非線性系統時不可避免地會產生一定誤差,當噪聲為非高斯復雜噪聲時甚至引起濾波發散。國內外學者也曾嘗試通過對彈道方程進行多元逼近來解決這些問題,但多元函數的數學逼近一般以多元剖分法為主,對彈道方程組逼近精度不足,且其建立在較深的數學知識的基礎上,難以為一般學者掌握。
出于這些原因,本文提出了一種使用神經網絡對外彈道方程進行逼近來預報彈丸落點的方法。神經網絡是模仿人腦進行信息處理的一種智能方法,具有出色的非線性處理能力和容錯能力。而在眾多的神經網絡類型中,徑向基函數(RBF)神經網絡是建立在基函數逼近理論上的一種神經網絡,所以具有比其他網絡更好的全局逼近能力和最佳逼近能力[3]。根據函數逼近理論,任何函數都可以表示成一組RBF 的加權和。而RBF 神經網絡的拓撲結構則可以通過權值閾值和基函數中心的調整來實現對不同基函數的加權組合,進而實現對目標函數的逼近。從而實現這樣的映射關系:Γ∶ x→y,其中,x∈Rn,y∈Rm,x 和y 分別為輸入向量和輸出向量,Rn和Rm分別表示n 維和m 維實數空間。那么當自變量x 為彈丸的飛行數據且因變量y 為彈丸的落點信息時,通過RBF 神經網絡即可實現由飛行數據對落點信息的映射。同時,RBF 神經網絡對多元函數的逼近能力也得到了充分的證明[4]。RBF 神經網絡在彈丸落點的預報中,由于采用了并行結構,且沒有繁瑣的迭代過程,所以具有解算時間短的優點,有利于落點預報的快速實現。但其缺陷在于逼近精度依賴于網絡結構和訓練方法。傳統的RBF 網絡的訓練方法主要有K-means 方法和梯度下降法等,但這些訓練方法容易導致局部最優和結構冗余,所以本文采用了能夠收斂于全局最優的量子行為粒子群優化(QPSO)算法對其進行優化,并引入了濾波算法以減小模型誤差。
根據文獻[1 -2]可知,對于任一組彈丸飛行數據向量I=(x,y,z,vx,vy,vz,a,φ,φ),分別表示當前位置三分量,速度三分量,軸向加速度,偏航角,俯仰角,在彈道不進行機動的情況下對應唯一一個落點。記落點信息在慣性坐標系中的向量表示為O =(X,Z),即射程和橫偏。那么必然存在這樣的方程:

即射程和橫偏量是關于當前飛行數據的函數(注:F不是指6 自由度外彈道方程組)。只需求出這樣的函數,使得(1)式形式的方程恒成立,即可根據當前飛行數據實時求解落點信息。(1)式形式的函數為一超曲面函數,不易求得精確的初等表達式。本文試圖找到這樣一種映射Γ(·),實現對(1)式的無限逼近,即對于任意第i 組飛行數據Ii=(xi,yi,zi,vxi,vyi,vzi,ai,φi,φi),都能夠使得

成立,那么此映射即可以用于快速解算彈丸落點信息。基于這個思路,本文引入了RBF 神經網絡方法來解決這個問題。
RBF 神經網絡是在借鑒生物交疊接受區域知識的基礎上提出的一種神經網絡[3]。在眾多的神經網絡中,RBF 神經網絡結構簡潔、穩定性好,是具有輸入層、隱含層、輸出層的3 層前向神經網絡。其中輸入層到隱含層執行非線性變換,隱含層到輸出層執行線性加權運算。由于隱含層上的激勵函數采用了RBF,可使得網絡具有很好的局部逼近能力[4]。RBF 神經網絡的拓撲結構如圖1所示。

圖1 RBF 神經網絡拓撲結構圖Fig.1 Topology structure of RBF neural network
令(Ii,Oi)表示由飛行數據和落點信息構成的歐氏空間中的點,并且(Ii,Oi)共有N 個,則可以使用函數Γ 對這N 個點進行插值以實現對F 的逼近。當N 足夠大,且網絡的結構和激勵函數合理時,可實現對任一函數的高精度的逼近[5],即可實現Γ 的功能。
不同于其他前向神經網絡的是,RBF 神經網絡并不事先確定隱層神經元數,一般方法是在訓練過程中,經對樣本的動態聚類來確定隱層神經元數。所謂動態聚類,是指在訓練過程中,對整體訓練樣本基于動態聚類算法進行分類,每一組聚類后的子樣本集構成一個單元,即可認為是一個神經元。可見,在樣本完備且適定的情況下,原函數所表達的每一種情況都可以包括在內,那么經神經網絡對原函數F 的逼近就是精確的。經合適的訓練之后,網絡的輸入輸出關系可表達為

式中:x、y 分別為神經網絡的輸入向量和輸出向量;w 為權值,上標表示權值所處的層數,下標表示參與連接的神經元編號;b 為相應神經元上的閾值;‖·‖表示歐氏范數[4,6];xi表示輸入層第i 個神經元上的輸入值。經訓練確定網絡的結構、權值和閾值后,即可在網絡中形成智能映射Γ,實現從I 到O的映射。
作為一種監督式學習網絡,RBF 神經網絡在學習中確定隱層單元數和權值閾值,如前所述,一般的RBF 訓練方法為動態聚類算法,但這種方法的聚類數不易確定,以致不能完全表現出RBF 網絡的優越性。為此,本文引入粒子群優化(PSO)算法進行RBF 神經網絡的訓練。
PSO 算法通過群體中粒子間的協作與競爭來搜索全局最優解[7-8]。在實際應用中,每一個粒子代表一個待求量的可能解,每個粒子通過以下規則實現尋優:

式中:vk+1i,j為第i 個粒子第j 維當前前進的速度;xk+1i,j為第i 個粒子第j 維粒子的當前位置;pi,j、pg,j分別表示粒子的個體最優位置和全局最優位置;r 為隨機常數;c 為學習因子;w 為慣性權重。
將PSO 方法用于RBF 神經網絡的訓練時,其目的在于求得最佳的神經元數和最優的權值和閾值[6-7]。那么這些粒子就可以認為是待定的神經元中心數、權值和閾值大小,而粒子的當前位置就可以認為是這些待定參數的當前值。即

不妨將其看作是一組向量,而找到的最優“位置”即為對向量中的元素最優解,也就是神經網絡的最佳權值和閾值。
PSO 雖然是一種高效的全局尋優算法,但是也存在一定的缺陷。比如算法容易早熟,搜索空間不能夠覆蓋整個可能的解空間等。這樣訓練RBF 神經網絡時,相關參數便不能得到全局最優解。為了利用PSO 的優點,且避開其典型缺陷,本文使用改進型量子行為粒子群優化(IQPSO)算法進行網絡訓練。與PSO 相比,該算法模型更簡單,協同能力更強,極大增強了全局搜索能力[8-10]。IQPSO 在進化搜索過程中舍去了傳統PSO 中的速度更新部分,并在傳統PSO 的基礎上引入了勢點p 的概念[8]。p 點表示每個粒子收斂的隨機點,是對量子行為思想的體現。其中

式中:m 表示粒子的個數;n 表示每個粒子的維數;k表示第k 次迭代。
同時定義:

式中:pi,j表示粒子個體最佳位置;全局最佳位置pg的下標即為(8)式中的g;a 是0 ~1 之間的隨機系數;f(·)是表征在優化的作用下目標函數輸出性能的函數,這里稱之為適應度函數。結合彈丸落點預報的需求,本文定義f(·)表征神經網絡的映射能力的優劣,即

式中:N 表示輸出層神經元數。(11)式的含義為對應于待定參數x 的神經網絡的實際輸出與理論輸出的偏差量。這時,粒子位置的表達形式為


式中:u 為0 ~1 之間的隨機數,當u≥0.5 時,±取-號,否則取為+號表示當前粒子群的平均最優位置;β 為速度系數。實際應用中發現,系數β 會影響粒子群的收斂性能。為此文中取β 為自適應變量[10],即

式中:kmax表示最大迭代次數。同時將(13)式改進為

那么,選取樣本,并定義誤差函數后,即可使用IQPSO 算法對神經網絡進行訓練,即對所有待定參數尋求最優解。其算法流程如圖2所示。

圖2 IQPSO 算法優化RBF 神經網絡流程Fig.2 Flow chart of optimizing RBF neural network with IQPSO
使用RBF 神經網絡對彈道方程進行插值逼近時,理論上可以無限逼近,由于訓練樣本不可能真正完備且適定,并且即使采用了改進的參數優化算法確定網絡的結構和權閾值,也只是在RBF 神經網絡的基礎上對已知樣本點的空間點進行插值逼近,與真實外彈道方程仍有一些誤差。為此,本文引入濾波算法來消除一步預報值的誤差。由于無法判知RBF 神經網絡一步預報落點信息的偏差所服從分布的類型,所以使用適用于非線性系統和非高斯噪聲環境的無跡卡爾曼濾波(UKF)算法對初步的預報結果進行去噪處理。
UKF 區別于卡爾曼濾波和最小二乘濾波之處在于,在求最佳增益矩陣時,UKF 根據觀測量和協方差來確定最佳增益矩陣[11],并根據狀態向量均值和方差陣復現出2n+1 個σ 樣本點,實現系統狀態變量的近似分布[12]。令待求狀態向量表示為X,量測向量表示為Z,狀態向量和觀測向量是同維的,表示為n,這里觀測向量即可認為是神經網絡的一步預報輸出結果。令狀態向量X 的均值和方差表示為和PX,那么按照無跡變換(UT),可取得在X 周圍的2n+1 個σ 點為

式中:λ=α2(n +κ)-n,同時定義與χi對應的權值為

式中:α 用于調節σ 點和X 的距離,通常取大于0 的小數;β 是包含了X 的分布信息的加權系數;κ 是為保證方差陣半正定而設置的次要參數[11-12]。不失一般性,設狀態方程和觀測方程分別為

式中:W、V 分別為狀態噪聲和量測噪聲;k 表示第k次觀測,那么對狀態向量的濾波迭代更新過程可表示為


訓練樣本對網絡的逼近精度和泛化能力有很大影響。樣本選取時,在每條彈道上,提取對應于前文(x,y,z,vx,vy,vz,a,φ,φ)的飛行數據和與此相對應的(X,Z)值。神經網絡的輸入量即為(x,y,z,vx,vy,vz,a,φ,φ),輸出量為(X,Z).這樣的輸入量可以用較少的參數比較完善地表達彈丸飛行特性。而且經驗表明,這樣的樣本組合可以比其他形式的樣本組合獲得更好的預測精度。在實際應用時,這些輸入量數據可以通過彈載的GPS/慣性測量單元,或GPS/慣性測量單元/地磁測量單元獲得比較精確的值,數據獲取也較為容易。
為保證樣本的適定性,本文采用這樣的方法選取訓練樣本:基于6 自由度彈道方程,使用4 階龍格庫塔法,設定解算步長為0.01 s,解算出彈道數據作為備選飛行數據,從5° ~60°的射角范圍內,每隔2°提取一條彈道,從出炮口5 s 開始每隔2 s 采集一次飛行數據,至落地前5 s 結束,作為初級樣本,記為A.確定初級樣本A 后,基于模糊聚類和因子分析的方法對樣本A 進行優化,使訓練樣本分布更均勻且更具有“代表性”,避免某類樣本過多致使網絡過擬合和某類樣本過少而致使網絡欠擬合,最終影響網絡的泛化能力和逼近精度。選取出合適的樣本后,基于IQPSO 對RBF 神經網絡進行訓練優化。以順序方式輸入樣本進行訓練,得到訓練過程中網絡的理論輸出值和實際輸出值之間誤差的變化曲線,如圖3所示。

圖3 IQPSO 優化RBF 神經網絡的誤差收斂曲線Fig.3 The convergence curve of the error of IQPSO optimizing RBF neural network
從圖3中可以看出,訓練到300 次以后,隨著訓練樣本的輸入,網絡的期望輸出與實際輸出之間的差值逐漸變小,并最終趨于穩定,即各參數已達到最優解的某鄰域內,也即說明IQPSO 優化神經網絡是全局收斂的。從訓練誤差變化曲線中可以看出,隨著訓練的進行,誤差達到了0.000 1 的精度,說明收斂精度較好,而對應于本次訓練,訓練時間為12.4 s,收斂速度也較好。
取自同一彈種而未錄入訓練樣本的飛行數據作為測試樣本對訓練完畢的網絡進行測試,輸入量為測試樣本中對應的(x,y,z,vx,vy,vz,a,φ,φ)值。仿真預報時對測試樣本加入由高斯噪聲和厚尾噪聲組合的復雜噪聲。考慮到實際測量時,加速度誤差和姿態角誤差數值較小,所以對加速度信息添加其真實值1.5%的噪聲,均值為0,統計方差為0.35;對俯仰角和偏航角添加其真實值2%的噪聲,均值為0,統計方差分別為0.5 和0.6;實際應用中速度測量誤差一般不大于5 m/s,位置測量誤差一般不大于15 m,文中對速度信息和位置信息添加均值為0,方差分別為5 和15 的噪聲,約占其真實值的1%和0.3%.每隔0.2 s 輸入一次飛行數據,對每次一步預報數據進行濾波處理,設定前后兩次濾波輸出差值小于2 m 時輸出結果。測試時,設定瞄準點為15 ~20 km,每隔100 m 測試一次。記錄每條彈道上經神經網絡預報的落點信息的最大誤差與經濾波后的最終預報落點信息,與實際落點比較,統計出射向和橫向上的偏差值,如圖4和圖5所示。
每次測試時從出炮口10 s 后開始采集飛行數據作為測試的輸入。最多解算次數27 次,即跟蹤彈道時間5.4 s,最少解算次數8 次,即跟蹤彈道時間1.6 s,后續預報彈道長度為10 ~16 km.分析預報數據可知,由于測試數據具有輸入噪聲,經神經網絡輸出的一步預報數據,射向最大預報誤差為132 m,橫向最大預報誤差為53 m,并且射向和橫向的預報數據均有誤差。經濾波處理后,射向誤差最大為10.2 m,最小誤差為0 m,橫向最大誤差為8.4 m,最小誤差為0 m,即誤差控制在了較小的范圍內。

圖4 射程方向預報偏差統計Fig.4 Range direction prediction bias statistics

圖5 橫偏方向預報偏差統計Fig.5 Side direction-of-arrival prediction bias statistics
為了對比本文方法與傳統方法預報效果的異同,在15.5 km、16.5 km、17.5 km 射程的彈道數據上,加入前文所述噪聲,分別用數值積分法和濾波外推法預報彈丸落點,此時設定數值積分步長、外推步長均為0.05 s,飛行數據輸入間隔設定為0.1 s,出炮口10 s 時開始輸入飛行數據。分別統計其落點解算信息,如表1所示。
從表1中可以看出,在飛行數據有復雜噪聲時,數值積分法解算精度最差,由于其在計算機上解算時進行繁復的循環迭代,其解算時間較長;濾波外推法解算精度較數值積分方法有所提高,但其在外推之前有計算方差的時間,即彈道跟蹤時間,使得其解算時間較數值積分法長,但實際測量噪聲較簡單時,彈道跟蹤點數會減少從而減小總體解算時間;本文方法在解算精度與解算時間上均有優勢,也就是說,當輸入量為完備的(x,y,z,vx,vy,vz,a,φ,φ)值時,在神經網絡中很好地形成了由飛行信息到落點信息的非線性映射。

表1 不同方法的落點預報統計Tab.1 The statistics of impact-points predicted by various methods
如圖1所示,RBF 神經網絡采用了并行結構,其計算原理從根本上區別于馮諾衣曼計算機原理,而是對數據采用并行處理的方式,實際應用時可以節省大量解算時間。濾波過程又對預報數據進行了去噪處理,所以可以獲得較高的精度,使得本文方法具有良好的容錯性和實時性。當實際工作中輸入數據噪聲較為簡單時,濾波次數將會大幅減小,解算耗時會更短。但本文方法的解算精度依賴于樣本的精確性,因為樣本的精度決定了逼近誤差的大小,如果實際使用時訓練樣本誤差較大,預報誤差會較大。實踐表明,使用神經網絡方法進行落點預報時,若神經網絡輸入層數據不完整,預報結果會產生較大誤差。同時,因神經網絡的性能依賴于訓練樣本,所以通用性不佳,如155 mm 口徑彈丸的飛行數據訓練的網絡不能用于125 mm 口徑彈丸落點的預測。對于這類問題,將網絡訓練完畢后提取出其數學模型,并設置根據不同彈種變化的自適應參數,是解決這個問題的一種方法,也是今后工作的方向。
為了快速高精確地實現落點預報,本文引入了RBF 神經網絡方法,并使用IQPSO 來獲取所需神經網絡的參數,然后在此基礎上對預報數據進行濾波處理,最后進行了仿真。仿真結果表明:IQPSO 的RBF 神經網絡逼近精度高,訓練誤差達到了0.000 1的精度級別,收斂速度較快;基于RBF 神經網絡和無跡卡爾曼濾波的方法預報彈丸落點具有良好的容錯性,當輸入數據具有復雜噪聲時,最大預報誤差為10.2 m,最小預報誤差0 m.說明本文提出的方法對飛行數據不盡準確的情況下進行的落點預報是有效的,為彈丸落點預報的實際應用提供了一種參考。
References)
[1] 楊紹卿.火箭外彈道偏差與修正理論[M].北京:國防工業出版社,2011:20 -30.YANG Shao-qing.The trajectory error and correction theory of rocket[M].Beijing:National Defense Industry Press,2011:20 -30.(in Chinese)
[2] 柏杰鋒,王曉鳴,李文彬.CCD 與MEMS 組合測量彈丸落點偏差的方法[J].系統仿真學報,2009,21(2):599 -604.BAI Jie-feng,WANG Xiao-ming,LI Wen-bin.Combined measuring method and simulation of deviation[J].Journal of System Simulation,2009,21(2):599 -604.(in Chinese)
[3] 侯媛彬,杜京義.神經網絡[M].西安:西安電子科技大學出版社,2007:128 -138.HOU Yuan-bin,DU Jing-yi.Neural network[M].Xi’an:Xidian University Press,2007:128 -138.(in Chinese)
[4] 隆金玲.Sum-of-Product 神經網絡和徑向基函數神經網絡逼近能力研究[D].大連:大連理工大學,2008.LONG Jin-ling.Approximation capability of sum-of-product neural networks and radial basis function neural networks[D].Dalian:Dalian University of Technology,2008.(in Chinese)
[5] 段曉君.神經網絡的函數逼近能力分析[J].模糊系統與數學,1998,24(4):80 -84.DUAN Xiao-jun.Analysis on neural network capability of approximation to function[J].Fuzzy System and Mathematics,1998,24(4):80 -84.(in Chinese)
[6] Fathi V,Montazer G A.An improvement in RBF learning algorithm based on PSO for real time applications[J].Neurocomputing,2013,111(2):169 -176.
[7] Tsekouras G E.A simple and effective algorithm for implementing particle swarm optimization in RBF network's design using inputoutput fuzzy clustering[J].Neurocomputing,2013,108(2):36 -44.
[8] Su X,Fang W,Shen Q,et al.An image enhancement method using the quantum-behaved particle swarm optimization with an adaptive strategy[J].Mathematical Problems in Engineering,2013,2013(1):1 -14.
[9] Sun J,Fang W,Palade V,et al.Quantum-behaved particle swarm optimization with Gaussian distributed local attractor point[J].Applied Mathematics and Computation,2011,218(7):3763 -3775.
[10] Xi M,Sun J,Xu W.An improved quantum-behaved particle swarm optimization algorithm with weighted mean best position[J].Applied Mathematics and Computation,2008,205(2):751 -759.
[11] Rhudy M,Gu Y,Napolitano M R.An analytical approach for comparing linearization methods in EKF and UKF[J].International Journal of Advanced Robotic Systems,2013,208(10):1-9.
[12] 吳小文,李擎.UKF 在MEMS 陀螺隨機噪聲補償的應用[J].火力與指揮控制,2013,38(6):8 -10.WU Xiao-wen,LI Qing.Research on application of UKF to compensation of MEMS gyro random noise[J].Fire Control & Command Control,2013,38(6):8 -10.(in Chinese)