孫 巖, 雷 超,董 恒,史新虎,屈淵博
(中國人民解放軍63726部隊,寧夏 銀川 750004)
當(dāng)前形勢下,航天發(fā)射任務(wù)密度越來越高,機動參試逐漸常態(tài)化。測控設(shè)備到達機動點位后,設(shè)備準備周期相對較短,相位標(biāo)定校準經(jīng)常受到環(huán)境、天氣、周邊架設(shè)標(biāo)校信標(biāo)機位置等條件的影響,本文通過設(shè)備歷史記錄數(shù)據(jù)進行相位值預(yù)測,解決人工經(jīng)驗值裝填可用性、穩(wěn)定性差等局限性問題。
傳統(tǒng)無對塔標(biāo)校環(huán)境下,采用理論計算、經(jīng)驗值推導(dǎo)實驗等方法計算可用值。如王健等[1]通過分析微波自檢校相值與信號頻率之間的關(guān)系,歸納出相應(yīng)的計算公式,提出了利用公式進行相位快速修正的方法。該方法解決了海上快速相位修正問題,但需較為煩瑣的理論模型建立及統(tǒng)計方法推導(dǎo),同時存在環(huán)境適應(yīng)性差和可推廣應(yīng)用性等問題。隨著硬件條件的改善,數(shù)據(jù)庫和人工智能等技術(shù)的發(fā)展,目前基于數(shù)據(jù)驅(qū)動的序列預(yù)測方法已經(jīng)普遍應(yīng)用于各個行業(yè),測控領(lǐng)域也逐漸應(yīng)用算法輔助決策,數(shù)據(jù)驅(qū)動方法主要分為統(tǒng)計分析和機器學(xué)習(xí)2類,統(tǒng)計學(xué)方法利用統(tǒng)計模型或隨機過程模型描述參數(shù),通過統(tǒng)計參數(shù)變化規(guī)律進一步分析總結(jié)規(guī)律。而機器學(xué)習(xí)的方法自適應(yīng)性能好,無須過多地關(guān)注建模過程,利用原始記錄數(shù)據(jù)即可實現(xiàn)設(shè)備的關(guān)鍵參數(shù)長期分析預(yù)測。如楊羅蘭等[2]針對測控系統(tǒng)關(guān)鍵指標(biāo)預(yù)測的問題,探索基于歷史數(shù)據(jù)的指標(biāo)預(yù)測方法,具體分析了基于支持向量機(Support Vector Machine,SVR)的單步和多步指標(biāo)預(yù)測方法,并使用實測數(shù)據(jù)進行了試驗和分析;岳瑞華等[3]針對設(shè)備校準中的預(yù)測問題,提出了基于粒子群優(yōu)化支持向量機的預(yù)測方法,取得了較好的效果。Sokullu等[4]研究了利用全連接深度神經(jīng)網(wǎng)絡(luò)實現(xiàn)信道估計的方法,討論了不同導(dǎo)頻尺寸下模型的性能。支持向量機和全連接神經(jīng)網(wǎng)絡(luò)在預(yù)測領(lǐng)域取得了一定的效果,但存在泛化能力弱和無效連接過多等問題,本文進一步選用循環(huán)神經(jīng)網(wǎng)絡(luò)開展預(yù)測,其作為機器學(xué)習(xí)中深度學(xué)習(xí)模型較為成功的方法之一,廣泛應(yīng)用于時間序列預(yù)測與回歸過程中,在信息處理、參數(shù)序列建模、設(shè)備指標(biāo)預(yù)測等領(lǐng)域起到了很好的效果。
循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)的主體思想是通過數(shù)據(jù)的隱藏層循環(huán),實現(xiàn)序列演進方向的遞歸且所有節(jié)點按鏈式傳播。具體計算過程為
ht=f(U·Xt+W·ht-1)
(1)
Ot=g·(V·ht)
(2)
式中:ht為隱藏層輸出;f、g為激活函數(shù);U、W為權(quán)重值;Xt為原始輸入值;Ot為模型輸出值。從結(jié)構(gòu)和計算公式可以看出,輸出結(jié)果與輸入和隱藏層狀態(tài)有關(guān),通過串聯(lián)式的記憶單元,實現(xiàn)了時間序列的前后關(guān)聯(lián)。
循環(huán)神經(jīng)網(wǎng)絡(luò)記憶單元如圖1所示。本文選用循環(huán)神經(jīng)網(wǎng)絡(luò)改進型門控循環(huán)單元(Gated Recurrent Unit,GRU)模型,通過優(yōu)化超參數(shù)選擇機制,實現(xiàn)相位值準確的預(yù)測估計,為設(shè)備在無塔標(biāo)校條件下,提供可用參考裝填值。

圖1 循環(huán)神經(jīng)網(wǎng)絡(luò)記憶單元
GRU網(wǎng)絡(luò)是循環(huán)神經(jīng)網(wǎng)絡(luò)的一種,是傳統(tǒng)循環(huán)神經(jīng)網(wǎng)絡(luò)和長短時記憶網(wǎng)絡(luò)(Long-Short Term Memory RNN,LSTM)的改進模型[5],相較于LSTM訓(xùn)練參數(shù)較少,利用更新門代替了LSTM的輸入門和遺忘門,簡化了LSTM結(jié)構(gòu),GRU模型單元如圖2所示。

圖2 GRU模型單元
單元的主要計算過程如下。
① 重置門計算,控制狀態(tài)結(jié)果受上一狀態(tài)的影響。
rt=σ(Wr·[ht-1,xt]
(3)
當(dāng)前的狀態(tài)為
(4)
② 更新門和當(dāng)前值計算:
zt=σ(Wz·[ht-1,xt]
(5)
計算隱狀態(tài)為
(6)
式中:σ為sigmoid型激活函數(shù);tanh為雙曲正切型激活函數(shù);W為權(quán)值。
近年來,多種仿生群智能算法被提出和應(yīng)用于各個領(lǐng)域,大部分算法結(jié)合群體性生物特點,進行隨機性和趨向性尋優(yōu)迭代,具有速度快、準確性高的優(yōu)勢。仿生類鯨魚算法(Whale Optimization Algorithm,WOA)是一種新穎的、受自然啟發(fā)的元啟發(fā)式優(yōu)化算法,通過模擬座頭鯨的狩獵行為,建立泡沫網(wǎng)搜索策略。在座頭鯨圍獵時,會通過對魚蝦群位置的判斷,移動自己的位置吐出氣泡,將魚蝦群不斷圍繞在隨自身位置變化吐出的氣泡中,最終將魚蝦群鎖定。氣泡網(wǎng)狩獵策略融合了座頭鯨收縮包圍獵物和螺旋狩獵方式的局部開發(fā)能力,以及隨機搜索獵物的全局尋優(yōu)特點,具有操作簡單、搜索能力強、能夠跳出局部最優(yōu)且收斂速度更快等優(yōu)點[6]。本文利用WOA算法對GRU網(wǎng)絡(luò)模型參數(shù)進行優(yōu)化,將每條鯨魚個體看作每種優(yōu)化策略,并將鯨魚位置的維數(shù)對應(yīng)GRU模型待優(yōu)化參數(shù)的個數(shù),可在鯨魚不斷更新自身位置的過程中獲得網(wǎng)絡(luò)的最優(yōu)參數(shù)組合。與最終預(yù)測模型評估指標(biāo)損失函數(shù)一致,同樣選擇適應(yīng)度函數(shù)為均方根誤差(Root Mean Square Error,RMSE),可得:
(7)
式中:m為組內(nèi)樣本個數(shù);h(x)為預(yù)測值;y為實際校相值。算法主要計算過程分為以下3個步驟。
(1)包圍獵物過程。
鯨魚算法模擬自然界鯨魚捕獵,發(fā)現(xiàn)獵物后迅速更新位置進行包圍,計算公式為
D=|CX*(t)-X(t)|
(8)
X(t+1)=X*(t)-AD
(9)
式中:t為當(dāng)前迭代次數(shù);D為搜索個體與當(dāng)前最優(yōu)解的距離;A和C為系數(shù);X*為當(dāng)前最好的鯨魚位置向量,X(t)為當(dāng)前鯨魚的位置向量。
A、C系數(shù)采用隨機生成變換,實現(xiàn)群智能算法常見的隨機搜索,可得:
A=2a·r-a
(10)
C=2r
(11)
a=2-2·t/M
(12)
式中:r和a分別為[0,1]、[0,2]的隨機數(shù);M為算法的設(shè)置迭代次數(shù)。
(2)狩獵過程。
鯨魚狩獵過程最大的特點是采用螺旋式掃描的方式,不斷縮小范圍從而捕獲目標(biāo),其變換過程數(shù)據(jù)模型公式為
D=|X*(t)-X(t)|
(13)
X(t+1)=D·ebl·cos(2π·l)+X*(t)
(14)
式中:b為螺旋形狀控制參數(shù);l為范圍[-1,1]的隨機 數(shù)。
游走變換后,位置同步模型過程中,以概率p完成收縮包圍,在狩獵過程中,鯨魚將以50%的概率包圍獵物(完成迭代尋優(yōu)過程)。
(15)
(3)隨機重捕過程。
若|A|>1,那么鯨魚將離開現(xiàn)在所包圍的獵物去尋找新的獵物,即重復(fù)迭代過程。
鯨魚優(yōu)化算法是一種新型元啟發(fā)式算法,通過鯨魚的狩獵行為,抽象出螺旋搜索過程算法,較其他智能優(yōu)化算法有更好的避免局部最優(yōu)的能力,但仍可能存在局部最優(yōu)的可能,本文算法用于GRU模型神經(jīng)元個數(shù)和步長尋優(yōu),主要作用是規(guī)避人為難以定義的參數(shù)值,可能出現(xiàn)偏離程度大、無準確規(guī)則的問題。鯨魚尋優(yōu)算法陷入局部最優(yōu)解時,提供的參數(shù)非最優(yōu)情況,本文實驗過程中對10次迭代尋優(yōu)和10次的一次尋優(yōu)(取最差值)模型結(jié)果進行了比對,一次尋優(yōu)即使出現(xiàn)陷入局部最優(yōu)解,仍達到網(wǎng)絡(luò)模型參數(shù)優(yōu)化設(shè)置要求,如表1所示。

表1 經(jīng)驗值、局部最優(yōu)、多次尋優(yōu)對比
序列網(wǎng)絡(luò)GRU的預(yù)測準確性受到超參數(shù)神經(jīng)元個數(shù)和時間步長設(shè)置的影響。時間步長為循環(huán)單元結(jié)構(gòu)的個數(shù),表示了某一個時刻的信息最多可由該時刻之前的若干個時刻的信息綜合得來。時間步長過小會失去不同時刻間信息的關(guān)聯(lián)性,過大則會減弱神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)能力[7]。目前隱藏層神經(jīng)元個數(shù)和時間步長獲取只能根據(jù)經(jīng)驗,人工挑選一個大致可選的神經(jīng)元個數(shù)范圍。本文針對隱藏層神經(jīng)元個數(shù)和時間步長兩個超參數(shù)選擇問題,利用鯨魚算法WOA進行自適應(yīng)參數(shù)尋優(yōu),避免人工設(shè)置影響預(yù)測準確性,通過尋優(yōu)可得神經(jīng)元個數(shù)為64,步長為5。WOA優(yōu)化GRU模型過程如圖3所示。

圖3 WOA優(yōu)化GRU模型過程
以某型號設(shè)備相位歷史數(shù)據(jù)為例,采用軟件自動記錄每次校相結(jié)果的方式,區(qū)分組合號(信道中各設(shè)備區(qū)分組合),不同組合號和頻點狀態(tài)下的數(shù)據(jù)分別進行分組,因信道影響較大,不能同時進行預(yù)測。將遠場信標(biāo)機和設(shè)備天線上偏饋校零一體機數(shù)據(jù)分別記錄,本文預(yù)處理過程中若遠場和偏饋校相時間在20 min內(nèi)則認為是同一組數(shù)據(jù),此時偏饋校相數(shù)據(jù)同樣作為輸入條件使用;若校相記錄中同一組數(shù)據(jù)中無偏饋校相結(jié)果,則將組內(nèi)值全部取0,屏蔽此處神經(jīng)元作用[8]。校相記錄數(shù)據(jù)示例如表2所示。

表2 校相記錄數(shù)據(jù)示例
從表2中可以看出,溫濕度、相位值樣本間差異相對較大,需要進行參數(shù)值歸一化運算,通過最大最小值比例歸一化數(shù)據(jù)情況,溫度范圍為0~40 ℃,濕度范圍為0~100%,相位值范圍為0~360,利用范圍值進行歸一化處理,最終結(jié)果進行范圍恢復(fù),可得:
(16)
通過缺失值和異常值剔除、歸一化等數(shù)據(jù)清洗[9]操作后,所得可用樣本總數(shù)量2392,訓(xùn)練集和驗證集按8:2比例隨機劃分,訓(xùn)練集樣本數(shù)1913,驗證集樣本數(shù)479。
WOA算法利用Python編寫,GRU模型基于Pytorch開源深度學(xué)習(xí)框架進行設(shè)計,使用 Intel?CoreTMi5-6300HQ CPU(主頻2.3 GHz),WIN7 64 位操作系統(tǒng)。
WOA優(yōu)化模型迭代損失值(每輪組平均均方誤差最小值)變化情況如圖4所示。

圖4 WOA迭代損失值變化情況
利用迭代優(yōu)化后選定的超參數(shù),構(gòu)建預(yù)測序列模型,為了更好地評估構(gòu)建改進GRU模型的預(yù)測效果,選取 Adam 優(yōu)化器對訓(xùn)練損失值(Loss)進行優(yōu)化,Adam 是目前深度學(xué)習(xí)模型訓(xùn)練中比較流行的一種優(yōu)化器,相較于其他優(yōu)化器能夠自適應(yīng)參數(shù)學(xué)習(xí),具有收斂速度快、對內(nèi)存需求小、能較好地處理噪音樣本等優(yōu)點[10],經(jīng)過模型訓(xùn)練驗證,得到模型結(jié)果,利用設(shè)備早、中、晚不同時間段(溫濕度對相位值影響較大)多次校正相位值現(xiàn)場驗證,得到方位、俯仰相位值真實值與預(yù)測值對比情況,統(tǒng)計結(jié)果中對應(yīng)的方位、俯仰校相值與預(yù)測值差的均值及標(biāo)準差[11],如表3所示。

表3 校相記錄數(shù)據(jù)示例
從表3中可以看出,均值和標(biāo)準差值均在5以下,預(yù)測值完全滿足設(shè)備使用標(biāo)準,選取其中5次對比情況,如圖5所示。

圖5 相位預(yù)測值與真實值對比
為進一步說明WOA優(yōu)化GRU模型的優(yōu)勢,比較了傳統(tǒng)循環(huán)神經(jīng)網(wǎng)絡(luò)、GRU模型(傳統(tǒng)參數(shù)值)和本文方法,在不同樣本劃分比例下的損失值比較情況如表4所示。

表4 不同劃分比例下模型情況
可以看出,在不同樣本劃分比例下,不明顯提高訓(xùn)練時間的情況下,損失值有明顯的下降,經(jīng)過計算后可得,在設(shè)備記錄數(shù)據(jù)上,WOA-GRU 模型相比GRU和RNN模型,其RMSE指標(biāo)分別提升了 19.7% 和 24.4% 左右,能夠得到效果更好的模型預(yù)測結(jié)果。
針對測控設(shè)備使用中的相位值預(yù)測這一問題進行分析,提出一種利用仿生學(xué)鯨魚算法WOA優(yōu)化序列模型GRU的預(yù)測方法,試驗后得出如下結(jié)論:WOA-GRU模型與普通GRU及RNN模型相比,在預(yù)測結(jié)果上更貼近實際相位值,擬合程度高,損失值更小,可以看出優(yōu)化后的 GRU模型在預(yù)測相位值這類序列問題上具有較好的表現(xiàn),證明了方法的可行性,能夠為測控設(shè)備機動參試狀態(tài)下的標(biāo)校參數(shù)輔助選擇提供一種新的思路和方法。