聶 凱,欒瑞鵬
(中國人民解放軍92124部隊,遼寧 大連 116023)
隨著仿真技術的迅速發展,仿真試驗已逐漸成為飛行器定型試驗中不可缺少的試驗手段,與外場試驗有機結合,推動著飛行器試驗與鑒定技術的發展。仿真試驗最重要的是仿真系統的可信性,仿真系統的校核、驗證與確認(Verification,Validation and Accreditation,VV&A)日益成為人們研究的熱點[1]。通過靜態、動態數據驗證飛行數據與仿真數據的一致性,是目前飛行器仿真模型驗證過程中最常用、最重要的方法[2]。通過驗證飛行數據與仿真數據的一致性,進而確定仿真系統的可信度對仿真系統來說非常重要。
靜態數據的驗證方法一般包括圖示法、統計分析法、假設檢驗法等,動態數據的驗證方法分為相似比較方法(誤差分析法、灰色關聯分析法、相關系數法)、特征比較方法(時域分析、頻域分析)等[3],已成功應用于各種仿真試驗模型驗證。受飛行器實際試驗成本限制,實際飛行數據呈現小樣本特性,而仿真結果樣本量不受限制,會造成驗前大容量仿真信息“淹沒”飛行小樣本試驗信息問題[4]。針對飛行數據小樣本問題,人們通過研究提出了很多解決方法,如貝葉斯估計、Bootstrap方法[5]、主從一體化檢驗[6]等,但依然會增加決策風險[7]。
近年來,以深度學習為代表的人工智能技術迅速發展,人們研究了多種數據增強方法來滿足其訓練時對大樣本數據量的需求[8]。當飛行器實際飛行數據小樣本無法滿足仿真模型驗證需求時,可以通過采用生成式對抗網絡(Generative Adversarial Nets,GAN)等深度學習新技術生成逼真數據,擴大數據子樣[9]。GAN通過非線性變換和迭代對抗訓練而具備擬合高度復雜分布的能力,因此增強后的數據與原飛行數據在相容性上保持高度一致。文獻[10]提出了一種離散序列生成式對抗網絡(Sequence Generative Adversarial Nets,SeqGAN),在語音、詩詞和音樂生成方面超過了傳統方法,也適合離散的實際飛行數據。
針對仿真模型驗證中飛行數據小樣本問題,采用離散序列生成式對抗網絡對飛行數據進行增強,并對增強后飛行數據和仿真數據的一致性進行驗證,最后選取靜態數據脫靶量和動態數據俯仰姿態角對某飛行器半實物制導仿真系統的相關仿真模型進行驗證測試。
仿真模型驗證過程分為飛行數據預處理、飛行數據增強、仿真模型驗證方法、實例驗證測試等,具體過程如圖1所示。

圖1 仿真模型驗證過程
仿真模型驗證具體步驟為:
1)飛行數據預處理。通過時間配準、野值識別與修復、平滑與去噪、重采樣等保持與仿真數據的一致性。
2)飛行數據增強。采用離散序列生成式對抗網絡SeqGAN對小樣本飛行數據進行增強。
3)仿真模型驗證方法。對于脫靶量等靜態數據采用假設檢驗方法進行驗證,對于位置、速度、姿態角等動態數據采用灰色關聯分析方法進行驗證。
4)實例驗證測試。選取飛行器制導仿真系統中的脫靶量、俯仰姿態角等實際飛行數據進行驗證測試。
假設檢驗方法是靜態數據驗證中最常用的一類方法,當數據為小樣本時,通常使用秩和檢驗、游程檢驗等非參數檢驗方法進行檢驗。文獻[11]采用秩和檢驗對樣本數為1的極端情況進行了驗證,得出了結果,但決策風險高。當實際飛行數據被增強后,數據樣本擴大了,有可能滿足正態分布,就可以使用F檢驗方法,即
令飛行數據和仿真數據的變量為X和Y,設其分布函數為F(x)和F(y),下面判斷公式(1)是否成立:
H0:F(x)=F(y)
(1)
當增強后數據滿足正態分布時,采用F檢驗驗證H0是否成立,F檢驗的步驟和公式見文獻[12]。
近年來,灰色關聯分析方法、時域內分析法、頻域內分析法等動態數據驗證方法獲得迅速發展[13],灰色關聯分析方法在序列一致性分析方面具有明顯優勢,因此本文選用灰色關聯分析方法對動態數據進行驗證,具體步驟為[14]:
1)若動態數據較長,則根據數據的特點和模型驗證的需要對動態數據進行分段,段數為N;
2) 對于每段數據,通過灰色關聯度模型計算灰色關聯度γk,基于專家經驗為每個灰色關聯度確定權重ωk;
4)根據灰色關聯度與仿真系統可信度的映射關系,評估系統的可信度。
無論靜態還是動態飛行數據,都是離散的。因此,采用GAN的變型——離散序列生成式對抗網絡(Sequence GAN,SeqGAN)對飛行數據進行增強。SeqGAN的生成器使用循環神經網絡(Recurrent Neural Network,RNN),判別器使用卷積神經網絡(Convolutional Neural Networks,CNN),并引入強化學習的獎勵和蒙特卡洛搜索。判別器的輸出作為強化學習的獎勵,采用獎勵和梯度策略對生成器進行更新,最后使用蒙特卡洛搜索評估中間狀態。SeqGAN很好地結合了GAN和強化學習,其計算流程和結構如圖2所示。

圖2 SeqGAN的計算流程和結構
離散序列生成式對抗網絡算法流程如表1所示。

表1 離散序列生成式對抗網絡算法流程
算法中用到的公式如下:
(2)
θ←θ+αhθJ(θ)
(3)
(4)
這里我們把SeqGAN的生成模型當作一種非參數的產生式建模方法,它可以逐步逼近任何概率分布,如果判別器訓練良好,生成器可以生成與真實樣本幾乎相同的分布,因此SeqGAN是漸進一致的[15]。而其他生成模型如變分自動編碼器會依賴預先假設的近似分布,而對近似分布的選擇需要一定的經驗信息,同時它還受變分方法本身的限制,生成的概率分布會存在偏差。
在我們搭建的深度學習系統中,離散序列生成對抗網絡中的RNN與CNN模型的訓練采用TensorFlow實現。RNN生成模型包含2層隱含層,每層包含200個長短記憶網絡,其訓練時采用了丟棄正則化方法,在預訓練與對抗訓練時初始丟棄率均為0.3。CNN判別模型分別采用窗長為1,2,3,4,5的卷積核進行卷積操作,每個窗長分別使用40個不同的卷積核。此外,判別模型包含2層通道層,每層200節點。輸出層包含1個節點,表示輸入序列與真實數據相似程度。在訓練過程中,也采取丟棄正則化技術防止模型過擬合,丟棄率為0.3。同時在輸出層采用L2范數正則化技術,正則項系數為0.15。
生成模型和判別模型的訓練采用基于Adam算法的批量(Mini-batch)隨機梯度下降更新參數,輸入序列長度為50,批量數目為分別為5000和400。生成模型的初始學習率為0.01,衰減速率為0.95,判別模型的學習率為 0.000 1。選擇靜態數據脫靶量和動態數據俯仰姿態角進行增強性能驗證。某型號飛行器脫靶量實測數據只有9個,樣本量小,因此我們采用遷移學習的方法[16],即將某艦炮5000發的脫靶量數據進行學習,然后結合某飛行器脫靶量分布實際進行遷移,發現學習效果較好。圖3為某飛行器的9次脫靶量結果,其增強后分布如圖4所示。

圖3 某飛行器脫靶量結果

圖4 某飛行器脫靶量增強后結果
我們對增強后的脫靶量數據進行統計分析,脫靶量數據已經達到5000個,其服從均值為6,方差為1的正態分布,達到了數據增強目的。
圖5為某飛行器一次飛行俯仰姿態角數據,其增強后結果如圖6所示。

圖5 某飛行器一次飛行俯仰姿態角數據

圖6 某飛行器俯仰姿態角增強后數據
我們對增強后的俯仰姿態角數據進行統計分析,姿態角數據已經達到400條,采用t-SNE算法[17]對原數據和生成數據的分布進行可視化,映射到二維空間,結果顯示其分布與原數據的分布十分接近。
選擇某飛行器半實物制導仿真系統,采用靜態、動態數據對仿真模型進行驗證,半實物制導仿真系統的組成如圖7所示。

圖7 某飛行器半實物制導仿真系統的組成圖
基于仿真系統和模型,通過仿真生成飛行器脫靶量數據記為Y,其分布函數為F(y),服從正態分布,實際飛行脫靶量數據記為X,其分布函數為F(x)。

當實際飛行脫靶量數據未增強,個數僅為9時,采用秩和檢驗法[11],不能通過一致性檢驗。
基于灰色關聯分析方法的動態數據驗證,首先在時間[0,100]上以 0.05秒步長仿真得到一組(400個)關于俯仰姿態角的仿真數據,與飛行數據個數相等,時間一致。驗證步驟為:
1)從400組數據中選擇一組數據,動態數據長達100 s,將時間序列分為N=2段,[0.02, 49.97][50.03, 99.97];
2)采用鄧氏灰色關聯度模型計算灰色關聯度γk,并確定ω1=[0.4,0.6],ω2=[0.7,0.3],按照上述參數設置之后獲得的灰色關聯度結果為γ1=[0.835,0.918],γ2=[0.931,0.886];

4)對剩余399組數據進行灰色關聯度計算,得到一組值,合起來記為矩陣A400x2。對固定的分辨系數ε,γ越大,表明兩組數據序列間的相關性就越強。相對于小樣本的計算結果,基于增強后的飛行俯仰姿態角數據,灰色關聯度計算結果矩陣A400x2包含的結果更多,對仿真模型的驗證更有效。從A400x2中γ值的計算結果看,基本都在0.8以上,動態飛行數據和仿真數據的一致性好。根據灰色關聯度與仿真系統可信度的映射關系,進一步可以評估系統的可信度。
相對于仿真數據,大型飛行器的飛行結果數據呈現小樣本特性,在仿真試驗時增加了仿真模型驗證的決策風險。本文采用生成式對抗網絡GAN這一深度學習新技術生成逼真數據,擴大飛行數據樣本。針對飛行數據的離散特性,在數據預處理的基礎上,采用離散序列生成式對抗網絡,對靜態結果數據(如脫靶量)和動態數據(如俯仰姿態角),進行增強,然后采用假設檢驗方法中的F檢驗對靜態數據,采用灰色關聯分析方法對動態數據分別進行了驗證。飛行數據增強后,F檢驗將一致性從未通過變成通過,灰色關聯分析方法使一致性檢驗通過,為仿真模型驗證及其可信度評估提供了一種新方法。下一步,將結合深度學習研究更多的數據增強方法及其增強后與原數據兼容性的定量評價標準,進一步提高仿真模型驗證及其可信度評估的效率。