孫劍橋,王樹禮,杜家興
1.軍事科學(xué)院系統(tǒng)工程研究院后勤科學(xué)與技術(shù)研究所,北京 100071
2.陸軍裝甲兵學(xué)院,北京 100072
傳統(tǒng)的基于數(shù)學(xué)原理的預(yù)測方法可以挖掘出經(jīng)驗法所達不到的數(shù)據(jù)之間的潛在關(guān)系,如相關(guān)性、趨勢、周期等要素,但只能對趨勢顯著的數(shù)據(jù)序列進行辨識和分析,且當歷史數(shù)據(jù)較少時,精度以及可用性無法得到保證。當前常用的灰色預(yù)測模型雖然能很好地解決小樣本問題,但對于擴展性大、類型豐富的數(shù)據(jù)集其預(yù)測精度較低;對于基于數(shù)據(jù)和歷史記錄的預(yù)測大多使用回歸分析、神經(jīng)網(wǎng)絡(luò)、支持向量機等方式,從訓(xùn)練樣本中提取各種因素與需求的關(guān)系,其準確性在很大程度上要依賴數(shù)據(jù)量的大小;基于統(tǒng)計建模的方法在場景復(fù)雜,干擾因素多的環(huán)境下效果不好,且建模過程困難[1-4]。
基于深度學(xué)習(xí)方法的裝備修復(fù)性需求模型可以實現(xiàn)無前期假設(shè)和預(yù)置故障模式、無需相關(guān)專業(yè)的知識和技能下就能夠自動學(xué)習(xí)預(yù)測所需的故障特征。其在圖像識別、自然語言處理和時間序列數(shù)據(jù)處理中均有良好的表現(xiàn)。本文利用深度學(xué)習(xí)算法對采集到的裝備故障數(shù)據(jù)進行分析,提出了一種基于深度學(xué)習(xí)的多維特征融合的修復(fù)性器材需求預(yù)測解決方案。
在深入研究深度網(wǎng)絡(luò)現(xiàn)狀及應(yīng)用的基礎(chǔ)上,針對修復(fù)性器材采集數(shù)據(jù)的特點構(gòu)建了基于Attention-Bi-LSTM 的深度網(wǎng)絡(luò),構(gòu)建了多維特征融合的修復(fù)性器材需求預(yù)測模型。
多維特征融合的修復(fù)性器材需求預(yù)測模型中輸入數(shù)據(jù)用到的是狀態(tài)數(shù)據(jù)中的裝備運行參數(shù)記錄儀回傳的總線數(shù)據(jù)、各類傳感器采集的數(shù)據(jù)、部分戰(zhàn)場態(tài)勢環(huán)境信息以及由業(yè)務(wù)數(shù)據(jù)中抽取的裝備故障信息形成的樣本標簽信息。
首先從所需信息中抽取出各類數(shù)據(jù),形成裝備故障信息表。從裝甲裝備歷史狀態(tài)數(shù)據(jù)中提取單裝編號(S1)、水溫(S2)、壓強(S3)、轉(zhuǎn)速(S4)、傳感器震動(S5)、行駛摩托小時(S9)等裝備狀態(tài)屬性、每一條維修信息對應(yīng)的裝備所在地的海拔(m)(e1)、月平均氣壓(Kpa)(e2)、月平均氣溫(℃)(e3)等地理環(huán)境因素屬性,以及從裝備保障業(yè)務(wù)數(shù)據(jù)中獲取到的裝備故障信息,裝備損壞時間(b1,以時間戳計量)、裝備故障部位(b2)、維修器材(b3)、裝備修復(fù)時間(b4),各傳感器采集的數(shù)據(jù)(c1~cn)等。將裝備故障信息按照單裝編號和數(shù)據(jù)記錄時間進行抽取,將其從上一次維修時間至下一次維修時間之間數(shù)據(jù)構(gòu)成一組,生成每條數(shù)據(jù)的目標變量Y,也即模型要預(yù)測的故障時間值,F(xiàn)標識故障所需器材類型。

圖1 網(wǎng)絡(luò)結(jié)構(gòu)圖Fig.1 Network structure
針對特定需求設(shè)計搭建了一種引入“注意力”機制下多維特征融合的LSTM-CNN 深度網(wǎng)絡(luò)模型架構(gòu),模型首先搭建卷積神經(jīng)網(wǎng)絡(luò)窗口模塊,使其與后續(xù)循環(huán)神經(jīng)網(wǎng)絡(luò)個數(shù)相同,根據(jù)循環(huán)神經(jīng)網(wǎng)絡(luò)的特點及多種方法的測試效果,選取LSTM 網(wǎng)絡(luò)作為時間序列特征的抽取層。多維特征抽取網(wǎng)絡(luò)采用的是SAE-DNN 網(wǎng)絡(luò),能夠?qū)?zhàn)場各類態(tài)勢信息進行抽取,例如海拔、地形、溫度、是否為主攻方向等信息,能夠有效融合戰(zhàn)場態(tài)勢信息。模型通過全連接層將多維特征與時間序列的傳感器數(shù)據(jù)特征融合,最后采用Softmax 分類器進行裝備保障需求的分類識別[5](圖1)。
根據(jù)模型的特點,按照網(wǎng)絡(luò)的結(jié)構(gòu)圖進行了模型的構(gòu)建,并在卷積層后融入了注意力機制以將強模型的特征提取能力。注意力概率分布計算如下:

其中I表示Bi-LSTM 層的輸出,ω表示權(quán)重的矩陣,hn表示當前時刻Bi-LSTM 層的狀態(tài)值,融合Attention 機制的網(wǎng)絡(luò)層在計算注意力概率分布的同時要計算最終的輸出特征的值。
特征融合層則是在Bi-LSTM 層和SAE-DNN 層之后執(zhí)行特征融合過程的網(wǎng)絡(luò),將兩組獲取的特征進行融合,分類模塊對應(yīng)的是裝備故障類型的預(yù)測,回歸模塊對應(yīng)的是裝備故障時間的預(yù)測[6]。本模型設(shè)計的基礎(chǔ)架構(gòu)能夠滿足此兩類問題的求解,同一輸入分別進入兩種模型的內(nèi)部,最終形成兩種結(jié)果的輸入,能夠滿足對裝備故障預(yù)測的需要。其中分類模塊對應(yīng)的訓(xùn)練標簽是故障器材(F),回歸模塊對應(yīng)的訓(xùn)練標簽是故障時間值(Y)。
在裝備運行過程中,傳感器會實時將采集到的數(shù)據(jù)返回到云中心中。模型的訓(xùn)練需要用到訓(xùn)練數(shù)據(jù)是從4 個保障點中歷次采集到的裝備行星齒輪箱中各齒輪的保障信息中進行整理得出,包括1-6號齒輪,采集過程中使用4 個檔位,每個檔位采用4 種轉(zhuǎn)速(600 r/min、900 r/min、1200 r/min、1500 r/min),共采集80 組數(shù)據(jù),每組采集700 個樣本。以1000 個點為片段進行截取作為訓(xùn)練數(shù)據(jù)的一條樣本。經(jīng)過整理共獲得有效樣本112000 條,其中1 號器材樣本數(shù)據(jù)21980 條、2 號器材樣本數(shù)據(jù)22250條、3 號器材樣本數(shù)據(jù)22870 條、4 號器材樣本數(shù)據(jù)22430 條、5 號器材樣本數(shù)據(jù)22384 條、6 號器材樣本數(shù)據(jù)21598 條。實驗中隨機選取了1 號器材、2 號器材、3 號器材、4 號器材、5 號器材和6號器材各17000 條,共計102000 條訓(xùn)練集數(shù)據(jù),剩余數(shù)據(jù)作為測試集。其結(jié)果如表1 所示。

表1 保障點數(shù)據(jù)標準化處理Table 1 Standardized processing of support point data
本實驗是在搭建的裝備保障決策體系平臺下申請的虛擬主機中進行的,系統(tǒng)為Ubuntu 16.10,處理器為Intel Core i7-6700,顯卡為NVIDIA GeForce GTX 1070,使用Tensorflow 1.4.1 版本進行模型的搭建。模型的優(yōu)化與迭代通過訓(xùn)練過程中的網(wǎng)絡(luò)結(jié)構(gòu)的優(yōu)化逐步進行,從而獲得針對該問題的最優(yōu)化網(wǎng)絡(luò)模型,并最后形成固化模型,為在線數(shù)據(jù)分析提供最優(yōu)化模型。為驗證文中設(shè)計的多屬性融合的深度神經(jīng)網(wǎng)絡(luò)在需求預(yù)測中的有效性,對本文方法與CNN 網(wǎng)絡(luò)和LSTM 網(wǎng)絡(luò)進行了對比實驗,并對每種方法是用兩類數(shù)據(jù)樣本進行實驗,分別是包含態(tài)勢環(huán)境的數(shù)據(jù)和不包含態(tài)勢環(huán)境的數(shù)據(jù),采用的為2017 年6 月份采集的數(shù)據(jù)進行具體實驗。各項指標計算結(jié)果如表2 所示。

表2 預(yù)測效果對比Table 2 Prediction effect comparison
綜上可以看出,本文提出的方法能夠?qū)⒏黝愐蛩乜紤]的齊全,相對于其他比較方法,具有更高的預(yù)測精度,取得了較理想的結(jié)果。該方法相較傳統(tǒng)的特征提取方法擺脫了大量的人工工作,節(jié)省了大量的時間,避免了主觀因素的干擾,提高了修復(fù)性器材需求預(yù)測效果和效率,為裝備保障維修提供了數(shù)據(jù)基礎(chǔ)和技術(shù)支撐。本文設(shè)計的模型預(yù)測結(jié)果如表3 所示。

表3 修復(fù)性器材需求預(yù)測結(jié)果Table 3 Forecast results of demand for repair equipment
LSTM 模型由于未能夠按照多窗口獲取樣本數(shù)據(jù),在特征提取上處于劣勢,因此預(yù)測精度比本文效果有明顯差距,但是相較于CNN 網(wǎng)絡(luò)來講,由于其能夠很好的獲取到樣本的時間序列特性,因此依然能夠獲得一個不錯的預(yù)測效果。進一步分析實驗結(jié)果可以看出,在20~30 個周期內(nèi),本文提出的模型能夠具有很高的預(yù)測裝備是否損壞的能力,初步實驗分析其準確率可以達到98%,召回率達到85%,能夠為預(yù)防性維修及裝備保障任務(wù)規(guī)劃提供數(shù)據(jù)支持。針對這一特點,能夠?qū)㈩A(yù)測模型轉(zhuǎn)換為預(yù)測一定時間內(nèi)裝備的故障情況,如預(yù)測裝備在動用使用一個月的時間內(nèi)是否故障,能夠進一步為裝備保障器材的需求預(yù)測與倉儲配置提供數(shù)據(jù)支撐。
綜上可以看出,本文提出的方法能夠?qū)⒏黝愐蛩乜紤]的齊全,相對于其他比較方法,能夠很好的自動抽取裝備器材需求的特征。該方法相較傳統(tǒng)的特征提取方法擺脫了大量的人工工作,節(jié)省了大量的時間,避免了主觀因素的干擾,提高了裝備保障的效率。
器材需求預(yù)測是器材庫存配置優(yōu)化的重要數(shù)據(jù)基礎(chǔ),針對傳統(tǒng)方法遇到的問題和不足,采用當前信息化手段和先進的模型算法對這一問題進行了研究和改進。采用數(shù)據(jù)驅(qū)動的思想,從數(shù)據(jù)入手,對修復(fù)性器材需求預(yù)測進行了研究,提出了多維特征融合的修復(fù)性器材需求預(yù)測方法,為后續(xù)器材庫存配置優(yōu)化分析提供了數(shù)據(jù)基礎(chǔ)和技術(shù)支撐。