孫臣良,鄭偉,趙濤,陳洪光
(1.海軍航空工程學院a.兵器科學與技術系;b.科研部,山東煙臺264001;2.91557部隊,浙江舟山316000;3.91440部隊,河南洛陽471000)
基于數據挖掘和小波神經網絡的航材消耗預測方法
孫臣良1a,鄭偉1b,趙濤2,陳洪光3
(1.海軍航空工程學院a.兵器科學與技術系;b.科研部,山東煙臺264001;2.91557部隊,浙江舟山316000;3.91440部隊,河南洛陽471000)
運用數據挖掘技術對航材消耗的歷史數據進行關聯分析,篩選出對保障飛機飛行有重要作用的航材消耗數據,大大縮減了需要預測的航材數量,同時對消耗航材之間的內在影響關系進行量化。在分析人工魚群算法原理的基礎上,對算法中步長參數和視野范圍參數的設置方法進行了改進。實例結果表明,運用小波神經網絡預測航材消耗的方法大大降低了預測誤差,說明了該方法的有效性、可行性和實用性。
數據挖掘;小波神經網絡;消耗預測
航材管理作為飛行勤務保障的重要組成部分,其科學管理水平將對飛機戰斗力的發揮產生直接的影響[1]。當代航空技術突飛猛進,航空裝備不斷朝著集成化、精細化、自動化、模塊化方向發展,飛機也越來越現代化、復雜化。飛機巨大戰斗力的發揮依賴于航材及時而又準確的供應,因而對航材保障提出了更新、更高的要求[2]。假如某一零部件發生故障,就可能導致飛機無法起飛,為避免因航材短缺而造成的飛機停飛現象,必須保證足夠、及時的航材供應[3]。為此,必須儲備一定數量的航材,而航材保障的經費以及航材倉庫的容積都是有限的。因此,只能以有限的保障經費、有限的庫容,采購有限的航材。如果儲備量過大,一方面,將增加航材庫存保管費和保管場所維護費用,降低經濟效益;另一方面,過量庫存降低了航材的質量,使航材陳舊、損壞,甚至因發霉、生銹而變質,這會致使保障成本增加,保障效益降低[4]。反之,航材儲備過少會造成維修停工、飛機停飛,降低軍事效益,并且因缺貨往往造成臨時訂貨,更增加了附加的人力和費用,造成更大的損失。因此,在有限的經費和現有的保障條件下,如何做到精確航材保障,提高航材保障良好率,仍是急需研究的重要課題。以往航材消耗量的預測往往存在2個方面的問題:一方面,是航材種類繁多、數量龐大,每一項航材都進行消耗量的預測工作量巨大;另一方面,選取的預測方法不合適會導致預測結果不準確。本文擬通過采用數據挖掘算法篩選待預測航材種類和名稱,再利用小波神經網絡(Wavelet Neural Networks,WNN)進行消耗量的預測。
數據挖掘(Data Mining)又稱為數據庫中的知識發現(Knowledge Discovery in Database),簡稱知識發現(KDD)。就是從海量的、不完全的、模糊的、隨機的原始數據中,提取隱含在其中的、人們事先不知道的、但又是潛在有用、可信、新穎的信息和知識的過程[5-8]。
數據挖掘是指一個完整的過程,包括數據準備、數據挖掘以及結果的解釋和評估3個部分[9-10],目的是從大型數據庫中挖掘出先前未知的、有效的、實用的信息,并使用這些信息做出決策或豐富知識。
數據準備包括了數據抽取,數據預處理和數據變換;數據挖掘階段首先要明確挖掘的任務或目的,如數據總結、分類等。確定了挖掘任務后,就要決定使用什么樣的算法,同樣的任務可以用不同的算法來實現;數據挖掘階段發現出來的模式,經過用戶或機器的評估,可能存在冗余或無關的模式,就需要將其剔除或返回初始階段重新選擇數據及數據變換方法。
在進行數據挖掘時,選擇合適的挖掘算法,其余的工作都可以自行完成。本文為了確定消耗航材之間的關聯,應用數據挖掘工具SAS中的Enterprise Miner模塊進行關聯規則挖掘,對某機型航材消耗數據進行分析。處理后的原始數據表結構見表1,主要存儲內容有單位、消耗航材。

表1 原始數據存儲表Tab.1 Table of initial data store
由于航材種類繁多,如果把所有原始數據表中列出的航材作為屬性進行關聯規則分析,一些不重要的、個例的屬性就會影響最終的分析結果,而且會影響分析的效率。通過數據清理(填寫空缺值、平滑噪聲數據、識別、刪除孤立點、解決不一致性),數據變換(規范化,即消除冗余屬性和數據匯總),對原始數據進行預處理,最終存入數據庫中準備進行實驗的部分數據見表2、表3。

表2 數據庫數據存儲表Tab.2 Table of database data store

表3 最大頻繁項目集表Tab.3 Table of maximum frequent itemsets
表2、3中,每一條數據對應一架飛機,“編號”列對應與該條數據的序號,“數據項”列存儲的是這架飛機存在的故障,每個英文字母對應一類故障,如:P為分電器夾子;Q為前起上位鎖;R為放油開關;S為火線;T為通風導管等。
根據實際情況,支持度設為0.1,采用Apriori算法,產生的最大頻繁項目集如表3所示。由試驗結果可以看出:P、Q、R、S、T發生故障的概率比較高,在33組數據中,概率超過15%。
依據產生的頻繁項生成關聯規則,產生結果如表4。如果最小信任度設置為0.6,從表4可以看出,產生了3條關聯規則,分別是:P→S;P→T;S→T。對應到飛機故障為:分電器夾子→火線;分電器夾子→通風導管;火線→通風導管。

表4 關聯規則表Tab.4 Table of association Rules
根據關聯規則挖掘得出的結論,在對飛機進行維修或保養時,要對可能引起其他零部件出現故障的零件進行重點檢測維修,從而減少航材消耗的誘因,對提高航材保障效率具有推進作用。
根據試驗結果,分電器夾子損壞會導致火線或者通風導管損壞,火線損壞會導致通風導管損壞,或者說分電器夾子和火線或者通風導管同時損壞的概率較高。這一試驗結果為飛機的保養、維修和庫存的關聯提供了可靠依據,但是這一結果仍需要更多的數據和實際應用來驗證。從數據不難看出,從關聯規則上對航空器材消耗進行挖掘,對維護飛機的技戰術性能上有很大的幫助。
首先,需要考慮網絡參數初始化和確定網絡中的輸入層、隱層、輸出層節點個數;之后,構建小波神經網絡,從而使航材消耗數據在網絡上進行學習、訓練。在利用小波神經網絡模型解決航材消耗預測建模問題時,將參數初始化和網絡結構問題統稱為優化的WNN預測模型建立問題[11-12]。
人工魚群算法(Artificial Fish Swarm Algorithm, AFSA)是一種模擬魚群覓食行為的新型高效的群體智能優化算法,是集群智能思想的一個具體應用,它能很好地解決復雜非線性系統的優化等問題。其基本原理是借鑒魚的覓食、聚群和追尾行為,從構造單條人工魚底層行為做起,通過魚群中各個體局部尋優,達到全局最優值在群體中突現出來的目的。
人工魚群算法具體包括以下步驟。
1)初始化魚群,在控制變量可行域內隨機生成n條人工魚個體,形成初始魚群;包括人工魚群的個體數目,每條人工魚的初始位置,人工魚移動的最大步長Step,視野范圍Visual,重試次數try-number,擁擠度因子δ。
2)設置公告板,公告板用來記錄人工魚群尋到的最優值及對應的人工魚個體狀態。
3)對魚群中的每條人工魚個體所在位置的食物濃度進行評價。
4)每條人工魚個體分別模擬執行追尾行為和聚群行為,選擇行動后食物濃度較大值的行為為實際執行,缺省行為方式為覓食行為。
5)更新公告板,每條人工魚個體每行動一次后,檢驗自身的食物濃度值與公告板的食物濃度值。如果優于公告板,則以自身取代之。
6)判斷是否迭代停止。若是,輸出結果;否則,轉向步驟3)。
人工魚在覓食行為中,其個體總是嘗試向更優的方向前進,這奠定了算法收斂的基礎。人工魚隨機巡視其視野范圍中某點的狀態Xj,如果發現好于當前狀態Xi,則狀態Xi的方向前進一步到達狀態Xj;如果狀態Xj并不比狀態Xi好,則它繼續隨機巡視視野范圍內的狀態,如果巡視次數達到一定次數try-number仍未找到更優狀態,則做隨機游動。在上述過程中,步長參數Step與視野范圍Visual對魚群算法收斂的速度和精度影響很大。設置不當則會陷入局部極值或達不到精度。在覓食行為中,人工魚個體沒有找到較優狀態時,會隨機選擇一個新狀態,未充分利用已得到的信息,致使計算量增加和收斂速度較慢。
針對以上不足,Visual和Step可動態調整為:

式(1)中:t為當前迭代次數;Tmax為最大迭代次數;Visualmin=0.001;Stepmin=0.000 2;Step=Visual 8;s為函數a的變化速率,通常取值整數的范圍為[1,30]。
用改進人工魚群算法優化WNN的目的是為了確定與給定任務最佳匹配的WNN參數初始值和網絡結構,優化的目的是不僅要確保初始化參數、網絡結構最優,還要減小WNN網絡的輸出誤差。適應值函數定義為輸出的均方誤差函數MSE,人工魚群代表了不同結構的WNN,不同人工魚對應于含有不同網絡參數和隱節點數的WNN網絡結構組成,且整個優化過程不是基于一種固定的網絡結構。
由改進人工魚群算法確定的WNN參數初始值和結構模型建立方法如下:
1)初始化人工魚群的群體規模M、每條人工魚的初始位置、視野范圍Visual、步長Step、擁擠度因子δ和最大重復嘗試次數因子try-number、最大迭代次數number等參數;
2)設置初始迭代次數num=0,在控制變量可行域內隨機生成M個人工魚個體,形成初始魚群;
3)計算每條人工魚的適應度,并與公告板的狀態比較,若較好,則將其賦給公告板;
4)按式(1)計算視野范圍Visual和步長Step;
5)每條人工魚通過覓食、聚群、追尾和隨機行為更新自己的位置;
6)判斷num是否已經達到預置的最大迭代次數number,若滿足,算法終止,輸出計算結(即公告板的FC值)果;否則num+1,轉步驟3);
7)將改進人工魚群算法得到的最優解,解碼為WNN參數的初始值和隱層節點數,采用BP算法,對網絡參數進行梯度下降法訓練。
選取研究對象為某型飛機的油箱安全活門,實驗所用的數據實測于其120個月該項器材的實際消耗量。
人工魚群算法中,WNN的初始參數(連接權值、平移因子和伸縮因子)為[-1,1]內的隨機數,隱層節點數取為[1,30]內的整數。群體規模M=40,視野范圍Visual=1,步長Step=0.05,擁擠度因子δ=0.168,s=3,最大重復嘗試次數因子try-number=30,迭代次數number=100,采用梯度下降法訓練WNN次數N=200,目標誤差MSN為0.000 1。本文設計了一種組合式的WNN優化設計方法,以便于驗證本文優化設計方法的有效性。即分別采用普通的BP算法和WNN算法來初始化參數和確定隱層節點個數。
表5列出了采用普通的BP算法和本文算法優化設計后的WNN的性能指標對比,即50次實驗的平均值。

表5 不同優化設計方法的WNN模型的性能對比Tab.5 Performance comparison of different optimization approach with WNN
從實驗結果可以看出,采用本文優化設計的方法得到的WNN模型具有較強的預測能力,僅需訓練87次,就可收斂目標精度,并且選取的隱層節點數也少于后者。另外,本文方法優化過程中沒有出現局部最優和不收斂現象,這也證明了本文方法的有效性。更為重要的是,該方法能夠實現WNN參數初始值和隱層節點數的同步優化,從而避免了WNN工程應用出現的參數初始化和結構設計的盲目性問題,具有較好的應用前景。
本文運用數據挖掘技術對航材消耗的歷史數據進行關聯分析,篩選出對保障飛機飛行有重要作用的航材消耗數據,大大縮減了需要預測的航材數量,同時對消耗航材之間的內在影響關系進行量化。小波神經網絡具有神經網絡的非線性映射能力和小波分析的時頻分析特點,其應用效果總體優于單純使用神經網絡或者小波分析。本文運用小波神經網絡預測航材消耗量,實例結果表明該預測方法大大降低了預測誤差,說明了該方法的有效性、可行性和實用性。
[1]張作剛.海軍航材庫存管理[M].北京:海潮出版社,2008:1-1;13-14. ZHANG ZUOGANG.Navy air material inventory management[M].Beijing:Tides Press,2008:1-1;13-14.(in Chinese)
[2]劉臣宇.航材供應[M].北京:國防工業出版社,2009:56-58. LIU CHENYU.Air material supply[M].Beijing:National Defense Industry Press,2009:56-58.(in Chinese)
[3]徐廷學,芮國勝,鄭偉.航空裝備綜合保障[M].北京:兵器工業出版社,2004:12-14. XU TINGXUE,RUI GUOSHENG,ZHENG WEI.Integrated logistic support for aeronautic equipment[M].Beijing:Weapon Industry Press,2004:12-14.(in Chinese)
[4]陳云翔,楊新廣.航空裝備戰斗損傷概率預測模型研究[J].數學的實踐與認識,2011,41(18):118-122. CHEN YUNXIANG,YANG XINGUANG.Research on battle damage probability forecast model for aeronautic equipment[J].Mathematics in Practice and Theory,2011,41(18):118-122.(in Chinese)
[5]計希禹.數據挖掘技術應用實例[M].北京:機械工業出版社,2009:23-26. JI XIYU.Data mining technology application[M].Beijing:China Machine Press,2009:23-26.(in Chinese)
[6]朱玉全,楊鶴標,孫蕾.數據挖掘技術[M].南京:東南大學出版社,2006:28-30. ZHU YUQUAN,YANG HEBIAO,SUN LEI.Data mining technology[M].Nanjing:Southeast University Press,2006:28-30.(in Chinese)
[7]邵峰晶,于忠清.數據挖掘原理與算法[M].北京:中國水利水電出版社,2003:12-16. SHAO FENGJING,YU ZHONGQING.The principle and algorithm of data mining[M].Beijing:China Water-Power Press,2003:12-16.(in Chinese)
[8]薛青,羅佳,鄭長偉,等.面向作戰仿真的數據挖掘[J].四川兵工學報,2013,34(8):93-95. XUE QING,LUO JIA,ZHENG CHANGWEI,et al. Study on data mining for combat simulation[J].Journal of Sichuan Ordnance,2013,34(8):93-95.(in Chinese)
[9]CHENG G,LIU X,WU J X.Interactive knowledge discovery through self-organising feature maps[C]//World Congress on Neural Networks.2004:430-434.
[10]ESTER M,KRIGEL H P,XU X.Knowledge discovery in large spatial databases,advances in knowledge discovery and data mining[M].MA:AAAI/MIT Press,2006:83-115.
[11]HSU K,GUPTA H V,SOROOSHIAN S.Artificial neural network modeling of the rainfall runoff process[J].Water Resources Research,2005,31(10):2517-2530.
[12]左廣東,周帥,張欣豫.小波神經網絡研究[J].四川兵工學報,2012,33(4):115-117. ZUO GUANGDONG,ZHOU SHUAI,ZHANG XINYU. Research of wavelet neural network[J].Journal of Sichuan Ordnance,2012,33(4):115-117.(in Chinese)
V240.2
A
2014-01-23;
2014-03-31
國家部委技術基礎基金資助項目(1036221)
孫臣良(1963-),男,副教授,大學。
1673-1522(2014)03-0235-04
10.7682/j.issn.1673-1522.2014.03.008