徐廷學,杜愛國,陳 紅
(1.海軍航空工程學院兵器科學與技術系,山東 煙臺 264001;2.海軍裝備部,北京 100048)
飛航導彈備件需求預測方法很多,如時間序列預測法、回歸預測法與專家系統法等[1]。時間序列預測法不能充分利用對備件需求量有很大影響的信息和因素,可能導致預測不準確和數據穩定性差;回歸預測法不能處理影響因素與需求量間的非平衡暫態關系;專家系統法在把專家知識和經驗等準確地轉化為一系列規則時非常困難。進行飛航導彈備件消耗規律的研究,必須立足于深入研究飛航導彈備件消耗的影響因素之上[2]。全面掌握各種影響因素及其性質,可使本文的研究工作獲得有力支撐。現實情況是,飛航導彈備件種類繁多,而影響其消耗的因素種類多、影響程度各異,導致在數據處理上耗費大量精力。如果某些影響因素對預測結果造成的影響微小,那么就可以通過忽略這些因素來降低預測的難度,提高預測的速度和有效性。本文提出基于粗糙集和BP 神經網絡的預測法。該方法充分發揮粗糙集在處理冗余數據上的優勢,結合BP神經網絡對飛航導彈備件進行消耗預測,提高了預測的速度和有效性。
粗糙集理論是波蘭華沙大學的pawlak2 教授于1952年提出的一種處理模糊性和不確定性新型數學工具。該理論能有效地處理不精確、不一致和不完整信息,并從中發現隱含知識,揭示潛在規律。目前,該理論已被廣泛應用于數據挖掘、機器學習、知識獲取、決策分析、人工智能、大型數據庫和智能信息處理等計算機領域。
如果給定一個有限的非空集合U,稱為論域,R 為U 上的一族等價關系,則知識可以定義為等價關系族R 對論域U 的劃分,記為U/R。假設根據關于論域U 的某種信息,使用屬性及其值來描述U 中的元素,屬性或屬性集合就構成了U 上的一族等價關系。任意一個等價關系r R∈ 可以對U 劃分,形成等價類,稱為關于r 的基本集。如果2 個元素同屬于一個等價類,則它們之間是不可分辨的。
粗糙集理論中,模糊性是一種基于邊界的概念,即一個模糊概念具有一個沒有明確界限的邊界,每個不精確的概念X 由一對精確概念(下近似與上近似)來表示。X 的下近似包含了可確切分類到X 中的元素,上近似包含了所有那些可能屬于X 的元素。上近似與下近似的差就是概念的邊界區域,即利用可用信息不能確定地分類到概念中的所有元素。顯然,如果邊界區域非空,則X 是一個模糊概念。
神經網絡是在現代神經科學的基礎上提出和發展起來的,旨在反映人腦結構及功能的一種抽象數學模型[3-4]。自1943年美國心理學家W.McCulloch和數學家W.Pitts 提出形式神經元的抽象數學模型—MP 模型以來,人工神經網絡理論技術已經過了50 多年曲折的發展,特別是20 世紀80年代,人工神經網絡的研究取得了重大進展[5]。
誤差反向傳播網絡(Back Propagation Network,BP)是一種應用最廣泛的神經網絡。BP 模型是一個多層感知器,是由輸入層、中間層(隱含層)和輸出層構成的前饋網絡。BP 神經網絡自學習過程是一個反復迭代過程,首先給網絡一組初始權值,然后輸入一個樣本并計算其輸出,通過實際輸出與期望值之間差值用一定方法來修改網絡權值,以達到減小這個差值的目的。反復執行這個過程直到這個差值小于預先確定的值為止。對足夠的樣本進行這樣的訓練后,網絡所得的那組權值便是網絡經過自適應學習得到的正確內部關系。[6]
H.N.Robert(1989)證明了對任意閉合區間連續函數都可以用含有一個隱含層的BP 網絡來逼近,因而BP 網絡可以來預測器材的消耗量[7-9]。
利用粗糙集處理影響因素的值,以影響因素作為輸入,并以消耗量作為輸出,建立基于粗糙集和BP 神經網絡的預測模型,其預測流程如圖1 所示。

圖1 基于粗糙集和神經網絡的預測流程
Step1:提出多信息量的備件預測問題,構思建立基于粗糙集和神經網絡的預測模型;
Step2:分析并量化影響備件消耗量的各因素。影響備件消耗量的因素很多,如備件的固有故障率、重大演習任務、環境因素、使用維修與定檢等。根據具體情況把各影響因素量化,并用適當的數字表示出來;
Step3:確定輸入輸出向量,把影響因素量化值作為輸入向量,把備件消耗量作為輸出向量;
Step4:收集數據并用粗糙集理論對數據進行處理;
Step5:確定輸入與輸出層神經元個數,并設計中間層神經元個數可變的網絡結構;
Step6:輸入訓練樣本與測式樣本進行網絡訓練與測試,對比訓練誤差和預測誤差,確定最優網絡結構;
Step7:輸入新的影響因素樣本數據到確定的最優模型中進行預測。
參照某飛航導彈8年備件的消耗,消耗量統計數據及主要影響因素編制見表1。應用基于粗糙集和神經網絡預測法進行飛航導彈備件消耗量分析。

表1 影響因素量化值
1)各影響因素如下:
A——備件的固有可靠性。把導彈裝備定檢過程中發現的失效備件數作為自然消耗的備件數并對其量化。
B——環境因素。根據該部隊氣象部門的統計資料,將其量化為根據環境的嚴酷度所劃分的7 個等級,并相應地量化為7~1 之間的整數值,即數值越大表示嚴酷程度越高,環境越惡劣。
C——人為因素。以導彈技術準備過程中因人為因素導致的備件失效數為該影響因素的量化值。
D——年度重大演習任務次數。將次數作為量化值。
E——執行任務時間。根據平時訓練計劃統計出該導彈年度使用總時間,單位為h,將其作為量化值。
F——年度使用、維修與定檢中該備件(或者含該備件的部件)被拆卸的總次數。將總次數作為量化值。
各影響因素組成屬性集合R={A,B,C,D,E,F}。
年度組成集合U={1,2,3,4,5,6,7,8}。
對每個屬性設定閾值,1 表示不小于閾值,0表示沒有達到標準。例如,對A,閾值設定為2,當A 值沒有達到2 時,閾值為0,否則閾值為1;對B,閾值設定為3;對C,閾值設定為3;對D,閾值設定為1;對E,閾值設定為650;對F,閾值設定為27。表2 為影響因素信息表。

表2 影響因素信息表
由表2 可知D 屬性值在8年跨度里只有一個不同,這說明每年重大演習次數對備件的影響程度基本穩定,對預測不會有太大影響,可以把它去掉。B 屬性值和F 屬性值相同,所以只保留一個,假設保留B,刪除F。這樣刪除表2 中D、F 兩列,得到影響因素化簡信息表,見表3。

表3 影響因素化簡信息表
下面對表中的數據進行約簡。 其中,U={1,2,3,4,5,6,7,8},R={A,B,C,E}。則A、B、C 和E 分別具有以下等價類:

ind(R)關系有以下等價類:

因此,因素B 可省,而A、C 和E 不可省。這樣就把原來6 個影響因素減為3 個。
采用3 層BP 神經網絡,輸入層有3 個神經元,輸出層有1 個神經元。把選定的消耗特征參數A、C 和E 作為神經網絡的輸入向量,備件的消耗量作為神經網絡的輸出向量。
中間層的神經元個數需要通過實驗來確定,因而需要設計一個隱含層可變的BP 網絡。一般可先根據Kolmogorov 定理取2n+1 個,再依據經驗在附近選擇不同的個數進行實驗尋找最佳數目。依實際情況分別選取6、10、15、20、25、29、33 和40進行實驗。按BP 網絡的一般設計原則,中間層神經元的傳遞函數為S 型正切函數tansig,輸出層神經元的傳遞函數可設定為S 型對數函數logsig。中間層神經元個數很難確定,但在很大程度上影響著網絡的預測性能[4]。
取表1 的影響因素數據作為輸入向量,以緊跟后8年的消耗數量作為目標向量進行網絡訓練。訓練次數設為1 000,訓練目標設為0.000 1,其他參數取默認值。依照上面設計網絡,觀察不同個數隱單元構成的BP 網絡訓練曲線,分別檢查網絡性能,一般收斂速度較快且能夠達到訓練精度的網絡為優。
以此類推,取某年影響因素數據作為測試樣本,得到各網絡輸出值后,分別再與下年實際消耗量相比較,將此誤差也作為選擇最優網絡結構重要依據之一。一般取收斂速度最快且誤差最小網絡結構為最優網絡結構。
在最優網絡模型中輸入某年的影響因素數據,從而可以預測次年的備件消耗量。
利用MATLAB 語言[10-11]編制描述該BP 網絡預測模型的計算機程序。運行該程序,可得到不同隱單元數的網絡訓練誤差曲線圖如圖2 所示。

圖2 不同隱單元數的網絡訓練誤差曲線對比圖
從圖2 中看出,訓練次數與預測誤差不隨隱單元數增加而線性增加或者減少,也證明了隱單元數增加可以提高網絡映射精度,但并不意味著一定提高網絡性能的重要結論。當隱單元數為29 時,網絡只需訓練162 次就能達到精度要求,可以作為最優網絡模型。
在最優網絡模型中輸入某年的影響因素數據,預測次年的備件消耗量時。網絡的訓練誤差曲線見圖3。若其預測輸出為0.876 5,反歸一化并取整數得年該備件的消耗量為30 個。
可以看出,經過粗糙集對影響因素數據約簡化處理,在神經網絡中輸入的數據量雖然大為減少,但預測結果還是比較貼近實際值,并沒有出現預測值與實際值之間相對誤差變的太大的問題,這就說明了所提出的基于粗糙集與BP 神經網絡的預測方法在進行飛航導彈備件消耗預測時的預測數據可信度高,預測方法好用。

圖3 實際預測網絡的訓練誤差曲線
本文提出基于粗糙集和BP 神經網絡的飛航導彈備件消耗規律預測方法,該方法能發揮粗糙集在處理冗余數據上的優勢。結合BP 神經網絡對飛航導彈備件進行消耗預測,大大提高了預測的速度和有效性。通過應用分析表明,該方法能達到很好的預測效果。
[1] 牟謳紅. 某型機備件需求確定過程和方法的研究[D]. 北京∶ 北京航空航天大學, 2000∶4-7.
[2] 徐廷學. 裝備綜合保障工程理論與方法[M]. 北京∶ 兵器工業出版社, 2009∶4-5.
[3] 沈世鎰. 神經網絡系統理論及其應用[M]. 北京∶ 科學出版社, 1998∶56-59.
[4] 葛哲學, 孫志強. 神經網絡理論與MATLAB R2007實現[M]. 北京∶ 電子工業出版社, 2007∶23-58.
[5] 岳付昌, 閻群章, 徐廷學, 趙明. 神經網絡在裝備使用階段質量評估中的應用[J]. 四川兵工學報, 2010, 31(11)∶56-59.
[6] 高雋. 人工神經網絡原理及仿真實例[M]. 2 版. 北京∶機械工業出版社, 2007∶43-54.
[7] 金偉. BP 神經網絡在維修保障系統能力評估中的應用[J]. 計算機仿真, 2005,22(10)∶43-46.
[8] 顧鈞元, 徐廷學, 陳海建, 等. 基于BP 神經網絡的產品壽命分布類型選擇[J]. 電子產品可靠性與環境試驗, 2011,29(1)∶42-45.
[9] 黃天辰, 韓京才, 葉術青, 等. 基于神經網絡的彈藥消耗預測[J]. 軍械工程學院學報, 2004,16(2)∶29-31.
[10] 景振毅, 張澤兵, 董霖. MATLAB 7.0 實用寶典[M]. 北京∶ 中國鐵道出版社, 2008∶23-205.
[11] 董長虹. MATLAB 神經網絡與應用[M]. 北京∶ 航空工業出版社, 2005∶64-80.