牟方青+許著龍+王言


1.西北工業大學電子信息學院,陜西西安 710129
2.西北工業大學力學與土木建筑學院,陜西西安 710129
3.西北工業大學計算機學院,陜西西安 710129
摘 要 本文針對高爐冶煉優質鐵水的過程,以由鐵水含硅量[Si]、含硫量[S]、噴煤量PML和鼓風量組成的數據庫作為數學建模分析和數據挖掘的基礎,建立基于誤差反向傳播神經網絡[Si]的動態預測數學模型,以SML和ML作為輸入參數,對于Si含量進行預測,通過在一定時間間隔內更新固定步數的訓練樣本,體現時間的累積效果,來提高預測的準確性。
關鍵詞 高爐煉鐵;神經網絡;Si預測;控制
中圖分類號 TP3 文獻標識碼 A 文章編號 2095-6363(2017)13-0017-01
煉鐵過程依時間順序采集的工藝參數是一個高維大數據時間序列,影響因素極多,然而其終極生產指標產量、能耗、鐵水質量等都與冶煉過程中的一項控制性中間指標——爐溫密切相關,爐溫又可以用鐵水含硅量進行描述,從而鐵水含硅量的時間序列的預測關系著當前高爐各項操作參數的調控方向。因此,鐵水含硅量的準確預測控制建模成為冶煉過程優化與預測控制的關鍵技術。
1 模型的建立
以誤差逆傳播神經網絡為例,神經網絡預測主要的計算過程由每個感知機的輸入權重、閾值、激勵函數、反饋函數以及神經網絡的整體結構所決定。而神經網絡的結構則包括了隱層數目以及每個隱層所包含的神經元的數目,感知機的閾值則由樣本根據學習函數迭代產生。所以為了得到最優的神經網絡模型,我們需要確定的參數包括網絡的隱層數目,每個隱層的神經元數目,學習函數,每層的傳播函數,每個感知機的激勵函數,迭代次數,學習率。
我們可以發現,要得到一個性能優良的神經網絡模型,需要調節的參數主要有8類,不便于優化。因此,我們根據題目進行參數的篩選,由初步試驗得到,其中影響預測網絡性能的主要因素為隱層數目,每個隱層的神經元數目,學習函數,激勵函數。因此,我們將其余因素限定為合理數值,然后對于主要參數進行優化。
對于傳遞函數,由于樣本的輸入矩陣為二維,而輸出矩陣為一維,但是輸入參數與輸出參數的關系較為復雜,不宜采用簡單線性函數,所以我們采用S型對數函數作為傳播函數。
對于學習函數,考慮到樣本的復雜性,我們選取自適應梯度遞減訓練函數,訓練函數,動量及自適應梯度遞減訓練函數作為待選函數,通過控制變量的方法選取最優學習函數[2]。
對于隱層數目,我們一般認為增加隱層數目有提高預測精度的效果,但是如果隱層數目過多可能會出現過擬合的現象,使得神經網絡對于新樣本的預測能力較弱,因此我們將網絡的隱層設置為2至6層,同樣通過控制變量的方法確定最優隱層數目。
在確定隱層數目之后,我們先經驗設置每個隱層的初始神經元數目,再把每層神經元數目在一定范圍內進行調節,從而得到每個隱層合適的神經元數目。
由此,我們可以確定優化后的神經網絡整體結構,再通過這個網絡進行學習的過程中,我們應該考慮到時間的累積影響。因在此網絡模型的基礎上,我們通過在一定時間間隔內將樣本進行更新,來考慮時間的累積影響??梢詫⑦x擇一步預測和兩步預測的方式。即在已有樣本的基礎上,每次分別更新一個樣本和兩個樣本,并對兩種方案進行比較。
我們首先確定神經網絡模型中的次要參數,可以設定迭代上限次數為10 000次,學習速率為,目標誤差值為0.000 4,并確定型對數函數作為傳播函數,隨后,我們在此基礎上對神經網絡模型進行進一步優化。
2 學習函數的優化
在優化隱層函數及各層感知機個數之前,我們需要先確定最優的學習函數。由模型建立部分可得,我們將自適應梯度遞減訓練函數,訓練函數,動量及自適應梯度遞減訓練函數作為待選函數。在限定隱層為層的條件下,我們可以明顯發現,在其他參數相同的條件下,以訓練函數為學習函數的神經網絡模型在數值準確率和方向準確率上均有明顯的優秀性能。因此,我們采用訓練函數作為我們的學習函數。
3 隱層數目及感知機數目的確定
在確定學習函數的基礎上,我們通過調節隱層數目及各個隱層感知機數目來確定最優的網絡模型。我們通過實驗發現,在隱層數目由6層變化為2層的過程中,數值準確率與方向準確率數值變化趨勢相同,均為先升高再降低,并且我們可以發現,在隱層數目為5層的時候,數值準確率與方向準確率均達到峰值,因此,我們可以確定隱層數目為5是最優的。
在確定隱層數目為5層的基礎上,我們繼續分析每層所安排的感知機數目,根據實際約束條件,我們把感知機數目分布離散化處理,先在較大的間隔內訓練樣本,之后選取最優兩組感知機,再進行間隔的縮小化處理,通過比較我們可以發現,在5個隱層的感知機數目滿足的時候,達到最優的準確率。
4 考慮時間累積效果
本小節之前的訓練,均是建立在靜態的預測之上的,并沒有考慮時間的累積效果。我們將時間因素考慮在內,分別采用一步預測和兩步預測的方式進行預測,得到結果如表1所示。
5 結論
通過比較我們可以發現,考慮時間累積效果的一步預測和兩步預測與未考慮時間累積效果的預測相比,數值準確率與方向準確率均較高。兩種預測之間,一步預測的效果比兩步預測的效果稍好,但是兩種預測模型的偏差百分比較小。
參考文獻
[1]崔桂梅,李靜,張勇,等.高爐鐵水溫度的多元時間序列建模和預測[J].鋼鐵研究學報,2014,26(4):33-37.
[2]周志華.機器學習[M].北京:清華大學出版社,2016.
[3]鄧乃揚,田英杰.數據挖掘中的新方法—支持向量機[M].北京:科學出版社,2004.
[4]唐賢倫,莊陵,胡向東.鐵水硅含量的混沌粒子群支持向量機預報方法[J].控制理論與應用,2009,26(8):838-842.