朱偉,陳凝,李旺洲,吳宇航
(1.華北理工大學數學建模創新實驗室,河北 唐山 063210;2.華北理工大學理學院,河北 唐山 063210;3.河北省數據科學與應用重點實驗室,河北 唐山 063210;4.唐山市數據科學重點實驗室,河北 唐山 063210)
當前我國現存的100噸以下的中小型轉爐約有500余座,占全國煉鋼產能的50%左右,這些轉爐在地方骨干鋼鐵企業中也起著舉足輕重的作用。由于中小型轉爐無法安裝副槍系統,終點控制命中率較低,且面臨著“去產能、綠色制造和市場競爭”的耦合壓力,因此,突破中小型轉爐煉鋼的技術瓶頸,開辟中小型轉爐智能煉鋼勢在必行。現有的轉爐煙氣分析系統是在靜態控制方程控制下在煉鋼的最后階段引入動態檢測,根據實時情況改變控制方程相關參數,從而引導煉鋼終點的精準命中。轉爐煙氣分析動態控制是通過連續檢測轉爐吹煉中產生的煙氣成分(CO、CO2、N2、O2、Ar、H2)和煙氣流量,計算熔池的瞬時脫碳速度和脫碳量,并根據瞬時供氧量和渣料加入量計算氧在C、Si、Mn、P、S等元素的分配比,推算出熔池中各元素含量與爐渣成分。在我國雖然已經有一部分轉爐采用煙氣分析系統,對煉鋼終點進行控制,但是該系統對鋼水中碳含量和溫度值的動態預報精度取決于煙道安裝環境和數據信息同步狀況,魯棒性不高,無法切實實現智能煉鋼。因此,深度挖掘煙氣分析系統采集的煉鋼過程數據信息,獲取魯棒性高的碳溫動態預報模型成為了一個關鍵問題,在實踐生產中也是一個關鍵技術。
通過實驗獲取了5組在不同轉爐情況下5次煉鋼進程中(靜態控制模型預設的累計耗氧比例)70%~100%過程中時間同步的氧氣消耗比例PQ、氧氣消耗總量Q、煙氣中的CO含量[CO]、煙氣中的[CO2]和該時刻對應的實際情況下鋼水中的碳含量[C]和鋼水溫度值[T],其中由于煙氣分析系統硬件與安裝的客觀原因[CO]和[CO2]指標值與其余的幾個標值雖然在時間上同步對應,但在實際反映上有一定的延遲,也就是說當前采集的[CO]和[CO2]兩個指標反映的是前一個時刻或前n個時刻的熔池反映信息。針對獲取的樣本數據,對其進行基于Z-score[1]的標準化處理,使樣本符合標準正態分布,去除參數量綱的影響,以提高訓練網絡時的收斂速度和模型的預測精度。
對標準化處理后的參數進行分析。可見每一個樣本均代表一次煉鋼過程,其各項參數均具有時間序列性。故對樣本按順序選取訓練集和驗證集的方式顯然是欠妥的,可能會導致網絡對特定情況下精度極低。鑒于上述情況,將5組樣本數據進行組合后,運用SPSS軟件對總體進行隨機取樣,隨機取樣情況如圖1所示。隨機選取70%的數據作為訓練集,選取30%的數據作為驗證集。

圖1 隨機取樣情況直方圖Fig. 1 Histogram of random sampling situation
由圖1可見其取樣情況較為均勻,訓練和驗證集的可信度較高。
運用Matlab以樣本的氧氣消耗比例PQ、氧氣消耗總量Q、煙氣中的CO含量[CO]、煙氣中的[CO2]為影響因素,鋼水中的碳含量[C]和鋼水溫度值[T]為目標預測值,建立三層神經網絡預測模型,網絡設置為單隱含層,神經元節點為10個,求解器選取TRAINLM,L-M優化權值算法[5],節點傳遞函數選取了TANSIG函數[6]。網絡的學習速率為0.1,梯度下降為0.001。在MSE(均方誤差)精度的選取上[7],發現MSE的選取與BP神經網絡的預測精度有著直接的關系,精度選取過高,會使網絡雖然收斂于樣本,但其泛化能力急劇降低,反而并不能很好用于預測;精度選取過低,則網絡收斂性較差,模型預測的準確率低。如何在模型的泛化能力和準確度中選取一個合適的精度顯然是一個需要多次試驗研究的過程。
建立碳含量和溫度值的BP網絡預測模型,設定其MSE精度分別為0.1、0.01、0.001、0.0001、0.00001。通過不同精度的網絡對驗證集進行驗證,尋找其最佳精度。
由表1可知當MSE精度選取為0.0001時,含碳量和溫度值預測模型的網絡收斂性和泛化能力均較強,能夠很好的運用于預測模型。因此,分別建立碳含量和溫度值的預測模型,預測情況如圖2~3所示。

圖2 碳含量預測網絡收斂示意圖Fig. 2 Schematic diagram of carbon content prediction network convergence
對碳含量以及溫度預測模型的誤差進行分析,可發現其網絡誤差的產生具有一定規律性,其誤差往往呈現波動態勢。其預測誤差分布圖如圖4所示。

表1 不同MSE精度下的預測均方誤差Table 1 Prediction mean square error under different MSE accuracy

圖3 溫度值預測網絡收斂示意圖Fig. 3 Schematic diagram of temperature prediction network convergence

圖4 預測誤差分布圖Fig. 4 Distribution of forecast error
為研究誤差產生的原因,將PQ,Q,CO,CO2以及前5次預測值等變量和訓練所產生的誤差進行相關性分析,分析結果顯示:

表2 誤差與CO相關性Table 2 Error and CO correlation
由表可見誤差的產生同CO和CO2的檢測量有著顯著性相關。
故可推斷出原模型的訓練過程中,可能丟失了部分CO與CO2相關的規律,導致了誤差的產生,這正好同數據表中的[CO]和[CO2]指標值與其余的幾個指標值在實際反映上有一定的延遲性相對應。

表3 誤差與CO2相關性Table 3Error and CO2 correlation
鑒于誤差產生的因素分析,提出基于預測誤差構建誤差分析預測模型,以修復原模型誤差的方法。將樣本訓練中所產生的誤差,重新構成誤差分析數據序列。將該時間點的煙氣中的CO含量[CO]、煙氣中的[CO2]作為網絡的變量,訓練誤差分析網絡,以預測該時間點的誤差。并將該預測誤差反向修復原預測值。其流程基本如下:

圖4 誤差預測修復模型流程圖Fig. 4 Flow chart of error prediction and repair model
對含碳量預測模型和溫度值預測模型分別構建誤差預測模型,反向修復原誤差值。
隨機選取總體中70%的數據作為訓練集,30%的樣本作為驗證集。并針對碳含量和溫度預測模型,分別引入誤差預測模型進行修復。
碳含量預測模型,誤差修復后的預測誤差分布圖及改進前后的預測誤差對比如圖所示:

圖5 含碳量預測模型誤差修復后的預測誤差分布圖及改進前后的預測誤差對比Fig. 5 Prediction error distribution of carbon content prediction model after error repair and comparison of prediction error before and after improvement
溫度值預測模型,誤差修復后的預測誤差分布圖及改進前后的預測誤差對比如圖6所示
差修復模型較好的改善了原網絡的誤差。改進前和改進后的模型誤差在波動規律上具有相似性。這也側面反應誤差分析網絡較好得描述出了誤差產生的原因。剩余誤差大致為誤差分析網絡對具體誤差大小的規則描述尚不完善,尚有改進的余地。
在改進后地碳含量預測在PQ [76.75-82.35]區間具有較為穩定準確的預報結果,其誤差均低于0.02。

圖6 溫度值預測模型誤差修復后的預測誤差分布圖及改進前后的預測誤差對比Fig. 6 Prediction error distribution of temperature prediction model after correction and comparison of prediction error before and after improvement
改進后的溫度預測在PQ [79.54-84.45]區間預測結果較為精準,誤差均小于1。
因此可得出結論預測模型在PQ [79.54-82.35]期間模型的C&T預測的均較為穩定,且預測的準確度較高。
另由于模型的驗證集是由5個樣本中隨機選取30%的數據進行驗證,其精度較為穩定,故可得出該模型在樣本中具有一定的普適性,其魯棒性較高。
通過建立BP神經網絡預測模型。較精確得獲取了鋼水含碳量和溫度值的預測值,泛化能力較好,模型具有較高的魯棒性。在問題的解決過程中,通過誤差的反向挖掘,較為準確的分析出了誤差產生的原因,提出建立了誤差的預測模型,修復預測模型所產生的誤差,極大得提高了預測模型的精度。且該方法具有一定的普適性,可用于其他的預測模型和方法。