常家瑋,曾水平
(北方工業大學 電氣與控制工程學院,北京 100144)
鋁電解作為一個復雜的工業生產過程,維持電解過程的兩大平衡(能量和物料平衡)是保障其生產高效穩定運行的關鍵因素,然而鋁電解的兩大平衡受多種因素、指標的共同影響,耦合關系復雜,對氟化鋁添加量和出鋁量的正確決策是維持兩大平衡,保證經濟效益最直接、有效的途徑。添加氟化鋁,可以降低分子比,降低電解溫度,提高電流效率;氟化鋁添加過多,則會造成氧化鋁溶解降低,未溶解的氧化鋁堆積在槽底容易產生病槽。出鋁量偏少,鋁水平偏高,電解槽熱損增加,電解溫度偏低,會造成冷槽甚至病槽;出鋁量過多,電解溫度升高,電流效率降低,又容易引發陽極效應。因此,獲取合適的氟化鋁添加量和出鋁量決策值,對于穩定生產和提升效益至關重要。
在目前的實際工業生產中氟化鋁的添加量主要是通過計算機專家系統進行決策,但由于鋁電解過程是個時變、非線性、強耦合的大時滯復雜系統,專家系統無法根據槽況的變化情況,較好地對其進行決策[1];出鋁量的決策主要是根據“鋁水有效值法”進行計算和管理,其測量和計算過程比較繁瑣,操作精度要求高,在非正常槽況下仍然需要車間管理人員依據經驗進行設置[2]。近年來,各專家學者也提出了一些氟化鋁添加量或出鋁量的控制策略,如:文獻[1]根據生產數據求解回歸相關系數,研究了一種氟化鋁添加量決策模型;文獻[3]提出了基于回歸分析、遺傳算法、支持向量機的氟化鋁添加量控制策略;文獻[4]提出了一種在線采集和離線測量相結合的氟化鋁添加方法;文獻[5]通過模糊控制實現對氟化鋁添加量和出鋁量的控制。關于神經網絡的運用方面,劉冰[6]和魏玉倩[7]分別使用了RBF 和BP 神經網絡進行了預測研究,取得了較好的效果。
本文充分考慮鋁電解過程非線性、大時滯、強耦合的特點,利用歷史生產數據,將特征選擇得到的強特征數據作為LSTM 神經網絡的輸入,氟化鋁添加量和出鋁量作為輸出對網絡進行訓練,通過訓練、測試和驗證,能夠滿足工業生產要求。
特征處理作為特征工程的核心內容,包括了數據清洗、規一化處理、特征選擇等內容。對于鋁電解工業,影響其生產過程的參數眾多,同時各參數之間又相互耦合,如電解溫度、氧化鋁濃度、氟化鋁添加量、出鋁量、工作電壓等多達二十幾項指標,其中一個指標的調整會引起其他參數均產生相應的變化。因此為了避免出現過擬合,使得試驗結果準確可靠,數據清洗和特征選擇必不可少。
本文數據來源于國內某鋁廠402 號槽的實際生產日報,包括電流、電壓、下料量、鋁水平、出鋁量、氟化鹽下料量(即氟化鋁添加量)等總計20 維2477 組數據,經過對該批數據的檢索和統計,存在數據缺失和異常的情況,因此為了降低壞數據的不良影響,首先對其進行數據清洗。
刪除缺失值較多的三個特征“爐底壓降”、“爐幫”、“伸腿”。同時,本文主要研究的是正常生產階段對氟化鋁添加量和出鋁量的預測,因此選取了啟停槽中間正常生產階段的數據,對于存在的缺失值使用KNN 算法進行填補,最后使用箱型圖篩選出異常值,并將低于下限和高于上限的異常值分別使用下限值和上限值進行替代,最終得到所需要的數據集。
本數據集具有多達17 個參數指標,同時各個指標的數量級差異較大,如氟化鋁添加量平均值為26.38,但出鋁量平均值達2184.28,因此必須進行數據歸一化處理。本文采用離差標準化算法,該算法將數據映射到[0,1]之間。
式中:xmin——原數據所在列最小值;xmax——原數據所在列最大值。
隨機森林屬于Embedding(嵌入法)特征選擇算法的一種,是基于集成思想對決策樹算法的進一步優化改進,它通過Bootstraping(自助)采樣法和Bagging(裝袋)算法生成一片由m 個不同的決策樹組成的“森林”,其隨機的特點體現于:①隨機地為每顆決策樹選取數據樣本(隨機有放回地從K 個原始數據樣本中重復抽取k 個數據樣本,k<<K);②隨機地為每顆決策樹分配不同的特征(隨機地從原始數據樣本的N 個特征中選取n 個特征,n<<N)。正是這兩個特點使隨機森林算法顯著有效地降低壞數據對算法結果的影響,避免出現過擬合等問題。它既能解決回歸問題,又能進行分類預測,同時可以對各個特征的重要性進行評價,方便了處理特征選擇方面的問題,目前該算法已經在特征工程和分類預測領域得到了廣泛使用[8,9]。
本文使用隨機森林回歸函數,算法輸入為17 個特征當日的數據,輸出為氟化鋁添加量和出鋁量第二天數據,共計2345 組,訓練集和測試集分別占80%和20%,建立由150個樹組成的森林對隨機森林進行訓練和預測。

圖1 特征重要性排序
得到特征重要性排序如圖3 所示,從圖中可以看出當天的氟化鋁下料量和出鋁量對次日的影響最大,與實際相符從而驗證了特征選擇結果的正確性,經多次試驗最終選取排名前10 的特征作為選取結果。
LSTM 神經網絡是德國計算機科學家Jürgen Schmidhuber 和Sepp Hochreiter 于1997 年 提 出 的 一 種為解決深度學習容易出現梯度消失和梯度爆炸問題的優化版RNN(循環神經網絡)[10]。其遺忘門決定了刪除先前時刻的信息,輸入門決定了保存當前時刻的信息,輸出門決定了輸出到下一時刻的信息,正是這三種門結構對信息的篩選,解決了梯度消失和梯度爆炸問題,同時保證了對重要信息的長期記憶。
本文用于神經網絡訓練和測試的數據共計2335 組,其中訓練集占80%,測試集占20%,10 組數據作為驗證數據,使用Python 經訓練和測試數據多次試驗后,搭建如下LSTM 神經網絡結構:
輸入層:氟化鋁下料量、出鋁量、電流、LiF、鐵含量、設定電壓、下料量、鋁水平、MgF、分子比10 個特征當天的數據
隱含層:2 層,每層50 個LSTM 神經元
輸出層:氟化鋁添加量、出鋁量2 個特征次日的數據

表1 其他參數設置
第一步,對輸入和輸出數據使用離差標準化算法進行歸一化處理;
第二步,對數據集進行劃分,將80%數據作為訓練集,20%作為測試集,最后再選取10 天的數據對網絡預測效果再次進行驗證;
第三步,使用搭建好的神經網絡對訓練集的輸入、輸出數據進行訓練;
第四步,使用訓練好的模型對測試集的輸入數據進行預測;
第五步,將輸出的預測值與真實值進行反歸一化處理并計算MAE(平均絕對誤差),同時畫出預測值與真實值的曲線對比圖;式中:n——測試集數據行數;

yi——第i 行真實值;
y?i——第i 行預測值。
第六步,選取訓練集和測試集以外連續10 天數據對網絡進行驗證。
訓練集數據在迭代48 次之后測試集的損失函數穩定在0.0122~0.127 之間。

圖2 損失函數衰減圖
使用測試集數據進行預測,得到預測值與真實值的曲線擬合效果較好,其中氟化鋁添加量的MAE1=2.341,出鋁量的MAE2=32.566,均在鋁電解工業誤差允許范圍內,曲線擬合情況如圖3、圖4 所示。

圖3 氟化鋁添加量預測值與真實值曲線擬合

圖4 出鋁量預測值與真實值曲線擬合
最后選取連續10 天數據進行驗證得到預測結果如表2、表3 所示。

表2 氟化鋁添加量預測驗證

?

表3 出鋁量預測驗證
從驗證結果可以得出:氟化鋁添加量預測值與真實值相比平均絕對誤差為1.32,最大誤差2.78,最小誤差0.09,該誤差不影響實際生產中參數的穩定[7];出鋁量預測值與真實值相比平均絕對誤差為25.21,最大誤差51.82,最小誤差6.13,同時相鄰兩天出鋁量的相差未超過50kg,使得生產穩定性得以保障[2],因此本算法預測的氟化鋁添加量和出鋁量符合實際生產要求。
經數據訓練、測試和驗證證明了本文的預測算法能夠較準確地預測氟化鋁添加量和出鋁量,能夠滿足實際生產需要,該算法還需要在實際生產實踐中進行進一步的驗證。