金秀章,景 昊
(華北電力大學 控制與計算機工程學院,河北 保定 071003)
目前燃煤電廠的SO2排放量已經超過了 SO2排放總量的一半,并且呈現逐年遞增的趨勢。我國先后頒布的《火電廠大氣污染物排放標準》和《煤電節能減排升級與改造行動計劃 (2014—2020 年)》等一系列政策法規,明確指出火電廠的SO2排放濃度必須控制在 35 mg/m3以下[1]。石灰石-石膏濕法煙氣脫硫技術(WFGD)是目前最有效的燃煤機組SO2控 制 技 術 之 一[2]。WFGD 工 藝 中 漿 液 pH 值 是決定煙氣脫硫效率的關鍵參數,因此pH 值的測量需要迅速、準確。
在 WFGD 現場測量時由于環境惡劣,且 pH 值變化具有較大的慣性,導致測量時長較大,無法及時得到漿液 pH 值的準確值,對于脫硫作業十分不利。因此需要對漿液 pH 值進行預測。
pH 值測量作為非線性系統一直是研究熱點[3]。利用燃煤機組的運行數據,再結合機理分析,采用實驗建模的方法可以辨識出精確合理的系統模型[4]。文獻[5]和文獻[6]把神經網絡等自適應模糊系統用于 pH 中和過程。BP 神經網絡、RBF 神經網絡、Elman 神經網絡等方法是 pH 值建模的典型方法,但上述算法本身在時間序列的處理上并沒有突出的優勢。
隨著技術的進步,深度學習、遞歸神經網絡、卷積神經網絡等也在 pH 值建模得到應用[7-10]。LSTM神經網絡,注重數據間的時間特性,在大遲延時間序列預測中具有突出優勢[11]。LSTM 神經網絡的特點在于發現當前時刻數據與之前數據間的聯系,利用本身具有的記憶能力,將之前數據的狀態進行保存[12],同時根據保存的信息影響后續的預測值及變化趨勢。
因此,本文提出一種基于LSTM 神經網絡的pH值預測模型。以某 600 MW 機組為研究對象,使用機組實際運行數據,經過機理和相關性分析,確定pH值模型的輔助變量,建立高精度的pH 值預測模型。
作為循環神經網絡(Recurrent Neural Network,RNN)中的一個特殊情況,LSTM 與前饋神經網絡不同,屬于反饋神經網絡的一種。RNN 中神經元的輸出可以在下一個時刻作用于自身,且共享從樣本序列中不同位置學習到的特征,以此減少模型中的參數數量,這一點在數據規模龐大時具有重要意義。與傳統RNN 網絡的區別在于,LSTM 網絡結構加入了控制門的機制,結構包括記憶細胞、輸入門、輸出門、遺忘門四部分。LSTM 原理圖如圖1 所示。
圖1 中,三個框分別為不同時序下的細胞狀態,δ表示激活函數為sig-moid 的前饋網絡層,tanh 表示激活函數為 tanh 的前饋網絡層。Xt表示 t 時刻的輸入,S(t)表示 t 時刻細胞的狀態值,前饋網絡層中的隱藏神經元個數經多次調試后,確定一個最佳值。
輸入門 it的值和在t 時刻輸入細胞的候選狀態值,計 算 如 下 :

其中,Wi為輸入門的權重矩陣,bi為輸入門的偏置項;Wc為細胞當前狀態的權重矩陣;bc為細胞當前狀態的偏置項。
其次,計算在 t 時刻遺忘門的激活值 ft,公式如下:

式中,Wf為遺忘門的權重矩陣,bf為遺忘門的偏置項。
由以上公式可計算出t 時刻的細胞狀態更新值 S(t),公式如下:

計算出細胞狀態更新值后,可計算輸出門的值ht,公式如下:

式中,Wo為輸出門的權重矩陣,bo為輸出門的偏置項。
通過以上計算,LSTM 可以有效利用輸入數據使LSTM 神經網絡具有長時期記憶功能。
根據 WFGD 的生產機理,pH 值的影響因素來源于兩個方面,分別是燃燒側產生的SO2總量和新鮮石灰石漿液的供應量。如果SO2總量不變,新鮮石灰石漿液供應量增加可以增大pH 值;如果新鮮石灰石漿液供應量不變,SO2總量增大可以降低pH值。因此模型輔助變量應選取與SO2總量和新鮮石灰石漿液變化有關的物理量。之后使用互信息計算漿液pH 值與生產中所涉及的物理量的相關性。選取與漿液pH 值相關性大的變量為輔助變量。因為漿液 pH 值變化慣性大,所以當前時刻漿液 pH 值受前時刻漿液pH 值的影響。最后確定總風量、總煤量、凈煙氣 SO2濃度、原煙氣 SO2濃度、原煙氣流量、空預器入口煙氣氧量、空預器出口煙氣氧量、爐漿液密度、新鮮石灰石漿液流量、吸收塔液位、兩臺氧化風機電流及5 s 前的漿液pH 值為輔助變量。

圖1 LSTM 結構圖
本文所用數據源于某燃煤電廠的歷史數據。預處理包括剔除粗大值、數據中值濾波兩部分。
2.2.1 粗大值處理
數據規模足夠,且趨于正態分布,因此使用 3σ準則對數據進行粗大值處理。步驟如下:
(1)計算標準差 σ

式中,xn為數據值;n 為數據個數;為數據平均值。
(2)比較數據是否滿足下式要求,如果不滿足則將數據剔除。

(3)重復步驟(2),直到數據全部滿足式(8)的要求。
2.2.2 數據濾波
對數據曲線中帶有“毛刺”的數據濾波,可以消除噪聲的影響,使數據變化更加平滑,更加接近真實數據。其中輔助變量總風量的濾波圖如圖2 所示。
2.2.3 時序調整
pH 值變化是一個復雜的過程,存在多變量、多耦合及遲延的問題。因此采用互信息法求輔助變量與主導變量間的時間遲延,對變量進行時序調整,進一步提高模型預測精度。
模型以漿液 pH 值作為輸出,采用三層 LSTM 神經網絡建立,每層21 個神經元,優化算法為 Adam,最大迭代次數為 280,初始學習率為 0.005,在 125輪訓練后乘以 0.1 來降低學習率。選用 8 700 組預處理后的數據進行仿真實驗,其中6 700 組用于模型訓練,2 000 組用于模型測試,數據采樣時間間隔為1 s。
基于 LSTM 神經網絡的 pH 值預測模型 LSTM模型結構如圖3 所示。

圖3 LSTM 模型結構

圖2 數據濾波
為了便于驗證模型的性能,使用LSTM 模型與BP 神經網絡模型和 LSSVM 模型進行對比。模型預測值與實際值如圖4 所示。LSTM 模型與 LSSVM 模型和BP 神經網絡模型相比在預測趨勢、預測精度方面更加具有優勢。LSSVM 模型測試結果顯示,在漿液 pH 值增大時,預測值下降;pH 值不變時,預測趨勢反復波動。BP 神經網絡模型測試結果顯示,漿液 pH 值不變時,預測值反復波動;pH 值增大時,預測值沒有明顯的趨勢變化。同時LSSVM 模型和BP 神經網絡模型的預測值一直在頻繁、劇烈波動,使預測精度更低。而LSTM 網絡模型測試結果顯示,漿液pH 值穩定時,預測值也比較穩定;在漿液 pH值急劇增加時,預測值也在急劇增加,預測值與實際值緊密跟隨,且增加后迅速保持穩定。對比三個不同模型測試結果,LSTM 模型在預測精度、趨勢跟隨上均優于LSSVM 模型和 BP 神經網絡模型,驗證了LSTM 模型在數據挖掘和時間序列處理上的優勢。
模型的預測誤差如圖5 所示。LSSVM 模型、BP神經網絡模型誤差較大,多次出現誤差比較嚴重的值,且誤差曲線一直存在頻繁、劇烈的波動,因此LSSVM 模型、BP 神經網絡模型預測不理想。LSTM模型誤差最小,誤差穩定在0 刻度左右,沒有出現較大誤差。因此 LSTM 模型測試結果最好。
為了進一步分析模型的性能,采用平均絕對誤差(MAE)和均方根誤差(RMSE)兩個指標對各個模型進行分析,如式(9)、式(10)所示:

式中,ypi為預測值,yai為實際值。
如表1 所示,LSTM 模型與 BP 神經網絡模型、LSSVM 模型相比測試結果最好。LSTM 模型與LSSVM 模型相比平均絕對誤差降低了0.014 0,均方根誤差降低0.016 6。本文建立的LSTM 神經網絡模型與BP 神經網絡模型、LSSVM 模型相比在趨勢、精度、平均絕對誤差及均方根誤差方面均有非常大的提升,驗證了LSTM神經網絡在時間序列處理上的優越性,也驗證了LSTM 模型在漿液pH 值預測的有效性及通用性。

表1 模型測試結果

圖4 模型預測值與實際值

圖5 模型預測誤差
針對燃煤電廠 WFGD 過程中石灰石漿液pH 值的變化受多個變量的影響,且變量之間具有相關性和現場數據具有時序特性,本文提出了一種基于長短期記憶網絡的 pH 值預測模型。首先,通過機理分析初步篩選輔助變量后進一步使用互信息確定輔助變量;然后,建立LSTM 神經網絡模型;最后,使用燃煤電廠數據對模型進行測試。模型測試結果表明本文所提出的 LSTM 模型相對 BP 神經網絡模型、LSSVM 模型預測精度高、泛化能力強。
需要說明的是,由于數據量有限,本研究只能歸納出高負荷狀態下的漿液pH 值預測模型。然而隨著燃煤電廠智能化水平的提高,電廠數據海量化和高維化已經成為必然趨勢。合理使用這些數據可以進一步建立全工況的漿液 pH 值預測模型,這也是后續的研究重點。本文結果對LSTM 算法在燃煤電廠的實際應用具有一定借鑒意義。