馬永濤,邢江寬,羅坤,樊建人
(浙江大學 能源高效清潔利用全國重點實驗室,浙江 杭州 310027)
我國煤炭資源較為豐富,煤炭消費占據(jù)重要地位。據(jù)國家統(tǒng)計局統(tǒng)計[1],2020年,火力發(fā)電用煤約占煤炭消費總量的52.3%,在源源不斷地輸送電力的同時,產(chǎn)生了如SO2、NOX、PM2.5等大氣污染物。為控制大氣污染物排放,我國政府出臺了一系列的排放指標要求。濕法煙氣脫硫系統(tǒng)能夠有效脫除燃煤煙氣中的SO2,因此,其被大部分燃煤電廠采用,作為主要的脫硫手段。在脫硫系統(tǒng)實際運行時,運行人員多根據(jù)自身經(jīng)驗調(diào)整優(yōu)化系統(tǒng)運行參數(shù),這樣無法保證系統(tǒng)全時段實現(xiàn)經(jīng)濟穩(wěn)定運行,因此,脫硫系統(tǒng)優(yōu)化一直是研究者們關(guān)心的重要問題。
建立較為準確的濕法煙氣脫硫系統(tǒng)(Wet Flue Gas Desulfurization,WFGD)排放預(yù)測模型是對其進行進一步優(yōu)化的基礎(chǔ)。第一性原理或機理模型,也被稱為“白箱”模型,通過聯(lián)立質(zhì)量和能量守恒方程、運動學方程、熱力學方程和輸運方程等求解得到。這一類模型通常由有物理意義的相關(guān)參數(shù)來表征,并能在較大運行參數(shù)變化范圍內(nèi)保持其有效性,但是其結(jié)構(gòu)較為復(fù)雜,建模的成本較高[2]。脫硫塔中的脫硫反應(yīng)是復(fù)雜、多變量、強耦合、非線性的過程[3],難以建立其機理模型。近年來,隨著計算機和人工智能技術(shù)蓬勃發(fā)展,使用過程數(shù)據(jù)來訓(xùn)練機器學習等人工智能算法的數(shù)據(jù)驅(qū)動模型或“黑箱模型”,因其建模成本低,被學者們用來建立多種復(fù)雜過程的模型。Chen等人[4]提出了一種寬深結(jié)構(gòu)的長短時記憶神經(jīng)網(wǎng)絡(luò)模型,用來預(yù)測循環(huán)流化床的二氧化硫排放。Li等人[3]使用動態(tài)建模方法建立二氧化硫排放的預(yù)測模型,結(jié)果顯示動態(tài)神經(jīng)網(wǎng)絡(luò)模型要優(yōu)于其它模型。基于脫硫系統(tǒng)歷史運行和實時運行數(shù)據(jù),建立SO2排放預(yù)測模型之后,可以在較短時間內(nèi)用較低的成本來優(yōu)化脫硫系統(tǒng)的部分運行參數(shù)。Guo等人[5]基于組合數(shù)學模型和人工神經(jīng)網(wǎng)絡(luò)的SO2排放預(yù)測模型,使用粒子群算法優(yōu)化濕法煙氣脫硫系統(tǒng)。葛志輝等人[6]使用聚類算法挖掘得到脫硫系統(tǒng)可調(diào)運行參數(shù)的目標值,并建立了脫硫系統(tǒng)優(yōu)化運行的目標庫。但上述預(yù)測模型的建模準確性仍有待提升,并且大多為單目標優(yōu)化研究,數(shù)據(jù)驅(qū)動的脫硫系統(tǒng)多目標優(yōu)化需要進一步研究。
本文的研究目的是建立適用于濕法煙氣脫硫系統(tǒng)的SO2排放預(yù)測模型,然后基于該模型對濕法煙氣脫硫系統(tǒng)進行多目標優(yōu)化。首先,本文基于某1000 MW燃煤電廠的運行數(shù)據(jù),采用靜態(tài)建模和動態(tài)建模兩種建模策略,并對比建模效果;然后結(jié)合動態(tài)建模和一階差分預(yù)測(Differential Prediction,DP)方法,對比隨機森林(Random Forest,RF)、極致梯度提升(eXtreme Gradient Boosting,XGBoost)、支持向量回歸(Support Vector Regression,SVR)、深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Network,DNN)、長短時記憶(Long Short-Term Memory,LSTM )神經(jīng)網(wǎng)絡(luò)五種機器學習算法的建模效果,用決定系數(shù)(coefficient of determination,R2)和均方誤差(Mean Squared Error, MSE)作為算法的評價標準。最后本文選取準確性較好的基于長短時記憶神經(jīng)網(wǎng)絡(luò)算法訓(xùn)練的模型作為SO2排放預(yù)測模型,使用多目標粒子群優(yōu)化(Multi-objective particle swarm optimization,MOPSO)算法優(yōu)化脫硫系統(tǒng)運行參數(shù),將優(yōu)化結(jié)果用來指導(dǎo)實際操作,實現(xiàn)脫硫系統(tǒng)穩(wěn)定經(jīng)濟運行。
在電廠機組實際運行時,由于設(shè)備故障等原因會產(chǎn)生明顯偏離數(shù)據(jù)正常分布的值,即異常值[7]。如果將這些異常值作為訓(xùn)練數(shù)據(jù)的一部分,就會嚴重影響建模精度。如圖1所示,煙氣脫硫系統(tǒng)(Flue Gas Desulfurization,F(xiàn)GD)入口煙氣SO2濃度數(shù)據(jù)中有一些異常值,因此有必要對原始數(shù)據(jù)進行預(yù)處理,剔除異常值。本文采用箱形圖中使用的四分位距(Inter-Quartile Range,IQR)法來識別出原始數(shù)據(jù)中的異常值。找到任一維度數(shù)據(jù)的四分之一位數(shù)Q1,四分之三位數(shù)Q3,定義四分位間距QR為:

圖1 部分樣本的FGD入口煙氣SO2濃度值
數(shù)據(jù)的上邊緣Qup和下邊緣Qlow分別定義為:
其中scale為尺度,通常取值為3或1.5,超過上邊緣Qup或者低于下邊緣Qlow的點被認為是數(shù)據(jù)中的異常點。當scale取3時,剔除的值為極端異常值;當scale取1.5時,剔除的值為溫和異常值和極端異常值。
本文采用動態(tài)建模方法[3],如圖2所示,Xt(p×1)為當前采樣時間維度為p的輸入變量,Yt+1(l×1)為下一采樣時間維度為l的輸出變量。k為時間步,是一個超參數(shù),可以根據(jù)實驗和經(jīng)驗人工選取。若k值較小,可能無法包含足夠的遲滯信息;若k值較大,就會導(dǎo)致輸入變量的維度過大,從而延長訓(xùn)練時間。使用動態(tài)建模方法可以將輸入變量重整如下:

圖2 靜態(tài)建模和動態(tài)建模示意圖
這樣,輸入變量就從p維擴展成了(k+1)×p維,總時間步為(k+1)。輸出變量則保持不變,維度仍為l維。
一階差分預(yù)測能減小預(yù)測數(shù)據(jù)的自相關(guān)性對預(yù)測結(jié)果的影響[4]。脫硫系統(tǒng)的數(shù)據(jù)具有明顯的自相關(guān)性,因此一階差分預(yù)測方法非常適用于對脫硫過程建模。本文結(jié)合動態(tài)建模和一階差分預(yù)測,采用公式如下:
其中yt+1為t+1時刻預(yù)測目標變量值;yt則為t時刻預(yù)測目標變量值;Δy即為兩個時刻預(yù)測目標變量的差值。本文所用模型通過預(yù)測Δy,再與yt相加,從而得到y(tǒng)t+1。
根據(jù)所使用算法不同,可以將機器學習模型分為集成學習、支持向量機和神經(jīng)網(wǎng)絡(luò)等。下面對本文所使用的算法原理進行介紹。
1.4.1 隨機森林
由L. Breiman于2001年提出的隨機森林算法已經(jīng)成為一個極度成功的算法,被應(yīng)用于各種一般性分類和回歸問題上[8,9]。該算法是一種集成學習算法,通過訓(xùn)練多個不同的隨機決策樹,并對每棵樹的預(yù)測結(jié)果取平均從而融合得到最終的預(yù)測結(jié)果。
1.4.2 極致梯度提升
極致梯度提升是由Chen和Guestrin于2016年提出的基于梯度提升且可擴展性較強的決策樹集成算法[10,11]。由于其在多種機器學習任務(wù)中能有較好的表現(xiàn)和較高的準確性,它被廣泛地應(yīng)用在數(shù)據(jù)科學競賽和實際生活中。該算法通過整合樹模型和線性模型,最終做出預(yù)測,并使用正則化技術(shù)來防止過擬合。
1.4.3 支持向量回歸
支持向量回歸是一種有效的回歸分析方法,其用數(shù)據(jù)集的子集來構(gòu)建一個函數(shù)估計[12],數(shù)學形式如下:
其中W∈Rn,為權(quán)重特征矢量;b為偏置。代表估計出的映射關(guān)系;W∈Rn,為輸入矢量。
支持向量回歸使用核函數(shù)將輸入數(shù)據(jù)映射到高維特征空間,將非線性問題轉(zhuǎn)換為線性問題來求解。徑向基函數(shù)(Radius Basis Function,RBF)是較為常用的核函數(shù),它將輸入數(shù)據(jù)投射到無限維特征空間,描述如下:
1.4.4 深度神經(jīng)網(wǎng)絡(luò)
深度神經(jīng)網(wǎng)絡(luò)是深度學習的基礎(chǔ)。而模仿人類大腦行為的人工神經(jīng)元則是構(gòu)建深度神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)[13]。這個基礎(chǔ)的計算元稱為節(jié)點,它接收外部輸入,通過學習獲得內(nèi)部權(quán)重和偏置參數(shù),并利用這些參數(shù)產(chǎn)生輸出。深度神經(jīng)網(wǎng)絡(luò)由輸入層、隱藏層、輸出層組成,每一層都由多個人工神經(jīng)元組成,層與層之間通過權(quán)重連接。
1.4.5 長短時記憶神經(jīng)網(wǎng)絡(luò)
長短時記憶(以下簡稱LSTM)神經(jīng)網(wǎng)絡(luò)算法是一種善于處理非線性時序數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)算法[14]。與深度神經(jīng)網(wǎng)絡(luò)不同,LSTM網(wǎng)絡(luò)層內(nèi)也建立了連接。這就使得LSTM能反映出序列中的相關(guān)信息,模型有了記憶能力,其記憶用細胞狀態(tài)表示。LSTM的記憶細胞由一個輸入門、一個輸出門和一個遺忘門組成[15]。這一結(jié)構(gòu)使LSTM能夠基于先前狀態(tài)、當前記憶和當前輸入,從而決定哪些細胞受到抑制、哪些細胞得到激活。
LSTM的結(jié)構(gòu)如圖3所示,其中xt表示當前輸入;Ct-1表示上一時刻的細胞狀態(tài);ht-1表示上一時刻的隱狀態(tài);ft表示遺忘門的狀態(tài);it表示輸入門的狀態(tài);Ct為候選細胞狀態(tài);ot表示輸出門的狀態(tài);Ct表示當前細胞狀態(tài);ht-1表示當前隱狀態(tài);yt表示當前輸出。σ(·)為sigmoid函數(shù),作為門激活函數(shù);tanh(·)是雙曲正切函數(shù),作為輸入和輸出模塊的激活函數(shù),數(shù)學描述如下所示:

圖3 LSTM的結(jié)構(gòu)
粒子群優(yōu)化算法是一個經(jīng)典的群體智能算法,它被廣泛應(yīng)用于單目標優(yōu)化問題的求解上[16]。由于其收斂速度快和實施簡單,后來也被應(yīng)用到多目標優(yōu)化問題上。
第一個基于粒子群優(yōu)化的多目標算法由Coello Coello等人提出[17]。在該算法中,帕累托(Pareto)支配被用來確定群體最優(yōu)粒子和個體最優(yōu)粒子,通過不斷更新最優(yōu)解集(Archive)將非支配粒子保存作為群體最優(yōu)粒子。本文所使用的算法流程如圖4所示:

圖4 多目標粒子群優(yōu)化算法的流程圖
對回歸問題的評價標準主要有決定系數(shù)R2和均方誤差MSE,具體計算方法如公式(10)和公式(11)所示:
其中n為樣本總數(shù);yi表示樣本i目標變量的測量值;為樣本i目標變量的預(yù)測值;為所有樣本目標變量的測量值的平均。R2的取值范圍為0~1,R2值越大,說明模型的預(yù)測能力越好;MSE越小,目標變量真實值和預(yù)測值之間的誤差越小,模型的預(yù)測能力越好。
以某1000 MW燃煤發(fā)電機組的濕法煙氣脫硫系統(tǒng)作為研究對象,收集到2022年10月至2022年11月間隔為54 s的系統(tǒng)相關(guān)運行數(shù)據(jù),由文獻[18]、[19]可知,該采樣間隔是合適的,樣本數(shù)量為50000,這些數(shù)據(jù)中可能存在異常值或者被記錄下的非真實值,因此需要對其進行預(yù)處理,剔除異常值。
在獲得數(shù)據(jù)后,選取合適的參數(shù)作為機器學習模型輸入變量,將54 s后脫硫系統(tǒng)出口SO2濃度作為被預(yù)測量。隨后基于該預(yù)測模型,對脫硫系統(tǒng)開展多目標優(yōu)化。
本文在選取模型輸入?yún)?shù)時,參考了相關(guān)文獻[3,5]。需要說明的是,煤的工業(yè)分析和元素分析作為影響SO2排放的重要參數(shù),但在采樣數(shù)據(jù)所處的時間段內(nèi),煤質(zhì)未發(fā)生顯著變化,因此為簡化模型,煤質(zhì)信息未被選入輸入?yún)?shù)。
為了衡量不同輸入?yún)?shù)和被預(yù)測量之間的關(guān)系,本文首先計算異常值處理前各變量的皮爾遜相關(guān)系數(shù)rxy,計算方法如公式(12)所示,通常來說,rxy的絕對值越接近于1,兩個變量之間存在線性相關(guān)的可能性越大。將得到的結(jié)果用熱力圖表示,如圖5所示。隨后用1.1中所描述的四分位距法剔除異常值,本文scale取1.5,再次計算各變量的皮爾遜相關(guān)系數(shù),將得到的結(jié)果用熱力圖表示,如圖6所示。最后使用處理后的70%的數(shù)據(jù)集去訓(xùn)練得到隨機森林模型,運用模型特征重要度這一屬性得出各輸入?yún)?shù)的重要度,并記錄在表1中。

表1 不同輸入?yún)?shù)對模型的輸入重要性

圖5 數(shù)據(jù)預(yù)處理前模型輸入輸出變量彼此相關(guān)系數(shù)的熱力圖

圖6 數(shù)據(jù)預(yù)處理后模型輸入輸出變量彼此相關(guān)系數(shù)的熱力圖
其中rxy表示樣本x和樣本y之間的皮爾遜相關(guān)系數(shù);xi和yi分別代表樣本x和樣本y中的第i個樣本;n為樣本總數(shù)。
對比圖5、圖6可得,雖然數(shù)據(jù)預(yù)處理后#1脫硫原煙氣SO2濃度和預(yù)測變量之間的rxy為-0.00019,但數(shù)據(jù)預(yù)處理前#1脫硫原煙氣SO2濃度和預(yù)測變量之間的rxy為0.24,并考慮其特征重要度為0.06985887,因此保留這一參數(shù)。同時,從圖6可以看出發(fā)電機功率、總?cè)剂狭俊?1脫硫原煙氣流量和#1FGD入口煙氣壓力1這四個輸入?yún)?shù)存在一定程度的相關(guān)性,但為提高模型的預(yù)測能力,本文選擇全部保留。最終選為模型輸入?yún)?shù)的變量如表1所示。
為確定動態(tài)建模時所需總時間步,本文使用隨機森林和LSTM兩種機器學習算法,對比在不同時間步下模型的預(yù)測效果。不同時間步下數(shù)據(jù)預(yù)處理后總量不同,每個時間步下70%的數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),30%的數(shù)據(jù)作為驗證數(shù)據(jù)。其中使用LSTM建模時結(jié)合了一階差分預(yù)測方法,而隨機森林未使用。結(jié)果如表2和表3所示:

表2 不同總時間步下隨機森林模型預(yù)測能力

表3 不同總時間步下LSTM模型預(yù)測能力
由表2和表3可得,不同總時間步下兩種模型的預(yù)測能力稍有差別。對隨機森林模型來說,總時間步為8小時,預(yù)測能力最好;對LSTM模型來說,總時間步為10小時,MSE最小,而總時間步為3小時,R2最大。這種情況是由總時間步不同和各總時間步下用于訓(xùn)練和驗證的數(shù)據(jù)總量不同兩種因素共同造成的。因此結(jié)合文獻[3],同時為降低模型復(fù)雜度,本文將總時間步確定為5。
為使機器學習模型獲得較好的預(yù)測效果,通常需要對其參數(shù)進行調(diào)優(yōu),由2.3節(jié)可知,結(jié)合一階差分預(yù)測時模型的預(yù)測效果較好,因此本文對結(jié)合了一階差分預(yù)測的模型調(diào)整參數(shù),同時總時間步設(shè)置為5小時,結(jié)果如下:
2.4.1 隨機森林模型參數(shù)確定
影響隨機森林模型預(yù)測效果主要參數(shù)為估計器數(shù)量,即nestimators,為確定其數(shù)值,采用五折交叉驗證,用MSE作為衡量標準,根據(jù)結(jié)果本文將nestimators設(shè)置為200,模型其它參數(shù)為默認值。該參數(shù)下模型的建模效果如表4所示。

表4 隨機森林模型的預(yù)測性能對比

表5 極致梯度提升模型的預(yù)測性能對比
2.4.2 極致梯度提升模型參數(shù)確定
影響極致梯度提升模型預(yù)測效果主要參數(shù)為估計器數(shù)量nestimators和學習率learningrate,為確定這兩個參數(shù)的取值,分別采用五折交叉驗證,用MSE作為衡量標準,根據(jù)結(jié)果本文將nestimators設(shè)置為100,learningrate設(shè)置為0.04,模型其它參數(shù)為默認值。當前參數(shù)下模型的建模效果如表五所示。
2.4.3 深度神經(jīng)網(wǎng)絡(luò)模型參數(shù)確定
影響深度神經(jīng)網(wǎng)絡(luò)模型預(yù)測效果主要參數(shù)為隱藏層神經(jīng)元數(shù)量和隱藏層層數(shù),為確定這兩個參數(shù)的取值,基于Pytorch架構(gòu),70%的數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),30%的數(shù)據(jù)作為驗證數(shù)據(jù),并對數(shù)據(jù)進行標準化處理,參數(shù)batchsize設(shè)置為256,初始學習率為0.001,并逐漸減小,進行L2正則化,最終用MSE作為衡量標準,結(jié)果如表6所示:

表6 不同隱藏層神經(jīng)元數(shù)量和層數(shù)下DNN預(yù)測能力
結(jié)合表6數(shù)據(jù),同時為降低模型復(fù)雜度,本文將隱藏層神經(jīng)元數(shù)量設(shè)置為256,層數(shù)設(shè)置為2,其它參數(shù)為默認值。值得說明的是,除層數(shù)為1的模型外,為緩解過擬合,其它模型均使用了批標準化和丟棄,其中丟棄概率為0.1。
2.4.4 LSTM模型參數(shù)確定
影響LSTM模型預(yù)測效果的主要參數(shù)為隱藏層神經(jīng)元數(shù)量和LSTM層層數(shù),為確定這兩個參數(shù)的取值,基于Pytorch架構(gòu),70%的數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),30%的數(shù)據(jù)作為驗證數(shù)據(jù),并對數(shù)據(jù)進行標準化處理,參數(shù)batchsize設(shè)置為256,初始學習率為0.001,并逐漸減小,進行L2正則化,最終用MSE作為衡量標準,結(jié)果如表7所示:

表7 不同隱藏層神經(jīng)元數(shù)量和LSTM層層數(shù)下LSTM預(yù)測能力
結(jié)合表7數(shù)據(jù),同時為降低模型復(fù)雜度,本文將隱藏層神經(jīng)元數(shù)量設(shè)置為256,LSTM層數(shù)設(shè)置為2,模型其它參數(shù)為默認值。值得說明的是,為提升模型預(yù)測效果,在LSTM層后添加一層線性層,同時為緩解過擬合,使用了批標準化和丟棄,其中丟棄概率為0.1。
綜上所述,本文確定了除支持向量回歸外的四個模型的參數(shù),在此處需要說明的是,對支持向量回歸,本文選擇默認參數(shù)。
由2.4節(jié)可知,針對五種模型,本文確定了相關(guān)參數(shù),通過比較可以獲得較好的SO2排放預(yù)測模型,隨后可以基于該模型,并結(jié)合多目標粒子群優(yōu)化算法,對脫硫系統(tǒng)相關(guān)參數(shù)進行優(yōu)化。本文選擇的待優(yōu)化參數(shù)分別為#1FGD入口煙氣溫度1、#1吸收塔修正液位1、#1吸收塔漿液pH值、泵臺數(shù)。本文所研究的問題為多目標優(yōu)化問題,目標函數(shù)為SO2排放預(yù)測函數(shù)和脫硫成本函數(shù),該問題數(shù)學描述如下:
其中f1(DV,MV)為前面訓(xùn)練好SO2排放預(yù)測函數(shù);MV為操縱變量,即待優(yōu)化參數(shù),在給定范圍內(nèi)變化;DV為干擾變量,即其它輸入?yún)?shù);為脫硫效率;為脫硫塔出口SO2濃度;costWFGD為脫硫成本函數(shù),即f2(DV,MV, ),以元/(kW·h)衡量,如公式(14)所示:
其中循環(huán)泵的運行成本Cpump和增壓風機的運行成本Cfan分別用公式(15)、(16)計算:
其中Ui,Ii,φi分別為第i個循環(huán)泵的電壓,電流和功率因子;Pelec是電價;load為發(fā)電機功率;Npump為漿液循環(huán)泵開啟臺數(shù);G為煙氣流量;ΔPtower為脫硫塔的壓降;ηfan為增壓風機的效率。
在消耗石灰石的同時,會生成石膏,其能帶來一定的經(jīng)濟回報。從石膏得來的收益可以用公式(18)表示:
由文獻[20]可知,離心式漿液循環(huán)泵始終在額定功率下運行,這樣可簡化循環(huán)泵運行成本的計算。
對多目標粒子群優(yōu)化算法來說,本文將種群規(guī)模設(shè)置為100,代數(shù)為100,選擇方法為輪盤賭方法。在一次次迭代中獲得非劣解集,選取優(yōu)化后參數(shù)值。
以上是數(shù)據(jù)驅(qū)動的脫硫系統(tǒng)多目標優(yōu)化模型,下面第 3 節(jié)對該模型的效果進行比較分析和討論。
為驗證動態(tài)建模方法的有效性,本文使用SVR模型,對比其在靜態(tài)建模(即總時間步為1)和動態(tài)建模(即總時間步為5)情況下各自數(shù)據(jù)集上的預(yù)測性能,結(jié)果如表8所示:

表8 支持向量回歸在靜態(tài)建模和動態(tài)建模下預(yù)測性能對比
由表8可知,動態(tài)建模情況下SVR模型的預(yù)測性能要優(yōu)于靜態(tài)建模,說明考慮了系統(tǒng)遲滯性的動態(tài)建模方法適用于對濕法煙氣脫硫系統(tǒng)建模。
為驗證一階差分預(yù)測方法的有效性,本文使用隨機森林模型,對比其在結(jié)合一階差分預(yù)測和未結(jié)合一階差分預(yù)測情況下各自數(shù)據(jù)集上的預(yù)測性能,結(jié)果如表9、圖7、圖8所示:

表9 隨機森林在結(jié)合一階差分和未結(jié)合一階差分下預(yù)測性能對比

圖7 結(jié)合一階差分預(yù)測下隨機森林模型在驗證集上預(yù)測性能

圖8 未結(jié)合一階差分預(yù)測下隨機森林模型在驗證集上的預(yù)測性能
結(jié)合表9、圖7和圖8可知,結(jié)合一階差分預(yù)測情況下RF模型的預(yù)測性能要優(yōu)于未結(jié)合一階差分的情況,說明一階差分預(yù)測方法減小了脫硫系統(tǒng)數(shù)據(jù)具有的自相關(guān)性對建模的影響。
為確定預(yù)測性能最佳的機器學習模型,本文對比五種機器學習模型在結(jié)合動態(tài)建模和一階差分預(yù)測方法情況下各自數(shù)據(jù)集上的預(yù)測性能,各模型參數(shù)設(shè)置參照2.4節(jié),結(jié)果如表10所示。

表10 五種機器學習模型的預(yù)測性能對比
由表10可知,DNN和LSTM模型的預(yù)測性能要優(yōu)于其它三種模型,說明這兩種模型能較好地對濕法煙氣脫硫系統(tǒng)中的非線性過程建模。考慮到LSTM模型更適用于時序數(shù)據(jù),且LSTM模型在驗證數(shù)據(jù)上MSE與訓(xùn)練數(shù)據(jù)上MSE之差小于DNN模型,因此本文選取LSTM模型為最優(yōu)模型,其建模效果如圖9、圖10所示,相對誤差在6%以內(nèi)的數(shù)據(jù)占驗證集總量的70%以上,值得說明的是,在驗證集上,濃度在0~10 mg/m3之間的數(shù)據(jù)量僅為1,在其它濃度范圍內(nèi)相對誤差小于5%的數(shù)據(jù)占比超過了50%。

圖9 LSTM在驗證集上的不同相對誤差范圍數(shù)據(jù)百分比

圖10 LSTM在驗證集上的不同濃度范圍內(nèi)相對誤差小于5%數(shù)據(jù)百分比
在獲得最優(yōu)SO2排放預(yù)測模型后,本文利用多目標粒子群優(yōu)化算法,對濕法脫硫系統(tǒng)的部分運行參數(shù)進行優(yōu)化,部分工況下優(yōu)化結(jié)果表11所示。由表11可知,發(fā)電機功率較低時,脫硫成本一般較高。為降低脫硫成本,可嘗試減小循環(huán)泵開啟臺數(shù)。為進一步說明各參數(shù)對濕法煙氣脫硫系統(tǒng)的影響,本文分析了在發(fā)電機功率為380.442 MW情況下分別改變四個參數(shù)時WFGD出口SO2預(yù)測值和脫硫成本的變化情況,結(jié)果見圖11―圖14,豎虛線表示該參數(shù)的初始值。

表11 部分工況下脫硫系統(tǒng)優(yōu)化前后效果對比

圖11 WFGD出口SO2預(yù)測值和脫硫成本隨#1FGD入口煙氣溫度1變化

圖12 WFGD出口SO2預(yù)測值和脫硫成本隨#1吸收塔修正液位1變化

圖13 WFGD出口SO2預(yù)測值和脫硫成本隨#1吸收塔漿液pH值變化

圖14 WFGD出口SO2預(yù)測值和脫硫成本隨泵臺數(shù)變化
由圖11―圖14可知,在給定工況下,濕法煙氣脫硫系統(tǒng)中#1吸收塔漿液pH值對脫硫過程影響較大,但并不是越大越好,實際運行時通常控制漿液pH值在一個合理范圍內(nèi),一般認為選擇在5.2~6.2為宜;從出口SO2濃度的視角看,另外三個參數(shù)的變化對其影響不大;但從脫硫成本的視角看,泵臺數(shù)的變化對其影響較大,泵臺數(shù)越多,脫硫成本越高,出口SO2濃度卻沒有明顯下降,另外三個參數(shù)對脫硫成本則影響較小。權(quán)衡出口SO2濃度和脫硫成本,#1FGD入口煙氣溫度1的選擇在98.281 ℃,#1吸收塔修正液位1選擇在9.667 m,#1吸收塔漿液pH值選擇為5.397,泵臺數(shù)選為2臺,此時脫硫成本下降了18.44%,出口SO2濃度則由于#1吸收塔漿液pH值的提升有一定程度的下降。
綜上所述,本文提出的方法可以用來對濕法煙氣脫硫系統(tǒng)開展優(yōu)化。
本文針對燃煤電廠濕法煙氣脫硫系統(tǒng)脫硫過程建模存在的模型準確性不足的情況,采用數(shù)據(jù)驅(qū)動建模方法,通過箱形圖對異常值進行識別刪除,使用動態(tài)建模和一階差分預(yù)測方法,用機器學習算法對濕法脫硫系統(tǒng)進行建模,對下一采樣時間的脫硫系統(tǒng)出口二氧化硫濃度進行了預(yù)測,用決定系數(shù)和均方誤差判斷所建立模型的優(yōu)劣,并對比不同機器學習算法的預(yù)測效果,選出效果較好的模型;并進一步基于數(shù)據(jù)驅(qū)動的脫硫過程模型,根據(jù)多目標粒子群優(yōu)化算法,得到優(yōu)化后的帕累托最優(yōu)解集,在脫硫成本和出口SO2濃度之間權(quán)衡,在最優(yōu)解集中選擇優(yōu)化的脫硫系統(tǒng)運行參數(shù)值。主要有以下幾點結(jié)論:
1)由訓(xùn)練結(jié)果可以得出,動態(tài)建模加一階差分預(yù)測的方法顯著優(yōu)于靜態(tài)建模方法,說明動態(tài)建模加一階差分預(yù)測的方法能較為準確地表征復(fù)雜的脫硫過程。
2)通過對比不同機器學習算法的結(jié)果,得出LSTM神經(jīng)網(wǎng)絡(luò)的建模能力略優(yōu)于其它算法,說明LSTM神經(jīng)網(wǎng)絡(luò)能更好地處理時間序列數(shù)據(jù)。
3)根據(jù)多目標優(yōu)化結(jié)果,隨著脫硫成本的上升,出口SO2濃度逐漸下降;在實際運行時,運行人員可以根據(jù)優(yōu)化結(jié)果,在脫硫成本和出口SO2濃度兩者之間權(quán)衡,實現(xiàn)經(jīng)濟穩(wěn)定運行。