劉 近,徐亞豹
(1.貴溪發(fā)電有限責任公司,江西 貴溪 335400; 2.北京博望華科科技有限公司,北京 100045)
依據能源局有關統(tǒng)計資料,2018年底全國的火力發(fā)電量高達49 794.7億kWh,約占全國總發(fā)電量73.23%,位于主導地位[1]。所產生的對環(huán)境污染大,已受到相關部門和廣大學者的廣泛關注。目前研究資料顯示,排放控制方法主要為燃燒控制和脫硝處理2種[2]。合理設定排放控制參數和優(yōu)化脫硝過程的噴氨量,對降低排放具有重要意義。
鍋爐燃燒反應是具備對控制要求很高的物化過程[3],所建模型應充分考慮控制精度。另外,排放同時受多種因素的影響。這些因素將為建立排放模型實現精準控制設置了眾多障礙。電廠運行經驗不斷積累以及智能算法的深度應用,將為排放建模提供新思路。文獻[4]結合支持向量機訓練模型建立了鍋爐運行參數和排放模型。文獻[5]利用核心向量機模型建立了超臨界鍋爐的排放模型。為充分提高模型訓練精度,眾多學者對SVM的訓練參數進行了對應的優(yōu)化。文獻[6]結合粒子群優(yōu)化算法對支持向量機模型參數進行適應性優(yōu)化,提高了排放量模型的預測精度。文獻[7]使用蟻群算法優(yōu)化支持向量回歸參數。除了支持向量機算法,神經網絡算法也被應用到排放建模上。人工神經網絡、徑向基函數神經網絡、廣義回歸神經網絡、反向傳播神經網絡等被應用于排放建模中,均取得了較好的效果,然而這些算法都屬于淺層神經網絡算法。受結構的限制,這些算法難以挖掘樣本數據種的深層信息[8]。而深度學習算法擁有挖掘數據深層信息的能力,能有效地解決非線性特征學習、過擬合等問題。這一類算法在機器翻譯、圖像預測、人臉識別等多個領域得到了廣泛應用。在排放量預測方面,文獻[3]結合深度置信網絡建立了燃煤電廠預測模型,驗證了該算法的高效性。鑒于深度神經網絡模型拓撲簡單、控制參數少等特點,文獻[9]提出一種基于深度模型訓練的燃燒和排放的優(yōu)化控制模型。
此外,模型的輸入特征也將影響預測精度。文獻[10]通過偏最小二乘算法(Partial Least-square Method,PLS)對影響NOx排放的有關變量進行相關性分析。Hong等[11]提出了利用主成分分析法(Principal Component Analysis,PCA)對預處理之后的輸入變量進行相關性去除。但是PLS、PCA等特征選取方法改變了原始變量信息,不利于后期模型解釋。同時,結合鍋爐燃燒的時延特點,采用lasso算法對模型輸入時延時間進行相應改進。并考慮到運行數據的隨機因素,數據中時頻信息難以被提煉的難點問題。經驗模態(tài)分解(Empirical Mode Decomposition,EMD)能夠將時間序列所蘊含的時域和頻域的信息最大化地反映出來,分解得到不同頻率的線性平穩(wěn)信號,且包含原始數據的所有時間尺度。文獻[12]結合經驗模態(tài)分解對典型正常、故障信號進行特征提取,作為PSO-SVM的訓練數據。文獻[13]采用EMD分解算法將時間序列信號分解為數個本征模函數(IMF)分量和趨勢分量,然后利用LSTM模型進行預測。文獻[14]分別對經驗模態(tài)分解后的模態(tài)函數序列進行DBN建模、組合后獲得電力負荷預測值。因此,嘗試將EMD分解算法引入排放預測建模過程,利用EMD分解算法最大化提取數據內部特征信息。
綜上所述,提出了一種基于深度學習的排放預測模型。①在模型建立前,依據經驗和機理分析選取可能影響排放的若干參數變量;②為了降低模型復雜性,利用lasso進行參數篩選得到相關性更大的變量,以確定基礎數據集。針對電站鍋爐生產過程具有的大時延特征,分析延遲時間對建模精度的影響,篩選相關性最大的時刻;③利用EMD算法將得到的變量進行分解作為最終建模的輸入,最終采用DNN對排放量進行預測。為了驗證模型的有效性,設計相關實驗,驗證提出算法各個環(huán)節(jié)的有效性,并與常用建模方法進行比較,結果顯示所提出的方法模型精確度更高。
以某大型超超臨界直流鍋爐為研究對象,鍋爐大小選取32.084 m×15.670 m,采用Π型布置、單爐膛、改進型低NOxPM(Pollution Minimum)主燃燒器和MACT(Mitsubishi Advanced Combustion Technology)型低分級送風燃燒系統(tǒng)。八角反向雙切圓燃燒方式,每只燃燒器共設計6層低PM一次風噴口(A,B,C,D,E,F),6層二次風噴口(AA,BB,CC,DD,EE,FF),一層燃盡風室(OFA)。鍋爐尺寸及燃燒器布置如圖1所示。

圖1 鍋爐尺寸及燃燒器布置Fig.1 Boiler size and burner arrangement
目前,電站鍋爐為降低排放,通常選取空氣分級燃燒、燃料分級和煙氣再循環(huán)等技術。本文鍋爐選用空氣分級燃燒技術,其原理為分級送風,通過助燃劑量的變化控制NOx的生成。煤在燃燒過程中產生的NOx主要是NO,約占95%,NO2約占5%。NOx排放物主要由空氣中的氮高溫氧化或燃料中的氮氧化物分解氧化形成。在煤燃燒過程中,主要會產生3種類型的NOx:熱力型、快速型和燃料型。根據不同類型產生NOx的機理,首先進行了建模參數的初選。
熱力型是指供給燃燒的空氣中的N2在高溫下氧化而生成的氮氧化物。熱力型NOx與一次風量/二次風量/煙氣含氧量及溫度等因素相關。因此,初步選取24個二次風風量、6個一次風給煤量、2個鍋爐尾部煙氣氧量以及15個爐內溫度變量等與煙氣氧量和溫度有關的可測量因素作為建模參數。
快速型NOx作為弗尼莫爾(Fenimore) 針對氣體類、油類等含碳氫化合物燃料在欠氧反應下提出的。火焰中大量的O、OH等原子與空氣中的N等原子反應,本文不計入溫度和壓力對快速型NOx的生成影響,重點考慮過量空氣系數的作用。因此,選取可以影響過量空氣系數的24個二次風量作為備選參數。而只有在高溫含氧的條件下部分N2才會生成燃料型NOx。因此選取上述24個二次風量及15個溫度變量。依據機理分析和生產實踐經驗初步選取的與NOx排放的相關變量詳細信息見表1。

表1 相關變量初選Tab.1 Correlation variable primaries
為了建立準確的排放量預測模型,提出了一種考慮時延特征的排放量深度學習預測算法。該算法主要包括相關變量分析,考慮時延特征的特征選擇,基于EMD分解的數據信息提取以及DNN建模4個環(huán)節(jié),分別在2.1—2.4節(jié)中進行說明,最終在2.5節(jié)給出算法整體流程。
經過機理分析之后,可以得到與NOx排放量相關的變量。但是由于各個鍋爐的運行狀態(tài)、健康狀態(tài)等因素的影響,機理分析得到的變量可能存在冗余變量。而冗余的變量可能導致模型計算量的增加,效率的降低[15-16]。因此結合鍋爐實際生產數據對機理分析得到的相關變量進行降維,舍掉相關性小的變量。lasso算法是一種通過最小化殘差平方和來消除冗余變量的方法,在實際應用中具有使用方便、可解釋性強的優(yōu)點,選用lasso算法可將1.2節(jié)選取的變量和NOx排放量進行關聯分析。篩選后的結果見表2。

表2 lasso選擇后輸入Tab.2 Input data after lasso selection
由于鍋爐是一個大時延系統(tǒng),為了研究2.1節(jié)選擇出的相關變量與NOx排放量之間的時間相關性,采用Pearson相關系數法對選定的13組輸入與NOx排放量進行了時延相關性分析。實驗的研究鍋爐高為32.08 m,而直流鍋爐的一次風速為20~25 m/s。因此,對10 min內的13組輸入與輸出進行時間相關性分析。10 min內13組輸入變量與輸出之間的時延相關性分析見表3,選擇相關性顯著系數最大時刻對應的參數作為最終選擇的特征信息。
由于電廠實際運行數據存在隨機性和不穩(wěn)定性,導致數據中時頻信息難以被提煉,為了進一步挖掘2.2節(jié)中選擇的特征數據的時頻特征,采用EMD算法對特征數據進行分解。EMD分解能夠將時間序列所蘊含的時域和頻域的信息最大化地反映出來,分解得到不同頻率的線性平穩(wěn)信號,且包含原始數據的所有時間尺度。
采用EMD算法對經過lasso篩選得到的13組數據進行經驗模態(tài)分解,共得到110個不同頻率成分的固有模態(tài)函數(Intrinsic Mode Function,IMF)分量。以總風量分解為例,圖2為總風量經過EMD分解之后得到的11組IMF分量a1—a11,從圖2中可以看出,分解得到的數據在頻率等各方面都有不同。而由于分解得到的分量可能存在與輸出無關的量,因此對分解得到的110組IMF分量與NOx排放量再次進行最大相關性選擇,篩選得到相關性較大的56組分量,作為DNN預測模型的最終輸入。

圖2 總風量EMD分解結果Fig.2 EMD decomposition results of total air volume
所構建的DNN模型為56輸入,單輸出,4隱含層的全連接神經網絡,結構如圖3所示。圖3中,輸入層為Xi(i=1,2,3,…,56),X為影響NOx排放的向量,設定為56個影響因素,因此輸入層為56個神經元;Wi為深度神經網絡中第i層的權重權值,bi為第i層的神經元偏置,ai為第i層的輸出向量。深度學習模型的每個隱含層從前一層獲取輸入向量,利用該隱含層的激活函數進行非線性變換,隱含層采用ReLU作為激活函數。每個隱含層再將向量作為輸入傳給下層神經元,逐層迭代,最終形成數據輸出。

圖3 DNN結構Fig.3 Structure of a DNN
深度學習模型的隱含層輸出為:
ai=φhi(wiai-1+bi)
(3)
評估整個訓練樣本表現的MSE損失函數為:
(4)
使用深度神經網絡作為預測模型的基本架構,即將DNN近似為一個函數,即:
y=f(x,w1e,w2e,w3e,w4e,b)
(5)

綜上所述,所提出算法的整體結構如圖4所示。①采用2.1節(jié)中的方法針對建模參數進行初選,去除冗余變量;②對上述13組數據進行時延分析,對10 min內的13組相關變量與輸出數據進行時刻相關性分析,篩選相關性最大的時刻作為輸入時刻;③對13組變量進行EMD分解與相關性篩選,獲得模型最終輸入;④進行DNN模型構建。

圖4 算法流程Fig.4 Algorithm flow chart
為驗證本文所建模型的有效性,選取某火電廠1 000 MW超超臨界直流鍋爐歷史運行數據進行實驗。實驗數據從DCS系統(tǒng)中隨機采集,采樣周期為1 min,為了驗證模型的泛化性,采用3個數據集進行驗證。為了便于后續(xù)描述,將3個數據集分別表示為D1、D2、D3,見表4。

表4 數據集劃分Tab.4 Data set partitioning
使用平均相對誤差(MAPE)、平均絕對誤差(MAE)、相關系數R作為模型的評價指標。MAPE和MAE的值越小,模型的預測性能越好;相關系數R越接近1,模型的預測性能越準確。評價指標的計算公式為:
(6)
(7)
(8)

3.3.1 時延影響
為驗證時延影響,對時延分析前后采用不同輸入變量進行建模的結果進行實驗對比。以數據集1為例。不同算法進行時延分析后得結果對比,見表5。從表5中可看出,采用時延分析后,所有模型的預測精度均不同程度的提高。其中MAPE方面,EMD-DNN模型降低了0.26%,DNN模型降低了0.34%,ELM、SVR、LSTM模型也均降低了0.3%以上。MAE方面,EMD-DNN模型降低了21.6%,DNN模型降低了19.2%,其余模型也降低了8%以上。另外,本文模型的各誤差指標值均優(yōu)于其他算法。平均相對誤差EMD-DNN模型與ELM模型相差7.81%,與SVR模型相差了5.24%,與LSTM模型相差了6.57%,平均絕對誤差的指標相比,EMD-DNN模型與ELM模型相差13.38%,與SVR模型相差10.19%,與LSTM模型相差12.84%。以此說明鍋爐系統(tǒng)是一個大時延系統(tǒng),對輸入數據進行時延處理可提高模型精度。

表5 時延分析前后模型誤差比較Tab.5 Comparison of model error before and after time delay analysis
3.3.2 數據分解的影響
為了驗證數據分解對建模精度的影響,采用了2組不同的數據進行DNN建模,第1組為經過EMD分解的56組輸入數據,第2組為未經過EMD分解的13組輸入數據,其他條件均相同。本文所選取的不同算法的預測平均相對誤差結果如圖5所示。

圖5 分解前后實驗結果對比Fig.5 Comparison of model error before and after data decomposition
從圖5可知,結合EMD分解算法后,本文所有模型的精度均提高,從而說明EMD分解算法的有效性。原因在于EMD算法將輸入信號分解為高頻和低頻,有利于模型的數據提取。為進一步定量對比各算法的預測精度,各算法的誤差評價指標對比結果見表6。由表6可知,上述各算法的預測精度均有提高,其中以ELM算法最為明顯,MAPE、MAE分別比分解前減小了17.80%和17.66%。且明顯看出本文算法優(yōu)于其他對比模型。
3.3.3 不同模型預測結果對比
為充分驗證本文所提算法的高效性,將所提模型同其他對比模型結果進行對比(圖6)。為了更清楚地分析模型的預測差異,將圖6(a)—圖6(c)中的部分曲線進行放大。從圖6中可以看到,經過EMD分解的DNN模型也就是EMD-DNN模型能夠更好地跟蹤實際曲線,所構建的EMD-DNN模型能更準確地對真實值進行預測。同時,從圖6(d)中3個數據集R2的平均值也可以看出EMD-DNN模型的真實值與預測值擬合效果更好。

表6 數據分解前后模型誤差比較Tab.6 Comparison of model error before and after data decomposition
為了進一步分析所構建模型的性能,不同模型的真實值與預測值之間的絕對誤差如圖7所示。從圖7中可以看出,不同數據集的EMD-DNN模型的絕對誤差大部分都分布在最小誤差0~5,最小誤差區(qū)間內百分比達到95%,其頻率隨著絕對誤差的增加逐漸降低,圖7(a)—圖7(c)均反映了該分布規(guī)律。DNN、ELM、SVR、LSTM與EMD-DNN的頻數分布相似,但是EMD-DNN的頻數分布減少得更快,且在絕對誤差較大的區(qū)間中沒有分布,這表明EMD-DNN的絕對誤差是最小的,且預測精度遠高于其他幾種模型。如圖7(d)所示,從不同數據集的箱型圖中也可以明顯地看出EMD-DNN算法預測結果相對誤差值相比于其他算法更接近0誤差線附近。
5種不同模型的預測結果對比見表7。通過分析得到,EMD-DNN模型的MAE、MEPE值遠小于其余對比模型,且各種誤差指標也小于單純的DNN模型。在數據集D1上,所提出算法的MAE、MAPE、R三種指標相較于第2好的算法分別降低了49.0%、48.0%、1.9%;在數據集D2上,MAE、MAPE、R比第2好的算法分別降低了44.0%、48.0%、1.8%;在數據集D3上,MAE、MAP分別降低了46.0%、45.0%、1.3%。從而說明了本文算法的高效性。
通過對燃煤電廠排放影響因素展開分析,本文提出一種深度學習的神經網絡預測方法,結合lasso算法對模型訓練參數進行變量延時分析,并選擇訓練數據相關性作為模型輸入集。另外,將lasso篩選后變量開展經驗模態(tài)分解獲得多頻率分量,并同模型輸出量展開相關性分析,篩選出最大相關性變量作為模型最終輸入集,并展開DNN網絡深度建模。

圖6 不同模型預測結果Fig.6 Different models predict results

圖7 NOx排放量模型預測結果統(tǒng)計Fig.7 Statistics of NOx emission model prediction results

表7 模型在不同數據集上的預測誤差比較Tab.7 Comparison of prediction errors in different data sets
(1)lasso算法對模型參數特征選取上采取降維處理,消除耦合影響,降低計算時間。
(2)采用EMD分解方法提取模型輸入信息,提高建模精度。
(3)DNN算法很好地適用于排放問題,同文中其他算法對比,其結果充分說明了DNN算法在排放問題上具有很強的適應性。