陸婷婷 楊小民 霍國鋒
(華電國際電力股份有限公司奉節發電廠,重慶 404600)
目前,大部分電廠煤的發熱量測定是借助氧彈筒量熱儀測量反應物與生成物的焓差計算,這種實驗測定方法具有很高的精度。但實際測定的煤樣需要經采樣、制樣及化驗等處理流程,測定過程復雜,結果耗時較長,不能很好地滿足煤炭生產、利用等環節的需求。為了解決上述問題,越來越多的學者通過建立煤的發熱量模型,簡單、快速地得到發熱量數據,但是精度和通用性還存在一定局限性。本文綜述了目前常用的煤的發熱量預測方法,并就目前存在的問題進行了分析。
回歸分析是一種數量統計方法,通過對大量數據進行分析處理,評估各個變量之間關系的強度,從而估計因變量與一個或多個自變量之間的關系,建立回歸方程。線性回歸分析方法大致步驟如下:
(1)確定變量。對變量x1,x2,x3…xp作n次檢測,得到檢測值為xi1,xi2,xi3…xip,yi,i=1,2,3 …n。
(2)建立數學模型。線性回歸的數學模型可建立為:

式中:i=1,2,3 … n;β0,β1,β2,β3…βp是相關線性回歸系數;ε是均值為0、方差為σ2(σ> 0)的隨機誤差。
(3)相關分析。求線性回歸模型可以利用Excel、MATLAB 及SPSS 等軟件快速準確計算回歸系數β0,β1,β2,β3...βp的數值,建立所需的回歸方程。
陸新科[1]依據所用的煤的特點,忽略揮發分、硫分對發熱量的影響,建立了發熱量關于灰分、全水分的二元線性回歸方程。唐成亮[2]考慮了多種影響因素,建立了燃煤低位發熱量與工業分析、元素分析的多元線性回歸方程。該模型的最大偏差為2.8%,平均偏差為0.97%,較傳統經驗公式預測準確度較高、誤差較小。
除了最常用的線性回歸法,還有其他建模方法:閔凡飛等[3]利用灰色系統理論對數據信息容忍性強等特點,僅使用煤灰分、水分兩種數據建立了GM(0, H)灰色預測模型。結果證明GM(0, H)模型對煤的發熱量預測具有很高的擬合精度。申國民[4]利用統計方法提出了查表計算法。這種方法省略了計算過程,只需通過灰分、全水分結果便可查到煤樣的收到基低位發熱量。
非線性回歸建模類似于線性回歸建模,兩者都是研究自變量和因變量之間的關系。但是非線性模型的建立比線性模型更復雜,因為函數是通過一系列的反復試驗的近似(迭代)創建的。二次回歸的步驟如下:
(1)建立二次回歸方程。設y為因變量,x1,x2…xn為自變量,a0,a1…an;a0,a12,a23…an-1,n;a11,a22…an,n為未知參數,建立二次回歸方程:

(3)求出未知參數。以最小化目標函數為優化目標,利用MATLAB 與SPSS 等軟件可以快速求出未知參數值,從而建立所需的二次回歸方程。
王江榮等[5]通過引入三角模糊數來彌補工業指標之間分類界限不明顯的缺點,提出了一種基于三角模糊數非線性回歸模型。最終模型預測的非線性擬合優度值為0.983 8,均方誤差為0.447 3,平均相對誤差為0.020 3。
2.2.1 隨機森林算法
隨機森林算法是一種包含集成學習的機器學習方法,其中包含多棵決策樹,這些決策樹共同組合解出復雜問題,實現高精度的預測輸出。由于整個預測處理流程和數據處理方式比較簡單,隨機森林算法擁有訓練時間少、對數據依賴性小等優點。隨機森林算法的算法流程可分為以下幾步(如圖1):

圖1 隨機森林算法
(1)從訓練集中隨機選擇n個數據點,即n個數據子集;
(2)構建與所選數據點(子集)相關聯的決策樹;
(3)通過測試集對每棵決策樹預測結果進行投票,去掉票少的決策樹;
(4)重復上述步驟,直至有足夠多可用的決策樹;
(5)取平均值作為預測結果。
韓學義[6]使用隨機森林算法擬合出的模型中各個元素權重值得出了對煤發熱量影響最重要的參數為固定碳含量和灰分,并且證明了固定碳含量對發熱量的影響具有較強的非線性。為了進一步提高算法實用性,作者還利用隨機森林算法預測了煤中的碳含量,預測結果的誤差達到了2.3%以下。
2.2.2 人工神經網絡
人工神經網絡是一種模擬生物神經網絡的建模技術,被廣泛地使用在了各種建模困難的場景中。人工神經網絡在經過訓練后能夠從代表性的數據中構建出復雜的非線性映射結構,與回歸分析相比,人工神經網絡具有更強的非線性分析和預測能力。
(1)BP 神經網絡
BP神經網絡是指反向傳播神經網絡,由輸入層、隱含層、輸出層三層組成。其中輸入層用于接收訓練數據,隱含層用于執行計算以確定數據關系,輸出層用于得到最終輸出結果。BP 神經網絡能夠不斷調整隱含層權值來逼近最小誤差,具有強大的自適應、非線性映射能力。構建BP 神經網絡的流程可分為以下幾步(如圖2):

圖2 BP 神經網絡算法
① 輸入層通過預設協議接收數據x;
② 信息前向傳遞傳入隱含層處理;
③ 隱含層依據權值將數據處理后傳給輸出層;
④ 輸出層計算誤差,誤差反向傳遞修改隱含層權值;
⑤ 重復以上步驟,直至輸出誤差在允許范圍內。
曹建波等[7]利用七個工業分析參數作為輸入,建立了發熱量的BP 神經網絡預測模型,預測的相對誤差最小能夠到達0.039%。
(2)RBF 神經網絡
RBF 神經網絡是指徑向基神經網絡,其結構與BP 神經網絡相似,但RBF 神經網絡隱含層只有一層,沒有反向傳遞調整權值過程。RBF 神經網絡隱含層采用輸入與中心向量的距離作為基函數,擁有更好的模型泛化能力,網絡收斂速度更快。如圖3。

圖3 RBF 神經網絡算法
于海華等[8]利用揮發分、灰分、分析水為輸入,以格林函數為激活函數建立了RBF 神經網絡預測模型,最終結果證明訓練后的RBF 神經網絡模型發熱量預測精度最高能夠達到98%。雷萌等[9]為進一步提高RBF 神經網絡預測精度,引入了模糊聚類對輸入樣本分類,并根據分類結果分別建立RBF 神經網絡模型。這種預處理手段減少了預測的誤差,相對誤差能夠控制在0.5%~2.5%之間。
2.2.3 支持向量機
支持向量機是一種用于分類、回歸的機器學習算法。與神經網絡相比,支持向量機收斂速度更快,易于獲得全局最優解。為了提升工業分析數據對煤發熱量的預測精度,譚鵬等[10]建立了基于支持向量機的煤質發熱量預測模型。其所建立的模型可以快速、可靠地預測出煤的發熱量,平均相對誤差最低可達到2.16%。為了減少參數對訓練集的依賴,江文豪等[11]在支持向量機中加入遺傳算法進行參數尋優,用這些參數進行訓練的向量機相比常規的向量機模型擁有更高的預測精度。
從前文及表1、表2 可以總結出,良好的預測算法應該滿足以下3 個要求:

表1 預測算法總結

表2 各文獻對比總結
(1)精確。能夠在可允許誤差范圍內準確預測出煤的發熱量。
(2)快速。預測速度快,能滿足生產使用要求。
(3)簡單。預測算法簡單、收斂快。
(1)預測精度不足。由于煤的發熱量與工業分析組分之間是非線性關系,使用線性模型預測的精度普遍不高,并且需要經常預測結果中出現的處理異常值。非線性模型能夠較好擬合發熱量預測中的非線性性質,但容易陷入局部最優,并且為了保證預測精度,過程中還需要大量的維護。
(2)煤種間差距較大,標準不統一。由于煤種、礦區等的不同,煤的發熱量并不能簡單的用統一因變量表示。
(1)基于大數據的算法改進。無論是因變量的選取還是機器學習的模型訓練,都需要大量的數據作為參考。建立煤發熱量數據庫,使用大數據分析方法來確定預測自變量選取標準,排除對發熱量影響較小的自變量,進而統一預測標準,降低預測算法復雜程度。利用數據庫還可以對機器學習模型進行不斷的訓練,使預測精度不斷提高。
(2)深度學習算法。基于深度學習的數據驅動算法正在逐漸興起,并且展現出強大的模式識別和預測能力。足夠數量的樣品測試和訓練可以使一個深度學習模型掌握不同種類煤的特點,預測出不同種類的煤發熱量。深度學習模型能自動在不同的預測模式之間切換,而不需要像常規預測建模方法考慮泛化和收斂能力,在精度和通用性上擁有獨特的優勢。
(1)非線性的預測方法越來越多,非線性預測模型正逐漸取代傳統的線性模型。一方面是因為隨著生產要求提高,線性模型的預測精度已經不能滿足實際需要;另一方面隨著非線性建模理論的完善,非線性模型預測的精度普遍高于線性模型。
(2)機器學習能夠很好地建立非線性模型,還擁有一定泛化能力,能夠自適應不同的樣本數據。