葛彥鵬,崔 凝,董麗麗,楊 琛
(1.華北電力大學 能源動力與機械工程學院,保定071003; 2.天津大學 機械學院,天津300072)
電站鍋爐效率與其排煙熱損失、固體未完全燃燒熱損失、灰渣物理熱損失、可燃氣體未完全燃燒熱損失和散熱損失有關[1],其中固體未完全燃燒熱損失是鍋爐的最主要熱損失之一,僅次于排煙熱損失。影響固體未完全燃燒熱損失的因素多而復雜[2-3],其中飛灰含碳質量分數是一個重要因素。過高的飛灰含碳質量分數會對電廠的經濟運行及安全生產造成許多不利影響,及時有效地獲得其數據對機組運行人員調節機組狀態有著重要意義[4]。
長期以來飛灰含碳質量分數數據的獲得一直沿用傳統的質量燃燒法[5],但此方法在時間上有很大的延遲性,很難及時地反映鍋爐的燃燒運行狀況,在安全生產上存在一定的隱患。因此對于飛灰含碳質量分數預測技術的研究顯得格外迫切[6]。
偏最 小 二 乘 法 (PLS)是 由 S.Wold 和C.Albano等人于1983年首次提出[7],此方法是一種多因變量對多自變量的回歸建模方法,較好地解決了許多以往用普通多元線性回歸難以解決的問題,尤為重要的是當變量之間存在高度相關時,用偏最小二乘法進行建模,其分析結論更加可靠,整體性更強。而飛灰含碳質量分數的影響因素眾多,各影響因素之間也是存在高度相關性,因此使用偏最小二乘法對其建立數學模型,并分析預測能達到很好的效果。
在實際工作中,有一組因變量數據Y={y1,…,yq}(q為因變量個數)和一組自變量X={x1,…,xp}(p 為自變量個數)。
數據的標準化處理可以使新坐標系的原點與樣本點集合的重心重合,并消除變量間的量綱差異,數據處理后不會改變其樣本點間的相互位置及變量間的相關性。以自變量X為例,具體公式為:

處理后自變量數組記為E0=(E01,…,E0p)n×p,同理因變量數組記為 F0=(F01,…,F0p)n×q。
t1是E0的第一個主成分,t1=E0w1;w1是E0的第一個軸,是一個單位向量,即‖w1‖=1。同樣,u1是F0的第一個主成分,u1=F0c1,c1是F0的第一個軸,并且‖c1‖=1。為使t1、u1能很好地代表X、Y 中的數據變異信息,同時t1對u1有最大的解釋能力,應使t1對u1的協方差(Cov(t1,u1))達到最大,即:

式中:Var(t1)、Var(u1)分別表示t1與u1的方差,r(t1,u1)表示t1與u1的相關度。
經推導有:

可見w1是矩陣E′0F0F′0E0的特征向量,其特征值是θ21。θ1是目標函數值,它取最大值時對應的w1是矩陣E′0F0F′0E0的最大特征值的單位向量。同樣c1是對應于矩陣F′0E0E′0F0最大特征值θ21的單位特征向量。求得w1與c1后即可得主成分:

然后得回歸方程:

式中E1、F*1、F1分別是三個回歸方程的殘差矩陣,方程回歸系數為:

數學原理及方法與第一個主成分的提取相同,用殘差矩陣E1和F1分別取代E0和F0,求出第二個軸w2和c2及第二個主成分t2和u2。如果矩陣X的秩是A,則依次進行循環計算得到主成分t3,…,tA,則會有:

由于t1,…,tA均可以表示成E01,…,E0p的線性組合,上式可以變成y*k=F0k關于x*j=E0j的回歸方程形式:

式中:k=1,2,…,q,FAk是殘差矩陣FA的第k列。
在偏最小二乘法回歸建模中,為防止不充分擬合及過度擬合的發生,應確定合理的參與建模的主成分個數,目前廣泛采用“舍一交叉驗證法”選定建模的主成分個數。假設有n組樣本點,先使用去掉第i組樣本點所得樣本集合(含n-i組樣本點),并且用h主成分擬合一個回歸方程;再將之前排除的第i組樣本點帶入擬合的回歸方程,得到yi在樣本點i上的擬合值^yhj(-i)。對于每一個i=1,2,…,n重復以上步驟,得到Y的預測誤差平方和Bh(PRESSh,h=1,2,…,n):
當回歸模型不穩定時,B的值就會增大,當B達到最小時模型的預測能力最好,則選擇對應的h個主成分擬合方程。
影響飛灰含碳質量分數的因素眾多,本文選取了發電負荷、總煤量、一次風壓、二次風壓、排煙溫度、省煤器出口煙溫、燃盡風風門開度、煙氣含氧體積分數等8個因素(x1~x8)作為輸入變量,利用內蒙某電廠2011年6月的運行數據進行計算,從中選取具有代表性的40組數據作為樣本建立預測模型,15組數據用于模型精度的檢驗。建模數據見表1,檢驗樣本見表2。
經“舍一交叉驗證法”計算的B值見表3。

表1 飛灰含碳質量分數建模數據

表2 飛灰含碳質量分數檢驗數據

表3 舍一交叉驗證表
從表3可以看出:當主成分個數h=3時,B值最小,所以選擇提取3個主成分建立預測模型,得到偏最小二乘回歸模型。回歸方程如下:
(1)標準化變量回歸方程為:

2.3.1 變量投影重要性指標
為了分析自變量與因變量之間的相關性關系,這里使用變量投影重要性指標Dj(VIPj,Variable important in projection)來測度各因素對于因變量影響的大小。其定義式為:

式中:p表示自變量個數;r(Y,th)表示兩個變量的相關系數;whj是軸wh的第j個分量。對于各自變量,如果它們在解釋因變量Y時的作用相同,則所有的Dj均等于1;對于Dj>1的自變量xj,它在解釋Y時就有更加重要的作用。
根據上述偏最小二乘回歸模型,繪制變量投影重要性指標圖(見圖1),從中可以看出各個因素對于因變量的影響程度。

圖1 變量重要性指標投影圖
從圖1可以看出:8個因素中煙氣含氧體積分數對于飛灰含碳質量分數的影響最大,燃盡風風門開度對其影響最小,整體來說各因素的Dj值均接近于1,所以選取的影響因素比較恰當。
2.3.2 數據檢驗與分析
為了分析模型的回歸效果,給出40組建模數據樣本的預測值與實際值對比圖以及相對誤差圖,見圖2與圖3。

圖2 建模數據實際值/預測值對比曲線

圖3 建模數據相對誤差曲線
從圖3可以看出:絕大多數樣本點的預測值相對誤差在3%以內,整體來說回歸模型對于因變量的擬合效果很好。
為了進一步檢驗飛灰含碳質量分數回歸模型的精確有效性,使用15組檢驗數據進行飛灰含碳質量分數的預測,結果見圖4與圖5。

圖4 檢驗數據實際值/預測值對比曲線

圖5 檢驗數據相對誤差曲線
從檢驗樣本的預測結果不難看出,預測值相對誤差依然控制在3%以內,模型預測精確性較高。
電站鍋爐飛灰含碳質量分數的影響因素眾多,各因素間存在較高的相關性,本文使用偏最小二乘法可以很好地克服變量間的多重相關性影響,其計算結果的精確性也很高,模型預測結果可以很好地代替實際測量值。因此,偏最小二乘回歸法適合飛灰含碳質量分數的預測,具有很強的可行性。
[1]樊泉貴 .鍋爐原理[M].北京:中國電力出版社,2004.
[2]王凱.基于遺傳算法-BP神經網絡的飛灰含碳量和NOx的研究[D].北京:華北電力大學,2009.
[3]羅春雷 .基于BP網絡的鍋爐優化燃燒指導系統[J].中國電力,2001,34(10):59-61.
[4]楊國強 .反向建模方法在電站鍋爐飛灰含碳量測量中的應用[D].北京:華北電力大學,2009.
[5]周新剛 .燃煤電站鍋爐飛灰含碳量預測模型研究[D].濟南:山東大學,2006.
[6]陳敏生,劉定平 .基于核主元分析和支持向量機的電站鍋爐飛灰含碳量軟測量建模[J].華北電力大學學報,2006,33(1):72-75,92.
[7]王惠文.偏最小二乘回歸方法及其應用[M].北京:國防工業出版社,1999.