王真,魏琳,金秀章
(1.華電電力科學研究院山東分院,濟南250000;2.華北電力大學控制與計算機工程學院,河北保定071003)
基于改進的KPCA和LSSVM飛灰含碳量的軟測量建模
王真1,魏琳2,金秀章2
(1.華電電力科學研究院山東分院,濟南250000;2.華北電力大學控制與計算機工程學院,河北保定071003)
以華能嘉祥電廠330 MW機組為例,針對火電廠飛灰含碳量影響因素的非線性和耦合性的問題,提出一種優化樣本的KPCA(核主元分析)方法,利用加權相似度優化樣本,再對其進行核主元分析,建立基于加權相似度的KPCA和LSSVM(最小二乘支持向量機)的爐膛溫度軟測量模型。現場實測數據表明,運用該軟測量模型監測效果良好,不僅避免了在測量裝置損壞時影響生產的弊端,滿足飛灰含碳量實時測量要求,還為提高鍋爐運行效率提供了依據。
飛灰含碳量;加權相似度;核主元分析;最小二乘支持向量機;軟測量
飛灰含碳量是燃煤鍋爐主要經濟指標之一,對鍋爐的運行效率有一定的影響。然而由于人為因素和目前工業水平等條件的制約,存在時間滯后性及測量結果代表性較低等問題,不能及時、有效地指導鍋爐運行,提高鍋爐燃燒效率。閆維平等采用間接估算方法即采用二維列表差值計算模型并結合氧量、負荷、煤種等信息對飛灰含碳量進行估計[1],不僅存在過多的假設條件,而且火電廠鍋爐內在的燃燒過程非常復雜,其模型是非線性函數關系,即影響火電廠鍋爐飛灰含碳量的因素復雜且有耦合性和非線性,故用機理定量分析有一定的局限性。
現場通常安裝微波測碳裝置對飛灰含碳量進行實時測量,但運行一段時間后,由于煙氣的沖刷該裝置極易磨損甚至有可能發生堵塞現象以致裝置損壞。采用軟測量技術建立飛灰含碳量軟測量是解決以上問題的有效途徑之一。其關鍵就是利用易于測量的變量將工藝過程中難以直接獲取的變量通過模型推理預測出來。用飛灰含碳量軟測量模型代替出現故障失效的硬件測量裝置投入現場,對飛灰含碳量進行軟監測,給操作人員提供參考依據。采用基于改進核主元分析和最小二乘支持向量機結合的方法進行飛灰含碳量預測。
1.1核主元分析
主成分分析(Principal Components Analysis)的核心是將具有一定相關性的多變量轉化成少數相互獨立的變量指標,是一種線性的特征提取方法,對于提取非線性特征具有一定的局限性。故Sch lkopf等[2]提出了主元分析的非線性推廣——核主元分析(Kernel Principal Components Analysis,KPCA)。基本思想是將樣本數據通過非線性映射變換到特征空間,再在高維空間上進行主成分分析,獲得非線性特征。非線性映射不易獲取,故引入核函數來完成從原始數據到高維特征空間的非線性映射,進而轉化為求核矩陣的特征向量和特征值,輸入數據在特征向量上的投影轉化為求核函數的線性組合,這大大簡化了計算[3]。KPCA具體算法步驟見文獻[4]。KPCA能夠更好地處理樣本數據的高階信息,故其在特征提取上更有優勢,而PCA只能處理樣本的二階協方差矩陣[5]。
1.2最小二乘支持向量機
Vapnik在1963年提出支持向量機理論,其采用了結構風險最小化原則和核函數技術,標準SVM算法設計復雜度與訓練樣本個數有關,當樣本數目過大時,求解相應的二次規劃問題就變得復雜,計算速度也會相應變慢[6]。
1999年Suykens提出最小二乘支持向量機(LSSVM)算法,其作為標準SVM的發展,可以解決此類問題,將SVM中的不等式約束改為等式約束條件,與標準SVM的主要區別在于損失函數和等式約束
上[7]。
設有n個樣本(x1,y1),(x2,y2),…,(xn,yn),xi∈R,表示輸入數據;yi∈R,表示輸出數據,其中,i=1,2,…,n。
SVM模型就是采用非線性映射把訓練數據映射到高維空間,通過引用核函數K(xi,x),避免了數據的高維數帶來的計算復雜性。將帶有高維核函數的回歸問題表示為

式中:b為偏置值,ω為權向量,n為樣本個數,其目標函數為

式中:ξ=(ξ1,ξ2,…,ξn)T為松弛變量,c為正則化參數,ε為不敏感系數。
LSSVM在優化目標中的損失函數為誤差ξi的二次項。故優化問題可以描述為求解下面問題:

核主元分析在解決非線性及高維的數據處理方面具有一定優勢,但是對于處理大量數據具有一定的局限性,耗時甚至在提取主成分時會增加誤差率。文獻[8]提出一種基于特征子空間的KPCA,雖在特征空間上構建具有較小維數的正交基來簡化核矩陣,減小運算復雜度。但每個樣本均參與核矩陣運算,并不斷計算其行列式,在一定程度上增加了運算復雜度。文獻[9]提出相似度的概念,通過數據間的相似度值來優化樣本數據。但是現場經常會出現高維空間存在非常相似的數據,它們在大多數維度上的值非常相近,只是在小數維上相差很大,此時就會存在干擾。
為解決該問題,提出基于加權相似度的核主元分析,即在每組相似度函數分別乘以其權重因子。下面詳細介紹該方法。
關于相似度的基本計算方法都是基于向量的,即計算兩個向量的距離,距離越小相似度越大。常用的算法有皮爾遜相關系數、歐幾里德距離、Cosine相似度、Spearman秩相關系數等。一般計算樣本數據的相似度采用的公式為:

式中:δ為相似度函數的歸一化參數;xi、xj∈R,其中,i,j=1,2,…,n,n為樣本個數;Rij為第i組數據與第j組數據的相似程度。樣本優化標準如下:

以減小處理誤差為原則,根據現場數據由經驗一般選取歸一化參數δ為

式中:i=1,2,…,m為樣本特征數。
本文采用的加權相似度函數為:

式中:ωi∈(0,1),ωi越接近1,說明第i組數據包含的信息越多,在樣本中貢獻越大。綜上,利用基于加權相似度的核主元分析進行主成分提取,即先利用加權相似度剔除相似度高的的樣本,再對簡化的樣本數據利用核主元分析進行主成分提取,既避免了
由于相似數據造成的誤判斷,又縮短了分析時間。
核主元分析具有能夠處理高維的、非線性的特點,而LSSVM簡化了SVM的計算復雜度,將兩者的優勢結合形成軟測量建模在工業建模問題上具有一定的意義。建模的基本思想是先利用基于相似度的核主元分析對樣本輸入數據進行特征提取,得到相互獨立的主成分,再利用最小二乘法支持向量機對數據壓縮、特征信息提取后的主元進行訓練和測試,得到軟測量模型。具體流程如圖1。

圖1 飛灰含碳量軟測量建模流程
以華能嘉祥330 MW機組為例,該廠2號鍋爐采用上海鍋爐廠的SG1036/17.50-M882鍋爐,亞臨界、一次中間再熱、單爐膛、平衡通風、汽包型燃煤鍋爐。采用直吹式制粉方式和改造的低氮燃燒器。爐膛前、后墻寬度為14.12 m,左、右墻寬度為12.72 m。根據機理定性分析,影響電廠飛灰含碳量的主要因素有:機組實發功率、煤質(低位發熱量、水分、揮發分等)、4臺給煤機的給煤量、各二次風門(SOFA、消旋風、周界風等)的擋板開度、爐膛與風箱差壓、爐膛出口氧量及影響一次風速的一次差壓等。
采用DCS現場采集的3個不同工況(300 MW、270 MW、240 MW)下的600組數據,作為訓練樣本和測試樣本。抽取180個樣本作為測試樣本,由于現場存在噪聲干擾和量綱不一致等現象,故要進行對現場數據先進行3σ法去除異常值,多值一平均進行線性平滑性處理,歸一化處理等。
在進行主成分提取時,閾值ε根據經驗一般取0.96~0.99之間,根據窮舉法當均方誤差MSE最小時,ε最合適,本文選取ε=0.97,此時MSE=6.116 9×10-4。選高斯徑向基核函數,σ為核函數寬度)作為軟測量模型的核函數。
為了說明提出算法的合理性,分別利用核主元分析(KPCA)、相似度的核主元分析、基于加權相似度的核主元分析進一步驗證。
基于KPCA和最小二乘支持向量機的飛灰含碳量軟測量仿真結果如圖2、圖3所示。

圖2 基于KPCA的真實值與預測值趨勢

圖3 基于KPCA的絕對誤差
基于相似度的KPCA和最小二乘支持向量機的飛灰含碳量軟測量仿真結果如圖4、圖5。

圖4 基于相似度的KPCA趨勢

圖5 基于相似度的KPCA的絕對誤差
基于加權相似度的核主元分析和最小二乘支持向量機的飛灰含碳量軟測量仿真結果如圖6、圖7。

圖6 加權相似度的KPCA預測趨勢

圖7 加權相似度的KPCA的絕對誤差
從飛灰含碳量的真實值與預測值趨勢圖2、圖4、圖6可知,3種不同的建模方法中,基于加權相似度的核主元分析和最小二乘支持向量機的模型擬合效果更好一些。基于加權相似度的核主元分析的模型絕對誤差相對集中一些,不存在偏離很大的現象且其相對誤差主要集中在(-0.01,0.02)間,而前兩種的相對誤差主要集中在(-0.02,0.03)間。3種方法的均方誤差、絕對誤差、平均相對誤差見表1。
綜上,基于加權相似度的核主元分析的最小二乘支持向量機建模的泛化誤差均小于其他兩種建模方法,而且運算時間相對短一些。該使用核主元分析的軟測量方法具有更好的泛化能力,預測效果更好,是一種有效的建模工具。

表1 基于KPCA、相似度KPCA和加權相似度的LSSVM誤差比較
采用基于加權相似度的核主參考文獻
元分析和最小二乘支持向量機結合,對燃煤鍋爐的飛灰含碳量進行軟測量預測,通過電廠現場數據進行仿真,結果表明改進的核主元分析和LSSVM的預測模型具有更強的學習能力和泛化能力,而且運算速度相對快,為火電廠中飛灰含碳量的實時監測控制提供了參考依據,對提高鍋爐的效率有一定的作用。關于由窮舉法得到的閾值需進一步研究,以便得到更精確的軟測量模型。
[1]閻維平,梁秀俊,陳寶康.基于在線檢測數據的電站鍋爐效率實時計算方法的研究[J].熱能動力工程,2001,16(2):77-78.
[2]B Sch?lkopf,A Smola,K R Müller.Nonlinear component analysis as a kernel eigenvalue problem[J].Neural Computation(S0899-7667),1998,10(5):1 299-1 319.
[3]鄭小霞,錢鋒.基于PCA和最小二乘支持向量機的軟測量建模[J].系統仿真學報,2006,18(3):217-219.
[4]Lee J M,Yoo C,Choi S W,et al.Non-linear process monitoring using kernel principal component analysis.Chemical Engineering Science,2004,59(1):223-224.
[5]L J Cao,K S Chua,W K Chong,et al.A comparison of PCA,KPCA and ICA for dimensionality reduction in support vector machine[J].NeuroComputing(S0925-2312),2003,55(1):321-336.
[6]Vapnik V.The Nature of Statistical Learning Theory[M].New York:Springer Verlag,1995:181-197.
[7]Suykens J A K,Van Gestel T,Jos De Brabanter.Least Squares Support Vector Machines[M].World Scientific Press,2002.
[8]付克昌,吳鐵軍.基于特征子空間的KPCA及其在故障檢測與診斷中的應用[J].化工學報,2006,57(11):145-150.
[9]張傳標,倪建軍,劉明華,等.樣本優化核主元分析及其在水質監測中的應用[J].中國環境監測,2012,28(2):92-93.
Soft Measurement Model of Unburned Carbon in Fly Ash Based on Improved KPCA and LSSVM
WANG Zhen1,WEI Lin2,JIN Xiuzhang2
(1.Shandong Branch of Huadian Electric Power Research Institute,Jinan 250000,China;2.School of Control and Computer Engineering of North China Electric Power University,Baoding 071003,China)
Taking the 330 MW unit of Huaneng Jiaxiang power plant as an example,the KPCA(kernel principal component analysis)method is proposed to analyze impacting factors on the carbon content of the fly ash in the power plant.The KPCA and LSSVM(least square support vector machine)are used to establish the model of the furnace temperature.Field test data show that the use of the soft measurement model is of considerable result,which helps to avoid the negative affect to the production when any damage occurred to the measuring devices and meets the requirements of real-time measurement of carbon content in fly ash.More over,it also helps to improve the efficiency of the boiler.
carbon content of fly ash;weighted similarity;kernerl principal component analysis;least squares support vector machine;soft measurement
TP274;TK229
A
1007-9904(2015)10-0040-04
王真(1978),女,工程師,主要研究領域為電廠、化工DCS控制及優化;
金秀章(1969),男,博士,副教授,主要從事先進控制策略在大型電力機組控制研究;
魏琳(1990),女,碩士研究生,主要研究領域為先進控制理論與智能算法。