王惠杰, 陳林霄, 李 洋, 孫美琪, 楊新健
(1.華北電力大學 電站設備狀態監測與控制教育部重點實驗室,保定071003;2.廣東惠州天然氣發電有限公司,惠州516082)
熱耗率一直作為研究和衡量電廠熱經濟性的重要指標[1],如今很多電廠都可以對其進行實時監測,但是電廠運行人員對可控邊界參數的調節往往只能依賴于運行經驗和常規技術手冊,難以通過對可控邊界參數優化得到最佳的運行狀態參數[2].由于傳統的計算方法應用的參數眾多,涉及一系列相變和能量轉換等過程,很難定性得出某些參數與重要經濟性指標間的直接關系,往往需要依靠細致的數據挖掘手段[3].文獻[4]闡述了應用支持向量機建立強關聯性參數與熱耗率的回歸模型.由于機組能耗與運行工況、環境條件、機組功率和設備狀態等存在強烈的耦合以及可控邊界參數決定內部參數的特性,可通過調節可控邊界條件來實現針對熱耗率的參數優化.因此,可以選取可控邊界參數建立熱耗率回歸模型,通過可控參數的調節可以更清楚地反映熱耗率的變化,從而得出最佳運行工況.筆者基于υ-SVM建立了可控邊界參數與熱耗率的回歸模型,為進行機組耗差分析和可控邊界參數優化工作開辟了新的途徑.
支持向量機又稱SVM,是Vapnik等人根據統計學習理論中結構風險化最小原則提出的.SVM的基本思想是從線性可分情況下的最優分類超平面(見圖1)發展而來的.機器學習算法的實際風險由經驗風險和置信范圍2部分組成,經驗風險與學習機器的復雜程度(即VC維數h)成反比,而置信范圍與h成正比.因此,只有選擇一個合適的VC維數h,使兩者之和最小才能得到最小的實際風險.將函數集構造成一個函數子集序列,使各子集按照VC維的大小排列,即H1?H2?…?Hn?…,每個Hi的VC維數hi為有限值,于是有h1≤h2≤ …≤hn≤…,兼顧考慮經驗風險和置信范圍,從而取出最小實際風險,這就是結構風險最小化的思想[5-7],其示意圖見圖2.在hx處取得經驗風險和置信范圍的平均最小值,不會出現過學習和欠學習現象,泛化能力很強.

圖1 最優分類超平面示意圖Fig.1 Schematic diagram of optimal separating hyperplane

圖2 結構風險最小化示意圖Fig.2 Schematic diagram of structural risk minimization
考慮應用線性回歸函數[8]:

擬合數據{xi,yi},其中i=1,2,…,l,xi∈Rn,yi∈R,為了使式(1)平坦,解下面的凸優化問題[9]:

滿足約束:

在二次型優化函數的非線性約束條件中引入拉格朗日乘子αi、、ηi和η*i,將線性可分問題轉化為其對偶問題,通過非線性映射Ψ(x)映射到高維特征空間F,在F中求解最優回歸函數.在最優回歸函數中選取合適的核函數K(x,xi)代替高維空間的向量內積Ψ(xi)·Ψ(x),從而實現非線性變換后的線性擬合.此優化問題轉化為[10]

為了在高維特征空間中構造最優分類超平面,只需計算支持向量和特征空間中向量的內積,也就是以核函數的方式來計算.應用核函數的最大好處是將非線性分類平面轉化為高維特征空間里的線性平面來處理[11],如圖3所示.
目前主要應用的核函數有:(1)多項式函數,K(x,xi)=[(x·xi)+1]d,d 代表多項式分類器的階數.(2)徑向基函數(RBF),K(x,xi)=exp{-|xxi|2/σ2},每個基函數的中心對應著一個支持向量,算法 自 動 確 定.(3)Sigmoid 函 數,K(x,xi)=tanh[v(x·xi)+c],該算法自動確定隱層節點數,不存在神經網絡的局部極小點問題.

圖3 輸入空間的非線性分類映射到特征空間的線性分類Fig.3 Mapping from nonlinear classification in input space to linear classification in feature space
基于數據挖掘的火電機組歷史運行數據既包括穩定工況下的運行數據,也包括機組啟停和變負荷時的瞬態數據.考慮到測量手段和精度的影響,采集到的數據中不免存在失真數據.因此,要對采集的歷史數據進行預處理[12].
由于“穩定工況”沒有統一的界定,穩態檢測根據ASME機組性能試驗規程進行,采樣周期為10~15min時,規定各主要參數在穩定工況下的波動范圍如表1所示.

表1 性能試驗規程定義的穩定工況[13]Tab.1 Steady-state range specified in performance test code
在處理采樣數據中有誤差、失真和不完整的數據時,采用模糊粗糙集[13]的方法,具體內容參考文獻[14].
輸入參數的選擇原則是選擇與輸出參數具有強關聯度的參數,而與輸出參數關聯度小的參數應盡可能不選[15].汽輪機組額定工況下熱耗率的計算公式[16]為

式中:qm,0為主蒸汽質量流量,kg/s;h0為主蒸汽焓,kJ/kg;hfw為鍋爐給水焓,kJ/kg;qm,rh為再熱蒸汽管道熱端質量流量,kg/s;hrh為再熱蒸汽熱端焓,kJ/kg;qm,rc為再熱蒸汽管道冷端質量流量,kg/s;hrc為再熱蒸汽冷端焓,kJ/kg;Pcl為發電機輸出功率(即機組功率),kW.
由卡諾循環效率η=1-T2/T1可知,平均吸熱溫度T1降低,平均放熱溫度T2不變,卡諾循環效率降低,熱耗率升高.由此可知,主蒸汽溫度t0和再熱蒸汽溫度t1是影響熱耗率的重要因素.從式(5)也可以看出,h0是直接影響熱耗率的參數之一,又因h0=u0+p0v,其中u0為熱力學能,可推知主蒸汽壓力p0和主蒸汽溫度t0影響熱耗率.再熱減溫水能防止再熱器超溫,但是降低了吸熱段的吸熱量,卡諾循環效率降低,熱耗率升高.提高凝汽器的真空,可以盡可能多地使蒸汽中的熱能轉換為機械能,減少冷源損失,提高循環熱效率.凝汽器真空是關系到汽輪機組安全性和經濟性的重要指標,循環水流量和循環水溫度又是影響凝汽器真空的重要參數,因此循環水溫度和循環水流量是與熱耗率有密切關系的可控邊界參數.從式(5)可知,主蒸汽質量流量和再熱蒸汽質量流量也與熱耗率密切相關,但是由于現有儀器很難準確測量暫且不考慮.
通過以上分析可知,機組功率、主蒸汽壓力、主蒸汽溫度、再熱蒸汽溫度、循環水入口溫度、循環水質量流量和再熱減溫水質量流量等7個參數與熱耗率有直接或間接的強關聯性,因此將這7個參數作為模型的輸入參數,熱耗率作為模型的輸出參數.
以上述輸入參數作為子序列,熱耗率作為母序列建立灰色關聯度模型進行驗證.已知機組負荷與熱耗率具有強關聯性,將其作為子序列進行參照,以增強對比性[17].
灰色關聯度分析的基本原理是對動態過程發展態勢的量化分析,通過對系統內時間序列有關統計數據幾何關系的比較,確定參考數列和若干個比較數列的幾何形狀相似程度來判斷其聯系是否緊密,它反映了曲線間的關聯程度.與參考數列關聯度越大的比較數列,其發展方向和速率與參考數列越接近,與參考數列的關系越緊密.關聯度分析的基本步驟參考文獻[18].計算結果見表2.
從計算結果可以看出,所選參數均與熱耗率具有很強的關聯性,可以作為回歸模型的輸入參數.
在使用SVM進行回歸運算時,只有ε-SVM和υ-SVM兩類算法,取某600MW火電廠680組歷史數據,一半數據為訓練數據,另一半數據為測試數據.其他參數取默認值,求出模型輸出熱耗率的相對誤差,選取相對誤差較小的SVM類型.本文相對誤差定義為

式中:x1為真實值;x2為計算值.
回歸預測結果如表3所示,υ-SVM的相對誤差較小,因此選擇υ-SVM進行回歸運算.

表2 參數關聯度計算數據匯總Tab.2 Calculation results of relevance degree for various parameters

表3 不同類別SVM的回歸預測結果Tab.3 Comparison of regression accuracy between ε-SVM andυ-SVM model
核函數的選取對模型的準確性起著決定性的作用,由于邊界參數與熱耗率之間復雜的非線性關系,很難推算出分布函數,這給核函數的選擇帶來一些困難.分別采用前文提到的3種核函數來建立支持向量回歸模型,比較這些模型輸出熱耗率的回歸精度,其他參數均為默認值,采用擇優選取的方法.不同核函數的SVM回歸結果見表4.

表4 不同核函數的SVM回歸結果Tab.4 SVM regression results with different kernel functions
從表4可以看出,Sigmoid函數不適合作為回歸模型的核函數,多項式函數回歸的相對誤差大于徑向基函數,因此選取徑向基函數作為本次模型的核函數.
在Libsvm平臺上,對于核函數為徑向基函數的υ-SVM,可設定的參數為c和g,如式(2)所示,c值的大小對模型的影響很大,g為核函數中的γ函數設置.參數的選取通過預測的相對誤差決定,測試結果見圖4和圖5.由圖4和圖5可知,當c=87、g=2.7時,回歸相對誤差最小.

圖4 參數c回歸相對誤差Fig.4 Relative error of parameter c regression

圖5 參數g回歸相對誤差Fig.5 Relative error of parameter gregression
通過以上對比分析,在Libsvm工具箱里選取υ-SVM類支持向量機,徑向基函數作為核函數,核函數中的γ取2.8,c值取90,取340組數據為訓練數據建立回歸模型,另外340組數據為測試數據,部分參數見表5.由于數值較大,為避免溢出,在數據應用時都要進行歸一化處理,再對回歸結果進行反歸一化處理.回歸值的相對誤差如圖6所示.

圖6 熱耗率回歸值相對誤差Fig.6 Relative error of heat rate regression
在理論優化原則方面,SVM采用結構最小化原則,而BP神經網絡則采用經驗最小化原則.雖然SVM和BP神經網絡都能夠逼近非線性函數,但是仍有很大不同.陳林霄等[19]建立了BP神經網絡模型,并與υ-SVM模型進行對比,在不同訓練樣本數目的情況下,兩者回歸相對誤差如表6所示.從表6可以看出,BP神經網絡的訓練相對誤差較小,但是測試相對誤差隨著訓練樣本數的減少而逐漸增大;υ-SVM模型的訓練相對誤差和測試相對誤差基本維持穩定,分別保持在0.15%和0.22%左右.通過比較發現SVM具有小樣本學習能力強、高維非線性數據處理性好、泛化能力強的特點.

表5 部分參數列表Tab.5 List of main parameters

表6 υ-SVM模型與BP神經網絡模型回歸相對誤差的比較Tab.6 Comparison of regression relative error betweenυ-SVM and BP neural network model
由式(5)可知,熱耗率是由許多參數共同決定的,每一個參數的變化都將影響計算的精確性.尤其是在主蒸汽質量流量和再熱蒸汽質量流量的測量上存在很大誤差,因此,實時計算出的熱耗率誤差也將很大.在對υ-SVM的魯棒性分析上,采用對輸入參數增加隨機變量的方法,對比熱耗率的變化情況.總共輸入350組數據,對每一組數據里的一個隨機參數附加5%的隨機變量,回歸結果如圖7和圖8所示.

圖8 熱耗率回歸值絕對誤差Fig.8 Absolute error of heat rate regression
在增加了5%隨機變量的情況下,通過式(5)計算所得熱耗率的絕對誤差基本在400kJ/(kW·h)左右.由圖8可以看出,支持向量機模型的回歸值與真實值的絕對誤差基本在50kJ/(kW·h)左右,最大相對誤差也未能超過190kJ/(kW·h),說明參數的小幅波動對回歸模型的影響很小.在實際連續數據的采集下,采用υ-SVM回歸模型是十分有利的.
選取關聯度較強的機組負荷和循環水質量流量做規律性分析,其余各輸入參數取定值,帶入建立好的υ-SVM回歸模型,回歸結果如圖9和圖10所示.
由圖9和圖10可以看出,熱耗率隨著機組負荷和循環水質量流量的增大均為遞減趨勢,符合實際規律.但是局部規律性有些變化,這些變化可能是由于樣本數據中的噪聲和失真數據,也有可能是因為在變化單一參數的過程中,其他參數不符合定值規律造成的.

圖9 機組負荷-熱耗率圖Fig.9 Load vs.heat rate

圖10 循環水質量流量-熱耗率圖Fig.1 0 Circulating water flow vs.heat rate
(1)基于結構風險最小化的支持向量機建立回歸模型時,泛化能力優于BP神經網絡,尤其是在小樣本情況下,效果更加突出.
(2)υ-SVM模型只應用了包括熱耗率在內的7個參數,與傳統計算模型相比,大大降低了對已知參數的要求.
(3)在輸入參數增加5%隨機變量的情況下,υ-SVM模型的輸出值保持穩定,具有很好的魯棒性.在測試連續實際數據的情況下,相對于傳統的熱耗率計算模型具有明顯的優勢.
(4)υ-SVM模型的整體規律性較強,符合實際規律,但是局部規律性較差,主要與樣本數據(噪聲、失真等)有關或者是因為在變化單一參數的過程中,其他參數不符合定值規律.
[1]鄭體寬.熱力發電廠[M].北京:中國電力出版社,2008.
[2]張春發,王惠杰,宋之平,等.火電廠單元機組最優運行初壓的定量研究[J].中國電機工程學報,2006,26(4):36-40.ZHANG Chunfa,WANG Huijie,SONG Zhiping,et al.Quantitative research of optimal initial operation pressure for the coal-fired power unit plant[J].Proceedings of the CSEE,2006,26(4):36-40.
[3]王寧玲.基于數據挖掘的大型燃煤發電機組節能診斷優化理論與方法研究[D].北京:華北電力大學,2011.
[4]王雷,張欣剛,王洪躍,等.基于支持向量回歸算法的汽輪機熱耗率模型[J].動力工程,2007,27(1):19-23.WANG Lei,ZHANG Xingang,WANG Hongyue,et al.Model for the turbine heat rate based on the support vector regression[J].Journal of Power Engineering,2007,27(1):19-23.
[5]VAPNIK V.統計學習理論的本質[M].張學工,譯.北京:清華大學出版社,2000.
[6]沈曙光,王廣軍,陳紅,等.最小支持向量機在系統逆動力學辨識與控制中的應用[J].中國電機工程學報,2008,28(5):85-89.SHEN Shuguang,WANG Guangjun,CHEN Hong,et al.Application of RLS-SVM in identification and control for inverse dynamics of system[J].Proceedings of the CSEE,2008,28(5):85-89.
[7]MARC G.Classes of kernels for machine learning:a statistics perspective[J].The Journal of Machine Learning Research,2002,2:299-312.
[8]鄧乃揚,田英杰.數據挖掘中的新方法——支持向量機[M].北京:科學出版社,2004.
[9]王春林,周昊,周樟華,等.基于支持向量機的大型電廠鍋爐飛灰含碳量建模[J].中國電機工程學報,2005,25(20):72-76.WANG Chunlin,ZHOU Hao,ZHOU Zhanghua,et al.Support vector machine modeling on the unburned carbon in fly ash[J].Proceedings of the CSEE,2005,25(20):72-76.
[10]CRISTIANINI N,SHAWE-TAYLOR J.支持向量機導論[M].李國正,王猛,曾華軍,譯.北京:電子工業出版社,2004.
[11]SCHOLKOPF B,MIKA S,BURGES C J C,et al.Input space versus feature space in kernel-based methods[J].IEEE Transactions on Neural Networks,1999,10(5):1000-1017.
[12]李蔚,仁浩仁,盛德仁,等.300MW火電機組在線能耗分析系統的研制[J].中國電機工程學報,2002,22(11):85-89.LI Wei,REN Haoren,SHENG Deren,et al.Developing a software for analyzing on-line the energy-loss for 300MW unit[J].Proceedings of the CSEE,2002,22(11):85-89.
[13]中華人民共和國機械電子工業部.GB 10184—1988電站鍋爐性能試驗規程[S].北京:國家技術監督局,1989.
[14]TSANG Eric,ZHAO S Y.Decision table reduction in KDD:fuzzy rough approach[J].Transactions on Rough Sets XI,2010,5946:177-188.
[15]王惠杰,張春發,宋之平,等.火電機組運行參數能耗敏感性分析[J].中國電機工程學報,2008,28(29):6-10.WANG Huijie,ZHANG Chunfa,SONG Zhiping,et al.Sensitive analysis of energy consumption of operating parameters for coal-fired unit[J].Proceedings of the CSEE,2008,28(29):6-10.
[16]沈士一,莊賀慶,康松,等.汽輪機原理[M].北京:中國電力出版社,1992.
[17]郭江龍 ,張樹芳,姚力強,等.汽輪機性能預測BP神經網絡輸入層神經元篩選方法[J].汽輪機技術,2010,52(2):147-149.GUO Jianglong,ZHANG Shufang,YAO Liqiang,et al.A method for screening input nodes in BP artificial neural network on performance forecasting of steam turbine[J].Turbine Technology,2010,52(2):147-149.
[18]劉思峰.灰色系統理論及其應用[M].3版.北京:科學出版社,2004.
[19]陳林霄,王惠杰,楊新健.基于改進型BP神經網絡的火電機組初壓優化[J].節能,2013,32(11):53-56.CHEN Linxiao,WANG Huijie,YANG Xinjian.Initial pressure to optimize BP neural network based on improved thermal power[J].Energy Conservation,2013,32(11):53-56.