黃昕宇,張棟良,李帥位
?
基于改進模糊支持向量機的汽輪機熱耗率預測模型
黃昕宇,張棟良,李帥位
(上海電力學院自動化工程學院,上海 200090)
針對現有方法難以準確預測具有復雜非線性特征的汽輪機熱耗率問題,本文提出一種改進模糊支持向量機(FSVM)的汽輪機熱耗率預測模型。首先采用間隔統計算法計算熱耗率數據最佳聚類個數,防止出現聚類數目的不確定性,然后利用模糊C均值聚類(KFCM)算法將熱耗率數據劃分,生成聚類子樣本,將聚類子樣本代入經粒子群算法優化的FSVM中,建立基于FSVM的汽輪機熱耗率預測模型。將現場采集的某超超臨界660 MW機組汽輪機熱耗率數據輸入模型進行預測,并與傳統支持向量機的預測結果進行比較。結果表明,改進的FSVM方法具有更高的預測精度和更強的泛化能力。
汽輪機;熱耗率;聚類算法;模糊支持向量機;預測模型;間隔統計
汽輪機熱耗率是火電廠技術經濟重要指標。為了更好地對機組經濟性以及運行參數進行分析和優化,精確預測熱耗率數值十分必要[1-3]。
支持向量機(SVM)克服了以往預測算法訓練時間長、預測結果存在不確定性等問題,在多年的研究和發展后,SVM已經在預測診斷領域有了一定的應用基礎[4-6]。但是,應用SVM建立熱耗率預測模型還存在一些亟待優化之處。首先,影響汽輪機熱耗率的因素較多,而且各個影響因素與熱耗率之間存在復雜非線性聯系,導致部分數據樣本和最優超平面的距離較遠,干擾模型的預測精度;其次,SVM的參數選擇也會干擾預測的結果。
針對以上問題,Lin Chunfu等[7-8]提出了模糊支持向量機(FSVM)算法。該算法通過給不同的樣本加上相應的模糊隸屬度值,進而反映不同樣本的重要程度。但是,該算法中沒有明確定義模糊隸屬度值的計算方法,而且對影響FSVM算法結果的參數未進行優化。張戰成等[9]研究了一種提高SVM預測精度的算法,該算法通過訓練SVM并對支持向量集使用模糊C均值聚類(FCM)算法,將獲得的聚類中心當作新的支持向量來優化模型。不過FCM算法本身也有不足之處,聚類個數的選擇在很大程度上會干擾聚類的效果。
基于上述研究,本文采用改進模糊支持向量機(FSVM)算法對汽輪機熱耗率進行預測分析。首先通過間隔統計(gap statistic)算法計算最佳聚類個數,并將其代入核模糊C均值聚類(KFCM)算法中,對熱耗率進行分類,生成聚類子樣本,并求取模糊隸屬度值μ;其次,根據不同的聚類樣本分別建立模糊支持向量機(FSVM),對熱耗率樣本進行預測分析,同時,應用粒子群算法(PSO)解決FSVM的參數優化問題;最后,建立某超超臨界660 MW機組汽輪機熱耗率預測模型,將本文提出的算法與傳統支持向量機和經過粒子群算法優化的支持向量機方法進行仿真比較。結果表明本文所提出的算法具有更高的預測準確率和泛化能力。
在現有的聚類算法中,聚類數在很多情況下難以確定。聚類數不同,聚類結果也可能產生變化。確定樣本集的最優聚類數是聚類算法中一個很困難的問題。
為了計算出最優聚類數,得到更好的聚類結果,本文采用間隔統計算法首先對數據進行分析,以計算出最優聚類個數。
間隔統計算法的計算方法可以分為以下3步。
步驟1 將故障數據分為類,1,2,3, …,,表示數據點屬于類,計算W,

式中:n表示屬于類的數據的個數,表示第類中任兩點的距離和,W表示類離差程度的總和。
步驟2 生成個參考數據集,并計算每個參考數據集的離差程度總和W*,1, 2, …,,=1, 2, …,,計算Gap值,

步驟3 計算出滿足式(3)的最小值,以此值作為最優聚類數,




KFCM算法是通過隸屬度確定每個數據點屬于某個類的程度,從而劃分數據點類別[10-11]。假設特征空間中的輸入樣本定義為

式中x∈R。
采用高斯核函數把映射至特征空間中展開聚類。高斯核函數定義為

式中為核帶寬。
KFCM算法的目標函數表達式為

式中:2(x,v)=(x,?x)-2(x,?v)+(,?v),表示x到v的距離,v為第個聚類中心;(0≤≤1)為模糊指數;μ為第個樣本屬于第類的隸屬度。
滿足如下約束條件:

以式(9)為約束條件,使用Lagrange法求解m,計算出隸屬度μ以及聚類中心的表達式:


KFCM的詳細計算過程如下。
步驟1 初始化聚類的個數,的值為間隔統計算法計算出的最佳聚類數,模糊參數的范圍為0≤≤1,確定終止參數。
步驟2 根據式(10)計算模糊隸屬度μ。
步驟3 由式(11)更新聚類中心矩陣。
步驟4 重復步驟2和3的優化過程,直到滿足設定的終止條件:max{x|μ–μ|}<。結束后得出個聚類中心以及模糊隸屬度μ。
FSVM算法可以有效克服SVM在復雜非線性樣本預測過程中存在的過擬合問題,FSVM算法利用模糊隸屬度函數來模糊化輸入的樣本,對于重要程度不同的樣本賦予不同的隸屬度值[12-14]。假設每個樣本的隸屬度值為,則模糊化的輸入樣本為={(1,1,1), (2,2,2), …, (x,y,μ)},其中x∈R,y∈,≤≤1(=1, 2, …,),其中為足夠小的正數,μ表示x在樣本中的重要程度。將求解FSVM最優超平面問題轉換為如下的規劃問題:

該規劃問題的約束函數為:

式中:為分離超平面的向量,為經驗風險系數,和均為松弛變量,為常數。隸屬度值越小,其對應的樣本點x對上述規劃問題的目標函數所起的作用就越小。為求解該規劃問題,構造拉格朗日函數




在式(15)中,(x,)為核函數,本文選取徑向基(RBF)核函數,其表達式為

式中為核帶寬。
在FSVM模型中,需要優化的主要參數包括核帶寬參數以及經驗風險系數。其中是用來權衡損失和置信范圍之間的權重,參數則可以反映訓練樣本的特征[15-16]。這2個參數對模型的分類精度會產生較明顯的影響,傳統FSVM算法采用交叉驗證的方法對參數進行優化,該方法尋優時間較長,本文采取PSO來優化FSVM中的參數[17]。通過計算這2個參數的最優值,提高模型的診斷效率。PSO尋優的具體步驟如下。
步驟1 設置粒子群的慣性權重、學習因子、迭代次數以及種群規模,確定需要優化的2個參數的極值以及迭代速度的范圍。
步驟2 定義適應度函數,本文采取基于倍交叉驗證的方法來確定適應度值,

式中:l為第個驗證集合中樣本的數量,l,T為第個驗證集中預測正確的樣本數量,首先將訓練集隨機置換,然后將其分為個集合,在第次迭代后,將第個集合(稱為驗證集合)的訓練成果用來訓練其他–1個集合(稱為訓練集合),從而計算樣本的適應度值。
步驟3 對粒子進行速度和位置更新,比較更新粒子的個體最優適應度值和群體最優適應度值。
步驟4 確定是否達到終止條件,滿足則結束運算輸出最優解,否則返回步驟3。
基于核模糊C均值及粒子群算法優化參數的模糊支持向量機對汽輪機熱耗率進行預測的的具體步驟如圖1所示。
1)初始化聚類參數,其值是通過間隔統計算法計算出的最佳聚類個數;
2)采取KFCM算法對樣本進行聚類劃分,按照式(10)—式(11)更新模糊隸屬度以及聚類中心,直到滿足條件后,生成模糊聚類子樣本;
3)對于每一種經過聚類后熱耗率子樣本分別建立經PSO優化相關參數的FSVM預測模型;
4)將各個子模型進行疊加,建立最終的預測模型;
5)將測試樣本輸入預測模型中檢驗模型精度。

圖1 改進的FSVM預測模型算法流程
根據某火電廠超超臨界660 MW汽輪機組(N660-25/600/600)的數據建立熱耗率模型,其中數據樣本每個月隨機選擇7天采集,每天在DCS數據庫中采集5組數據,共采集6個月,一共得到210組數據,基本包含機組運行的各種工況。表1為部分熱耗率數據。把其中160組樣本作為訓練集,其余50組樣本作為測試集。
汽輪機熱耗率的計算表達式為

式中:r為熱耗率,kJ/(kW·h);e為發電機端功 率,MW;b為汽輪機背壓,kPa;(ms,ms,ms)、(crh,crh,crh)、(hrh,hrh,hrh)、(ffw,ffw,ffw)、(rhs,rhs,rhs)分別為主蒸汽、冷再熱蒸汽、熱再熱蒸汽、最終給水、再熱減溫水的流量(t/h)、溫度(℃)、壓力(MPa)。各加熱器端差τ也會影響汽輪機熱耗率,本文選擇在數據采集現場中出水溫度最高的高壓加熱器給水端差作為輸入變量,代入汽輪機熱耗率的計量中。
機組運行參數中主蒸汽流量和再熱蒸汽流量需要計算得到。本文數據來源的火電廠主蒸汽流量的計量過程是通過在除氧器入口管道上安裝節流孔板測量凝結水流量,計量凝結水至除氧器的凝結水流量,然后計算各個高壓加熱器進汽流量及除氧器進汽流量,最終計算出主給水流量以及主蒸汽流量。
冷再熱蒸汽流量一般通過熱平衡方法計算出高壓加熱器的抽汽流量,再根據式(19)計算得出,

式中,e為抽汽流量,la為高壓缸前軸封漏汽總量,va為高壓缸后軸封漏汽總量。熱再熱蒸汽流量的計算公式為

通過間隔統計算法確定最佳聚類數,根據 式(3)—式(5)尋找,得到的Gap值如圖2所示。由圖2可知最佳聚類數為5。

圖2 Gap值與聚類數曲線
表1 某超超臨界660 MW 機組熱耗率數據樣本

Tab.1 The heat rate data of an ultra-supercritical 660 MW unit
圖3為目標函數的曲線,在迭代30次后,趨于穩定,記錄所生成的聚類子樣本。熱耗率數據在聚類算法下分為7 450.6、7 800.2、8 020.5、 7 695.0、7 536.4 kJ/(kW·h)這5類。

圖3 目標函數J的曲線
為了更好地驗證改進FSVM算法在汽輪機熱耗率預測模型上的優化程度,分別采用SVM、經PSO優化參數的SVM和本文提出的改進FSVM進行仿真對比,圖4為采用改進FSVM方法預測結果,圖5為3種預測模型對測試樣本的誤差曲線。
從圖4和圖5可以看出,改進FSVM預測模型預測精度更佳,與其他2種預測方法相比,預測誤差更小,預測誤差的波動性小,說明本文提出的預測模型能更準確地預測汽輪機熱耗率。
為了更準確地表示預測精度,采取以下4種預測性能指標對結果進行對比,不同預測模型在訓練集和測試集的誤差對比分別見表2和表3,各項指標定義如下:
1)平均相對百分比誤差MAPE
式中x為對熱耗率數據預測分析后得到的數值。
3)最大絕對偏差MAD
4)最大絕對誤差max
表2 不同預測模型在訓練集的誤差對比

Tab.2 The errors of different prediction models for training sets
表3 不同預測模型在測試集的誤差對比

Tab.3 The errors of different prediction models for test set
由表2可見,針對訓練集,KFCM-PSO- FSVM預測模型的4項預測指標比其他2種預測模型都低,因此,KFCM-PSO-FSVM預測模型在擬合精度上更佳。由表3可見,在測試集中,經過聚類算法優化預測模型后,4項預測誤差的指標相比其他2種預測模型明顯降低,尤其是MAD僅為0.232 0。對比表2和表3可見,KFCM-PSO-FSVM預測模型中的各項數據指標沒有明顯增大,這說明對測試集而言,KFCM-PSO-FSVM預測模型有更好的泛化能力和預測精度。綜上所述,本文提出的改進FSVM預測模型在預測精度及預測效果上更好,綜合性能更佳。
本文在傳統支持向量機的基礎上,提出了基于核模糊C均值聚類算法和粒子群優化算法的模糊支持向量機算法,建立了該算法針對汽輪機熱耗率的預測模型。該算法中FSVM作為預測模型,其核函數選擇RBF核函數;采用KFCM算法確定FSVM訓練樣本的模糊隸屬度值;采用間隔統計算法計算KFCM中的最佳聚類個數;采用PSO算法優化FSVM的2個重要參數以及。以某超超臨界660 MW機組汽輪機熱耗率為對象進行預測仿真,結果表明本文提出的算法能夠更好地對復雜的汽輪機熱耗率進行預測,預測效果更佳,泛化能力更強,對熱耗率預測研究提供了一種新的思路。
[1] 王惠杰, 范志愿, 許小剛. 基于FOA-LSSVM的汽輪機熱耗率預測模型研究[J]. 熱力發電, 2017, 46(5): 36-42. WANG Huijie, FAN Zhiyuan, XU Xiaogang. Research on prediction model of heat consumption rate of steam turbine based on FOA-LSSVM[J]. Thermal Power Generation, 2017, 46(5): 36-41.
[2] 翟兆銀, 王際洲, 李建蘭, 等. 基于功率的汽輪機組實時熱耗率計算方法[J]. 熱力發電, 2015, 44(10): 15-19. ZHAI Zhaoyin, WANG Jizhou, LI Jianlan, et al. A real-time monitoring model for heat consumption rate of steam turbine unit based on unit power[J]. Thermal Power Generation, 2015, 44(10): 15-19.
[3] 牛培峰, 吳志良, 馬云鵬, 等. 基于鯨魚優化算法的汽輪機熱耗率模型預測[J]. 化工學報, 2017, 68(3): 1049-1057.NIU Peifeng, WU Zhiliang, MA Yunpeng, et al. Prediction of steam turbine heat consumption rate based on whale optimization algorithm[J]. CIESC Journal, 2017, 68(3): 1049-1057.
[4] 韓中合, 劉明浩. 基于支持向量機的汽輪機振動故障診斷系統[J]. 汽輪機技術, 2013, 55(2): 127-130. HAN Zhonghe, LIU Minghao. Vibration fault diagnosis of steam turbine based on SVM[J]. Turbine Technology, 2013, 55(2): 127-130.
[5] 吳廣寧, 袁海滿, 宋臻杰, 等. 基于粗糙集與多類支持向量機的電力變壓器故障診斷[J]. 高電壓技術, 2017(11): 3668-3674. WU Guangning, YUAN Haiman, SONG Zhenjie, et al. Fault diagnosis for power transformer based on rough set and multi-class support vector machine[J]. High Voltage Engineering, 2017(11): 3668-3674.
[6] 李燕青, 袁燕舞, 郭通. 基于AMD-ICSA-SVM的超短期風電功率組合預測[J]. 電力系統保護與控制, 2017, 45(14): 113-120. LI Yanqing, YUAN Yanwu, GUO Tong. Combination ultra-short-term prediction of wind power based on AMD-ICSA-SVM[J]. Power System Protection and Control, 2017, 45(14): 113-120.
[7] LIN C F, WANG S D. Fuzzy support vector machines[J]. IEEE Transactions on Neural Networks, 2002, 13(2): 464-471.
[8] 趙克楠, 李雷, 鄧楠. 一種構造模糊隸屬度的新方法[J]. 計算機技術與發展, 2012, 22(8): 75-77. ZHAO Kenan, LI Lei, DENG Nan. A new method to construct fuzzy membership[J]. Computer Technology and Development, 2012, 22(8): 75-77.
[9] 張戰成, 王士同, 鄧趙紅, 等. 一種支持向量機的快速分類算法[J]. 控制與決策, 2012, 27(3): 459-463. ZHANG Zhancheng, WANG Shitong, DENG Zhaohong, et al. A fast decision algorithm of support vector machine[J]. Control and Decision, 2012, 27(3): 459-463.
[10] 李狀, 柳亦兵, 滕偉, 等. 基于粒子群優化KFCM的風電齒輪箱故障診斷[J]. 振動、測試與診斷, 2017, 37(3): 484-488. LI Zhuang, LIU Yibing, TENG Wei, et al. Fault diagnosis of wind turbine gearbox based on KFCM optimized by particle swarm optimization[J]. Journal of Vibration, Measurement & Diagnosis, 2017, 37(3): 484-488.
[11] 朱曉東, 倪秋華. 基于模糊聚類的支持向量機在振動故障診斷中的運用[J]. 汽輪機技術, 2013, 55(3): 232-234. ZHU Xiaodong, NI Qiuhua. Application of support vector machines based on the fuzzy clustering for fault diagnosis[J]. Turbine Technology, 2013, 55(3): 232-234.
[12] 牛培峰, 劉超, 李國強, 等. 基于雙層聚類與GSA-LSSVM的汽輪機熱耗率多模型預測[J]. 電機與控制學報, 2016, 20(3): 90-95. NIU Peifeng, LIU Chao, LI Guoqiang, et al. Multi-model for turbine heat rate forecasting based on double layer clustering algorithm and GSA-LSSVM[J]. Electric Machines and Control, 2016, 20(3): 90-95.
[13] 李小輝, 朱莉, 吳堅. 基于模糊支持向量機的毫米波輻射計目標識別[J]. 微波學報, 2017, 33(增刊1): 203-206. LI Xiaohui, ZHU Li, WU Jian. Target identification of millimeter wave radiometer based on fuzzy support vector machines[J]. Journal of Microwaves, 2017, 33(Suppl.1): 203-206.
[14] HANG J, ZHANG J Z, CHENG M. Application of multi-class fuzzy support vector machine classifier for fault diagnosis of wind turbine[J]. Fuzzy Sets & Systems, 2016, 297(C): 128-140.
[15] DOU D, ZHOU S. Comparison of four direct classification methods for intelligent fault diagnosis of rotating machinery[J]. Applied Soft Computing, 2016, 46: 459-468.
[16] XU H, CHEN G. An intelligent fault identification method of rolling bearings based on LSSVM optimized by improved PSO[J]. Mechanical Systems & Signal Processing, 2013, 35(1/2): 167-175.
[17] 葉小嶺, 顧榮, 鄧華, 等. 基于WRF模式和PSO-LSSVM的風電場短期風速訂正[J]. 電力系統保護與控制, 2017, 45(22): 48-54. YE Xiaoling, GU Rong, DENG Hua, et al. Modification technology research of short-term wind speed in wind farm based on WRF model and PSO-LSSVM method[J]. Power System Protection and Control, 2017, 45(22): 48-54.
Prediction model of steam turbine heat consumption based on improved fuzzy support vector machine
HUANG Xinyu, ZHANG Dongliang, LI Shuaiwei
(School of Automation Engineering, Shanghai University of Electric Power, Shanghai 200090, China)
To the problem that the existing methods are difficult to accurately predict and analyze the heat consumption of steam turbines with complex non-linear characteristics, this paper presents an improved prediction model of steam turbine heat consumption based on fuzzy support vector machine (FSVM). Firstly, the gap statistic algorithm is used to calculate the optimal number of clusters to avoid the uncertainty of the number of clusters. Then, the kernel fuzzy C mean clustering (KFCM) algorithm is applied to divide the heat consumption data, generate cluster subsamples, and replace it into the FSVM optimized by particle swarm optimization (PSO), and establish a thermal consumption rate prediction model based on the FSVM. Finally, this model is employed to predict the heat consumption rate of an ultra-supercritical 660 MW unit steam turbine based on the data collected in the field, and the results are compared with that of the conventional support vector machine. The research results show that the improved FSVM method has higher prediction accuracy and stronger generalization ability.
steam turbine, heat consumption rate, clustering algorithm, fuzzy support vector machine, prediction model, gap statistic
National Natural Science Foundation of China (61503237); Shanghai Natural Science Foundation (15ZR1418300); Shanghai Key Laboratory of Power Station Automation Technology (13DZ2273800); Shanghai Scientific Research Plan Project (18020500900)
TK26
A
10.19666/j.rlfd.201806119
黃昕宇, 張棟良, 李帥位. 基于改進模糊支持向量機的汽輪機熱耗率預測模型[J]. 熱力發電, 2019, 48(3): 22-27. HUANG Xinyu, ZHANG Dongliang, LI Shuaiwei. Prediction model of steam turbine heat consumption based on improved fuzzy support vector machine[J]. Thermal Power Generation, 2019, 48(3): 22-27.
2018-06-10
國家自然科學基金項目(61503237);上海市自然科學基金項目(15ZR1418300);上海市電站自動化技術重點實驗室(13DZ2273800);上海市科研計劃項目(18020500900)
黃昕宇(1994—),男,碩士研究生,主要研究方向為汽輪機運行優化與故障診斷,642552867@qq.com。
(責任編輯 杜亞勤)