劉 超,牛培峰,?,段小龍,李國強,張維平,陳 科
(1.燕山大學電氣工程學院,河北秦皇島066004;2.秦皇島職業技術學院機電工程系,河北秦皇島066100)
基于優化支持向量機的熱耗率預測方法
劉 超1,牛培峰1,?,段小龍1,李國強1,張維平2,陳 科1
(1.燕山大學電氣工程學院,河北秦皇島066004;2.秦皇島職業技術學院機電工程系,河北秦皇島066100)
針對傳統的汽輪機熱耗率計算模型精度較低的問題,構建了一種基于改進生物地理學優化算法優化支持向量機的熱耗率預報模型。首先,提出改進的生物地理學優化算法以加強算法的優化能力,并通過4個典型的測試函數驗證算法的有效性。其次,采用支持向量機建立汽輪機熱耗率的預報模型,并選用徑向基函數作為核函數,用改進的生物地理學優化算法優化該模型參數。最后,結合某火電站600 MW超臨界汽輪機組現場數據進行熱耗率預報的仿真研究,結果表明基于該算法建立的汽輪機熱耗率預報模型具有較高的預報精度。
熱耗率;汽輪機;生物地理學優化算法;支持向量機
汽輪機熱耗率是反映機組熱經濟性的重要指標,精確的熱耗率值是機組安全運行和優化控制等問題的關鍵,同時對于獲取汽輪機最優初壓也有著重要意義,因此,建立熱耗率預測模型是十分必要的。超臨界汽輪機系統中存在眾多的影響熱耗率因素,受到諸如主蒸汽溫度、流量、壓力,再熱蒸汽的溫度、流量、壓力,發電輸出功率,汽輪機自身健康情況等多種因素影響[1]。傳統的熱耗率計算主要是通過熱力學分析[2],運用熱力學計算公式得到的。但常規計算受到計算方法的限制,需要做出一些假設和簡化,但是機組在實際運行中受到負荷頻繁變動、煤質變化、環境溫度改變等因素的影響,往往偏離設計工況,這種情況下熱力學計算公式很難達到滿意的效果。同時,對于參數之間具有強耦合、非線性等特征的物理過程,難以用機理模型來描述。
目前,一種可行辦法是利用回歸方法計算熱耗率值。文獻[3]采用偏最小二乘算法預測熱耗率值,文獻[4]采用BP神經網絡分析汽輪機的運行特性。但由于神經網絡模型易發生過擬合,從而降低網絡的泛化能力。近年來,為了克服神經網絡固有的缺點,基于統計學習理論的支持向量機(support vector machine,SVM)被提出并得到廣泛的應用[5?7],這些研究表明SVM具有較好的模擬能力。因此,本文采用SVM建立汽輪機熱耗率的預報模型,并選用徑向基函數作為核函數。SVM建模過程中參數的選擇對模型精度和泛化能力有很大的影響,其最優參數的選擇問題其實就是一個組合優化問題,存在大量的智能優化算法用來解決支持向量機的參數選擇問題。
生物地理學優化(biogeography?based optimiza?tion,BBO)算法是由美國學者Simon D根據生物地理學原理于2008年提出的一種群智能的隨機優化算法[8]。BBO算法具有易于理解、操作簡單、易于實現的優點,該算法已經被證明是一種較好的全局優化方法。但基本的生物地理學優化算法又易于陷入局部最優,導致搜索成功率不高[9]。本文在混合遷移算子的基礎上引入了模擬退火思想[10],提出了基于模擬退火的混合生物地理學優化算法(blended biogeography?based optimization based on simulated annealing,B?BBO?SA),混合遷移算子保證遷移過程中種群的多樣性,引入具有強大局部搜索能力的模擬退火算法以避免算法陷入局部最優解的不足,同時,仿真實驗驗證了改進算法的有效性。
本文結合超臨界汽輪機的工藝特點,構造了一種基于SVM建立熱耗率預報模型,并采用B?BBO?SA算法解決SVM參數優化的問題。實驗結果表明該預報模型具有良好的預報精確和泛化能力,大大提高了汽輪機熱耗率預報的準確度。
1.1 生物地理學優化算法
生物地理學優化(BBO)算法是基于生物地理學中生物種群在棲息地間的分布、遷移和滅絕規律而提出的,它主要是模擬生物種群在棲息地間的遷移操作和突變操作來解決各種工程優化問題。各棲息地生物種群間以遷入概率(Immigration rate,λ)和遷出概率(Emigration rate,μ)來決定信息交換和信息共享,以變異概率(Mutation rate,Mu)來增加物種的多樣性。借助精英策略來保護每代中最優的個體,在此通過設定它們的遷入率λ=0,使其在進化中不被破壞,從而把它們優良的特征保存到下一代,這樣可以保證種群在進化過程中不會退化。遷入率λ(s)和遷出率μ(s)可以描述成適應度指數(s)的函數,單個棲息地生物種群線性遷移模型如圖1所示。

圖1 單個棲息地生物種群線性遷移模型Fig.1 Single habitats population migration of linear model
遷入率λ和遷出率μ可以由式(1)計算得到:

其中,s∈[0,1]表示個體的適應度值。
BBO中用遷入率λi來選擇遷入個體Hi,用遷出率μj來選擇待遷出個體Hj,遷移操作可以表示為

其中,Hi(i=1,2,…,n)代表待尋優個體的一個候選解,X表示個體的一個特征向量。遷移操作完成后,通過突變概率Mu對生物種群進行隨機突變性操作來增加物種的多樣性。
1.2 模擬退火算法
模擬退火(simulated annealing,SA)算法[10]是由Kirkpatrick S在1983年提出的。SA算法受啟發于金屬固體從高溫到低溫的物理降溫過程,當金屬物體離開加熱源后會經過一個降溫過程,只要溫度降低的足夠慢,它會在每個溫度下達到一個熱平衡,最后會趨于周圍的環境溫度從而達到平衡狀態。SA算法在迭代過程中既接受使目標值變好的個體,又以一定的概率接受使目標值變差的個體,從而提高算法在迭代過程跳出局部最優解的可能性,使算法能夠更好地趨于全局最優解。其具體步驟如下:
1)初始化溫度Tk(k=0),在可行域隨機產生初始解x0,并計算目標函數值f(x0);
2)在溫度Tk下重復執行如下操作,直到達到Tk溫度下的終止條件:
a)在解x的基礎上產生新的可行解x′,并計算目標函數值f(x′);
b)求出Δ=f(x′)-f(x),如果Δ≤0,接受x′,并令x=x′;如果Δ>0,以概率exp(-Δ/Tk)>rand接受x′,否則x值不變;
3)降溫操作Tk=CTk-1,C為降溫系數。達到進化結束的條件,結束退火過程;否則轉向步驟(2)。
1.3 B?BBO?SA算法
鑒于基本生物地理學優化算法在迭代過程中易于陷入局部最優、早熟收斂的不足,本節在混合遷移算子的基礎上引入模擬退火算法,提出一種基于模擬退火的混合生物地理學優化算法(blended biogeography?based optimization based on simulated annealing,B?BBO?SA)以提高了算法的優化能力。在遷移操作中,采用式(3)的混合遷移(blended migration)算子:

式中,α為0到1間的常數。從式(3)中可以看出,混合遷移操作后的新個體既保留了遷入個體自身的一些特征又可以得到遷出個體的一些特征,從而組成遷入個體中新的特征變量。
為避免算法陷入局部最優解,在BBO算法中引入模擬退火算法。為了提高算法的效率,只對遷移操作后的最好個體按照式(4)進行退火操作:

式中,r為0到1之間的隨機數,Vmax、Vmin分別為可行域的上、下限,γ為步長的控制參數,t表示進化的代數。在進化前期,t較小,算法可以進行廣域的搜索,有助于跳出局部最優解;在進化后期,個體靠近最優解,這時搜索范圍隨著t值逐漸變大而漸小,局部搜索的作用越來越強,在最優解的小鄰域內進行搜索,增大了找到最優解的可能性。用式(5)判斷新個體變量的合法性:

本文的B?BBO?SA算法具體實現步驟如下:1)參數的設定和種群的初始化;
2)計算每個個體的適應度值s,并計算遷入率λi和遷出率μi,同時保存精英個體;
3)用λi選擇需要進行遷入的個體Hi,用μj選擇需要遷出的個體 Hj,根據式(3)進行遷移操作;
4)選出遷移操作后的最優個體 Hi按照式(4)進行模擬退火操作;
5)根據突變概率Mu進行突變操作;
6)降溫操作Tk=CTk-1。達到進化代數,結束進化操作,否則,轉向步驟(2)。
1.4 B?BBO?SA算法驗證
本節通過兩個性能指標:平均最優解(Mean)和標準差(Std)來定性驗證B?BBO?SA算法的優化性能。采用4個基準測試函數[11]:F1(Schwefe12)、F2(Step)、F3(Penalty2)、F4(Ackley)。其中F1和F2為單峰函數;F3和F4為多峰函數,它們有多個極值點。在此并分別與BBO、正弦遷移模型[9](BBO?C)、混合遷移算子和高斯突變策略[12](B?BBO?G)進行比較。
測試中所有算法具有相同的參數設置:初始種群規模為100,個體維數為30,最大進化代數為200,突變概率 Mu=0.005,混合遷移操作中 α=0.9,精英個體數為1,控制步長γ=3,初始溫度T0=1 000℃,降溫系數C=0.8。各種算法在每次迭代獨立運行30次,各算法的測試結果見表1。

表1 基準測試函數的仿真結果Tab.1 Simulation results of benchmark test functions
從表1中可以看出,在單峰函數F1上B?BBO?SA有較好的尋優能力,F2上 B?BBO?SA與 B?BBO?G的平均最優解大體相同,整體上B?BBO?SA優化能力要高于BBO和BBO?C算法。在高維多模函數F3、F4上,B?BBO?SA表現出很好的優化能力。特別是在F3上,相對于BBO優化的最優值4.802 6,B?BBO?SA為2.988 7e?5要遠遠好于BBO算法。
下面以F1~F4為例,具體研究B?BBO?SA算法的尋優過程。由獨立運行20次后的平均目標適應度值繪制進化曲線,進化曲線如圖2~5。從圖2~5比較結果可以看出,B?BBO?SA算法對于目標函數的優化性能和收斂速度相對其它3種算法來說都有明顯的提升。在進化前期由于混合遷移算子的加入保證進化過程中種群的多樣性,增大算法跳出局部最優解的可能性;進化后期模擬退火策略增強了算法的局部搜索能力,提高了解的精度,從而驗證了B?BBO?SA算法的有效性。

圖2 F1進化曲線Fig.2 Fitness performance curve of function F1

圖3 F2進化曲線Fig.3 Fitness performance curve of function F2

圖4 F3進化曲線Fig.4 Fitness performance curve of function F3

圖5 F4進化曲線Fig.5 Fitness performance curve of function F4
支持向量機方法是建立在統計學習理論的VC維理論和結構風險最小原理基礎上,能較好地解決小樣本、非線性、高維數和局部極小點等實際問題,具有很強的泛化能力。基本思路是通過一個非線性變換?(x)把一組訓練樣本(xi,yi)映射到高維特征空間H中。SVM用下式函數對未知函數進行估計[5?7]:

其中,w為權值向量,b為通過風險函數最小化得出的閾值。
假設所有訓練樣本可以在精度ε下無誤差的進行函數擬合,考慮到允許擬合誤差的存在,引入松弛變量ξi≥0和,則問題轉化為如下最小化函數:

通過引入拉格朗日函數將式(7)轉化為對偶問題,解對偶問題得到訓練集的測量模型

其中,ai,為拉格朗日乘子,其中只有少部分ai,不為0,k(xi,xj)為核函數。
3.1 SVM參數選擇
本文采用支持向量機作為汽輪機熱耗率的預報模型,SVM是將熱耗率相關的非線性樣本數據映射為高維控制的線性輸出,如式(8)。文中采用徑向基函數(radial basis function,RBF)作為核函數


其中,f為適應度函數,yi為實際值,為預報值,n為訓練樣本個數。
3.2 熱耗率預報模型仿真分析
汽輪機的熱耗率是指汽輪發電機組每發出1 kW·h的電所消耗的熱量,其大小體現了汽輪機機組能量轉換過程中的一項重要經濟指標。針對傳統的汽輪機熱耗率計算模型精度較低的問題,本文構建了一種基于改進生物地理學優化算法優化支持向量機的熱耗率軟測量預報模型。根據文獻[1]、[5]最終選定發電負荷、主蒸汽溫度、主蒸汽壓力、再熱器出口蒸汽溫度、再熱器出口蒸汽壓力再熱減溫水流量、過熱減溫水流量等20個參數作為SVM模型的輸入參數,熱耗率作為SVM模型的學習目標。影響汽輪機熱耗率計算有兩大因素:①汽輪機性能及“健康狀況”;②機組的運行參數。
汽輪機運行過程往往具有周期性重復運行的特點,運行參數中充分包含了在不同工況范圍內的動態特性信息,也蘊含有汽輪機“健康狀況”的信息。機組運行參數中的主汽流量的測量對熱耗率計算的精度影響較大,因此,主汽流量的準確計量非常重要。常規的標準節流孔板測量具有壓縮性的過熱蒸汽,其精度較低。本文數據來源的火電廠,其主汽流量的計量是通過在鍋爐的給水管道上安裝節流孔板,通過測量給水流量,然后間接換算成主蒸汽流量,其計量結果有較高的精度。最后,通過熱力分析,在線計算獲得模型可靠的學習目標——熱耗率。本文通過大量的運行參數,采用優化的SVM來建立汽輪機熱耗率的軟測量模型。以某火電廠 600 MW超臨界汽輪機組(CLN600?24.2/556/556?I型)為研究對象,其中289數據樣本是由集散控制系統中每隔1小時采樣一次而得,每天采集24組,基本覆蓋了汽輪機組全天運行的典型工況[1]。將其中265組數據用來訓練模型,余下的24組數據作為測試數據。
根據3.1節優化SVM預報模型的參數,選取參數范圍:0.000 1≤ε≤0.1,0.1≤σ2≤1 000,1≤C≤10 000。設置B?BBO?SA種群規模為30,最大進化代數為100。SVM參數經過B?BBO?SA優化得到最優組合:ε=0.001 7,σ2=0.772 4,C=7.140 2×103。為進一步驗證B?BBO?SA?SVM模型預報能力,將其與1.4節中表現良好的B?BBO?G算法優化SVM預報模型進行比較。SVM參數經過B?BBO?G優化得到最優組合:ε=0.046 5,σ2=9.919 2,C=6.727 9×103。在對訓練集訓練以及對測試集的預報中,B?BBO?SA?SVM模型的平均絕對誤差值分別為0.183 9和51.468 3,而B?BBO?G?SVM模型的平均絕對誤差值分別為56.017 7和98.744 1。數據顯示B?BBO?SA?SVM熱耗率預報模型有很小的訓練誤差,同時,針對測試樣本,B?BBO?SA?SVM模型有更好泛化能力。最后將 B?BBO?SA?SVM與標準SVM熱耗率預報模型進行對比,針對訓練集和測試集,其熱耗率預測模型的平均絕對誤差分別為78.941 5、145.025 9,其預測結果明顯大于B?BBO?SA?SVM優化的結果,進而驗證了B?BBO?SA算法的有效性。
為進一步驗證模型的泛化能力,圖6為 B?BBO?SA?SVM、B?BBO?G?SVM和SVM模型對24組測試樣本的熱耗率預測結果,圖7為預測誤差。從圖6中可以看出,SVM模型不能較好地預報出熱耗率,B?BBO?SA?SVM熱耗率預測效果要明顯好于SVM預測效果;針對其中9個樣本(2,4,5,6,9,11,12,18,21)B?BBO?G?SVM的熱耗率預測結果與B?BBO?SA?SVM的預測結果有比較接近的預測效果,剩余15測試樣本,B?BBO?SA?SVM均有較好的預測效果。圖7顯示了預測值與真實值之間的絕對誤差,圓點實線為B?BBO?SA?SVM預測誤差,其絕對誤差值大部分都在[-85,95]kJ·(kW·h)-1范圍內;圖7中三角形虛線的曲線為SVM的預測絕對誤差,其絕對誤差值大部分都超B?BBO?SA?SVM的絕對誤差值,最大值已達到450 kJ·(kW·h)-1。因而B?BBO?SA?SVM模型顯示了更出色的泛化能力。

圖6 熱耗率預報曲線Fig.6 Heat rate prediction curve

圖7 各模型預報誤差曲線Fig.7 Prediction error curve of each model
問題,本文提出了一種基于改進的生物地理學優化算法(B?BBO?SA)優化支持向量機(SVM)模型參數的方法,用于建立汽輪機熱耗率的預報模型。改進的生物地理學優化算法引入了混合遷移算子和模擬退火算法,混合遷移操作能夠使遷入個體和遷出個體的對應變量進行有效的組合,在進化過程中能夠保持種群的多樣性,增強全局尋優能力,模擬退火算法可以增強算法的局部搜索能力,提高了跳出局部最優解的可能性,從而增強算法的優化能力。最后將所建立的B?BBO?SA?SVM熱耗率預報模型應用在某600 MW超臨界汽輪機組的熱耗率預報中,結果驗證了該模型具有較高的預報精度和良好的泛化能力。
[1]劉超,牛培峰,游霞.反向建模方法在汽輪機熱耗率建模中的應用[J].動力工程學報,2014,239(11):867?872.
[2]郭江龍,常澍平,姚力強,等.大型汽輪機復合滑壓運行參數尋優方法研究[J].汽輪機技術,2010,52(6):467?469.
[3]張文琴,付忠廣,靳濤,等.基于偏最小二乘算法的熱耗率回歸分析[J].現代電力,2009,26(5):56?59.
[4]李勇,王海榮.基于BP網絡的汽輪機運行特性方程[J].熱能動力工程,2002,17(3):268?270.
[5]王雷,張欣剛,王洪躍,等.基于支持向量回歸算法的汽輪機熱耗率模型[J].動力工程,2007,27(1):19?23.
[6]王春林,周昊,李國能,等.基于支持向量機與遺傳算法的灰熔點預測[J].中國電機工程學報.2007,27(8):11?16.
[7]Niu Peifeng,Liu Chao,Li Pengfei.Optimized support vector regres?sion model by improved gravitational search algorithm for flatness pattern recognition[J].Neural Computing and Applications,2015,26(5):1167?1177.
[8]Simon D.Biogeography?based optimization[J].IEEE Transactions Evolutionary Computation.2008,12(6):702?713.
[9]Ma H P,Simon D.Analysis of migration models of biogeography?based optimization using Markov theory [J].Engineering Application of Artificial Intelligence,2011,24(6):1052?1060.
[10]戚孝銘,施亮.基于模擬退火及蜂群算法的優化特征選擇算法[J].計算機工程與設計,2013,34(8):2917?2921.
[11]P Venkata Rao,Vivek Patel.An improved teaching?learning?based optimization algorithm for solving unconstrained optimization problems[J].Scientia Iranica D,2013,20(3):710?720.
[12]Gong W Y,Cai Z H,Ling Charles X,et al.A real?coded biogeogra?phy?based optimization with mutation[J].Applied Mathematics and Computation,2010,216(9):2749?2758.
針對汽輪機熱耗率傳統模型難以精確求解的
Heat rate forecasting based on optimized support vector machines
LIU Chao1,NIU Pei?feng1,DUAN Xiao?long1,LI Guo?qiang1,ZHANG Wei?ping2,CHEN Ke1
(1.School of Electrical Engineering,Yanshan University,Qinhuangdao,Hebei 066004,China;2.Department of Electromechanical Engineering,Qinhuangdao Institute of Technology,Qinhuangdao,Hebei 066100,China)
To deal with the low precision of the traditional calculation model,a new optimized support vector machine(SVM)based on improved biogeography?based optimization(BBO)algorithm is introduced to prediction steam turbine heat rate.First,an improved BBO algorithm called B?BBO?SA is proposed to enhance the performance of original BBO algorithm by introducing a hy?brid migration operator and simulated annealing.At the same time,the validity of B?BBO?SA is evaluated by four classical test functions.Then,SVM is employed to establish the prediction model of steam turbine heat rate,and the radial basis function is se?lected as the kernel function,in which,the B?BBO?SA is employed to serve as a method for pre?selecting SVM parameters in order to build heat rate prediction model and obtain a well?generalized model.Finally,a hybrid B?BBO?SA?SVM model is established for heat rate forecasting of a 600 MW supercritical steam turbine unit.Experimental results show that the optimized SVM model by B?BBO?SA has well regression precision and generalization ability.
hate rate;steam turbine;biogeography?based optimization algorithm;support vector machine
TK26
A
10.3969/j.issn.1007?791X.2015.05.007
1007?791X(2015)05?0425?06
2015?06?20 基金項目:國家自然科學基金資助項目(61403331,61573306);河北省自然科學基金資助項目(F2010001318)
劉超(1986?),男,四川巴中人,博士研究生,主要研究方向為人工智能技術與復雜工業系統的優化控制;?通信作者:牛培峰(1963?),男,吉林舒蘭人,博士,教授,博士生導師,主要研究方向為復雜工業系統的智能建模與智能控制,Email:npf882000@163.com。