杜寧,黃喜軍,肖洪
GA-SVM 模型在煤質分析中的應用
杜寧,黃喜軍,肖洪
利用支持向量機建立工業分析與元素分析的轉化模型, 并采用遺傳算法對工況進行參數尋優(即GA-SVM模型),為燃燒提供了更好的指導。實驗結果表明,模型具有更高的預測精度,且適用于更寬的煤質范圍,研究成果具有一定理論意義和應用價值。
煤質;工業分析;元素分析;支持向量機(SVM);遺傳算法(GA)
煤的元素分析為研究煤的燃燒提供基本數據,是指導燃煤鍋爐合理燃燒的前提,但煤的元素分析實驗項目多,時間長,操作復雜,對化驗人員要求高,其開展收到極大限制,通常電站無力開展此項研究,而煤的工業分析實驗較簡單,電站可自行測定[1]。所以,如何建立煤的元素分析與工業分析之間的相互轉化模型,就顯得尤為重要。
目前,在利用工業分析預測元素分析方面,傳統方法是采用回歸分析方法將元素分析與工業分析相關聯,但是,元素分析與工業分析存在著復雜的非線性關系。傳統方法只是兩者之間的多元線性相關,對于特定的煤種,單煤種效果較好,對于寬范圍的煤種和混煤,只是粗略的估算。對于非線性方法應用,大都是采用神經網絡建立元素分析與工業分析之間的非線性關系,支持向量機(SVM)是當前應用比較廣泛的非線性預測建模工具,與人工神經網絡方法相比,支持向量機模型的預測精度更高,速度更快[2]。本文提出利用基于遺傳算法(GA)優化的支持向量機(SVM)方法來建立煤質工業分析與元素分析之間的預測模型。
1.1 支持向量機回歸算法
支持向量機回歸算法的基本思想是通過一個非線性映射將輸入向量映射到高維特征空間,并在該空間進行線性回歸[3]。ε-SVR是Napkin等人提出的一種最常用的支持向量機回歸算法,由于引入ε-(不敏感損失函數)使SVM從分類領域推廣到回歸領域;通過引入懲罰系數C實現算法結構風險最小化原則;引入核函數可以解決由于維數變大帶來的維數災難,這樣就可以把選擇非線性映射轉化成選擇核函數,最后轉化為求解凸二次優化問題,且能保證找到的極值解就是全局的最優解。
1.2 遺傳算法
遺傳算法是由美國Michigan大學Holland教授于1975年首先提出的[4]。它是模仿自然界生物進化機制發展起來的隨機全局搜索和優化方法,借鑒了達爾文的進化論和孟德爾的遺傳學說。主要步驟包括編碼、種群初始化、選擇、交叉和變異。其本質是一種高效、并行、全局搜索的方法,他能在搜索過程中自動獲取和累積有關搜索空間的知識,并自適應地控制搜索過程以求得最優解。遺傳算法的一個顯著優勢是不需要目標函數明確的數學方程和倒數表達式,同時,又是一種全局尋優算法,不像某些傳統算法易于陷入局部最優解,尋優的效率高,速度快[5]。
1.3 基于GA的SVM參數優化法
1.3.1 核函數的選擇
在支持向量機回歸算法中,核函數的選擇對回歸分析有很大的影響,但是,目前對于如何選擇核函數還沒有成熟的理論指導,常用的核函數有:徑向基核函數、多項式核函數、Sigmoid核函數、線性核函數等。文獻[6]研究認為徑向基核函數比線性核函數好,在選擇了徑向基核函數后就沒必要再考慮線性核函數;文獻[7]認為Sigmoid核函數精度沒有徑向基核函數高,而且,不是完全正定的,在滿足一定條件后它才能成為有效的核函數,一般情況下Sigmoid核函數不比徑向基核函數好;多項式核函數當其階次較高時會導致數值計算困難,耗費大量資源和時間[8]。因此,本文在建模時選擇徑向基核函數
1.3.2 支持向量機三參數尋優
采用徑向基核函數后,支持向量機模型中有3個重要參數,分別是核函數的參數σ,懲罰參數C,不敏感損失函數系數ε。核函數的參數σ影響樣本數據在高維特征空間中分布的復雜程度;懲罰參數C越大,過擬合現象就越明顯,C越小,欠擬合現象就越明顯,參數C影響算法復雜度,避免過擬合;置信區間的寬度是由不敏感損失函數系數ε的大小來決定的,可以反映函數擬合的精度,起到調節模型復雜度和逼近精度作用。這3個參數將影響SVM模型的泛化能力和收斂速度。利用GA算法對支持向量機這3個參數進行尋優,適應度函數設置為目標輸出值的5-fold交叉驗證誤差,尋優步驟如圖1所示:

圖1 支持向量機三參數尋優流程圖
2.1 煤質數據分析
文獻[9]認為:門捷列夫經驗公式利用煤的元素分析對其熱值進行估算,同一種煤發熱量用實驗測量值和經驗公式計算值之間的誤差一般不超過3%~4%,所以,如果誤差超過4%,就認為該煤質數據分析不可靠,予以剔除,最后,從186煤質數據中挑選出154個有效數據,這些媒質數據包括煤的工業分析、元素分析、干燥無灰基高位發熱量、收到基的低位發熱量和煤的種類。隨機選擇有效樣本中的124個樣本作為訓練樣本,剩下的30個樣本作為測試樣本,訓練樣本和測試樣本都包括了較大范圍的貧煤、煙煤和褐煤,煤的分類如表1所示:

表1 煤樣分類
在建模前要對數據樣本進行[0~1]歸一化處理,提高預測精度。
2.2 基于GA-SVM方法的預測建模
本文利用GA-SVM建立以下4種煤質工業分析與元素分析的轉化模型:
(1)建立預測收到基Har元素的計算模型(輸入為參數為煤質低位發熱量Qar,net、收到基水分Mar、收到基碳含量Car、收到基氧含量Oar、收到基灰分含量Aar,輸出為收到基氫含量Har);
(2)建立預測揮發分干燥無灰基Vdaf的計算模型(輸入參數為煤質低位發熱量Qar,net、收到基水分Mar、收到基灰分含量Aar、收到基碳含量Car、收到基氫含量Har、收到基氧含量Oar、收到基氮含量Nar、收到基硫含量Sar,輸出為揮發分Vdaf);
(3)建立預測收到基碳元素Car的計算模型(輸入參數為煤質低位發熱量Qar,net、收到基固定碳含量FCar、收到基灰分含量Aar、收到基揮發分含量Var,輸出參數為收到基碳元素含量Car);
(4)建立預測干燥無灰基碳元素Cdaf的計算模型(干燥無灰基高位發熱量Qar,gr、干燥無灰基固定碳含量FCdaf、干燥無灰基揮發分含量Vdaf、干燥無灰基氫元素含量Hdaf、干燥無灰基硫元素含量Sdaf,輸出參數為干燥無灰基碳元素含量Cdaf)。
在建模過程中,設核函數的參數σ,懲罰參數C,不敏感損失函數系數ε尋優區間分別為(0~100)(0~100)(0~1)。遺傳算法種群數目為20,交叉率為0.9,變異率0.01,最大迭代次數為200,適應度函數值為目標輸出的5-fold交叉驗證誤差。在Matlab的環境下,4種模型的參數尋優結果如表2所示:

表2 四種模型的參數尋優結果
預測結果如圖2所示:

圖2 四種模型的預測結果
2.3 誤差分析
本文以均方根誤差(RMSE)、平均相對誤差(MRE)和線性相關系數r作為誤差分析指標,將基于遺傳算法的支持向量機模型(GA-SVM)與傳統的基于網格搜索法的支持向量機模型(Grid-SVM)作對比,誤差分析結果如下:
均方根誤差(RMSE)是檢驗模型泛化能力的重要指標。均方根誤差越小,模型的泛化能力越強,反之,模型的泛化能力就越弱。,GA-SVM模型的RMSE均小于Grid-SVM模型。所以GA-SVM模型的泛化能力強如表3所示:

表3 兩種模型的誤差對比表
平均相對誤差(MRE)是評價模型誤差大小的重要指標之一,相對誤差越大,說明模型整體誤差比較大,預測精度不高;反之,預測精度就比較差。從表3可以看出,GA-SVM模型的MRE均小于Grid-SVM模型。所以GA-SVM模型的預測精度高。
線性相關系數r是用來衡量兩個變量之間線性相關關系的指標,當0<|r|<1時,表示兩變量存在一定程度的線性相關。表示兩變量的線性相關越弱,一般可按3級劃分:|r|<0.4為低度線性相關;0.4≤|r|<0.7為顯著性相關;0.7≤|r|<1為高度線性相關[10]。從表3可以看出,GA-SVM模型的線性相關性為顯著相關,并且GA-SVM模型的線性相關性均強于Grid-SVM模型。
從總體來看,線性相關系數越大,均方根誤差與平均誤差越小,說明模型的預測精度越高,從以上分析得出GA-SVM模型在預測精度上整體高于Grid-SVM模型。煤質包含了較大范圍的貧煤、煙煤和褐煤,因此說GA-SVM模型還具有一定的通用性。
[1] 曹子棟.鍋爐測試技術[M].西安:西安交通大學出版社,1995:1-20.
[2] 趙虹,沈利,楊建國,楊麗蓉,徐洪明. 利用煤的工業分析計算元素分析的DE-SVM模型[J]. 煤炭學報,2010,10:1721-1724.
[3] GB /T 476一2001,煤的元素分析方法[S].
[4] 趙義武,牛慶銀,王憲成.遺傳算法與蟻群算法的融合研究[J].科學技術與工程.2010.10(16):4017-4020.
[5] Z.米凱利維茨.演化程序[M].周家駒,何險峰,譯北京科學出版社,2000.
[6] keerthi K,Lin C J. Asymptotic behaviors of support vector machines with Gaussian kernel[J]·Neural Computation,2003,153(3):1GG7-1689.
[7] Lin H T, Lin C J. A study on sigmoid kernels for SVM and the training of non-PSD kernels by SMO-type methods[EB]. March 2003, http:/www.csie.ntu. edu. Tw/~cilin/papers.Html.
[8] 王春林,周昊,李國能,邱坤贊,岑可法. 基于支持向量機與遺傳算法的灰熔點預測[J]. 中國電機工程學報,2007,08:11-15.
[9] 葉江明.電廠鍋爐原理及設備[M].北京:中國電力出版社,2003:18-19.
[10] 王麗莉,李林侗,任雪等.基于房屋普查數據的房屋增長規律研究[J]. 防災減災報,2013,(3):9-12.DOI:10
The Research on the Application of Ga-Svm Model in Analysis of Coal Quality
Du Ning, Huang Xijun, Xiao Hong
(Institute of Mechanical and Electrical Engineering , Hohai University,Jiangsu Changzhou 213022)
Using genetic algorithm to search the optimum solution of the SVM model which was used to set up the transformation model (GA-SVM model) of industrial analysis and elemental analysis, so as to provide better guidance for combustion. The results show that, the model performs higher prediction accuracy and faster computing speed, and is suitable for a wider range of coal quality. Research results have certain theoretical significance and application value.
Coal Quality; Industrial Analysis; Elemental Analysis; Support Vector Machine; Genetic Algorithm
TP273
A
2014.07.10)
全國大學生創新訓練計劃(201310294041x)
杜 寧(1991-),男,陜西,河海大學機電工程學院,碩士,研究方向:熱能與動力工程,常州,213022
黃喜軍(1991-),男,廣西,河海大學機電工程學院,本科,研究方向:熱能與動力工程,常州,213022
肖 洪(1968-),女,常州,河海大學機電工程學院,副教授,碩士,研究方向:太陽能熱發電、新能源與可再生能源的應用,常州,213022
1007-757X(2014)08-0049-03