董 超,趙牧元
(天津理工大學 天津市復雜系統控制理論及應用重點實驗室,天津 300384)
基于改進的LSSVM循環冷卻水結垢預測研究
董 超,趙牧元
(天津理工大學 天津市復雜系統控制理論及應用重點實驗室,天津 300384)
工業循環冷卻水結垢機理十分復雜,對其進行準確的結垢預測一直是工業界的研究熱點問題。采用LSSVM進行結垢預測,運用加權灰關聯分析法選擇預測模型的輸入變量,通過全局搜索能力強的PSO對LSSVM的重要參數進行優化。并通過與經典預測模型BP神經網絡進行預測結果對比,表明在小樣本情況下改進的LSSVM具有較小的擬合誤差和較強的泛化能力。結論對于循環冷卻水的結垢預測具有科學指導意義和廣泛的應用價值。
LSSVM;PSO;加權灰關聯分析法;循環冷卻水;結垢預測
循環冷卻水系統是石油化工領域最大的用水單元,在生產過程中隨著循環冷卻水水質逐漸惡化,導致系統結垢,從而影響系統的傳熱效率,降低設備管道的使用壽命[1]。結垢問題作為一種典型的多學科交叉問題,其形成機制是十分復雜的,至今沒有一個統一、可信、適用的預測模型。本文嘗試采用最小二乘支持向量機(least square support vector machine,LSSVM)構建結垢預測模型,運用加權灰關聯分析法確定模型輸入變量,采用粒子群(particle swarm optmization,PSO)優化LSSVM的懲罰因子與核寬度。采用現場生產數據對模型進行訓練與測試,通過與BP神經網絡對比分析,取得了相應結論。
1)最小二乘支持向量機(LSSVM)與核函數的選擇。最小二乘支持向量機是支持向量機的一種擴展,其待選參數少,而且用等式約束代替原有的不等式約束,其損失函數直接定義為誤差平方和,將二次規劃問題轉化為線性方程組求解。降低了計算復雜性,加快了求解速度。LSSVM最重要的是核函數的選擇。常見的核函數有徑向基核函數、多項式核函數、線性核函數等。徑向基核函數徑向對稱,各階導數均存在,便于進行理論分析[2]。基于徑向基函數的這些特點,采用徑向基函數作為回歸模型中的核函數[3]。
正則化參數γ和核寬度σ是LSSVM兩類十分重要的參數[4]。γ為正則化參數,用于表示懲罰經驗誤差的程度[5]。γ取值過小則懲罰小會造成學習機器欠學習,取值過大則會造成過學習[6]。核寬度σ數值小對LSSVM影響小數值大則影響過于劇烈,所以選取適當的模型參數至關重要。
2)粒子群優化算法(PSO)。由于PSO具有全局尋優能力強,算法簡單故利用PSO優化LSSVM兩個關鍵參數,優化流程圖如圖1所示。

圖1 PSO優化LSSVM流程圖
具體優化步驟如下:
(1)初始化PSO各項參數如種群規模、最大迭代次、學習因子、初始位置、慣性權重等[7]。
(2)每個粒子都通過LSSVM預測模型,計算得出其適應度。再將當前適應度與該粒子本身的最佳適應度相比較,若更優,則粒子當前位置作為最優位置。
(3)將每個粒子的最優位置適應度與種群最優位置適應度相比較,選擇最優作為種群的最優位置[8]。
(4)根據LSSVM原理更新慣性權重,并更新每個粒子的位置和速度[9]。
(5)當適應值達到預設精度或迭代次數到達最大值時結束尋優,選擇當前最優粒子作為LSSVM的參數,否則跳轉到(2)。
3)加權灰關聯分析法。利用加權灰關聯分析法選擇模型的輸入變量,將表示結垢大小的黏附速率作為參考序列采樣頻率為1次/月。將循環冷卻水系統中的水質參數和工藝參數作為行為序列采樣頻率為1次/天,采用累加求平均值方法得出每月與參考序列相對應的行為序列。
對四個觀測原始點數據應用無量綱方法處理后代入公式,根據四個觀測點的關聯度R(X0,Xi)排序得到Ph值>總磷>鈣硬>電導率>氯離子>濁度>……,于是選出前6個參數作為預測模型的輸入。
結垢預測模型總體結構如圖2所示。

圖2 預測模型總體結構
預測數據來源于現場真實的40個月的生產運行數據,分別為某石化企業烯烴一循、烯烴二循、煉油東、煉油三循如表1所示。每個部門整理出18935個數據。首先刪除誤差數據,消除冗余數據,推導缺值數據,再按照4:1的比例分別隨機選取訓練集和測試集。

表1 四個觀測點的原始數據列表
由于各個參數的單位、量綱、數量級都不同,需要對數據進行歸一化處理[10]。歸一化處理通過數學變換把性質、量綱各不相同的參數轉化為可以綜合比較的一個相對數[11]。
利用表中數據經試算,PSO采用,種群規模為40,維數為2,慣性權重為0.9,學習因子c1=1.5,c2=2,最大迭代次數為300。運用MATLAB軟件運行改進的LSSVM預測模型。計算結果如圖3所示。

圖3 測試集結果對比
改進的LSSVM結垢預測模型的性能采用四個指標來檢驗:均方誤差MSE,可以評價數據的變化程度;決定系數R2,當越接近于1,越能表示預測模型性能強;絕對誤差,即預測值與實際值的誤差;相對誤差,即該誤差相當于測量的絕對誤差占真值(或給出值)的百分比。該模型的MSE=0.0055847,R2=0.98365,絕對誤差和相對誤差如圖4所示。


圖4 測試集結果對比
BP神經網絡結構為6輸入,7個隱層節點,1個輸出[13]。利用訓練集對BP神經網絡進行訓練,得到PSOLSSVM與BP神經網絡的預測對比曲線,如圖5所示。

圖5 預測結果對比
PSO-LSSVM和BP神經網絡預測的的均方誤差和決定系數如表2所示。

表2 PSO-LSSVM和BP神經網絡預測精度對比
綜合分析PSO-LSSVM預測精度更高,優于BP神經網絡,并且在擬合方面,PSO-LSSVM基本擬合預測情況,而BP神經網絡在小樣本時泛化能力較差。
目前石化行業循環冷卻水結垢預測大部分還是依靠
傳統的掛片法進行預測,存在著很大的滯后性和不確定性。本文采用改進的LSSVM對循環冷卻水進行了結垢預測研究,并利用加權灰關聯分析法科學的選出對循環冷卻水影響較大的參數作為輸入變量,大大提高了預測模型的精度。對其預測結果和BP神經網絡進行了預測精度和擬合情況的對比,在精度和泛化能力上優于BP神經網絡。為石油化工領域等流程工業同類課題的研究與應用提供了參考,具有重要的可借鑒價值。
[1] 張凌峰.工業循環冷卻水智能輔助分析平臺的關鍵技術研究[D].天津:天津理工大學,2012.
[2] 劉君堯,邱嵐.基于徑向基函數神經網絡的函數逼近[J].大眾科技,2009,09:39,19.
[3] 宋翼頡,王欣.基于LSSVM的污水處理過程預測控制[J].新型工業化,2015,08:33-38.
[4] 王新,孟玲玲.基于EEMD-LSSVM的超短期負荷預測[J].電力系統保護與控制,2015,01:61-66.
[5] 薛暉.分類器設計中的正則化技術研究[D].南京航空航天大學,2008.
[6] 王梅.一種改進的核函數參數選擇方法[D].西安科技大學,2011.
[7] 汪華.粒子群算法的研究及其在供水優化調度中的應用[D].合肥工業大學,2011.
[8] 白明明,孫輝,吳烈陽.基于小生境粒子群算法的圖像分割方法[J].計算機工程與應用,2010,03:183-185.
[9] WU Xiao-juan,HUANG Qi,ZHU Xin-jian.Thermal modeling of a solid oxide fuel cell and micro gas turbine hybrid power system based on modifed LS-SVM[J].International Journal of Hydrogen Energy.2010.
[10] 滕明鑫.回歸神經網絡預測模型歸一化方法分析[J].電腦知識與技術,2014,07:1508-1510.
[11] 張立軍,袁能文.線性綜合評價模型中指標標準化方法的比較與選擇[J].統計與信息論壇,2010,08:10-15.
[12] 郭龍盛,殷海兵,徐寧.基于失真-量化模型的視頻編碼算法優化[J].電視技術,2012,17:20-22,25.
[13] 汪興東.基于BP神經網絡的智能入侵檢測系統的設計與實現[D].電子科技大學,2005.
Study on scaling prediction of circulating cooling water based on improved LSSVM
DONG Chao, ZHAO Mu-yuan
TP391
:A
1009-0134(2017)01-0040-04
2016-10-19
董超(1978 -),男,山東煙臺人,副研究員,博士,主要研究領域為過程控制。