趙曉東 李文竹 劉心



摘要:水資源需求預測是優化調度的基礎,為供水系統提供了決策支持。本文以校園用水為例,提出了運用遺傳和模擬退火組合算法(GASA)優化支持向量回歸機(SVR)參數,建立GASA-SVR預測模型,用于校園日用水需求預測。利用SPSS軟件進行因子分析,確定校園用水的影響因素并將其作為輸入層,以均方根誤差(RMSE)和相關系數(r2)作為評價標準,結果同BP神經網絡(BP-ANN)、GA-BP-ANN、SVR模型進行了比較。實驗結果表明,GASA-SVR模型 RMSE值較小,擬合度r2較好,因此,所提出的GASA-SVR模型是日常用水需求預測的有效工具。
關鍵詞:需水預測;支持向量回歸機(SVR);遺傳算法;模擬退火算法;日用水量;因子分析
中圖分類號:TV214 ? ? ? 文獻標識碼:A
文章編號:1009-3044(2019)13-0195-04
Abstract: As the basis of optimal dispatching, prediction of the water resource demand can provide decision for water supply system. Taking campus water use as an example, this paper proposes to optimize SVR parameters by using chaotic GASA algorithm and establishes GASA-SVR predicting model for daily campus water demand. Analysis of influencing factors was carried out with SPSS software to determine the input of the model. Root mean square error (RMSE) and correlation coefficient (r2) were used as evaluation criteria. Compared with BP-ANN, GA-BP-ANN and SVR models, the results show that the GASA-SVR model has the smallest RMSE and the best r2. Therefore, the GASA-SVR model is proposed an effective tool for prediction of daily water demand. It is better than the other models commonly used.
Key words: prediction of water demand; support vector regression (SVR); GA; SA; Daily water demand; Factor analysis
1 引言
供水系統的自動化運營是將來供水發展的一個趨勢,而要實現這個目標,就需要通過建立準確的水需求預測模型來控制泵站的最優總體數量以及最優泵調度。目前國內外需水預測方法主要分為時間序列法、結構分析法和系統方法[1,2,3]。近年來,研究者還利用一些研究方法,如人工神經網絡、細胞自動機、蟻群算法、進化算法等,通過“擬物”或者“仿生”模擬自然現象來解決問題,已在人工智能、機器學習、數據挖掘等領域發揮了巨大的作用。支持向量回歸機(SVR)由Vapnik等人[4]提出,是以統計學為基礎的理論,它比傳統時間序列預測模型有更好的預測效果[5],改善了神經網絡容易出現的局部最優問題[6]。SVR預測方法已經成功應用于許多領域,如金融(股票指數和匯率)預測[7][8],短期光伏發電預測[9],工程與軟件領域的產值和可靠性預測等。這些文獻中,用SVR進行需水預測的文章比較少,對SVR三個超參數進行組合優化也很少,GASA混合算法可以利用SA算法的優勢,在尋優過程中跳出局部最小值,逼近全局最優值,再利用GA算法的變異過程來提高最優值的搜索能力。鑒于此,本文通過遺傳和模擬退火組合優化算法(GASA)對SVR的三個參數C,ε和σ進行尋優,建立GASA-SVR預測模型,并對用水影響因素進行因子分析,將關聯度高的特征值作為GASA-SVR模型的輸入,該方法在需水預測領域具有一定的泛化和指導意義。
第二主成分方差貢獻率最大為:24.908%,通過線性方程所得特征向量分析為,主成分[F2]與平均氣溫[X1]、最高氣溫[X2]、最低氣溫[X3]相關性較低,與人數[X4]有較大的正相關,說明人數的增多直接影響到用水量的增長。
從以上分析可知,兩個主成分F1和F2能很好的描述各影響因子跟用水量之間的關系,因此,將這兩個主成分作為GASA-SVR預測模型的輸入。
4 實驗仿真
4.1 數據劃分
為提高系統模型的預測精度和泛化能力,本文將這1035組原始數據進行如下處理:
1. 進行歸一化,消除影響因素和目標用水量的量綱差異。得出結果后再進行反歸一化得到所預測的日用水量。
2. 將原始數據組劃分為訓練集和測試集,分別為1005組和30組。
4.2 不同對比預測模型的參數初始化
本文將GASA-SVR的預測結果同SVR、BP-ANN和GA-BP-ANN進行對比,其中遺傳算法和模擬退火算法的初始值如表3和表4:
對比模型中,SVR模型的超參數C,ε和σ的默認值分別為50,0.2,0.001,核函數選取徑向基核函數,[σ]取0.001。所采用的ANN結構為常用的BP單隱層網絡結構,因為單隱層BP神經網絡可以以任意精度擬合函數[11],隱層神經元采用Sigmoid函數,默認隱層神經元10個,第一層學習率為0.5,第二層學習率為0.03,訓練次數為100。
4.3 仿真結果與討論
本文仿真用Spyder開發環境下的Python 3.6軟件,分別對GASA-SVR、SVR、BP-ANN、GA-BP-ANN四個模型對校園用水量進行預測,圖3為四種預測模型的仿真曲線比較:
四個模型分別用1005組數據進行訓練,用剩下的30個數據進行測試驗證。從圖3中明顯可以看出,GASA-SVR預測模型與實際日用水量曲線最為接近,特別是經過GASA組合優化超參數,可有效避免陷入局部最小值,得到GASA-SVR的三個超參數[C],[ε]和[σ]的值分別為4.5,0.05和0.01,精度提高了近3%,相對于BP-ANN和GA-BP-ANN具有明顯的優勢。
從表5中可以看出四種模型的平均相對誤差、均方根誤差、r2系數和平均絕對誤差的比較,GASA-SVR的各項指標均優于其他四個模型,擬合度系數達到了0.927034。
5 結束語
a.本文運用GASA組合算法優化SVR的三個超參數進行需水量預測,分別建立GASA-SVR、SVR、BP-ANN、GA-BP-ANN四個模型進行擬合度對比,解決了傳統超參數局部尋優而不是全局最優的問題,該模型可作為需水量預測領域的一個高效的替代方案。
b.運用SPSS軟件分析用水影響因素,選擇關聯度較高的特征值作為輸入,這樣比傳統單一使用歷史用水數據作為輸入更具有科學性。
c.本文建立的模型雖然提高了預測精度,但在運行時間上比其他模型要長,在現實生活中若把它們結合起來進行組合預測,將會有更廣闊的發展前景。
參考文獻:
[1] 袁偉,陳曉東.基于GA-BP神經網絡與LSSVM支持向量機的日用水量組合預測模型[J].水電能源科學,2015,33(10):33-37.
[2] Herrera, Manuel1( mahefe@gmmf.upv.es);Torso, Luís2;Izquierdo,Joaquín1;Pérez-García, Rafael1.Predictive models for forecasting hourly urban water demand. [J].Journal of Hydrology.2010,Vol.387(No.1-2):141-150.
[3] 黃國如,李彤彤,王欣,等.基于系統動力學的??谑行杷A測分析[J].水電能源科學,2016,34(12):1-5+40.
[4] 鄧乃揚,田英杰.數據挖掘中的新方法:支持向量機[M].科學出版社,2004.
[5] Kwon, Hyun-Han; Kim, Min-Ji; Kim, Oon Gi. A Development of Water Demand Forecasting Model Based on Wavelet Transform and Support Vector Machine[J].Journal of Korea Water Resources Association.2012,Vol.45(No.11):1187-1199.
[6] 賈曉光.基于支持向量機的稅收預測算法研究[J].電腦知識與技術,2018,14(02):242-245.
[7] Salim Lahmiri. Minute-ahead stock price forecasting based on singular spectrum analysis and support vector regression[J].Applied Mathematics and Computation.2018:444-451.
[8] Kazem, A; Sharifi, E; Hussain, Farookh Khadeer; Saberi, Morteza; Hussain, Omar. Support vector regression with chaos-based firefly algorithm for stock market price forecasting[J].Applied Soft Computing.2012,13(2):947-958.
[9] 陳錦銘,郭雅娟,伍旺松,等.基于數據預處理與特征表示的多核SVM短期光伏發電預測[J].水電能源科學,2018,36(09):205-208+147.
[10]員永生,馬天,章立軍,等.兩種基于支持向量機的時間序列數據建模[J].電腦知識與技術,2016,12(19):241-246.
[11] 張維敏.兩種需水預測影響因素分析方法的比較[J].人民珠江.2017,(3):29-31.
【通聯編輯:梁書】