陳 磊,石 也
(浙江工業大學 建筑工程學院,浙江 杭州 310014)
變結構遺傳最小二乘支持向量機法預測日用水量
陳 磊,石 也
(浙江工業大學 建筑工程學院,浙江 杭州 310014)
為解決日用水量預測模型的動態參數估計問題,提出了基于變結構遺傳最小二乘支持向量機的預測模型.以日用水量的主要影響因素和相關日用水量為輸入,利用遺傳算法對基于LSSVM的歷史日用水量模型參數進行尋優,獲得模型結構參數序列;采用擴展卡爾曼濾波器估計基于最小二乘支持向量機的預測日用水量模型參數,進而預測下一日用水量.實例分析表明:提出的模型具有較高的預測精度,預測的最大絕對相對誤差僅為9.3%,平均絕對相對誤差為2.09%.
遺傳算法;最小二乘支持向量機;變結構;擴展卡爾曼濾波;日用水量
科學的管網調度能節省大量的供水能耗,全面提高管網的安全性和可靠性,但調度方案是否可行很大程度上取決于日用水量的預測精度.針對日用水量的非線性特征,學者們一般以預測日用水量的相關日用水量和主要影響因素為輸入,采用具有較強非線性映射能力的神經網絡[1-2]和支持向量機[3-4]進行預測,但他們都未提及預測前是否需要以及如何持續動態更新模型參數的方法.BAI Yun等[5]提出根據歷史日用水量模型的參數,采用卡爾曼濾波法估計預測日用水量的模型參數,實現了日用水量模型參數的動態更新.然而其采用交叉驗證法確定歷史日用水量模型參數耗時較長,獲得的優化模型參數也很大程度上取決于模型參數區間以及參數網格的劃分,難以保證獲得較優的模型參數,并且其模型輸入僅考慮日用水量歷史序列,當日用水量變化較大時,采用更新參數的模型仍會出現較大的預測誤差.為此,模型的輸入增加了日用水量的主要影響因素,并利用具有較強全局尋優能力的自適應遺傳算法對歷史日用水量模型的參數組尋優,得到較優的參數組序列.根據參數組序列采用卡爾曼濾波法估計預測日模型的參數,實現預測日用水量的更高精度預測.
1.1 最小二乘支持向量機
最小二乘支持向量機[6](LSSVM)是對支持向量機[7](SVM)改進的算法,它采用等式約束替代SVM的不等式約束,將SVM的二次規劃轉變為線性問題,尋優空間從SVM的三維降低到LSSVM的二維.與SVM相比,LSSVM具有更少的參數和更快的訓練速度.

(1)
式中:ω為權矢量,ω∈Rnf;ei為誤差,ei∈R;γ為懲罰因子;φ(·)為核函數,φ(·):Rn→Rnf;b為偏置.
為求解最小值,可構造函數式

(2)
式中αi為拉格朗日系數.
根據KKT條件,對式(2)求偏導,即
(3)
消去ω和e后變為線性方程
(4)
式中:y=[y1,y2,…,yn]T,1v=[1,1,…,1]T,α=[α1,α2,…,αn]T;I為N×N的單位矩陣;Ωij=φ(xi)Tφ(xj)=K(xi,xj),i,j=1,2,…,N.
根據式(4)得到α和b,則LSSVM的估計函數為

(5)
式中徑向基核函數K(x,xi)=exp{-‖x-xi‖2/σ2}.
LSSVM一般采用網格交叉驗證法來確定寬度系數σ和懲罰因子γ兩個參數,但該方法耗時長,并且如何選擇參數范圍和劃分網格對結果影響較大.
1.2 遺傳算法優化LSSVM參數
傳統遺傳算法(GA)簡單實用,但是收斂速度較慢,采用隨個體適應值自適應調整交叉和變異概率,具有較強全局搜索能力的自適應遺傳算法[8]來優化LSSVM的參數σ,γ.
優化步驟如下:
1)σ,γ的取值范圍:σ∈[0.01,50],γ∈[0.01,50].兩參數采用12位二進制編碼,遺傳算法的每個個體為24位.
2)根據個體的適應值,利用輪盤賭法從父代選出相同數目的較優個體.
3)自適應交叉和變異.
采用兩位交叉,自適應交叉概率計算表達式為
(6)
式中:f′為兩個體中較大的適應值;favg為種群平均適應值;fmax為種群最大適應值.
變異方式為:對所有個體的每位二進制編碼從0~1的范圍內隨機產生一個數,若其大于個體的變異率,則編碼將從0變1或從1變0,否則不變.
自適應變異概率計算方法為
(7)
式中f為變異個體的適應值.
4)保留較優個體.父代中一半適應值較小的個體由子代中適應值較大的個體替代.
由于所建模型涉及非線性系統狀態及參數估計問題,因此采用擴展卡爾曼濾波器[9].該算法利用一個系統狀態方程和一個測量更新方程來描述線性動態過程,形成一種遞推濾波.
系統的狀態方程和測量方程分別為
x(k)=f(x(k-1),u(k-1))+w(k-1)
(8)
y(k)=g(x(k))+v(k)
(9)
式中:u為控制矢量;x為狀態矢量;y為觀測矢量;w和v分別為過程噪聲和觀測噪聲,假設它們獨立,并分別服從正態分布的高斯白色噪聲w~N(0,Q),v~N(0,R),則
E[w(k-1)]=0,E[v(k-1)]=0
(10)
過程噪聲Q和觀測噪聲R的方差分別為
E[w(k-1)wT(l-1)]=Q(k-1)
E[v(k-1)vT(l-1)]=R(k-1),k≠l
(11)
利用EKF計算模型參數,計算過程可分兩個階段:
1)預測階段


2)更新階段

由于隔年變化的日用水量具有很強的相似性,因此模型采用365 d的等維樣本長度.采用等維的數據,以預測日用水量的主要影響因素(包括平均溫度、最低溫度、最高溫度、陰晴量、相對濕度及星期量)和高度相關日用水量為輸入,以預測日用水量為輸出,建立遺傳最小二乘支持向量機模型(GA-LSSVM模型).通過計算日用水量序列的自相關系數[10],發現預測日與預測日前第7 d的日用水量高度相關,因此取預測日前第7 d的日用水量為輸入.
由于相同季節內有相似的氣候和用水量情況,日用水量模型參數也存在相似性,因此EKF模型參數組序列取92組(1年中最大的季節天數).為了確定預測日用水量的模型參數,需先分別采用GA確定對預測日前92 d的日用水量進行預測的92個模型參數,根據92個模型參數組利用擴展卡爾曼濾波估計預測日模型參數,建立變結構遺傳最小二乘支持向量機模型(VSG-LSSVM模型),從而對預測日用水量進行預測.
建模和預測具體過程如下:


圖1 VSG-LSSVM建模Fig.1 Daily water consumption forecasting modeling based on VSG-LSSVM
2) 若t=1,模型參數組序列保持不變;否則,將最新獲得(t+455) d的日用水量數據加入到用于確定最新模型參數(σt+91,γt+91)的等維365組的訓練樣本,拋棄該樣本中第(t+90) d的日用水量數據,以(t+91)~(t+455) d共365組數據構建新的訓練樣本,將該樣本5等分,利用自適應遺傳算法對LSSVM的模型參數進行尋優(采用5折交叉驗證來評價遺傳算法個體適應函數值),得到(σt+91,γt+91),去掉原模型參數序列中的(σt-1,γt-1),組成新的92組較優參數(σt,γt),(σt+1,γt+1),…,(σt+91,γt+91).


5) 判斷t是否等于預測天數274:若是,轉步驟6),若否,t=t+1,返回步驟2).
6) 程序結束.
實際日用水量與GA-LSSVM模型、VSG-LSSVM模型預測結果的對比見圖2.GA-LSSVM模型預測的最大絕對相對誤差為13.7%(第645 d),VSG-LSSVM模型預測的最大絕對相對誤差為9.3%(第484 d).

圖2 實際日用水量和2種模型預測值對比Fig.2 Comparison of daily water consumption between real and two prediction models

表1 兩模型預測誤差分布對比
Table 1 The comparison of predicted relative error between two models

絕對相對誤差誤差所占比例/%GA?LSSVM模型VSG?LSSVM模型0~585.7795.995~1013.874.01>100.360
由圖2以及兩模型預測誤差的分布可知:VSG-LSSVM模型總體的預測精度明顯高于GA-LSSVM模型.在預測前期(457~486 d),擴展卡爾曼濾波參數需要根據模型參數組序列進行調整,因此30 d中僅有7 d的VSG-LSSVM模型預測結果優于GA-LSSVM模型.但在第487 d后,244 d中有165 d的VSG-LSSVM模型預測結果優于GA-LSSVM模型,VSG-LSSVM模型的預測精度有顯著提高.
對傳統日用水量模型參數的預測方法進行了改進,提出了日用水量模型參數的動態預測方法.利用具有較強全局搜索能力的自適應遺傳算法對歷史日用水量的模型參數進行尋優,得到較優的模型參數序列;根據序列采用具有較強非線性估計能力的卡爾曼濾波法推斷基于最小二乘支持向量機的預測模型參數,實現參數的精確估計.實例分析結果表明:該模型預測的最大絕對相對誤差、平均絕對相對誤差以及預測誤差分布都較大程度優于傳統基于遺傳最小支持向量機的預測模型,可用于長期日用水量預測.
[1] BABEL M S, SHINDE V R. Identifying prominent explanatory variables for water demand prediction using artificial neural networks: a case study of Bangkok [J]. Water resources management,2011,25(6):1653-1676.
[2] 袁一星,蘭宏娟,趙洪賓,等.城市用水量BP網絡預測模型[J].哈爾濱建筑大學學報,2002,35(3):56-58.
[3] 王亮,張宏偉,牛志廣.支持向量機在城市用水量短期預測中的應用[J].天津大學學報,2005,38(11):1021-1025.
[4] 陳磊,余翔.遺傳最小二乘支持向量機法預測日用水量[J].節水灌溉,2012(8):4-7.
[5] BAI Yun, WANG Pu, LI Chuan, et al. Dynamic forecast of daily urban water consumption using a variable-structure support vector regression model[J]. Journal of water resource planning and management,2015,141(3):1-10.
[6] SUYKEN J A K, VAN G T, DE M B, et al. Least squares support vector machines[M]. Singapore: World Scientific,2002.
[7] 陳磊,董志勇.支持向量機在短期用水量預測中的應用[J].浙江工業大學學報,2007,35(4):448-451.
[8] 王小平,曹力明.遺傳算法-理論、應用與軟件實現[M].西安:西安交通大學出版社,2002.
[9] ANDERSON B, MOORE J. Optimal filtering [M]. New Jersey: Prentice-Hall,1979.
[10] 丁晶,鄧育仁.隨機水文學[M].成都:成都科技大學出版社,1988.
Daily water demand forecasting method based on variable structure genetic least squares support vector machine
CHEN Lei, SHI Ye
(College of Civil Engineering and Architecture, Zhejiang University of Technology, Hangzhou 310014, China)
To dynamically estimate the parameters of daily water consumption model,a new variable-structure genetic least squares vector machine(LSSVM)-based model is proposed. The principal factors of daily water consumption and the correlative daily water consumption are used as the model inputs. With genetic algorithm, the parametersseries of LSSVM-based historical daily water consumption models aredetermined. With the series, Extended Kalman Filter(EKF) is applied to estimate the parameters of LSSVM-based next-day prediction modeland the next-day daily water consumption is forecasted. Case study shows that the proposed model has higher forecasting performance in term of a maximum absolute relative error of 9.3% and a mean absolute relative error of 2.09%.
genetic algorithm; least squares vector machine; variable structure; extended Kalman Filter; daily water consumption
(責任編輯:劉 巖)
2016-04-07
國家自然科學基金資助項目(50908165);浙江省飲用水安全保障與城市水環境治理重點科技創新團隊項目(2010R50037)
陳 磊(1977—),男,浙江衢州人,副教授,博士,主要從事給水管網系統建模和優化研究,E-mail:zj_chen_lei@sina.com.cn.
TU991.33
A
1006-4303(2017)01-0069-04