朱 雙,周建中,丁小玲,謝蒙飛,吳 江
(華中科技大學水電與數字化工程學院,湖北武漢430074)
基于GM-SVR耦合的月徑流預測模型研究與應用
朱 雙,周建中,丁小玲,謝蒙飛,吳 江
(華中科技大學水電與數字化工程學院,湖北武漢430074)
考慮到某月徑流與該月歷史同期徑流以及臨近月徑流均有較強相關性,而通常預報方法只采用其中一種徑流序列,導致了可用信息損失。為此,提出一種基于灰色理論和支持向量機回歸的組合預報模型。提出的模型綜合利用了徑流年內變化和年際變化信息,與單一灰色模型和支持向量機模型進行預測對比,結果表明基于灰色支持向量機的月徑流模型預測精度明顯高于單一模型,尤其是對徑流變化劇烈的汛期表現出更優越的預測性能。
支持向量機;灰色理論;核函數;月徑流
河川徑流的中長期預報是水資源配置與管理的重要組成部分,對防汛、抗旱、發電及流域水利規劃均有重要意義。目前徑流中長期預測方法大致可以分成兩類:一是基于徑流本身變化規律建立預測模型,二是基于徑流與其影響因素之間關系建立預測模型[1]。徑流的形成受水文、地形、氣候和人類活動等諸多因素的影響,呈現高度的非線性、隨機性和不確定性特征[2];因而傳統的徑流預測方法只能近似描述徑流過程,模擬精度大多不高。支持向量機實現了低維空間到高維空間的非線性映射,近年來在中長期徑流預報領域應用廣泛[3- 4]。支持向量機是建立在統計學習理論的VC維理論和結構風險最小原理基礎上的[5],它將具體問題轉化為一個二次型尋優問題,理論上可以得到全局最優解,且對于小樣本學習具有良好的泛化性能,能夠進行高效、精確的預測,較好地解決了傳統方法的經驗依賴、局部極值等問題[6- 7]。近年來,采用支持向量機回歸方法進行水文預測的研究逐漸增多,郭俊等[8]將改進的支持向量機回歸模型應用于流域徑流預測,于國榮等[9]建立了混沌時間序列的支持向量機水文序列預測模型,劉芳等[10]提出一種基于相關向量回歸的非線性時間序列預測方法。盡管支持向量機回歸模型在水文領域得到了廣泛的應用,但其仍存在一些不足。在有限樣本學習下,支持向量機回歸模型針對振蕩較劇烈徑流時間序列的預測仍表現出泛化能力較差、預測精度偏低的缺陷。
灰色系統理論是鄧聚龍教授1982年提出的系統分析方法[11],通過對已知信息的灰色生成盡可能提取有效信息并進行灰色建模,實現系統演化規律和發展趨勢的正確描述。灰色預測是一種對含有不確定因素的系統進行預測的方法,通過鑒別系統因素之間發展趨勢的相異程度,即進行關聯分析,并對原始數據進行生成處理來削弱隨機擾動因素的影響,尋找系統變動的規律,生成規律性較強的數據序列,然后建立相應的微分方程模型,從而預測事物未來發展趨勢的狀況[12],對時間序列變化趨勢有良好的預測性能。灰色預測在預報領域應用廣泛,馮利華[13]利用灰色分析預測水資源的變化趨勢,王渺林[14]應用灰色系統理論預測了寸灘站年最高水位。灰色預測模型主要通過對原始數據的累加生成序列建立指數模型來實現數據預測,GM(1,1)模型是其基礎和核心[15];但是GM(1,1)僅從序列本身尋找數據變化規律進行預測,因此模型的預測精度不穩定。
關于支持向量機的月徑流預測研究大多利用前幾個月徑流信息來預報后一個月,這種方式對徑流信息的利用效率低,預測精度不高。考慮到灰色模型對歷史同期徑流序列趨勢變化良好的預測性能,本文嘗試將支持向量機回歸和灰色模型相結合,提出基于GM-SVR耦合的月徑流預測模型。該模型充分利用徑流年內、年際變化信息,在提高徑流預測精度的同時增強模型的泛化性能,為徑流的中長期預測提供了一種可靠的新方法。
1.1 灰色動態模型
灰色預測方法首先對原始數據進行累加,從而生成(AGO)得到新的序列,新序列削弱了原始數據的隨機性,增強了規律性;然后再利用新序列進行建模和預測,預測模型是一階單變量微分灰色模型 GM (1,1)。
設有非負的時間序列
X(0)={X(0)(1),X(0)(2),…,X(0)(n)}
(1)
將原始序列進行一次累加,獲得新數據系列X(1)。GM(1,1)模型的微分方程
(2)
式中,a為發展系數;u為灰色作用量。累加序列為

(t=1,2,…,n)
(3)

(4)

1.2 SVR預測模型
支持向量機事先通過樣本訓練模型訓練好的模型輸入預測因子,就可以得到相應的預測輸出。支持向量機原理如下:
設訓練樣本數據為(Xi,yi),其中i=1,2,…,L, Xi∈RD, yi∈R,Xi為輸入,yi為相應的輸出。亦即擬合函數
yi=W·Xi+b
(5)
式中,W為空間超平面;b為偏置量。
若用ti表示模型的輸出,當|ti-yi|<ε,誤差損失取零;當|ti-yi|≥ε,誤差取|ti-yi|-ε。其中,ε為不靈敏參數,用來反映對誤差的容忍度。
根據結構化風險最小原理,擬合函數估計問題可以等價于
(6)
式中,C為誤差懲罰系數。
通過引入Lagrange乘子,給定相應的輸入X′,即可計算對應的預測輸出
(7)
通過引入核函數技術,將低維問題高維化,使無法用線性函數擬合或線性擬合精度較差的問題在高維空間中能達到較好的線性擬合效果,并同時不增加問題求解的復雜度。核函數一般應滿足Mercer條件,常用的核函數有線性核函數、多項式核函數、徑向基核函數。Hsu[16]曾對各個常用的核函數做了比較分析研究,并指出徑向基核函數是比較通用的核函數;因此,本文的核函數選擇徑向基核函數。
基于GM-SVR的月徑流預測模型針對1年12個月分別建模,首先利用模型預測,輸入為歷史同期月徑流,利用徑流趨勢變化信息獲得GM(1,1)模型的預報月徑流;然后利用SVR模型預測,輸入為預報月的前12個月徑流,利用徑流年內變化信息獲得SVR模型的預報月徑流;最后對預測結果進行加權耦合,得到GM-SVR模型的預測結果。由于GM-SVR模型綜合利用了徑流年際變化趨勢信息和徑流年內分配不均勻信息,因此能表現出更優越的預測性能。
設GM(1,1)和SVR預測結果分別為Qgt和Qst,則GM-SVR模型預測結果
(8)
式中,ωg和ωs分別為GM(1,1)和SVR模型的耦合權重,滿足ωg+ωs=1。GM-SVR模型采用最小二乘法求解ωg,ωs。

(9)
引入拉格朗日乘子求解方程組,即可得到各個水文模型的耦合權重ωg,ωs的值,從而得到組合模型預測結果。
3.1 研究流域概況
金沙江上游河段長970 km,流域面積7.65萬km2,落差約1 715 m,河道平均比降1.76%,干流年內降雨與徑流皆集中于 6月~10月,多年平均徑流量和控制面積占金沙江流域出口屏山站的29.2% 和46.7%。豐富的水資源量和水能蘊藏量使其成為金沙江水電基地的重點布局區域,在我國水能資源開發中占有極其重要的地位。石鼓為金沙江上游控制站,本文選用石鼓1953年~2004年共52年月徑流資料,對石鼓站進行徑流中長期預測研究。依據石鼓水文站52年月徑流資料,分析得到該站多年年平均流量為1 349 m3/s,離勢系數0.16,偏態系數0.75,年內徑流極值比為8.6,因此徑流年際變化不大,但年內分配極不均勻。采用M-K秩檢驗法,得到石鼓站1953年~2004年徑流總量呈上升趨勢。
3.2 預報方法
本文建立了基于GM-SVR耦合的月徑流預測模型,對石鼓進行徑流預報。為了驗證模型的有效性,采用GM(1,1)和SVR模型進行對比。以石鼓水文站11月徑流預報為例。
GM-SVR模型預報步驟如下:①選取石鼓站1953年~2004年月徑流資料,1953年~1999年為模型建立期,2000年~2004年為模型檢驗期;②用GM(1,1)模型和SVR模型分別預報11月徑流,GM(1,1)輸入為歷史同期11月徑流實測值,輸出為11月徑流預報值;SVR輸入為前一年11月到次年10月共計12個月徑流實測值,輸出為11月徑流預報值;③利用最小二乘法確定GM、SVR模型權重分別為0.15和0.85,將預報結果加權得到石鼓站2000年~2004年11月徑流預報值。
3.3 預測結果
石鼓站11月預報詳細結果見表1。
表1 石鼓11月徑流預報結果

年份實測流量/m3·s-1GM(1,1)/m3·s-1GM(1,1)誤差/%SVR/m3·s-1SVR誤差/%GM-SVR/m3·s-1GM-SVR誤差/%2000年9548936910596712001年89391328307773132002年80492415829380702003年9529174864991042004年937926188369311MRE664
由表1可知,三種模型均能較好模擬石鼓水文站11月徑流,相比之下,GM-SVR模型的平均相對誤差只有4%,GM-SVR的預測性能更好。石鼓站2000年~2004年共計60個月的徑流實測值和三種模型預報值見圖1。

圖1 石鼓2000年~2004年逐月預報結果
圖1顯示的是2000年~2004年共計60個月的徑流實測值和三種模型預報值。由圖2可知,GM(1,1)模型的汛期徑流預測值比實測值普遍偏低;SVR模型對枯水期徑流有較好的預測能力,但是對徑流峰值的擬合不理想,預測的徑流峰值明顯高于其實測值;而GM-SVR模型對枯期和汛期徑流都有較好的預測能力。表2顯示的是三種模型預測性能統計結果,包括平均相對誤差和誤差在5%、10%和20%內的百分比以及確定性系數。GM-SVR模型的平均相對誤差為9%,低于GM(1,1)模型和SVR模型;GM-SVR模型誤差在5%、10%和20%內百分比分別為68%、83%和95%,均高于GM(1,1)模型和SVR模型;GM-SVR模型確定性系數0.92,與GM(1,1)模型相同,遠高于SVR模型。因此分析多種指標后表明 GM-SVR模型預測結果更逼近徑流實測值,具有最佳的預測性能。
表2 石鼓2000年~2004年逐月預報統計值

模型模型誤差在各誤差范圍內所占比例/%MRE≤5%≤10%≤20%確定性系數RGM(1,1)125382930.92SVR116582900.85GM-SVR96883950.92
汛期(6月~10月)預報結果誤差統計如表3所示,GM-SVR模型汛期平均相對誤差為12%,低于GM(1,1)模型的14%,遠低于SVR模型的20%;GM-SVR模型誤差5%、10%、20%內百分比為48%、60%、80%,均遠高于GM(1,1)和SVR模型。因此,GM-SVR模型對汛期徑流的預測精度更高,可見GM-SVR模型更有利于指導水資源的發電和防洪調度,具有更大的工程應用價值。

表3 石鼓6~10月預報結果誤差統計 %
綜合比較表2和表3結果可看出,SVR模型對變化劇烈的汛期徑流預測能力較差,原因是在小樣本情況下,SVR模型對變化劇烈的徑流序列泛化能力較弱;而GM(1,1)模型對較平穩枯期徑流的逼近能力弱于SVR;GM-SVR模型克服了GM(1,1)和SVR模型的缺陷,不論在全年還是汛期都表現出了最高的預測精度。
針對支持向量機在有限樣本情況下泛化能力較差的缺陷,本文建立了一種基于GM-SVR耦合的月徑流預測模型并應用于金沙江上游控制站石鼓水文站。其月徑流的預測充分說明了該模型的實用性和優越性。研究表明:
(1)將灰色預測和支持向量機相結合,利用了灰色預測對徑流趨勢良好的預報性能和支持向量機回歸對隨機非線性徑流強大的逼近能力,為月徑流可靠預報奠定了基礎。
(2)GM-SVR模型將歷史同期徑流數據融入到傳統支持向量機預測中,在有限數據長度情況下,提高了數據利用效率,充分挖掘了月徑流年際趨勢和年內變化不均勻特性,在有限樣本學習下,增強了模型泛化性能。
(3) GM-SVR模型月徑流預測精度較單一的GM(1,1)和SVR模型有較大的提高,尤其是對于劇烈變化的汛期徑流預測,相比傳統的GM(1,1)和SVR模型魯棒性更好、預測精度更高,是一種很有應用前景的月徑流預測方法。
[1]廖杰, 王文圣, 李躍清, 等. 支持向量機及其在徑流預測中的應用[J]. 四川大學學報: 工程科學版, 2006, 38(6): 24228.
[2]王文圣, 丁晶, 李躍清. 水文小波分析[M]. 北京: 化學工業出版社, 2005.
[3]張衛國, 鐘平安, 張玉蘭, 等. 季節性支持向量機中長期徑流預報模型[J]. 水力發電, 2014, 40(4): 17- 21.
[4]周秀平, 王文圣, 黃偉軍. 支持向量機回歸模型在徑流預測中的應用[J]. 水電能源科學, 2006, 24(4): 4- 6.
[5]CORTES C, VAPNIK V. Support-vector networks[J]. Machine Learning, 1995, 20(3): 273- 297.
[6]VAPNIK V. The Nature of Statistical Learning Theory[M]. New York: Springer Verlag, 1999.
[7]SMOLA A J, SCHOELKOPF B. A tutorial on support vector regression[J]. Statistics and Computing, 2004, 14: 199- 222.
[8]郭俊, 周建中, 張勇傳, 等. 基于改進支持向量機回歸的日徑流預測模型[J]. 水力發電, 2010, 36(3): 12- 15.
[9]于國榮, 夏自強. 混沌時間序列支持向量機模型及其在徑流預測中應用[J]. 水科學進展, 2008, 19(1): 116- 122.
[10]劉芳, 周建中, 邱方鵬, 等. 基于相關向量回歸的非線性時間序列預測方法[J]. 計算機工程, 2008, 34(3): 1- 2, 5.
[11]鄧聚龍. 灰色理論基礎[M]. 武漢: 華中科技大學出版社, 2002.
[12]劉思峰, 楊英杰, 吳利非, 等. 灰色系統理論及其應用 [M]. 北京: 科學出版社, 2000.
[13]馮利華. 水資源變化趨勢的灰色聚類預測[J]. 資源科學, 1999, 21(3): 11- 15.
[14]王渺林. 長江上游寸灘站年最高水位預測模型研究[J]. 水資源研究, 2005, 26(3): 35- 36.
[15]DENG J. L. Introduction to grey system theory [J ]. The Journal of Grey System (U K), 1989, 1(1): 1- 24.
[16]HSU C W, CHANG C C, LIN C J. A practical Guide to Support Vector Classification[J]. Technical report, Department of Computer Science and Information Engineering, 2003.
(責任編輯陳 萍)
Research and Application of Monthly Runoff Forecast Model Based on GM-SVR Coupling
ZHU Shuang, ZHOU Jianzhong, DING Xiaoling, XIE Mengfei, WU Jiang
(Huazhong University of Science and Technology, Wuhan 430074, Hubei, China)
The monthly runoff has a strong correlation with both the same period runoff in the history and nearby runoff. The previous prediction methods for monthly runoff often use only one kind of runoff series, which led to the loss of available information. So, a combination forecasting model based on Grey Theory and Support Vector Machine regression is presented. The model comprehensively utilizes annual and inter-annual runoff information. Compared to single grey model and support vector machine model, the results show that the performance of combination model is obviously better, especially for the flood season runoff predictions.
Support Vector Machine; Gray Theory; Kernel Function; monthly runoff

2014- 07- 26
國家自然科學基金項目(51239004);高等學校博士學科點專線科研基金資助項目(20100142110012)
朱雙(1990—),女,湖北武漢人,博士研究生,研究方向為水文水資源;周建中(通訊作者).
P338.2
A
0559- 9342(2015)12- 0017- 04