倪遠臣
(遼寧省東港市友誼灌區(qū)管理處 遼寧 丹東 118300)
近年來,許多學者著眼于降水量的研究,取得了較為可觀的結果,其方法層出不窮,基于預測模型的研究深受諸多學者喜愛。滕衛(wèi)平等(2008)應用SVM回歸法對浙江省汛期旱澇災害進行預測[1]。周振民等(2011)運用BP神經(jīng)網(wǎng)絡對鄭州市旱災進行預測,該模型對預測鄭州旱災發(fā)生情況具有重要的參考價值,依據(jù)BP神經(jīng)網(wǎng)絡預測模型的預測結果結合鄭州市的實際情況提出可靠的防災、減災對策[2]。鑒于上述研究,本文將運用支持向量的降水量預測模型,對遼寧省東港市降水量進行預測分析,以期得較好的預測效果,為東港市降水量預測提供一種新的思路。
支持向量機 (SupportVectorMachines,SVM)由Vapnik在20世紀90年代發(fā)明,是統(tǒng)計學理論上一種通用的學習算法,它基于核函數(shù)進行學習,具有數(shù)據(jù)挖掘能力。支持向量機的基本思路是通過非線性映射將輸入空間的低維變量變換到一個高維的特征空間中,在這個高維特征空間中進行線性回歸,非線性變換。支持向量機方法具有三個主要優(yōu)點:首先,SVM算法最終將轉化成為一個二次型尋優(yōu)問題,解決了神經(jīng)網(wǎng)絡方法中局部極值問題;其次,針對有限樣本情況,其目標是得到現(xiàn)有信息下的最優(yōu);第三,支持向量機模型將實際問題通過非線性變換轉換到高維的特征空間,在高維空間中構造線性判別函數(shù)來實現(xiàn)原空間中的非線性判別函數(shù),同時它巧妙地解決了維數(shù)問題。基于上述優(yōu)點SVM被廣泛應用于回歸問題(時間序列分析)和模式識別(分類問題、判別分析)并推廣到預測和綜合評價等領域[3-5]。
其基本原理如下:假定給定的訓練樣本為(xi,yi)(xi∈Rn為輸入變量,yi∈Rn為對應輸出值,i=1,2…L,L為樣本個數(shù)),通過一個非線性映射Φ將數(shù)據(jù)映射到高維特征空間F,實現(xiàn)將非線性回歸問題轉化為高維特征空間的線性問題,

其中:b為閥值,w為權值矢量,Φ(x)是將樣本點映射到高維空間的非線性變換,f(x)為x的非線性函數(shù),同時又是Φ(x)的線性函數(shù),x和b是通過正則化和結構風險準則來估計的,根據(jù)結構風險最小化準則得:

ε為引入的不敏感損失函數(shù),其定義為:



通過利用對偶原理、拉格朗日乘子法以及核函數(shù)方法其回歸方程最終表達式為:

其中:ai*、ai為二次規(guī)劃中的拉格朗日乘子,常用核函數(shù)有線性核函數(shù)、多項式核函數(shù)、徑向基核函數(shù)和Sigmoid核函數(shù),本文選用徑向基核函數(shù):

其中,k(x,xi)是滿足Mercer條件的核函數(shù),其作用是不必知道從低維輸入空間到高維特征空間非線性映射的Φ (x)具體形式,通過引入核函數(shù)就可得到回歸方程。
BP(Back Propagation Network)人工神經(jīng)網(wǎng)絡是由Rumelhart和Mc Celland為首的科學家小組于1986年提出的,是一種按誤差逆?zhèn)鞑ニ惴ㄓ柧毜亩鄬忧梆伨W(wǎng)絡,是目前應用最廣泛的神經(jīng)網(wǎng)絡模型之一。BP神經(jīng)網(wǎng)絡能夠?qū)W習和存貯大量的輸入—輸出模式映射關系,具有拓撲結構,包括輸入層(input)、隱層 (hidelayer)和輸出層(output layer)。由于其具有大規(guī)模處理信息、存儲信息及良好的自主學習能力等特點,被廣泛應用于諸多領域[6-8]。

圖1 東港市降水預測值與真實值對比圖

表1 預測模型精度表
東港市地處遼東半島東端,位于東經(jīng)123°22′~124°22′,北緯 39°45′~40°15′,隸屬于遼寧省丹東市,南臨黃海,東依鴨綠江,和朝鮮隔江相望,與日本一衣帶水,擁有沿海、沿江、沿邊的地理優(yōu)勢,是中國海岸線上最北端的縣級市。它是一座新興沿海港口城市,境內(nèi)邊境線23.85km,海岸線93.5km,全境東西極長83km,南北極寬 38km,陸域面積 2396km2,海域面積3500km2。轄15個鄉(xiāng)鎮(zhèn)、3個街道辦事處、5個國有農(nóng)場、2個省級經(jīng)濟開發(fā)區(qū),總人口64萬。東港屬溫帶濕潤地區(qū)大陸性季風氣候,并具有海洋氣候特點,四季分明。年平均降雨量786mm,年平均氣溫8.9℃,有大小河流12條、水庫42座,水資源儲量為全省平均水平的3倍,城市日供水能力20萬t,是環(huán)黃渤海著名的豐水城市。東港是東北出海口,素有“北國江南”的美譽,2010年躋身“全國百強縣”。
根據(jù)遼寧省東港市44年(1970年~2013年)年均降水量通過matlab工具建立基于支持向量機的降水量預測模型、BP神經(jīng)網(wǎng)絡降水預測模型。基于SVM的降水量預測模型、BP神經(jīng)網(wǎng)絡預測模型均選取34年降水量作為訓練樣本,10年的降水量作為測試樣本。支持向量機參數(shù)的選擇,即不敏感損失函數(shù)ε和誤差懲罰因子C,ε影響支持向量的數(shù)目,ε值越大,支持向量數(shù)目就越少,估計的函數(shù)精度越低;C取得小,訓練誤差變大,系統(tǒng)的泛化能力變差,C值大,泛化能力下降,以平均相對誤差最小為尋優(yōu)條件,得到不同序列的最優(yōu)參數(shù);BP神經(jīng)網(wǎng)絡降水量預測模型選用單一隱層的拓撲結構,輸出層神經(jīng)元傳遞函數(shù)設定為tansig,訓練函數(shù)設定為trainglm,學習速率初始值為0.1,動量系數(shù)的初值設值為1,訓練次數(shù)為1000次。在模型運行過程中發(fā)現(xiàn),BP神經(jīng)網(wǎng)絡表現(xiàn)出它固有的弊端,即BP神經(jīng)網(wǎng)絡降水量模型需經(jīng)過多次試錯法才能最終確定預測的結果;而SVM支持向量機降水量預測模型表現(xiàn)出較好的自主學習能力、泛化能力,收斂速度快。兩種預測模型的預測結果,如圖1所示。
選擇均方誤差(MSE)和確定性系數(shù)(R2)作為基于支持向量機的降水預測模型、BP模型預測精度的評價標準。公式如下,模型精度檢驗結果如表1所示:

其中:Ro為實際降水值;Rm為預測降水值為實際降水量平均值;
表1結果所示:遼寧省東港市基于支持向量機的降水量預測模型的預測值均方誤差(MSE)值小于BP神經(jīng)網(wǎng)絡預測結果,決定系數(shù) (R2)大于BP神經(jīng)網(wǎng)絡預測模型的預測結果。可見,基于SVM的降水量預測模型能夠真實的反應東港地區(qū)降水量的變化,其預測結果優(yōu)于基于BP神經(jīng)網(wǎng)絡降水量預測模型,且學習速度快,克服了傳統(tǒng)BP神經(jīng)網(wǎng)絡的一些缺點,將支持向量機的降水量預測模型應用到遼寧省丹東市降水量預測中具有一定的可行性。
基于支持向量機的降水量預測模型具有結構簡單、學習速度快、全局最優(yōu)、泛化性能好等優(yōu)點,能較好解決小樣本、非線性、高維數(shù)和局部極小等問題,克服了傳統(tǒng)的神經(jīng)網(wǎng)絡模型所固有的局部極小點、過學習現(xiàn)象以及結構和類型的選擇過于依賴經(jīng)驗等缺陷[9]。通過對遼寧省東港市44年的年均降水量的預測研究發(fā)現(xiàn),基于SVM的降水量預測模型可以有效的預測東港市的降水量,且方法簡單,獲得了較高的預測精度,為東港市降水量變化提供了依據(jù),具有較大的參考價值。陜西水利
[1]藤衛(wèi)平,俞善賢,胡波等.SVM回歸法在汛期旱澇預測中的應用研究.浙江大學學報(理學版),2008,35(3):343-347.
[2]周振民,謝濱帆.BP神經(jīng)網(wǎng)絡在鄭州市旱災預測中的應用及防災減災對策.中國農(nóng)村水利水電,2011,12:97.
[3]劉向東,駱斌,陳兆乾.支持向量機最優(yōu)模型選擇的研究[J].計算機研究與發(fā)展,2005,42(4):576一581.
[4]Vapnik著,張學工譯.統(tǒng)計學習理論本質(zhì)[M].北京:清華大學出版社,2000.
[5]刑佳瑩,黎奧華,張佳薇.基于粒子群優(yōu)化支持向量機的時間序列木材含水率預測[J].林業(yè)科技,2012,37(1):24-27.
[6]曹廣學,張世泉.2005.BP模型在降雨徑流預報中的應用研究.太原理工大學學報,36(3):350~353
[7]孫吉輝.基于人工神經(jīng)網(wǎng)絡模型的降水量預測研究[D].山東青島:中國海洋大學,2008.
[8]董長虹.MATLAB神經(jīng)網(wǎng)絡與應用 [M].北京:國防工業(yè)出版社,2005.
[9]BURGES C. A tutorial on support vector machines for pattern recognition[J]. Data Mining and Knowledge Discovery, 1998,2(2):121-127.