張和喜, 遲道才, 王永濤, 王富臣
(1.沈陽農業大學 水利學院, 沈陽 110016; 2.貴州省水利科學研究院, 貴陽 550002)
基于NNBR與蒙特卡洛算法的降雨量預報模型應用研究
張和喜1,2, 遲道才1, 王永濤2, 王富臣2
(1.沈陽農業大學 水利學院, 沈陽 110016; 2.貴州省水利科學研究院, 貴陽 550002)
從統計學的觀點去了解和分析降雨歷史的復雜過程,并從中發現其存在的內在規律,為預測未來降雨量提供理論依據。該文在分析了蒙特卡洛算法及其分布函數的基礎上,使用P-Ⅲ型分布函數對降雨量進行模擬,提出了基于NNBR與蒙特卡洛算法相結合的降雨量預報模型。通過基于NNBR的蒙特卡洛預測值與實際值驗證得出,各年的誤差均小于10%,循環次數增加,誤差逐漸變小,所以本文所建立的預報模型基本可以滿足生產實際要求。同時,基于NNBR模型的蒙特卡洛算法優于僅使用蒙特卡洛算法的比率為89.1%,表明本文所使用的預測效果較優。最后,以北盤江水系50 a數據對預報模型結果進行驗證,并對未來5 a的降雨量開展了預測。預測結果既體現了降雨量的隨機性和統計的規律性,又反映出降雨序列的時間性,應用效果較好。
NNBR模型; 蒙特卡洛算法; P-Ⅲ型分布函數; 降雨量預報模型
降雨的發生機理是一個十分復雜的過程,不但具有隨機性和周期性,還具有復雜性,如:相似性、灰色性、混沌性、非線性等。目前,對于降雨量預報主要有天氣學方法、數值天氣預報、統計預報等方法,大量事實表明,這些方法富有一定的成效。但如果僅僅依靠降雨量的單一性進行模擬預報,預報結果有失客觀和準確。近年來,隨著數理統計學的快速發展,從統計學的觀點去了解和分析歷史,并從中發現其存在的內在規律,為預測未來發生事件提供有力的支持。已有研究表明單獨運用蒙特卡洛方法預測未來降雨量,預測序列雖然很好地體現了研究地區降雨量發生的隨機性和統計規律性,但是卻不能夠準確反映出降雨序列的時間性,使預報序列的排列具有多解性[1]。而用最近鄰抽樣模型(NNBR模型)來預測未來的降雨量,其假設為客觀世界的發生、發展和演變存在一定的聯系,未來的運動軌跡與歷史具有相似性。NNBR應用特征序列來預測下一個降水量,使降雨量的預測具有時間性[2]。故本文將蒙特卡洛和NNBR模型相結合,提出基于NNBR與蒙特卡洛算法相結合的降雨量預報模型,利用回溯算法對預測降雨量序列進行回溯檢測,有效解決預報序列排列的多解性問題,使預報結果具有時間性,預測序列可以很好地體現研究地區降雨量發生的隨機性和統計規律性,并能夠準確反映出降雨預測序列的時間性。
最近鄰抽樣回歸模型是基于數據驅動、無需識別參數的非參數模型。該模型假設客觀世界的發生、發展和演變存在一定的聯系,未來的運動軌跡與歷史具有相似性,利用歷史數據的變化趨勢對未來數據變化趨勢進行預測。根據研究對象的不同,將NNBR模型分為單因子模型和多因子模型兩種形式[3-5],由于預測對象包含多個因子,故本文采用多因子模型。
1.1 模型原理及算法
設有水文時間序列Xt,它是有眾多因子影響的,一般考慮其中P個主要的影響因子,記為Z1,t,Z2,t,…,Zp,t(t=1,2,…,n;n為資料的長度)。由歷史數據構造特征矢量Dt=(Z1t,Z2,t,…,Zp,j),則Xt與Dt一一對應,可以寫成Dt=(Z1,t,Z2,t,…,Zp,t)?Xt。已知當前矢量Di=(Z1,j,Z2,i,…,Zp,i),預測Xi的基本思路與單因子NNBR模型相同,即在n個現有特征矢量Dt(t=1,2,…,n)中尋找與Di最近鄰的K個特征矢量。多因子NNBR模型基本形式同(1)式:
(1)
多因子模型的基本原理反映了客觀世界的發生、發展和演變存在一定的聯系,未來的運動軌跡與歷史具有相似性。即未來的發展模式Di=(Z1,j,Z2,j,…,Zp,j)?Xi可從已知模式Dt=(Z1,j,Z2,j,…,Zp,t)?Xt(t=1,2,…,n)中去尋找。可以看出,NNBR模型的關鍵在于確定最近鄰數K,特征矢量維數P和抽樣權重Wj(t)。
1.2 K、P和Wj(i)的確定


(2)
即特征矢量的權重與距離成反比,然后再歸一化,得到最后權重Wj(i)。
2.1 蒙特卡洛算法的概述
蒙特卡洛法又稱統計模擬實驗法,隨機模擬法。近年來,由于電子計算機的發明和科學技術的不斷進步,蒙特卡洛法逐漸作為一種獨立的方法被提出來,并首先在核武器的試驗與研制中得到了應用。蒙特卡洛方法是一種計算方法,但與一般數值計算方法最大的區別在于它是以概率統計理論為基礎。因為該方法能夠比較逼真地描述事物的特點及物理實驗過程,解決一些數值方法難以解決的問題,因而該方法的應用領域日趨廣泛[7]。
2.2 蒙特卡洛的基本應用
通常蒙特卡洛方法大體可以分成兩類:① 求解問題本身就具有概率和統計性。② 對于不具有隨機性質的確定性問題,就必須事先構造一個人為的概率過程,將不具有隨機性質的問題轉化為隨機性質的問題。近年來,由于信息技術的發展,蒙特卡洛算法在現代化的科學技術中發揮應有的作用。蒙特卡洛方法的一般步驟為:① 用蒙特卡洛方法模擬某一過程,產生各種概率分布的隨機變量。② 用統計方法把模型的數字特征估計出來,從而得到實際問題的數值解[8]。
由于降雨影響因素很多,因此降雨過程在時間上表現為隨機性。分布函數的選取應該按照以下兩個準則進行:① 密度函數的形狀應基本符合水文現象的物理性質,曲線一端或兩端應有限,不應出現負值。② 概率密度函數的數學性質簡單,計算方便,同時應有一定的彈性。以便有廣泛的適應性,但又不宜包含過多的參數。國內外的研究表明:在水文分析中P-Ⅲ型和K-M型曲線適應性都很強,只要參數Cv和Cs選用適當,都能與洪水資料相適應。我國現行制訂的水文計算規范中規定采用P-Ⅲ型分布函數[9]。
若有隨機變量x服從P-Ⅲ型分布函數,其概率表達見式(3):
(3)



式(3)直接計算復雜而困難,我們進行變量的替換,令t=β(x-α0),代入(3)可得:
(4)
式(4)中當P值已知時,tp僅依賴α或Cs。將x用t表示可得:
(5)

(6)
由于tp是xp的數學代換,同樣服從伽瑪分布。利用matlab函數x=gaminv(P,A,B)可得:
(7)

4.1預測值的選擇
為了保持預報序列和原始序列具有相同的概率特性,需要滿足兩個原則:① 預測值生成時遵循了歷史數據的分布概率規律;② 整個預報序列年降雨量的平均值與過去資料的年降雨量平均值近似相等。

4.2 Cs,Cv的選擇與確定

4.2.2 離差平方和準則的優化適線法 離差平方和準則的優化適線法就是使經驗點據和同頻率曲線縱坐標之差的平方和達到最小。對于P-Ⅲ型曲線,就是使下列目標函數取最小。
(8)
即S(Q′)=minS(Q)
(9)
由于樣本通過矩估計的均值誤差很小,一般不再使用優化適線法估計。通常只用優化適線法估計Cv和Cs兩個參數值。圖1為同均值時,離差系數Cv和偏態系數Cs的關系圖,可以看出,當離差平方和最小時,可以確定Cv=0.1110,Cs=0.7869,誤差Emin=4.0664E+004。選擇不同Cv和Cs,得到不同P-Ⅲ型曲線累積概率圖。由圖2可以看出其中當Cv=0.1110,Cs=0.7869時得到的經驗累積概率和P-Ⅲ曲線累積概率圖非常接近,說明此時Cv和Cs確定的P-Ⅲ型曲線能夠模擬樣本的分布情況[11]。

圖1離差系數Cv和偏態系數Cs的關系圖2經驗累計和Cv、Cs確定的P-Ⅲ的累計概率
4.3 分析步驟及算法流程



5.1 研究區域降雨量特征
北盤江水系屬于珠江流域,全長450km,貴州省境內長352km,流域面積26 538km2,貴州省境內20 982km2,涉及威寧、水城、六枝、盤縣、普安、晴隆、興仁、安龍、貞豐、冊亨、望謨、紫云、鎮寧、關嶺、普定、西秀16個縣(市、區)。流域內水資源豐富,年平均降雨量約為1 280mm。但降雨時空和地域分布不平衡:南多北少,山區多于河谷,迎風面降雨多,背風面降雨少。同時,區域土層薄,坡地土壤易侵蝕,風化土層,土質疏松易被沖刷,土壤蓄水保墑能力差。近年來水旱災害頻發。干旱的大致規律為“年年有旱情、三年一小旱、五年一中旱、十年一大旱”特點。頻發的旱災,給區域經濟社會帶來了巨大的損失,影響了社會的和諧穩定。同時年降雨量作為區域干旱最為顯著的致災因素,與眾多干旱指標相關性最大,因此對降雨量的預報工作尤為重要。
5.2 算法驗證
本實驗中,根據北盤江地區1961—2010年50a降雨實測數據,將數據劃分為訓練數據(前45年)和測試數據(后5a)。在連續的45a訓練數據中,分別計算了前m(m∈[1,2,…,m])年的均值,當m=25時,能夠很好地代表第一個歷史降雨量年均值,最小最大降雨量年平均值區間為[1 354.6mm,1 396.2mm]。訓練數據分別使用蒙特卡洛方法和基于NNBR模型的蒙特卡洛方法對未來5a進行預測,得到一個長度為5的預測序列,然后與測試數據(真實數據)對應計算相對誤差,最后計算整個序列與測試數據序列的總相對誤差平方和S2。為了能夠更好地比較兩種方法的結果,本實驗循環運行8次,并將所得的結果填入表1。其中測試數據在每次循環運行時相同,其降雨量序列值為:1 146.8,1 406.2,1 419.9,1 046.5,1 230.1mm。

表1 蒙特卡洛和NNBR+蒙特卡洛算法的預測結果比較
*其中,S2表示預測序列相對于真實序列的相對誤差平方和。
同時,基于NNBR的蒙特卡洛預測值與實際值比較可以看出,各年的誤差均小于10%,循環次數增加,誤差逐漸變小,所以本文所建立的預報模型基本可以滿足生產實際要求。為了能夠更好地說明上面的八次循環不是偶然的,又重復運行1 000次,其中基于NNBR模型的蒙特卡洛算法優于蒙特卡洛算法次數為891次,劣于蒙特卡洛算法109次。由此可以看出基于NNBR模型的蒙特卡洛算法好于蒙特卡洛算法。
5.3 未來降雨量的預測
以50 a的歷史數據對未來5 a的降雨量進行預測,分別使用蒙特卡洛算法和基于NNBR模型的蒙特卡洛算法得到不同的預測序列數據如表2所示。

表2 蒙特卡洛和基于NNBR模型的蒙特卡洛算法對未來5年降雨量的預測值 mm
本文根據蒙特卡洛算法原理,通過P-Ⅲ型函數對歷史降雨量進行模擬,將蒙特卡洛算法與NNBR模型相結合,采用研究區域50 a的降雨實測資料,并將其劃分為訓練數據(前45年)和測試數據(后5年),構建了貴州北盤江水系降雨量預報模型。基于NNBR的蒙特卡洛預測值與實際值模型驗證結果表明,各年的誤差均小于10%,循環次數增加,誤差變小趨勢明顯。所以本文所建立的預報模型與實際情況較為相符,基本可以滿足生產實際要求。同時,開展基于NNBR模型的蒙特卡洛方法與蒙特卡洛方法比較,基于NNBR模型的蒙特卡洛算法好于蒙特卡洛算法的比率為89.1%,表明前者優于后者。最后利用基于NNBR與蒙特卡洛算法的降雨量預報模型來預測未來5 a降雨量,準確地反映了研究區降雨量發生的隨機性和統計的規律性,以及降雨序列的時間性,具有重要的理論和實際意義。
[1] 韋慶,盧文喜,田竹君.運用蒙特卡洛方法預報年降雨量研究[J].干旱區資源與環境,2004,18(4):144-146.
[2] 楊金玲,吳亞楠,謝淼,等.蒙特卡洛法在嫩江流域汛期降雨量預測中的應用[J].南水北調與水利科技,2011,9(3):28-29.
[3] 王文圣,袁鵬,丁晶.最近鄰抽樣回歸模型在水環境預測中的應用[J].中國環境科學,2001,21(4):367-370.
[4] 王文圣,向紅蓮,丁晶.最近鄰抽樣回歸模型在水文水資源預報中的應用[J].水電能源科學,2001,19(2):8-10.
[5] 劉東,付強.小波最近鄰抽樣回歸耦合模型在三江平原年降水預測中的應用[J]. 灌溉排水學報,2007,26(4):82-85.
[6] 焦瑞峰,吳昊,師洋.基于灰色關聯分析的蒙特卡洛法建立水庫出庫水質預測模型[J].環境工程,2006,24(4):63-65.
[7] 張弦.基于改進粒子濾波算法的移動機器人定位[D].北京:北京郵電大學,2010.
[8] 董麗麗,徐淑琴,劉楊,等.小波隨機耦合模型在查哈陽農場降雨量預測中應用[J].中國農村水利水電,2011(4):26-28.
[9] 黃顯峰,邵東國,陽書敏.降雨時間序列分解預測模型及應用[J].中國農村水利水電,2007(9):6-8.
[10] 周愛霞,張行南.優化適線法在水文頻率分析中的應用[J].人民長江,2007,38(6):38-39.
[11] 崔磊,遲道才,曲霞.基于小波消噪的平穩時間序列分析方法在降雨量預測中的應用[J].中國農村水利水電,2010(9):30-35.
[12] 任曄,徐淑琴.灰色神經網絡組合模型在慶安縣年降雨量預測中的應用[J].節水灌溉,2012(9):24-25.
AppliedResearchoftheRainfallForecastModelBasedonNNBRandMonte-CarloAlgorithm
ZHANG He-xi1,2, CHI Dao-cai1, WANG Yong-tao2, WANG Fu-chen2
(1.CollegeofWaterResources,ShenyangAgriculturalUniversity,Shenyang110161,China; 2.GuizhouAcademyofHydraulicSciences,Guiyang550002,China)
From the statistical point, the complex historical process of rainfall was understood and analyzed, and the inherent law of its existence was found for the purpose of providing the theoretical basis for predicting the future rainfall. This paper had analyzed the Monte-Carlo algorithm and its distribution function, we had used the P-type Ⅲ distribution function to simulate rainfall and put forward the rainfall forecast model based on NNBR algorithm and the Monte-Carlo algorithm. Based on comparing Monte-Carlo predicted value to obserbed value, the result of error is less than 10%, the more cycling times, the less error, so the prediction model established in this paper can meet the production requirements basically. At the same time, the model based on NNBR Monte-Carlo algorithm is better than that of only using the Monte-Carlo algorithm of the ratio of 89.1%, indicating that the forecast accuracy presented in the paper is the best. Finally, with Beipaniiang drainage 50 years data,we had validated the result from the forecast model, and rainfall was predicted in the next five years. The results not only embody the randomness and statistical regularity of rainfall, but also reflect the rainfall sequence of timeliness, and the application effect is good.
model of NNBR; Monte-Carlo algorithm; P-Ⅲ distribution function; rainfall forecast model
2013-08-21
:2013-09-23
國家公益性行業(農業)科研專項(201303125);水利部公益性行業科研專項經費項目(201201025,201301039)
張和喜(1980—),男,湖北荊州人,在讀博士,主要從事節水灌溉原理與技術研究。E-mail:hexi0926@126.com
遲道才(1964—),男,遼寧沈陽人,博士生導師,主要從事灌溉排水原理與技術。E-mail:daocaichi@vip.sina.com
P457.6
:A
:1005-3409(2014)02-0106-05