劉 倪,葉金印
(1.南京大學大氣科學學院,江蘇南京 210093;2.淮河流域氣象中心,安徽蚌埠 233000)
基于RBF神經網絡馬爾可夫模型的淮河流域汛期暴雨量預測
劉 倪1,2,葉金印2
(1.南京大學大氣科學學院,江蘇南京 210093;2.淮河流域氣象中心,安徽蚌埠 233000)
利用淮河流域1960-2007年172個臺站汛期(6-9月)逐日降水資料,選取40個代表站,統計出代表站48年間逐年汛期暴雨量并建立時間序列,針對RBF神經網絡和馬爾可夫預測的優缺點,建立起RBF神經網絡與馬爾可夫模型相耦合的預測模型,并將該模型應用于淮河流域2006-2007年汛期暴雨量預測,預測結果令人滿意。
RBF神經網絡;馬爾可夫模型;暴雨量預測
淮河干流發源于河南省桐柏山,東流經豫、皖、蘇三省,在江蘇三江營入長江,全長1000 km,總落差200m,平均比降約萬分之二。淮河流域多年平均降雨量為883mm,50%~80%的降雨量集中在6-9月,且降雨年際變化大,豐水年的雨量多達枯水年的5倍;地區分布也不均勻,北部沿黃地區平均年降雨量為600~700mm,而南部及西部山區平均年降雨量可達900~1400mm。
淮河流域地理位置特殊,氣候條件復雜,流域平原廣闊,地勢低平,洼地易澇面積廣,人水爭地矛盾突出,加之歷史上黃河長期奪淮,使淮河失去了獨立的入海通道,造成淮河水系紊亂,環境惡化,加重了其水旱災害,這些因素共同決定了淮河流域是一個水旱災害頻繁發生的地區。淮河之流域內跨省河道多,河流上下游、左右岸、干支流等水事關系復雜,矛盾多,各方利益難以平衡,治理工作難度大;且干旱和水污染問題也十分突出。因此,研究淮河流域暴雨預測方法就顯得尤為重要且迫切。本文利用RBF神經網絡與馬爾可夫鏈預測的優勢,建立一個基于RBF神經網絡與馬爾可夫鏈的組合預測模型,并利用該模型對淮河流域2006-2007年汛期暴雨量進行預測,驗證其可行性,以期為相關研究提供參考。
本文所用資料為淮河流域氣象中心整編的淮河流域4省(河南、江蘇、安徽、山東)172個監測站1960-2007年汛期(6-9月)逐日氣象資料,以此為基礎統計出淮河流域40個代表站逐年汛期暴雨量并建立時間序列。代表站點的選擇主要依據以下標準:一是由于各站建站年代參差不齊,本著使所建時間序列盡可能長的原則,選取1960年及以前建站的站點,排除1961年及更晚建的站點;二是剔除51年中站點變動較大的測站;三是臺站等級要高,盡量選擇基準站和基本站。
RBF神經網絡是由Moody和Darken在1989年提出的,它模擬了人腦中局部調整、相互覆蓋接受域的神經網絡結構,具有很強的生物背景和逼近任意非線性函數的能力。它是一種三層前饋式神經網絡,其拓撲結構如圖1所示。根據圖中箭頭從左到右分別為輸入層、隱含層和輸出層。輸入層節點只傳遞輸入信息到隱含層,隱含層節點對輸入信號在局部產生響應,即當輸入信號靠近基函數的中央范圍時隱含層節點產生較大輸出,輸出層節點通常是簡單的線性函數,徑向基函數網絡也稱為局部感知場網絡。
RBF網絡的學習過程分為2個階段:第1階段,根據所有輸入樣本決定隱含層各節點的徑向基函數的中心值和徑向基函數的寬度;第2階段,在決定好隱含層的參數后,根據樣本,求出輸出層的權值。由此可見,確定中心和權值是RBF的關鍵任務。事實上,一旦確定了徑向基函數的中心,則對于所有的訓練樣本而言,基函數和預期輸出是已知的,輸出權值可以由最小二乘法等方法求出。因此建立RBF神經網絡的核心問題是根據給定的訓練樣本確定徑向基函數的中心。

圖1 徑向基網絡的結構
馬爾可夫鏈是一種特殊的隨機過程,其基本原理是:按照某系統的發展,時間可離散為n=0,1,2,3,…,對每個系統的狀態可用隨機變量表示,并且對應一定的概率,稱為狀態概率。當系統由某一階段狀態轉移到另一階段狀態時,在這個轉移過程中,存在著轉移的概率,稱之為轉移概率。馬爾可夫鏈預測是根據初始的狀態概率向量和狀態轉移矩陣來推測某一變量未來某一時期所在狀態的一種方法。
3.1 狀態劃分
根據馬爾可夫鏈將數據劃分為多個不同的狀態,分別用E1,E2,…,Em來表示,并且狀態轉移只在t1,t2,…,tm等可數時刻發生。
3.2 狀態轉移概率
馬爾可夫鏈由狀態Ei經過K步轉移到狀態Ej的轉移概率用Pij(k)表示:
Pij(k)=mij(k)/Mi。
式中,Mi表示狀態Ei出現的總次數,mij(k)表示狀態Ei經過K步轉移到狀態Ej的次數,m為劃分的狀態的數目,則一步狀態轉移概率矩陣如下:

反復使用C-K方程(切普曼-柯爾莫哥洛夫方程),則K步的轉移概率矩陣為:

3.3 預測模型
若某一變量初始狀態Ei的初始向量為P(0),經過K步轉移后的狀態向量為:

優選法是以較少的試驗次數找到最優方案的方法,其中最常用的就是黃金分割法。黃金分割率可以有效地應用于最優方案的選擇。將其推廣,黃金分割率亦可以有效地應用于馬爾可夫鏈狀態區間的劃分。設某指標z的均值為Z,黃金分割率A=0.618,則該指標可按下式計算分割點N,實現t個量級的劃分:

其中,s和量級t可依據指標z的值域大小來選取。
5.1 建模原理
RBF神經網絡馬爾可夫預測的基本思路:首先建立RBF神經網絡預測模型,再運用馬爾可夫模型,對由RBF神經網絡預測得到的結果進行分析,探明其誤差的波動幅度與波動發展趨勢,獲得誤差的狀態轉移概率矩陣,并據此矩陣對RBF神經網絡預測結果進行修正,每個預測值被修正為一組由概率狀態表示的預測區間值。
5.2 RBF神經網絡模型建模
首先應用相關分析計算,求得年汛期暴雨量數據的自相關系數。結果表明,年汛期暴雨量與其之前1,2,5,6,7年的相關度最大。因此,選取前1,2,5,6,7年的汛期暴雨量資料(5個數據)作為RBF輸入,當年的汛期暴雨量作為網絡輸出,以此構造RBF神經網絡模型。選擇1967-2007年的年汛期暴雨量數據作為樣本,進行RBF神經網絡的訓練擬合。并利用訓練好的RBF神經網絡預測1967-2007年的年汛期暴雨量,以驗證該方法的有效性,預測結果見表1。
5.3 劃分狀態區間
計算得到RBF預測值的歸一化相對誤差均值為0.213,采用黃金分割率法對狀態區間進行劃分。考慮到數據量較多的實際情況,公式取s=-1,1和0,可得區間[0,0.1316],(0.1316,0.213],(0.213,0.3447],(0.3447,1]。再利用X=Xmin+X’(Xmax-Xmin)式將各區間還原最終馬爾可夫狀態區域劃分為如下4種狀態:[-0.188,-0.0621],(-0.0621,0.0158],(0.0158,0.1419]和(0.1419,0.769]。

表1 RBF神經網絡汛期暴雨量預測結果
5.4 “馬氏性”檢驗
計算出統計量X2=19.88。取置信度a=0.05,查表得X((m-1)2)=16.919,可知X2>((m-1)2),認為該年暴雨量序列符合“馬氏性”。
5.5 計算轉移概率矩陣
由劃分好的狀態區間,求得一步概率轉移矩陣:

兩步狀態轉移矩陣為:

2005年作為初始狀態向量為:P(0)=[0,0.75,0.25,0],則下一年(2006年)的狀態為:P(0)×P(1)=[0.1365,0.412,0.3925,0.059],再用公式:

求得預測值的值域區間。式中Xt(0)為RBF網絡的預測值;X(0)(t)為還原后的預測值;q為原狀態區間的分界值。
由Xt(0)(2006)=247.163,可得待測年預測值區間[208.05,232.712],(232.712,251.13],(251.13,288.035],[288.035,1069.97],且預測值處于上述區間的概率分別為13.65%,41.2%,39.25%,5.9%,可知X(0)(2006)處于(251.13,288.035]的概率最大,所以取(251.13,288.035]為待測值的預測區間。
類似地,Xt(0)(2007)=362.392,X(0)(2007)處于區間[305.044,341.203],(341.203,368.21],(368.21,422.319],[422.319,1568.797]的概率分別為13.39%,48.59%,32.81%,5.21%,可知X(0)(2007)處于(341.203,368.21]的概率最大,所以取(341.203,368.21]為待測值的預測區間。
表2可知,2年的實測值剛好皆以最大概率落入所屬區間內,可見預測方法成功,達到了較高的預測準精度,從而說明RBF經網絡馬爾可夫模型可應用于淮河流域汛期暴雨預測。

表2 神經網絡預測與馬爾科夫神經網絡預測結果比較
由表2可知,RBF神經網絡馬爾可夫模型預測誤差較RBF神經網絡預測誤差要小,可見前者預測精度更高,而且前者給出了預測區間及對應的概率,比直接使用RBF神經網絡更能反映汛期暴雨量的變化狀態,更有說服力。
本文利用RBF神經網絡與馬爾可夫鏈預測的優勢,建立了基于RBF神經網絡與馬爾可夫鏈的組合預測模型,并運用該模型對淮河流域2006-2007年汛期暴雨量進行了預測。計算結果分析表明,基于RBF神經網絡的馬爾科夫模型預測效果較好。該方法預測精度高,簡便實用,可操作性強。此外,本文嘗試利用黃金分割法對狀態區間進行劃分,經驗證,方法可行。
[1] 孫才志,林學鈺.降水預測的模糊權馬爾可夫模型及應用[J].系統工程學報,2003,18(4):294-299.
[2] 劉倪,夏偉,吳曉蔚,等.幾種參考作物蒸散量計算方法的比較[J].河北科技大學學報,2009,30(1):17-24.
[3] 仲遠見,李靖,王龍.改進馬爾可夫鏈降雨量預測模型的應用[J].濟南大學學報:自然科學版,2009,23(4):402-405.
[4] 沈永梅,丁衛林.加權馬爾可夫鏈預測模型在降水量預測中的應用[J].江蘇工業學院學報,2009,21(2):54-56.
[5] 王學雷,邵惠鶴,李亞芬.一種徑向基函數神經網絡在線訓練算法及其在非線性控制中的應用[J].信息與控制,2001,30(3):249-253.
[6] 顧明.多層神經網絡在入侵檢測中的應用[J].計算機工程與設計,2007,28(8):1792-1794.
[7] 胡江林,涂松柏,馮光柳.基于人工神經網絡的暴雨預報方法探討[J].熱帶氣象學報,2004,19(4):422-428.
(責任編輯:高 峻)
S421
A
0528-9017(2014)08-1256-04
文獻著錄格式:劉倪,葉金印.基于RBF神經網絡馬爾可夫模型的淮河流域汛期暴雨量預測[J].浙江農業科學,2014(8):1256-1259.
2014-04-01
劉 倪(1983-)男,安徽舒城人,工程師,從事天氣預報研究工作。E-mail:121265225@qq.com。