苗正偉 徐利崗
(1.河北水利電力學院,河北 滄州 061001; 2.寧夏水利科學研究院,寧夏 銀川 750021)
降水的科學預測,不僅可為制定水資源開發利用策略提供依據,又可為防災、抗災、減災提供參考。由物理成因的定性分析及大量降水序列資料的統計分析得知,降水量可視為一列相依的隨機變量,其相依程度的強弱,可采用自相關系數作為其定量的測度[1],基于此,可建立馬爾可夫鏈模型進行預測分析。但實際上,降水是一種非常復雜的自然現象,具有大量的不確定性因素,很難嚴格滿足“齊次性”[2];同時,有研究表明:考慮隨機變量的中間過程狀態從而充分利用信息,可提高預測精度[3],因此本文以降水量序列的規范化后的各階自相關系數為權,建立加權馬爾可夫模型進行預測。
其原理參見文獻[4],基本步驟如下:
1)建立年降水量的分級標準[5],從而確定降水序列的狀態空間。可以樣本的均值—標準差為標準,將年降水序列劃分為五級,此時年降水序列的狀態空間E={1,2,3,4,5}。
2)按照上述分級標準確定資料序列中各年降水量的狀態,構成年降水狀態序列。
3)計算一步轉移概率:對于降水狀態這一隨機變量,很難確定其準確的轉移概率,但樣本序列足夠長時,可用轉移頻率近似代替轉移概率,其計算公式如下:
(1)
其中,m為樣本序列的狀態個數;fij為樣本序列中年降水量從狀態i一步轉移到j的頻次;pij為由樣本序列統計得出的狀態i到j的一步轉移概率(頻率)。
4)對樣本序列做馬氏性檢驗[6]:當樣本序列長度較大時,構造服從自由度為(m-1)2的χ2分布的統計量:
(2)
其中,p*j為邊際頻率,計算公式如下:
(3)
給定顯著性水平α,查表可得分位點χ2((m-1)2)的值,若χ2>χ2((m-1)2),則認為樣本序列具有馬氏性,可作為馬爾可夫鏈來處理。
5)計算各階自相關系數:
(4)

6)對各階自相關系數規范化:
(5)
其中,ωk為步長為k的轉移概率的權重;b為按預測需要計算到的最大步長。
7)計算轉移矩陣:與式(4)同理,由樣本序列統計各狀態間各步長的轉移概率,各步長的轉移概率構成相應步長的轉移矩陣,它決定了降水狀態轉移的概率法則。
關于擴大灌溉面積。第一,還是要堅持外延與內涵相結合。內涵就是對老的配套不完善的這些灌區進行挖潛改造,特別是著力解決好“最后一公里”的問題,這樣可以使有效灌溉面積得到恢復和改善。第二,在水土資源條件組合比較好、有開發利用潛力的地方,結合千億斤糧食生產規劃,大力發展灌溉面積。第三,大力推行節水措施,包括北方地區的節水、東北四省區的節水、西北地區的節水。第四,充分地調動農民的積極性,調動社會的資金。比如像剛才郝益東同志提出,內蒙古搞的大型噴灌,基本上很多都是用社會資金來搞的。還有水權置換,工業企業要上新項目,但是沒有用水指標,那么就支持河套灌區的農業節水,通過節出來的水量發展工業項目。

9)將同一狀態的各預測概率加權后求和:
(6)
則,max{pi,i∈E}所對應的i即為該年年降水的預測狀態。若該年年降水狀態可確定,將其加入原序列,重復以上步驟進行下一年度的預測。
10)進一步對該馬爾可夫鏈的特征(非周期、遍歷性、平穩分布等)進行分析。
于“中國氣象數據網”下載了榆林地區1951年—2010年的逐月降水數據,并將之整理為年降水序列。首先以1951年—2008年的資料建立模型預測2009年的年降水狀態。

表1 榆林地區1951年—2008年降水量分級表

表2 榆林地區1951年—2008年降水量及其狀態
3)一步轉移概率及馬氏性檢驗。經統計計算:
由表1知榆林地區年降水序列的狀態數m=5,給定顯著性水平α=0.05,查χ2分布分位數表可得χ2((5-1)2)=χ2(16)=26.296。可見,χ2>χ2(16),因此,該時間序列具有馬氏性,即榆林地區1951年—2008年年降水狀態序列可視為馬爾可夫鏈。
4)計算各階自相關系數和權重,結果如表3所示。

表3 各階自相關系數及權重
5)對降水狀態序列進行統計計算,得步長從1~5的轉移概率矩陣:
6)根據2004年—2008年的年降水狀態預測2009年的年降水狀態,結果見表4。

表4 2009年年降水狀態預測
由表4可知max{pi,i∈E}=0.449,對應的狀態為3,即榆林地區2009年年降水量狀態為3,平水年。榆林地區2009年的實際降水量為420.8 mm,由表1知,正屬于狀態3。預測結果與實際結果吻合。
7)以1951年—2009年的實測資料重復上述步驟預測2010年的降水狀態,結果見表5。

表5 2010年年降水狀態預測
由表5知,榆林地區2010年年降水量預測狀態為3,其實際降水量為363.9 mm,屬于平水年,預測與實際相吻合。
1)按照均值—標準差方法將榆林地區實測年降水序列劃分為豐水、偏豐、平水、偏枯、枯水年五種狀態,利用加權馬爾可夫鏈分別對2009年,2010年降水狀態進行預測,結果均與實測情況吻合,初步說明用加權馬爾可夫鏈預測榆林地區的年降水狀態是可行的。
2)狀態標準的劃分有一定的隨意性,對結果會產生一定影響,如何更科學的劃分降水狀態有待于進一步探討。
3)馬爾可夫鏈的預測結果是一個區間,如何結合其他理論或方法進一步預測出較為精確的具體數值,從而拓展預測結果的適用范圍,值得進一步研究。
4)用馬爾可夫鏈進行預測的基本假設是:年降水狀態序列是齊次馬爾可夫鏈,但實際上這很難嚴格滿足:齊次馬氏鏈的統計特性完全取決于初始分布和一步轉移概率,但對于年降水狀態序列卻很難獲得準確的轉移概率,只能用由足夠長的實際資料進行統計得出的轉移頻率代替轉移概率;齊次馬爾可夫鏈的n步轉移概率矩陣等于一步轉移概率矩陣的n次方,這對于由統計計算得出的各步轉移矩陣顯然是難以成立的。這些都會對預測精度產生影響,盡管引入了加權馬氏鏈,但這不能從根本上消弭不足。因此該方法對于水文時間序列預測的適用程度有待進一步檢驗。
參考文獻:
[1] 韓璞璞,張 生,李暢游,等.基于權馬爾可夫鏈模型的廬江縣降水量預測[J].水文,2012,32(3):38-42.
[2] 韓合忠,高淑會,國偉華.基于加權馬爾可夫模型的濟南市降水豐枯狀況預測研究[J].水文,2012,32(5):72-75.
[3] 王鑫東.加權馬爾科夫鏈模型在農業灌溉用水預測中的應用研究[J].中國農村水利水電,2016(5):58-64.
[4] 劉次華.隨機過程[M].第5版.武漢:華中科技大學出版社,2014.
[5] 王宇博,梁秀娟,喬 雨,等.基于疊加馬爾科夫鏈和BP神經網絡模型的降水量預測研究[J].中國農村水利水電,2014(9):80-86.
[6] 王 濤,錢 會,李培月.加權馬爾可夫鏈在銀川地區降雨量預測中的應用[J].南水北調與水利科技,2010,8(1):78-81.