杜海波,王洪波,侯緒麗
(鶴崗市氣象局,黑龍江 鶴崗 154100)
隨著全球變暖的進一步加劇,在很多方面將導致某些極端天氣、氣候事件更加頻發,由此產生的災害損失也必然會越來越嚴重。近年來,鶴崗地區極端天氣災害頻繁發生,2009年,鶴崗地區出現了春末夏初百年一遇的大旱。而2005年7月28-29日鶴崗暴雨降水量達116.7 mm,導致鶴崗出現嚴重的洪澇災害,梧桐河流域超過警戒水位,達到鶴崗建站以來極值。
本文利用GPD模式,借助L-矩估計方法對模型參數進行估計,模擬鶴崗暴雨的分布概率,并對這一概率分布進行統計檢驗。為進一步模擬和預測鶴崗的強降水奠定理論基礎。根據該模型估計一定重現期的分位數,在該地區橋梁、防洪堤壩、水庫等建設中加以考慮,從而提高防御自然災害的能力,爭取最大程度的降低損失。
本文利用鶴崗50 a(1961-2010年)的逐日降水量資料,應用基于超門限峰值(POT)抽樣法的廣義帕雷托分布模型,再用L-矩參數估計法,模擬鶴崗地區的強降水。模擬結果表明:(1)GPD不但計算簡便,而且基本不受原始序列樣本量的影響;(2)POT抽樣法增加了極值的樣本量,L-矩估計得到的參數穩定度高;(3)在一定門限值條件下的逐日降水量所擬合的降水極值分布符合GPD模型。GPD模型對模擬和預測鶴崗的強降水過程有一定的應用價值。
選取鶴崗本站50 a(1961-2010年)的逐日降水量作為研究對象。
2.2.1 POT抽樣
廣義帕雷托分布(GPD)最大優點在于,它的抽樣不只是每年抽取一個,而是從原始資料中抽取出超某一門限值的數據,即所謂的“超門限峰值POT”抽樣方法。顯然,在抽取的值中,每年可能會出現不只1個超過門限值的情況。由于POT抽樣方法直接由原始分布抽取極值,從而使所需樣本大大節省,或者說大大增加了樣本量,也更加的符合實際情況。
2.2.2 門限的選擇
門限值的選擇是考慮其用途及在實際工作中的意義,要根據不同情況來取門限值。既不能低,也不能太高,如果門限值選低了會使選出的數據與GPD分布擬合的不太好;如果選高了,不一定有足夠的樣本數據能估計出合理的分布參數。本文采用年平均交叉率接近于1的方法,也就是用1 a度量降水數據超過門限值的次數,這樣比較恰當。
2.2.3 GPD模型
廣義帕雷托分布 (Generalized Pareto Distribution)(簡稱GPD)是用來表達概率分布特征的,比如,大于某臨界值(β)的降水量、風速等的概率分布特征,其分布函數為

上式中,分布參數β為門限值;α為尺度參數;k為線性參數。
2.2.4 L-矩參數估計
L-矩法是由前R個L-矩和前R個PWM的線性組合而成的,其起源于“概率權重矩”(PWM),L-矩法與經典矩法相比,有許多優點,應用也越來越廣泛。它的統計方法較簡單,其參數估計精度與極大似然法估計精度相當,估計值的穩定性較高。計算方法如下:首先將所有大于門限值的極值按從大到小的順序排列,x1≥x2≥…≥xn-1≥xn,由此得到一組超門限值統計量xj,對其作PWM估計,考慮PWM的定義為:

式中,Br表示隨機變量x的第r階概率加權矩,其無偏估計通式可寫為:

一般情況下,r取相當的數量就可以了,很少用更高階矩,如,要計算概率密度曲線的峰度,只需要取4階矩,本文中只需計算b0和b1,根據概率加權矩與L矩的關系,有

這里λi分別表示第i階L矩,b0和b1則分別表示0階和1階PWM估計量,根據(4)式可推出下列關系式:

由(9)(10)兩式可最終得到GPD的參數 α和k估計式:

式中,β是門限值,也就是臨界值。例如,要研究降水量,可事先根據需要定出門限值或臨界值是多少,也可按標準差的倍數作為各種試驗的臨界值。
2.2.5 重現期與對應分位數的計算
研究重現期(return period),就是要對極值進行統計,找出分布規律。對于強降水的研究,要考慮的是超過某定值x的概率,稱為右側概率,可用下式表示:

根據重現期T的含義,可以認為出現極值的概率的倒數即為重現期,對于最大值的重現期可表示為:

值得注意的是,所謂重現期,并非指經過T時間就一定會出現,它只是概率意義上的回轉周期。T反應了事件發生概率的大小,重現期T越大,代表的概率就越小,越是稀有事件。
在確定重現期后,就可得到與T對應的極值分位數,極值的分位數就是對應著氣候稀有事件概率的極值變量的某種可能取值。由(14)式和pareto分布模型-(1)式,可推出極值分位數的表達式,k不為0時有:

式中,λ為年交叉率,即每年極值超過門限值的次數。也就是從原始資料中找出超門限值的數,記為n,用它除以數據資料的總年數N即可,λ=n/N。
2.2.6 柯爾莫哥洛夫--斯米爾諾夫檢驗(K-S檢驗)
所謂K-S檢驗,是在20世紀初提出的關于順序統計量極限分布的定理發展而來的,用于檢驗樣本是否來自某一特定分布的方法。其檢驗方法是將樣本數據的累積頻率分布與特定理論分布比較 (即將經驗分布函數與理論分布函數比較),若F0(x)表示理論分布函數,本文中為GPD模型,Fn(x)樣本的累計頻率函數,累計頻率=累計次數/總次數,D為F0(x)與Fn(x)的最大差值,即 D=max|F0(x)-Fn(x)|。 再根據置信水平1-a或信度a判斷其是否通過K-S檢驗。
2.2.7 相關系數檢驗
由經驗分布函數和理論分布函數可以分別確定一個與降水量相對應的概率值,若取多個不同的降水量,則可以得到兩組表示概率數據,分別記為x(i)和y(i),可由如下公式計算它們的相關系數:

鶴崗市位于中國東北邊陲,座落在小興安嶺與三江平原交匯地帶,屬丘陵地形,高低起伏,鶴崗屬高緯度地區,130°16′E,47°20′N, 由于西太平洋副熱帶高壓在夏季達到最北位置,副熱帶西風急流和東亞季風的水汽輸送也達到最北,給黑龍江東北部帶來了充沛的水汽,暖濕空氣與西風帶中的冷空氣交綏,易出現暴雨。故降水主要集中在7、8月,其他月份相對較少。加之特殊的地理條件致使鶴崗地區極易發生局地暴雨等災害性天氣,近兩年鶴崗出現的暴雨量等級均超過歷史極值。
對鶴崗1961-2010年(50 a)的降水資料按給定的門限值做 POT 抽樣,根據(3)-(12)式,對選取的數據采用L矩估計,由GPD模型中可得出一定重現期對應的分位數,再求出此極值在實測數據中出現的概率,即比較理論分布函數和經驗分布函數,做柯爾莫哥洛夫——斯米爾諾夫檢驗(K-S檢驗)和相關系數的檢驗。表1給出了門限值為50mm的GPD模型參數及擬合效果檢驗。
由表1可以看出,GPD模型參數估計的效果比較好,K-S統計量為0.06,通過檢驗,且其實測頻率和理論頻率的相關系數在0.9973,說明相關性較好。

表1 鶴崗市50 mm門限取值的GPD模型參數估計及其效果檢驗

表2 鶴崗GPD模型重現期表
重現期代表了極值出現的概率,這是研究極值分布模型最關心的問題,表2得出了鶴崗GPD模型的重現期。但重現期的取值與樣本的容量有關,本文的樣本容量僅為50 a,故50 a以下,甚至70 a以下的擬合效果比較好,時間較長擬合效果不一定很好。
pareto模擬曲線的擬合效果很好,與實測曲線的走勢基本一致,理論頻數與實測頻數的吻合程度比較高。由此可見,鶴崗的逐日極端降水量基本上符合GPD模式。對于鶴崗地區極端降水量采用廣義帕雷托模型(GPD)擬合是完全可行的,有很高的實用價值。
本文利用廣義帕雷托分布模型 (GPD),借助于L-矩參數估計法,對鶴崗的極端降水進行模擬,取鶴崗的降水資料為樣本作POT抽樣,再分別估算其參數,建立GPD模型,推算一定重現期的極端降水量分位數,并檢驗其擬合效果,結果表明:
(1)利用廣義帕雷托分布模型能較好的擬合鶴崗的暴雨分布概率,且GPD模型計算簡便,穩定性好,基本不受原始序列樣本量的影響。
(2)POT抽樣法增加了極值的樣本量,L-矩估計得到的參數穩定度高。
(3)在實際工作中,利用GPD模型推算出五十年一遇或百年一遇的極端強降水量,可為預防強降水引發的洪澇災害工作提供參考數據。