杜 懿,麻榮永
(1.廣西大學土木建筑工程學院,廣西 南寧 530004;2.廣西防災減災與工程安全重點實驗室,廣西 南寧 530004)
洪水、暴雨等水文極值事件一般都具有總量、強度和歷時等多屬性特點,且各屬性之間均存在著一定的相依關系[1]。傳統的單變量分析法已無法滿足應用要求,為了讓水文事件得到全面描述,進行多變量分析就顯得尤為必要。關于多變量分析的計算,目前概括起來主要有多元正態分布、非參數法、將多維聯合分布轉換成一維分布等方法[2]。但上述方法均存在一定問題。Copula函數的引入,有效地解決了這一問題。Copula函數是構建多變量聯合分布的一種高效方法,能夠構造出邊緣分布為任意分布的多變量聯合分布函數,具有極強的靈活性與適應性[3]。但Copula函數類型的選擇是個難題,不同的Copula函數具有不同的分布特性,對水文變量的描述也存在差異。對此,國內外很多學者也做了大量研究,大體上均認為Archimedean Copula函數族更適合于多數水文變量的描述[4]。隨著更多Copula函數的不斷涌現,這一經驗逐漸受到越來越多的挑戰。基于此,本文以郁江南寧水文站歷年最大洪峰、洪量為研究對象,通過建立不同Copula函數下兩變量的聯合分布來推求最佳函數選擇,以期為未來區域水利工程規劃和防洪減災工作提供一定指導。
Copula函數是定義在[0,1]區間上均勻分布的多維聯合分布函數,其理論最早可追溯到1959年Sklar提出的Sklar定理。該定理認為可以將一個N維聯合分布函數分解成N個邊緣分布函數和一個Copula連接函數。Nelsen于1999年給出了Copula函數的嚴格定義,即Copula函數是把隨機變量X1,X2,…,XN的聯合分布函數F(x1,x2,…,xN)與各自的邊緣分布函數FX1(x1),FX2(x2),…FXN(xN)相連接的連接函數。即函數C(u1,u2,…,uN),使得
F(x1,x2,…,xN)=C[FX1(x1),
FX2(x2),…FXN(xN)]
(1)
Copula函數具有橢圓型、二次型和Archimedean型三大類。其中,Archimedean Copula函數族又包括G-H、Clayton和Frank 等多種Copula函數[5]。本文選用的5種Copula函數的分布函數分別如下:
(1)正態(高斯)Copula
(2)
式中,u、v;ρ為變量間的線性相關系數;φ-1為標準正態分布的分布函數的逆函數;其他變量為函數中的參數。
(2)t-Copula函數

(3)

(3)G-H、Clayton、Frank Copula函數
C(u,v)=e-[(-lnu)θ+(-lnv)θ]1/θ
(4)
C(u,v)=(u-θ+v-θ-1)-1/θ
(5)
(6)
式中,θ為各Copula連接函數的參數值。
以上Copula函數具有不同的特點,無明顯的優劣之別。總體來說,正態Copula函數和Frank Copula函數適合于尾部對稱且漸近獨立的二維隨機變量; t-Copula函數適合于尾部對稱且尾部相關的二維隨機變量;G-H Copula函數和Clayton Copula函數均適合于具有非對稱尾部的二維隨機變量,前者上尾相關、下尾漸近獨立,后者相反。
本文根據郁江南寧水文站1942年~2002共61a洪水資料,整理出歷年最大洪水所對應的洪峰流量與洪水總量(具體數據略)。從推求兩變量各自最佳的邊緣分布、選取Copula連接函數、參數估計、模型評價4個過程來進行郁江南寧水文站洪水峰量聯合分布Copula函數選取問題的研究。
在我國,一般認為,P-Ⅲ型曲線可以很好地擬合水文變量的頻率分布。基于此,本文初選P-Ⅲ型分布對洪峰、洪量兩序列進行擬合,二者累積概率密度函數如圖1、2所示。

圖1 洪峰的P-Ⅲ型分布擬合結果

圖2 洪量的P-Ⅲ型分布擬合結果
從圖1、2中可以看出,P-Ⅲ型曲線對洪峰、洪量兩序列的擬合結果均不理想,誤差較大。為準確快速地推求出兩變量的邊緣分布,筆者采用非參數核密度估計法來對兩變量的分布形態進行研究。利用MATLAB軟件編程得到兩變量的核分布估計與經驗分布函數的擬合結果(見圖3、4)。

圖3 洪峰的核分布估計與經驗分布函數

圖4 洪量的核分布估計與經驗分布函數
從圖3、4可看出,洪峰和洪量的經驗分布函數與核分布估計幾乎重合,擬合效果優秀,誤差較小;從而說明本次利用非參數核密度估計法求得的兩個變量的邊緣分布較為準確,很好地反映出了兩序列的分布特性。

G-H、Clayton、Frank 3個Copula函數的參數取值分別為θ1=3.117 415,θ2=3.660 801,θ3=9.997 817。
將計算得到的經驗聯合分布值與用5種Copula函數計算得到的理論聯合分布值點繪作圖,結果如下。

圖5 經驗聯合分布與理論聯合分布的擬合
由圖5可以看出,以上5種Copula函數的擬合效果都較好,點據均分布在45°直線附近。為了更精確地評價每個Copula函數的擬合效果,分別以擬合趨勢線斜率(k)、相關系數平方(R2)、平方歐式距離(d)為標準進行判別。其中,k和R2值越接近于1或d值越小,擬合效果越好。比較結果見表1。

表1 五種Copula函數比較結果
比較發現,5種Copula連接函數中以二元t-Copula函數的擬合效果最好,Frank Copula函數最差(與經驗結論相悖)。故在郁江南寧水文站洪水峰量聯合分布研究中,推薦使用二元t-Copula連接函數。函數的聯合概率密度見圖6。其中,U表示洪峰,V表示洪量。

圖6 二元t-Copula概率密度
仔細觀察圖6可知,二元t-Copula函數具有對稱的尾部,且尾部較厚。該函數對變量之間的尾部相關變化較為敏感,可以很好地捕捉到變量的對稱的尾部相關關系。
本文以郁江南寧站61a洪水資料為基礎,采用5種不同的Copula函數來建立洪峰與洪量的聯合分布。在洪峰、洪量的邊緣分布推求中,由于傳統的P-Ⅲ型分布擬合較差,遂采用了非參數核密度估計法來描述兩個變量各自的邊緣分布,擬合誤差較小,結果有了很大提高;通過點繪5種Copula函數的理論聯合分布與經驗聯合分布的相關圖發現,5種Copula函數均適用于本次峰量聯合分布研究;以擬合趨勢線斜率、相關系數平方、平方歐式距離作為評價指標,比較得出適用于本次研究的最優Copula連接函數,即二元t-Copula函數。