楊 鵬,張 強
(1.海河水利委員會水文局,天津 300170;2.天津水文水資源勘測管理中心,天津 300061)
用河道上游斷面洪峰流量預測下游斷面洪峰流量是洪水預報的重要環節,以往多數做法是建立河道上下游斷面洪峰流量經驗關系。河道無區間匯流加入,其相關關系較好;或上下游斷面間雖含有一個區間,但區間降雨比較均勻,各場降雨的流域前期影響雨量大致相同,同時河道沒有區間來(引)水,其相關關系也較好,且上下游斷面洪峰流量關系比較穩定。如果不滿足上述條件,比如各場降雨的流域前期影響雨量相差較大,那么就要考慮這一因素對流量關系的影響。
在較大的區間流域降雨往往很不均勻,其降雨徑流關系不很穩定,主要原因是各場降雨雨區的產流面積變化很大。如果雨區內不產流的面積越大,則損失的水量在總雨量中的比重就越大,徑流系數也就越小。因此,如果把不產流地區的面積在集流面積中扣除,產流區的降雨量和徑流量的關系就比較穩定。
根據以上分析,把一場降雨分成產流區和非產流區,產流區和非產流區的邊界可定為雨量等于初損值的等雨量線,凡是降雨量小于初損值的地區都不產流。在上下游流量關系中除了區間雨量和前期影響雨量外,再增加一個產流面積系數(Cf)和一個凈雨歷時(Pt)作參數,即雨量大于初損值的雨量站為產流站,初損值用流域一次降雨平均雨量與一次降雨產流量的差值來確定,產流站數(n)與總雨量站數(N)之比為產流面積系數(Cf=n/N)。當降雨集中在較小地區時(Cf較小),損失量小,徑流量大;反之,當降雨分布面廣且均勻時,損失量大,徑流量小。所以,在其他因素相同時,產流面積系數與徑流量成反比關系。
凈雨歷時在有些地區對洪峰流量的影響也很顯著,在其他因素相同時,凈雨歷時越長則流量過程線越矮胖,洪峰值越低;反之,凈雨歷時越短則流量過程線越尖瘦,洪峰值越高。所以,凈雨歷時與洪峰流量成反比關系。
由于此問題是要確定因變量與自變量之間的關系,因此考慮采用多元線性回歸數學模型進行定量研究。

式中:Y 為因變量;X1,X2,X3,…,Xm為自變量;a0,a1,a2,…,am為未知待定參數;e 為n(0,σ)隨機變量。
以海河流域永定河官廳至三家店河道為例,因變量是三家店的洪峰流量,用Y 表示;自變量是官廳的洪峰流量,用X1表示;區間降雨量與前期影響雨量之和用X2表示;區間產流面積系數用X3表示;凈雨歷時用X4表示。
通過對n 場洪水的觀測得到一組數據:

式中:下標α 為觀測序號,其值為1~n,此處n=22;X的第二下標表示自變量序號,其值為1~m,此處m=4。將這組數據代入式(1)得到:

式(3)也可以表示為:

當n>m+1 時,式(3)構成矛盾方程組,a0,a1,a2,a3,a4不能同時滿足方程組(3)。為了對a 進行估計,采用最小二乘法,設b0,b1,b2,b3,b4分別是a0,a1,a2,a3,a4的最小二乘估值列向量,則估計的回歸方程為:

所謂a0,a1,a2,a3,a4的最小二乘估計b0,b1,b2,b3,b4是指使以下的殘差平方和(Q)達到最小。

由極值定理對式(6)求導,并令其等于0,則b0,b1,b2,b3,b4可由方程組(7)解出。

方程組(7)稱為正規方程組,式中除b0,b1,b2,b3,b4外,其他值都是已知的,所以可以求出b0,b1,b2,b3,b4的值,通過對22 場實測洪水的計算,最后求出b0,b1,b2,b3,b4的值分別為-1 087.6,1.559 2,7.197 1,-437.22,8.173 5。所求的回歸方程為:

由于求出的回歸方程并不是在任何情況下都有意義,為此先假設Y 與X1,X2,X3,X4符合式(1)的模型,即假設a1,a2,a3,a4不全為0,然后用觀測資料對假設進行檢驗,以決定是否接受這一假設,也就是決定所得到的回歸方程是否可以采用。為了便于確定檢驗用的統計量分布,我們采用上述假設的對立假設作為原假設,即H0:a1=0,a2=0,a3=0,a4=0。
解決這一問題可先將Y 的總平方和進行分解,再推導出檢驗用的統計量的分布,最后利用這一分布,根據觀測資料對式(2)進行檢驗,以決定對H0的取舍。
Y 的總平方和可分解為兩個部分:

即有S總=S剩+S回,根據F 分布定義,當H0成立時,則:

服從自由度為(m,N-m-1)的F 分布,對于指定的α,由F 分布表可查得Fα(m,N-m-1) ,當由式(2)計算得出的F>Fα(m,N-m-1)時,則拒絕H0,認為線性回歸模型式(1)適合于該組資料。由該組資料計算得到的方差分析,見表1。

表1 方差分析
設采用顯著水平(α)=0.05,由F 分布表可查得Fα(4,17)=3.007,故F>Fα,回歸方程(8)顯著,可以接受。
前面對回歸方程進行了顯著性檢驗,即通過檢驗回歸方程(8)是顯著的,但這只是拒絕了H0:a1=0,a2=0,a3=0,a4=0 ,即“回歸系數全部為0”這一假設,并不能排除某個ai可以為0 的可能性,而ai=0 即表示Xi與Y 沒有線性關系。我們自然不希望在線性回歸方程中包含那些與Y 沒有線性關系的變量,因此,除了對回歸方程進行顯著性檢驗外,還需要對每一個變量(Xi)進行檢驗。
假設H0:ai=0,如果檢驗結果接受這一假設,則Xi就應該從回歸方程中剔除,反之則應該保留。下面陳述檢驗步驟。
用與前面相同的方法做Y 關于m-1 個變量(m=4)的回歸方程以及S總,S剩(m-1),S回(m-1)與S剩m,S回m比較,由于自變量減少,S剩(m-1)必增大,等價地S回(m-1)也必減小,故有:

式中:Vm表示在m-1 個自變量基礎上增加一個自變量Xi后S剩減小的量(即S回增加的量),稱其為Xi的方差貢獻,這個量越大,表示Xi對Y 的線性關系越密切。
計算出所有m 個Vm后,選其中最小的一個設為Vk,相應的變量為Xk,于是Xk就是在所有m 個變量中對Y 的線性關系最差的一個,因此只要對其進行檢驗就可。如果Xk的作用顯著,在回歸方程中就應該保留,其他變量自然也作用顯著,在回歸方程中也應該保留。對于本組資料而言,V1=3 034 028,V2=3 459 019,V3=72 001,V4=144 869。
V3遠小于V1、V2、V4,表示X3(產流面積系數)對于Y 的線性關系遠不如X1(官廳洪峰流量)、X2(區間降雨量與前期影響雨量之和)、X4(凈雨歷時)對Y 的線性關系密切,這也是可以預料的。對X3進行檢驗:
在H0:a3=0的假設下,F3=V3/[S剩/(N-m-1)]=6.684 服從F(1,N-m-1)分布,采用顯著水平(α)=0.05 ,由F 分布表可查得Fα(1,17)=4.494,故F3>Fα,拒絕H0:a3=0 ,表示X3作用顯著,在回歸方程中應該保留。

表2 回歸方程檢驗結果
利用所求的回歸方程對該組觀測資料進行檢驗,以相對誤差小于20%為合格標準,合格率為95.5%,6 場大水(三家店洪峰大于1 000 m3/s)全部合格(見表2)。
在官廳洪峰(Q官)與三家店洪峰(Q三)關系中,如果以區間降雨量(P)代替區間降雨量與前期影響雨量之和(P+Pa),則合格率只有57.1%,這說明前期影響雨量(Pa)對徑流的影響較大,在實際計算時特別對于汛期第一場洪水不能忽略。
在Q官-Q三關系中,如果不考慮P+Pa的影響,合格率只有19.0%; 如果不考慮產流面積系數(Cf)的影響,合格率為61.9%;如果不考慮凈雨歷時(Pt)的影響,合格率為19.0%。
[1]長江流域規劃辦公室.水文預報方法[M].北京:水利電力出版社,1982.
[2]華東水利學院.水文學的概率統計基礎[M].北京:水利電力出版社,1981.