葉凌云
(臺州市水文站 浙江臺州 318000)
感潮河段是河流與海洋的過渡段,在該河段上,一方面有來自上游徑流的影響,另一方面又受到下游潮汐的作用,是受徑流和潮流共同作用的河段。由于兩種水流的共同作用,加上河口區本身的一些地理特性,使感潮河段的水文情勢較河流和海洋復雜,并具有獨自的特點,由于問題的復雜,目前較常用的預報方法仍主要是經驗相關法和回歸分析法。
社會科學統計軟件 SPSS(以下簡稱 SPSS)是世界上最早的統計分析軟件,目前已經廣泛應用于眾多領域和行業。在國際學術交流中,凡使用 SPSS軟件完成的計算,可以不必說明算法,可見影響之大。作為統計分析工具,SPSS軟件理論嚴謹、內容豐富,數據管理、統計分析、趨勢研究、制表繪圖、文字處理等功能,幾乎無所不包。本文應用 SPSS軟件對感潮河段控制站臨海站進行預報,把臨海站上游多個站點的水位、雨量作為影響因子,進行回歸分析,建立預報模型。
靈江流域地處浙江省東南沿海,位于120°~130°E、28°30′~29°30′N間,是浙江八大水系之一。它北以天臺山為界,南有括蒼山,其間山丘起伏,植被一般,屬亞熱帶季風性氣候區。夏秋季節,不僅常受臺風影響,出現較大暴雨洪水,而且常受東風波等天氣系統的影響,產生較強降雨。臨海站是靈江流域控制站,集雨面積4356km2,距椒江河口57km,潮汐影響顯著。當上游洪水下泄時,潮汐影響隨洪水位的升高而減弱,當臨海站洪水位高于 8m時, 水位過程線中潮形基本消失,潮汐影響基本消失。上游干流永安溪源于天堂尖,穿越仙居縣,入臨海市西部,河長141.3km , 集雨面積約2702km2;臨海站上游5km,有最大支流始豐溪匯入,始豐溪源于大盤山東麗,穿越天臺縣,河長134.2km ,集雨面積約1610km2。 靈江流域水文站網密度較大,站點較多,觀測資料系列比較長,采用回歸分析法可以綜合各種因素,建立預報模型,可以在感潮河段的水位預報中取得較好的效果。
臨海站河段是典型的感潮河段,導致洪水發生的因素較多,并且復雜多變。由于近二十年來流域特性發生較大變化,本文主要收集了 1980年到 2012年流域洪水資料,根據臨海站實際情況,共引入自變量10個,因變量1個。10個自變量指的是:仙居站洪峰水位1H、仙居洪峰水位發生時(t時刻)的沙段站同時水位2H ,t時刻天臺站同時水位3H ,t時刻柏枝岙站4H ,t時刻臨海站同時水位5H ,t時刻以前 6小時流域平均降雨量1P,t時刻以前6小時百步站、柏枝岙站、臨海站區間降雨量2P,t時刻以前 12小時流域平均降雨量3P, t時刻以前12小時百步站、柏枝岙站、臨海站區間降雨量4P,t時刻仙居站和臨海站水位差6H 。因變量是臨海站洪峰水位H。
SPSS軟件可以進行數據管理、統計分析、圖表分析和輸出管理,可為水文預報提供嶄新的操作環境平臺和豐富的技術方法。本文主要在臨海站上游仙居站洪峰水位出現時,對臨海站的洪峰水位進行預報,預見期 10個小時左右,分析步驟如下:
(1)打開SPSS數據文件窗口,建立由因變量(臨海站洪峰水位)和10個自變量組成的SPSS數據文件并保存。按照“分析→描述性統計”對所有的因變量和自變量進行描述性統計,為分析的數據提供一個直觀的描述。
(2)在數據編輯窗口中進行包含分類自變量的多元線性逐步回歸分析。按照“分析→回歸→線性”操作步驟計算預報對象的估計值;按照“轉換→計算變量”操作步驟生成臨海洪峰水位實測值與估計值之間的相對擬合誤差。SPSS軟件會把這些計算數據和結果自動保存在數據編輯窗口中。然后按照“圖形→舊對話框→線圖”操作步驟生成臨海洪峰水位實測值與其估計值組成的歷史擬合曲線,SPSS軟件會自動在數據編輯窗口中保存數據和計算結果,并在輸出窗口中輸出剔除因子和引人因子的統計結果、相關信息、圖形等。
(3)對回歸效果進行檢驗。SPSS軟件會自動進行回歸效果的統計檢驗,包括回歸方程的擬合度檢驗、回歸方程的顯著性檢驗和回歸系數的顯著性檢驗。擬合度檢驗通常用復相關系數 R2來判斷,R2越接近于 1,表明回歸直線的擬合程度越好;回歸方程的顯著性檢驗(F檢驗)和回歸系數的顯著性檢驗(t檢驗)都是計算樣本統計量的相伴概率P值,將其與給定的顯著水平α(即信度)值相比較。若P<α,則表明在這一信度水平上,回歸方程的回歸系數有統計學意義;若P>α,則表明在這一信度水平上,回歸方程的回歸系數無統計學意義。
(4)若通過統計檢驗,則可用包含分類自變量的多元線性回歸方程對臨海洪峰水位進行預報,也可進行概率區間預報。當因變量Y服從正態分布時,對應i個預報因子的觀測值 xi的預報對象估計值 yi落在區間[yi-Sy,yi+Sy]內的可能性約為68%,落在區間[yi-2Sy,yi+2Sy]內的可能性約為95%(Sy為剩余標準差),Sy越小,用回歸方程所估計的值就越精確。
由表 1可以看出,回歸模型的相關系數R=0.991,復相關系數R2=0.982,R2接近于1,表明回歸直線的擬合度高。修正的相關系數為0.974,估計值的標準誤差為0.212,標準誤差較小,表示用回歸方程估算的預報值相對精度較高。根據德賓—瓦特遜檢驗其自相關度,系數接近于 2,表示基本沒有自相關關系,對預報的結果不會使預報結果失去有效性。由此可見,本次回歸方程的擬合度較好。

表1 模型匯總

表2 方差分析

表3 預報模型系數
由表 2可以看出:回歸模型的回歸平方和35.77,均方差為5.932;剩余平方和為0.673,均方差 0.045。統計量 F=132.831,相伴概率值為ρ=0.000<0.001(信度),說明回歸方程通過了顯著性檢驗,預報值和因子之間有線性關系。
由表3中可以看出,有部分自變量從預報模型中剔除,這就說明這些自變量與臨海洪峰水位不存在顯著的線性關系,不將其引入回歸方程。剩余自變量都通過了回歸系數的顯著性檢驗(t檢驗),說明具有回歸意義,不能從回歸方程中剔除。由此可見,通過多元線性回歸可以找出預報值和哪種影響因子的整體相關度高,并且剔除相關度低的影響因子,從而降低樣本數據的冗余度。從圖1中可以看出殘差具有正態分布,從而可以認為得出的多元線性回歸方程是合理的,可表示為:

從1980年到2012年的發生洪水時臨海洪峰水位實測值和預報值的擬合曲線(見圖2)可以看到,曲線擬合結果較好。根據SPSS 的統計計算結果顯示臨海洪峰水位的平均值為8.81m,標準差 1.305,實測臨海洪峰水位的平均值為8.81m,兩者差值為0,預報精度高。從所選樣本統計結果來看,所有樣本擬合誤差均不超過0.30m,相對誤差均小于3%。根據《水文情報預報規范》(GB/T 22482—2008)臨海站水位預報允許誤差為0.50m,樣本預報合格率100%。表4中列出了從2000年到2012年臨海站幾場大洪水的洪峰水位預報結果。

圖1 標準化殘差正態概率

圖2 臨海站洪峰水位實測值和預報值擬合曲線

表4 2000-2012年臨海幾場大洪水的洪峰水位預報結果
(1)SPSS作為統計軟件,簡單易操作,具有強大的統計分析功能,特別在受到多重影響因素影響的感潮河段,可以利用現有資料,迅速的建立有關方程。
(2)從建立的預報方程來看,剔除了部分因子,根據臨海站實際情況,當臨海站上游洪水下泄時,潮汐影響隨洪水位的升高而減弱,當臨海站洪水位高于 8m時, 水位過程線中潮形基本消失,潮汐影響基本消失。本文洪水都選擇幾十年來較大的洪水,洪水水位均超過或者接近8m,因此剔除預報時臨海水位是合理的。但當水位不足8m時,潮汐影響較大,6m以下時,潮汐主要控制臨海站水位,當臨海站處于高潮位時候,對臨海洪峰水位預報值影響較大。另外一方面,暴雨中心的位置及其走向也是影響洪水位的因素之一,需進一步研究和考慮。
1. 劉曾美,吳俊校,陳子燊.感潮地區暴雨和潮水位遭遇組合的澇災風險[J].武漢大學學報(工學版2010,43(2)),167-168
2. 楊競,童禎恭,劉玉哲.SPSS軟件對飲用水質進行主成分分析評價的運用[J].環境科學與技術,2011,34(7)171-174.
3. 陳斌,包為民,瞿思敏,元曉華.雙向線性回歸模型在椒江臨海站水位預報中的應用[J].水文,2008,28(3):45-48.
4. 王姝,柴建設.基于社會科學統計(SPSS)回歸性分析的尾礦庫事故預測模型[J].中國安全科學學報,2008,18(12):35-39.
5. 胡廣錄,張濟世,樊立娟.基于SPSS軟件的黑河正義峽下泄水量預報分析[J].人民黃河,2013,35(4)22-28.