王 超,楊紹瓊,楊發瑞,周東俊,趙江艷,謝 平
(1.云南省水文水資源局,昆明 650106;2. 昆明市水文水資源局,昆明 650103;3.昆明市松華壩水庫管理處,昆明 650201;4.武漢大學 水資源與水電工程科學國家重點實驗室,武漢 430072.)
瀾滄江是我國西南的國際河流之一,發源于青藏高原之唐古拉山北麓,國境內先后流經青、藏、滇三省。瀾滄江天然落差1 768 m,水能資源極為豐富,中下游具有一定的通航能力,云南境內建有思茅港和景洪港兩個港口。瀾滄江素有“黃金水道”之美譽,中、老、緬、泰、柬、越等六國為之相連,全長4 900 km。由于其特殊的、重要的地理位置,發展其國際航運有利于加強我國和東盟國家的經濟合作等外交關系[1],有助于帶動云南省的經濟發展。
瀾滄江流域主要為西南季風控制,徑流主要來源于上游的冰雪融水和季風給中下游帶來的降水,大氣環流是影響徑流變化的主要因素。瀾滄江干濕季分明,5-10月為雨季,集中了77%以上的徑流量。在全球增暖的大背景下,瀾滄江年降水量、濕潤指數均呈現震蕩中下降的趨勢,1951-2008年瀾滄江年降水量下降46.4mm,氣溫約按0.15℃/10a的速度小幅上升,二者的變化對徑流影響也較為明顯[2,3],也是2009-2013年瀾滄江流域干旱的原因之一。近年來瀾滄江上的梯級水電站逐步建成,人類活動影響顯著,由于梯級電站的調豐補枯,徑流的年內變化幅度有所減小,對航運水量、補償河道生態水量都有一定的調節和補充作用。
對于天然河道來講,水深是能否通航的重要條件之一,在其他條件不變的一般情況下,河道水深與流量成正比,因此,流量是影響河道通航的重要因素之一。由于受大環流的影響對于天然河道流量一般呈現季節性變化,年內變化較大,最枯月平均流量通常只有年平均流量的幾分之一甚至更少,因此,開展河道的最枯月流量預測研究,對航運保障具有重要的參考作用。
年最枯月流量,影響因子多,具有一定的周期性和較強的隨機性,準確預測具有一定難度,李英晶[4-7]等學者運用多元回歸、自回歸模型、前后期徑流相關法等對伊春河流域、密云水庫等枯水季來水量預報進行了相關嘗試和研究,精度基本能滿足相關規范要求。年最枯月流量的預測影響因子較多,為解決個別預報因子噪聲影響較大的問題,本文利用奇異譜分析技術對隨機性較強的預報因子進行主周期成分重構,與其他原始因子混合后,與PPR結合形成SSA-PPR模型,對云南省瀾滄江某站最枯月徑流進行預測,以分析其通航保障能力。
奇異譜分析,簡稱SSA,是對具有非線性特征的時間序列進行研究的一種行之有效的方法,它的思想是先重構時間序列的成份,然后關聯經驗正交函數,利用實測的時間序列,歸一化后構造出軌跡矩陣,之后分解、重構軌跡矩陣,最后提取得到不同的成分和信號,并進一步識別出長期趨勢、強周期和白噪聲等成分,最后可對原始序列結構進行重構,目前,在各種時間序列的分析中也得到了大量應用。奇異譜分析和重構主成分,可以有效地去除時間序列中的噪聲,重生序列能夠較好地反映原始序列的特征[7,8]。其原理如下:
首先將所實際生產中實際觀測得到的時間序列數據:x(t),t=1,2,…,n,選擇適當的窗口長度:m(2≤m≤n/2),轉化為二維時滯矩陣(或軌跡矩陣):
(1)
設其滯后協方差矩陣為S,它的特征值可表示為λ1≥λ2≥…≥λm≥0,即為{xi}的奇異譜,展開如下:
(2)
式中,i=1,2,…,N-M+1;j=1,2,…,M;Gkj為時間經驗正交函數,akj為時間主分量。通過Gkj和akj進一步計算xi重建成分xkj,公式如下:
(3)
逐一對各重建分量進行分析,可識別各分量的振蕩周期,并根據貢獻的重要程度選擇前(從大到小排)y個奇異值,使他們的貢獻率之和大于一定閾值 (例如80%),再對原序列重構,以濾除原始序列的噪聲并顯示原始序列的主要變化特征。
投影尋蹤回歸法(Projection Pursuit Regression,PPR),是以直觀的低維空間投影來表現復雜的高維數據,這種方法較好地解決了維數禍根和解決超高維等問題,效果較為明顯。PPR應用領域日趨益廣泛,特別是在水文資源、水環境等各個方面均有嘗試,在洪水預報、徑流預報、降水預報、水資源評估、聚類分析、水質評價等細分領域的應用均得到深入開展[9-11]。PPR建模的原理主要如下[14]:
年最枯月流量f(x),非線性特征顯著,x為預測因子,a為投影向量,二者維數均w。首先要計算得到嶺函數族g(atx)。預測對象可用下式推求:
(4)
式中:g為嶺函數;N為嶺函數的個數。N=1、g=1時,式(4)就變為普通多元回歸函數。嶺函數采用Hermite多項式進行擬合,其投影回歸關系式為:
(5)
式中:m表示輸入樣本的個數;j為多項式的階數;c為多項式的系數;yi為在方向a上的投影;h為正交多項式(Hermite),它們的分別表達為:
(6)

(7)
式中:φ(y)為標準高斯方程;j!代表多項式階數j的階乘;回歸預測建模最終轉化為求下式的最小化問題。
(8)

(9)
(i=1,2, …,m)
因此,投影尋蹤回歸預測的求解過程就轉化為優選參數a、c和N。
目前,遺傳算法應用最為廣泛,另外,螢火蟲法、差分法、粒子群法和仿生群智能算法(如蜘蛛群、蛾群、雞群等優化算法[12,13])等也有很多探索研究,并取得了較好的效果,本文采用蜘蛛群算法確定最佳投影參數,具體步驟可參考文獻[14]。
根據前述奇異譜分析和投影尋蹤回歸建模的原理,年最枯月流量預測建模的具體步驟如下。
(1)確定預測因子。利用相關分析方法確定最枯月徑流的預測因子。根據所能獲得的預報因子,計算最枯月徑流與各種因子不同延遲時段的相關系數,選取相關系數最大且符合置信水平要求的延遲時段因子作為預報因子。
(2)對周期性較強且由于受人類活動等噪聲影響較大的因子進行奇異譜分析和重構序列。其他影響因子采用原始觀測因子作為預報因子。
(3)按照文獻[14]用群居蜘蛛算法確定最佳投影參數,得到最終投影尋蹤回歸模型及模擬和預測結果。
(4)根據水文情報預報規范(GB/T 22482-2008)對最枯月徑流預測結果進行評價。
本文選取瀾滄江某站受人類活動影響較小的1957-1999年共43年資料進行驗證,其中,1957-1994年共38年為訓練期,后面5年為檢驗期。瀾滄江某站最枯月徑流多出現在每年2月,故以2月平均流量作為預報對象。當預測的2月平均流量低于瀾滄江通航最小流量時,將無法正常通航,需通過一定的調度進行保障。
由于在該流域及其附近缺少全面的氣象資料,所以大氣環流方面的資料僅能從相近地區收集而得,23個氣象因子名稱見表1。
根據瀾滄江流域2月份天氣系統物理方面的成因,分析各因子的位置及影響范圍,結合本流域與各因子的物理關系選取相應的預報因子,首先從物理成因方面對各個影響因子進行考察,通過考察后,為了使各預報因子與預報對象相關性更好,采用相關系數法逐一對因子進行篩選。采用計算機智能挑選的方法確定各預報因子的提前期。置信度a取0.05,閥值Ra=0.31,相關系數小于0.31的因子予以舍棄。
為提高回歸分析的預測效果,在綜合平衡的前提下,將獨立性較差(相關性較好的一對因子其中之一)的因子去掉。最終選定的影響因子為因子2、因子4、因子9、因子19、因子20和因子23,同時,由于汛期5-10月份徑流對后期最枯月徑流影響較大,與預報對象2月份平均流量相關性較好,故將其納入作為影響因子。由于汛期5-10月份徑流受水利工程開發、調度等人類活動影響較大,數據白噪聲也較大,因此采用SSA方法對其進行主成分重構,選取累積貢獻率達85%的前10項對其重構,以消除其白噪聲的影響,原始序列與重構序列對比見圖1。

表1 預報因子序號、名稱對照表Tab.1 Forecast factor's number, name comparison table

圖1 影響因子(汛期徑流量)原始序列與重構序列對比圖Fig.1 Influence factor (Runoff of flood season) comparison between original sequence and reconstructed sequence
通過對比可以看出,SSA重構前后汛期徑流量趨勢一致性較好,由于去除了白噪聲等隨機性的影響,重構之后的序列變化更加平穩,變幅略有變小。
為驗證奇異譜分析前后對預測結果的影響,分別將因子2、因子4、因子9、因子19、因子20、因子23、汛期5-10月份平均流量原始序列,因子2、因子4、因子9、因子19、因子20、因子23、奇異譜分析重構的汛期5-10月份徑流序列兩組因子分別用模型進行模擬和預測,詳見表2。

表2 PPR模型和SSA-PPR模型預測結果對比Tab.2 Comparison of Predicted Results
結果表明:瀾滄江訓練期和檢驗期SSA-PPR模型的平均絕對相對誤差、最大絕對相對誤差、最小絕對相對誤差三者均較PPR模型小,說明SSA-PPR模型模擬和預報精度均較PPR模型高。SSA-PPR模型訓練期平均絕對相對誤差、最大絕對相對誤差、最小絕對相對誤差分別為2.5%、7.4%和0.02%,檢驗期分別為6.2%、17.5%和0.6%,檢驗期預測精度低于訓練期模擬精度。
根據PPR模型和SSA-PPR模型模擬和預測過程對比可以看出,SSA-PPR模型模擬和預測過程與實測序列過程更為吻合,起伏過程一致性更好,同時預測結果與實測過程均顯示總體呈現一個緩慢下降的趨勢,與有關學者研究結論基本一致[19,20],詳見圖2。

圖2 PPR模型和SSA-PPR模型預測過程對比圖Fig.2 Comparison of Prediction Process between PPR Model and SSA-PPR Model
按水文情報預報規范(GB/T 22482-2008)評定標準[15],SSA-PPR模型預報總體合格率為88.7%,綜合精度評價為甲等。總體上看SSA-PPR模型所預測的瀾滄江某站年最枯月流量精度滿足要求,效果較好。
上述成果經過訓練期與檢驗期檢驗分析有一定精度,但也主要基于不同要素的時間序列分析而得,因子之間物理聯系不明確,其成果存在一定不確定性。目前,瀾滄江流域由于受多級水電站影響,且各級電站水位、出入庫流量等監測信息還未統一報送,因此還暫時不具備構建流域水文模型的條件。在條件成熟時應構建水文模型,在多種方法相結合的基礎上綜合分析,進一步提高預測成果可靠性。
為解決瀾滄江枯季通航能力預測實際問題,從影響枯水徑流的因子及枯水徑流序列出發,提出了將影響因子與經過奇異譜重構的徑流周期因子相混合,并利用投影尋蹤回歸對瀾滄江枯水徑流進行預測;根據云南省某站(1957-1999年)的年最枯月流量資料預測,結果表明:
(1)天然河道徑流量是影響瀾滄江通航的重要因素之一,由于受大環流的影響季節性強,年內變化較大,開展瀾滄江的最枯月徑流量進行預測研究,對航運保障具有重要的參考作用。
(2)訓練期和檢驗期SSA-PPR模型的平均絕對相對誤差、最大絕對相對誤差、最小絕對相對誤差三者均較PPR模型小;SSA-PPR模型模擬和預測過程與實測序列過程吻合更好,SSA-PPR模型預測效果總體更優。
(3)SSA-PPR模型訓練期平均相對誤差絕對值為2.5%,預測期平均相對誤差絕對值為6.2%;預報合格率較高,為88.7%,按預報標準評價其精度為甲等。SSA-PPR模型所預測的瀾滄江最枯月流量精度達到要求,可供瀾滄江枯季通航流量預測和調度使用。
(4)筆者提出SSA-PPR模型,在傳統的多元回歸基礎上為枯季通航流量預測增加了一種方法,但由于受水利工程調度的影響,實際工作中還要結合短期的預報對成果實時進行修正,各部門應加強瀾滄江流域梯級電站水文信息共享建設,為構建物理意義明確的流域水文模型創造條件,對預報的實際效果不斷驗證并對方案逐步完善,提高預報成果的確定性,以滿足實際工作的需要。