(遼寧省鞍山水文局,遼寧 鞍山 114000)
當前,在全球氣候變化及人類活動的綜合影響下,河道徑流系列已經逐步從穩定、線性變化的序列轉變為非穩態、非線性的變化過程[1]。對于一切涉水活動的水利工程設計而言,水文設計是基礎,水文設計需要結合徑流數據進行頻率分析,得到不同設計標準下的徑流設計值,而頻率分析的關鍵在于水文資料的一致性。近年來,人類活動對河道徑流的影響逐步加大,對徑流數據系列的一致性影響較大,而要滿足工程設計要求,需要對徑流資料進行一致性處理,徑流重構方法則主要是對徑流的非一致性進行處理,使其滿足徑流一致性要求[2]。國內學者從水文統計學角度出發,對人類活動影響區徑流重構進行了大量的研究[3-4],其中高頻剔除方法采用數學方法進行分析,在多個研究成果中均證明應用效果好于傳統標準化的方法[5-6],但是由于其未能考慮徑流分量之間的平差,使得部分研究站點徑流重構的精度較低,而產生這一原因的關鍵在于其未能對重構系數進行優化。為此,本文結合PSO優化算法,對高頻剔除方法在進行徑流重構時,對其重構系數進行優化,并將兩種方法進行組合,構建基于面向EMD的徑流重構新方法,并以遼寧地區海城和岫巖兩個典型水文站點為研究實例,評估新方法對區域徑流重構的精度。研究結果對于人類活動區徑流重構具有重要的參考價值。
EMD為經驗模態分解方法的英文縮寫,在水文數據系列分析中,面向EMD分解方法對徑流重構具有較好的精度,其主要的計算步驟如下:
a.尋找徑流原始數據系列x(t)的最大和最小值,并采用樣條插值的方法對數據系列的上、下兩條包絡線進行均值化,均值計算方程為
(1)
式中:xmax(t)、xmin(t)分別為包絡線的最大、最小均值。
b.結合該包絡線均值m(t)與原始徑流數據系列進行相減,得到處理后的數據系列h(t),其計算方程為
h(t)=m(t)-x(t)
(2)
c.對構建的新徑流數據系列進行正態模函數(IMF)檢驗,需要滿足兩個條件,第一條件為在不同計算時刻,其對應的包絡線最大值的均值為0,其次特征值與為0數目的變量值相同或者數量相差較小。
d.將原始數據系列x(t)與第1個固態模函數相減得到數據系列r1(t),其計算方程為
r1(t)=x(t)-I1(t)
(3)
式中:I1(t)為分解出的第1個正態模函數。
e.將第1個數據系列r1(t)進行下一步分解重構,直到分解出的模函數In(t)為相對單一的殘余趨勢項(Residual)為止。
通過對徑流重構可以得到多個分解后的模函數以及殘余的趨勢項,得到徑流非平穩的數據系列,采用自回歸模型對其進行預測,預測方程為
xt=φ1xt-1+φ2xt-1+…+φnxt-n+at
(4)
式中:at為正態分布的隨機變量;φ1、φ2、…、φn為重構系數;n為模型計算的階數。
本文采用PSO優化算法對其重構系數φ1、φ2、…、φn進行優化計算,主要計算原理見圖1。
本文以岫巖站和海城站作為研究實例,兩個站點均位于鞍山境內,近些年來,受到人類活動影響,兩個站點的徑流數據呈現較為明顯的非一致性變化。采用非線性趨勢檢驗方法對兩個站點年徑流數據進行檢驗,其檢驗結果均通過95%的非線性顯著檢驗,表明岫巖站和海城站徑流呈現明顯的非線性變化,檢驗結果見表1。而岫巖站、海城站作為大洋河及渾河的主要控制站點,對于其流域防洪設計至關重要,需要結合徑流重構方法對各站點徑流數據進行非一致性處理,使其能滿足防洪設計所要求的一致性需求。

表1 研究站點徑流數據非線性檢驗結果
結合高頻剔除方法對岫巖站和海城站實測徑流數據系列進行徑流重構分解,得到不同徑流分量結果,兩個站點EMD分解結果見圖2、圖3。

圖2 海城站實測徑流EMD分解圖
由圖2可以看出,岫巖的原始徑流數據系列經過重構分解后,可形成4個固有模函數以及1個殘余趨勢項。由圖3可以看出,隨著徑流重構分解的次數增加,相比于初始數據系列,各分解后的固有模函數IMF1~IMF4變現逐步平穩,且逐漸呈現單一線性變化,而對于殘余趨勢項而言,當固有模函數分解穩定后,其

圖3 岫巖站實測徑流EMD分解圖
呈現明顯的遞減變化,這主要是因為高頻剔除法主要是對于非線性變化的徑流數據系列進行分解后使其逐步趨于穩定,而殘余趨勢項下的徑流重構分解量逐步減小,使得其總體呈現遞減變化。岫巖站和海城站具有較為一致的變化,均從原始數據系列進行徑流重構分解成4個固有模函數,在IMF4呈現明顯的正態函數變化,在IMF4下再進行正態模函數分解后,其殘余趨勢項逐步減小,徑流重構分解量呈現趨于線性、穩態變化。
分別按照率定期和驗證期對兩個站點實測徑流數據重構分解后的精度進行評價,評價結果見表2。
從兩個站點的徑流重構分解結果可以看出,其率定期和驗證期相對誤差絕對值MAPE和納什效率系數NSE呈現較為明顯的規律性變化。單純采用高頻剔除法進行徑流重構分解,其相對誤差絕對值較大,精度較差;而直接采用重構方法進行徑流分解,其分解后的誤差主要來源于徑流的高頻分量,隨著高頻分量的減少,其誤差有所減少。為降低高頻分量對其徑流重構分解的誤差影響,同時盡量減少樣本數據信息的丟失,在新的組合方法下主要對IMF1的信息進行剔除,而保留IMF2的徑流分解重構信息。

表2 基于EMD方法的研究站點徑流分解重構精度分析結果
對單一進行PSO優化以及與高頻分量組合下的重構系數進行優化分析,結果見表3,并對各站點采用組合方法下的徑流重構相關度進行分析,結果見圖4和圖5。

表3 不同方法下的人類活動影響站點的徑流重構系數分析結果

圖4 海城站徑流重構率定期和驗證期相關分析結果

圖5 岫巖站徑流重構率定期和驗證期相關分析結果
由表3可以看出,采用高頻剔除法和重構系數優化組合后,其重構系數明顯小于采用單一PSO優化后的重構系數值,這主要是因為采用單一PSO進行重構系數優化時,未能考慮高頻分解誤差對重構系數的影響,使得其重構系數有所偏大。由圖4、圖5可以看出,各站點不同徑流分解量下的相關度總體均在0.5以上,具有較好的相關性,其中殘余趨勢項下的相關度也可在0.6以上,相比于采用高頻剔除方法進行徑流重構下的精度改善效果更為明顯。
結合4種徑流重構方法分別對海城站和岫巖站徑流進行重構效果分析,選取MAPE(平均絕對百分比誤差)、NMSE(標準均方差)、MAE(平均絕對誤差)、DVS(方向變差對稱值)和NSE(納什效率系數)5種誤差評價指標,精度對比結果見表4。
從兩個站點不同徑流重構評估結果可以看出,標準重構方法下的徑流重構誤差最大,徑流重構效果最不理想,在岫巖站的徑流重構相對誤差絕對值MAPE達到47.35%,納什效率系數也低于其他徑流重構方法。高頻分量剔除方法下兩個站點的徑流重構精度相比于標準重構方法有所提升,這主要是因為該方法剔除了高頻分量IMF1,降低了徑流重構的相對誤差,但由于其計算結束條件設定使其MAPE值最小,使其對徑流重構驗證期計算誤差仍然有所影響。高頻分量剔除+權重優化方法綜合了以上兩種方法計算的優點,不僅對高頻分量進行有效剔除,且對其他徑流分解量進行了重構系數的優化計算,最大程度地消除了各徑流分量之間的平差,使得其計算精度較其他方法都有較為明顯的改善。
a.重構誤差主要來源于其高頻分量,隨著高頻分量的減少,其誤差有所減少,為降低高頻分量對徑流重構的誤差影響,建議采用新組合方法進行區域徑流重構時,應盡量將IMF1進行剔除。
b.高頻分量剔除+權重優化方法不僅可用于徑流重構分解,也可進行基于分解-重構-預測組合模式下的中長期徑流預測計算。
本文采用4個高頻分量進行了徑流重構分解,今后還需要重點分析研究高頻分量數目對其徑流重構精度的影響。