趙國羊,涂新軍,2,3*,王 天,謝育廷,莫曉梅
(1.中山大學土木工程學院,廣東 珠海 519082;2.中山大學水資源與環境研究中心,廣東 廣州 510275;3.廣東省華南地區水安全調控工程技術研究中心,廣東 廣州 510275;4.中山大學地理科學與規劃學院,廣東 廣州 510275)
干旱是一段時間內當降水量明顯低于正常水平時發生的一種自然現象,其隨時間發展緩慢、成因復雜,并且持續時間長、影響范圍廣[1]。干旱對自然環境和人類生活及社會經濟等造成重大破壞,是現今世界上最廣泛、最常見、最具災難性的自然災害之一,遠比其他氣象災害所造成的損失更巨大[2]。從全球范圍內來看,在發生的自然災害中,22%的經濟損失以及受影響人數的33%可歸因于干旱[3]。干旱不僅受降水、氣溫以及蒸散發量等自然因素影響,還與人類活動如過度耕作、過度灌溉、砍伐森林、過度開采可用水等密切相關。近年來隨著全球氣候變暖及社會經濟高速發展等影響,干旱發生的頻率增加、強度變大、范圍變廣,造成的破壞更加嚴重[4],已經引起國內外廣泛關注[5-7]。在國內,這種干旱加劇現象不僅出現在水資源相對貧乏的北方地帶,也頻繁發生在水資源相對豐富的南方濕潤地區[8-9]。因此,準確的干旱預測,對于流域自然資源條件、地區水資源規劃管理、緩解旱情的有害影響等具有重要作用,并為干旱的監測、預警及風險的評估提供科學依據,有助于相關部門優化水資源系統的運行,做好相應的防旱減災措施及決策分析。
干旱指數通常被用來識別干旱事件及表征干旱嚴重程度,基于干旱指數的干旱預測近年來受到關注[10]。常用的干旱指數有標準化降水指數(Standardized Precipitation Index,SPI)[11]、標準化降水蒸散指數(Standardized Precipitation Evapotranspiration Index,SPEI)[12]、Palmer干旱指數(Palmer Drought Severity Index,PDSI)[13]等。干旱預測模型有物理模型和數據驅動模型。物理模型考慮不同的物理成因,對干旱成因進行分析,但由于其需要的數據類型和模型參數較多,模型過于復雜,多數時候難以在預測中實現。而數據驅動模型對數據要求及模型復雜性低,已經被廣泛應用在各種水文預報中。Hudson、Abbot等[14-15]使用數據驅動模型和物理模型對降水量預測進行比較,發現前者相比后者的預測結果有顯著改善。對于數據驅動模型主要有統計方法[10]和機器學習方法[16-18]。由于統計模型在處理非線性問題能力有限,而機器學習技術如人工神經網絡(Artificial Neural Network,ANN)和支持向量機(Support Vector Machine,SVM)因其固有的非線性特性和建模的靈活性,已被應用在水文預測領域中。而ANN方法存在隱含層節點數難以確定、易陷入局部極小值等缺陷,一定程度上會影響其預測效果。Mokhtarzad 等[19]基于SPI進行干旱預測結果表明SVM比ANN更準確;Borji 等[20]用ANN和SVM對徑流干旱指數進行預測,發現SVM預測效果更好。
目前研究一般基于3個月及以上時間尺度的干旱指數進行干旱預測,而對于短時間尺度的干旱指數序列如1個月時間尺度的SPEI1序列,由于存在高度非線性、變化劇烈的特征,直接使用ANN和SVR預測擬合精度不高。一種可對序列進行多時間尺度分解的經驗模態分解(Empirical Mode Decomposition,EMD)方法,可將原序列分解成頻率不同的分量,挖掘數據本身隱含的信息,能夠提高ANN和SVR預測擬合精度。席東潔、范琳琳等[21-22]將EMD和ANN結合,發現可提高月徑流預測精度。劉嘉[23]結合EMD和SVM進行大壩變形預測,發現比SVM預測效果更好。由于分解后得到的高頻成分通常含有噪聲,掩蓋了數據真實特性,影響預測效果,而小波消噪技術可以實現信噪分離,減少干擾,提升預測精度[24]。
本文采用SPEI干旱指數,構建ANN、SVR、EMD-ANN和EMD-SVR預測模型,并應用于東江流域開展1~3個月預見期的干旱預測,對比分析干旱預測模型的適應性,為流域干旱預警和管理提供技術依據。
東江發源于江西尋烏縣,是珠江三大水系之一。東江流域地處亞熱帶季風濕潤氣候區,干濕特征明顯。流域內多年平均降水量約為1 795 mm,年內分配不均,汛期降水占全年80%以上。年均氣溫為20~22℃,年內差別不大,多年平均蒸發量約為1 200 mm。本文采用東江流域1956—2019年多個站點的月降水量和月平均氣溫數據,用泰森多邊形法得到區域月均面降水及氣溫數據。東江流域主要站點分布見圖1。

圖1 東江流域主要站點分布
1.2.1標準化降水蒸散指數
干旱涉及不同的時空尺度,PDSI、SPI、SPEI等指數是干旱評估的常用指標。PDSI對數據要求高,計算相對復雜,在干旱的多時間尺度應用上有所欠缺,在空間尺度上也不能夠很好地適用于大部分地區。對于SPI和SPEI,資料獲取容易,計算簡便,且能很好反映不同時空尺度的干旱特征,實用性強,應用范圍廣。SPI僅考慮降水卻未能表征溫度對干旱的影響,而SPEI體現了降水和溫度對干旱的作用,適合研究全球變暖背景下干旱特征的響應,是國內外研究干旱的理想指標。
東江流域即使在非夏季,溫度也相對較高,由此引起流域內蒸散發量高也是造成干旱的原因。故選取SPEI,并采用1、3、6和12個月時間尺度的SPEI1、SPEI3、SPEI6和SPEI12進行干旱預測。SPEI計算采用基于三參數的Log-logistic概率分布模型[25]。
1.2.2模型構建
ANN和SVR是近年來被廣泛應用于水文預測領域的新方法。本文對不同時間尺度的SPEI序列構建ANN和SVR模型。SPEI序列數據前75%為訓練集,剩余25%為測試集。SPEI與降水、溫度相關且具有一定的自相關性。對SPEI進行自相關性檢驗,滯后前6期自相關系數結果見表1,由表1結果知SPEI具有自相關性。因此降水和溫度取前2個時期(Pt,Pt-1)和(Tt,Tt-1)、SPEI取前6個時期(St,St-1,St-2,St-3,St-4,St-5)為模型的輸入[19],t+N時期的SPEI(St+N)為模型輸出,其函數映射為:

表1 SPEI自相關性檢驗
St+N=f[(Pt,Pt-1),(Tt,Tt-1),(St,St-1,St-2,St-3,St-4,St-5)]
(1)
式中S——SPEI;P——降水;T——溫度;N——預見期,本文分別取N=1,2,3。
1.2.3人工神經網絡
人工神經網絡(ANN)是一種基于與神經元大規模交互作用的并行分布式數據處理系統,非線性映射能力強,能很好地識別輸入和輸出變量之間的關系而無需明確定義二者間的物理關聯,模型易于使用,有較強的魯棒性和容錯性。神經網絡一般由輸入層、隱藏層和輸出層組成,有研究表明僅有單個隱含層的3層網絡結構就可實現任意非線性函數的逼近。
本文選用含3層結構的BP神經網絡,BP神經網絡是采用反向傳播算法對網絡權、閾值和偏差不斷進行調整以達到期望輸出的一種前饋網絡。隱含層節點數根據試錯法來擇定,由于ANN初始權、閾值及其調整的不確定性,對模型進行多次訓練及預測,并取其中最優5個結果的均值作為最終預測結果。隱含層神經元選用雙曲正切S型傳遞函數(tansig),輸出層神經元選用線性傳遞函數(purelin)采用梯度下降法(traingd)來訓練網絡。訓練誤差目標函數采用均方根誤差(MSE),網絡最大迭代次數為20 000次,學習率為0.05。
1.2.4支持向量機
支持向量機(SVM)是Vapnik[26]提出的一種機器學習方法,主要可分為支持向量分類機(Support Vector Classification,SVC)和支持向量回歸機(Support Vector Regression,SVR),分別解決分類和回歸問題。SVM基本思想是基于統計學習理論,通過非線性映射,采用結構風險最小化原則,將低維空間和線性不可分的數據映射到高維空間使其成為線性可分的,再將數據在高維空間進行分類和預測。SVM可有效避免局部極值問題,最大限度地提高預測精度,同時防止數據過擬合,并根據有限樣本信息,在模型復雜度和學習能力之間尋找最優值,提高其泛化能力。
核函數選用和相關參數設定是SVM的關鍵,本文選用SVR模型,核函數選擇應用最廣泛的徑向基核函數,因它適用于不同樣本及各種維度問題的處理且具有很強的非線性映射能力。SVR模型中的懲罰因子C、核參數g以及損失系數ε,用網格搜索算法來尋其最優值。
1.2.5經驗模態分解和小波消噪
由于SPEI1序列隨時間波動劇烈,ANN和SVR模型對其預測精度有限,故針對SPEI1結合經驗模態分解(EMD)和小波消噪對模型進行改進。EMD是Huang等[27]提出的一種適用于非線性、非平穩數據的處理方法,可自適應地將序列分解成多個固有模態函數(Intrinsic Mode Function,IMF)及殘余項之和。本文擬對SPEI1進行EMD處理,得到3個IMF(IMF1、IMF2、IMF3)分量和1個殘余項。
另一方面,時間序列數據受到多種因素影響會含有噪聲,直接將含噪數據輸入到模型中會影響預測精度。小波消噪是被廣泛采用的去除噪聲方法,其主要是對含噪數據通過小波變換得到消噪后的數據。時間序列中,噪聲表現為高頻信號,SPEI1經EMD處理得到頻率依次遞減的IMF1、IMF2、IMF3和殘余項分量。IMF1變化劇烈為高頻分量,噪聲主要存在于IMF1中。其余分量為低頻分量,受噪聲影響很小。本文采用db3小波,采用啟發式閾值選擇規則,對含噪聲較大的高頻分量IMF1進行消噪處理。
因此對于SPEI1序列,構建經驗模態分解神經網絡耦合模型(EMD-ANN)以及經驗模態分解支持向量回歸耦合模型(EMD-SVR)。即對SPEI1進行EMD處理得到各分量,對高頻分量IMF1先進行消噪處理,然后對各分量分別進行預測再進行疊加得到最終預測結果。
1.2.6模型性能評估
為了衡量模型預測值與實際值擬合情況,用決定系數(R2)、均方根誤差(RMSE)對模型性能進行評估。計算公式為:
(2)
(3)
式中n——測試集樣本個數;Oi——第i個樣本實際值;Pi——第i個樣本預測值。
經計算得到不同月時間尺度的SPEI序列見圖2,可知隨時間尺度增大,SPEI序列波動逐漸減緩。SPEI1變化最為劇烈,因為表征1個月尺度干旱的SPEI1受短期降水和溫度變化影響明顯,對降水和溫度變化敏感、響應迅速,致使旱澇轉換頻繁,曲線變化劇烈。而當時間尺度增大,SPEI對降水和溫度變化敏感性降低、響應減慢,故而曲線逐漸變得平滑。

圖2 不同時間尺度的SPEI序列
ANN模型和SVR模型在測試集中預測結果見圖3(N為預見期),預測效果見圖4,模型性能評價結果見表2。表2第三列是通過試錯法得到的網絡結構,第六列是網格搜索得到的3個參數。

圖3 基于ANN與SVR模型的干旱預測

圖4 基于ANN和SVR模型的干旱預測效果

表2 基于ANN與SVR模型的干旱預測效果評價
就SPEI3、SPEI6和SPEI12而言,2種模型預見期為1、2、3個月的決定系數R2分別為0.834~0.911、0.683~0.761和0.486~0.622。其中SPEI6的預測效果最好,其次SPEI12。如預見期為1個月時,SPEI6的預測效果最好,R2達到了0.908~0.911;其次為SPEI12,R2為0.900~0.907;SPEI3的R2也能達到0.834。一般來說,當時間尺度增大時,SPEI對降水和溫度敏感性減弱,曲線更平滑,模型預測更準確[19]。從圖4也可以看出,模型在預測SPEI12時相比SPEI6出現了更多的高估或低估的預測偏差,且當預見期增大時滯后性相對更明顯,預測效果不如SPEI6。
3個月以上尺度的干旱預測效果整體上來說較好,且預見期越短,預測效果越好。就SPEI3、SPEI6和SPEI12而言,與3個月預見期的預測效果對比,ANN模型的2個月和1個月預見期的決定系數R2分別提高了16%~41%和30%~72%;SVR模型的2個月和1個月預見期的決定系數R2分別提高了14%~37%和27%~64%。
對比2種模型的預測結果可知,SVR模型比ANN模型的干旱預測效果更好。對于SPEI3、SPEI6和SPEI12,當預見期分別為1、2、3個月時,SVR模型比ANN模型預測的決定系數R2分別提高了0.3%~1.1%、1.5%~3.2%和3.0%~5.8%。這是由于ANN模型網絡結構不易確定,有陷入局部極小值的問題,而SVR模型基于結構風險最小化原則,可避免局部極值問題,有良好的全局最優和預測能力,相比ANN模型其泛化能力更好。
SPEI1的預測效果相對較弱,2種模型預見期1、2、3個月的預測決定系數R2分別為0.311、0.292~0.305和0.267~0.291。因此,SPEI1的預測需要進一步改進。
2.3.1SPEI1的EMD分解及小波消噪
為了讓1個月尺度的干旱獲得更好的預測效果,對SPEI1進行 EMD分解,見圖5。IMF1、IMF2、IMF3頻率依次遞減,殘余項反應了原始序列的長期變化趨勢。對高頻分量IMF1進行消噪,見圖6。消噪后序列相對平滑,在一定程度減小隨機擾動的影響下仍保持了原IMF1序列的主要趨勢信息,較好地提取了原IMF1序列中的有用成分。

圖5 SPEI1序列EMD分解

圖6 消噪后IMF1序列
2.3.2基于EMD-ANN和EMD-SVR的SPEI1預測
EMD-ANN模型和EMD-SVR模型在測試集中的SPEI1預測結果見圖7,預測效果見圖8,模型性能評價見表3。

圖7 基于EMD-ANN和EMD-SVR模型的SPEI1預測

圖8 基于EMD-ANN和EMD-SVR模型的SPEI1預測效果

表3 基于EMD-ANN和EMD-SVR模型的SPEI1預測評價
經過EMD及小波消噪處理后的SPEI1預測效果得到了明顯改善,2種模型預見期1、2、3個月的SPEI1預測決定系數R2分別為0.685~0.692、0.747~0.752和0.428~0.448,與處理前相比分別提高了120%~123%、71%~73%和54%~60%。這是因為短時間尺度SPEI1序列變化波動不穩定,有較大干擾,直接利用ANN和SVR預測時,序列自身特性沒有得到深度挖掘,而EMD可將SPEI1分解成頻率不同的分量,各分量數據特征更加顯著,規律性更強,便于構建各分量預測模型;另一方面針對序列預測誤差主要集中在含有噪聲干擾的高頻分量IMF1上的問題,則對IMF1先消噪,在保留原IMF1序列數據真實性的同時去除噪聲干擾,提高分量預測精度。因此與ANN模型和SVR模型比較,EMD-ANN模型和EMD-SVR模型的SPEI1預測效果更好。
就SPEI1的預測,在預見期分別為1、2、3個月時,EMD-ANN模型好于EMD-SVR模型的預測結果,EMD-SVR模型比EMD-ANN模型預測的決定系數R2分別提高了1.0%、3.2%、4.7%。而在預見期分別為1、2、3個月時,SVR模型比ANN模型決定系數R2分別提高了0、4.5%、9.0%。說明應用EMD和小波消噪處理后,在預見期為1個月時SVR模型與ANN模型的預測效果差距增大,在預見期為2、3個月時SVR模型與ANN模型的預測效果差距縮小。
通過建立ANN、SVR、EMD-ANN和EMD-SVR模型,對1、3、6、12個月的SPEI指數,進行了預見期為1~3個月的干旱預測,主要結論如下。
a)對時間尺度為3個月及以上的SPEI,ANN和SVR模型具有較好預測效果。其中SVR模型預測精度略優于ANN模型,SPEI6的預測精度略優于SPEI12和SPEI3。
b)預見期越短,干旱預測精度越高。對于時間尺度3個月以上的干旱指數,預見期1個月的ANN和SVR模型預測決定系數可達到0.834 ~0.911。
c)ANN和SVR模型對1個月時間尺度的SPEI1預測效果較差,但是通過EMD及小波消噪處理后,基于EMD-ANN和EMD-SVR模型的預測精度顯著提高,干旱預測效果得到了明顯改善。