李 遙
(重慶市水利電力建筑勘測設計研究院有限公司,重慶 401121)
近年來,隨著極端氣候的發生,極端降雨事件在區域內的發生頻率也逐漸增加,這在很大程度上限制了區域經濟發展,嚴重危害了居民的人身安全[1-2]。為分析極端降雨事件的發生規律,國內學者在不同區域做了相應研究,并取得了一定的研究成果。王衛平等[3]分析了新疆地區極端降雨事件的時空分布特征,研究表明,區域多年極端降雨事件呈增加趨勢;杜穎恩等[4]分析了西安市極端降雨的發生規律,同樣指出了西安市極端降雨事件呈現逐漸增加趨勢;苗正偉等[5]研究了京津冀地區極端降水事件分布特征,也得出了相同的結論。
為進一步分析區域極端降雨事件的變化規律,相關學者構建了區域極端降雨事件預測模型。沈黎[6]基于高斯回歸模型、梯度提升樹模型等4種機器學習模型構建了浙江省極端降雨事件預測模型,并得出了精度最高模型;李春宇[7]基于優化的支持向量機模型構建了重慶極端降雨事件預測模型,并取得了較高的精度。截至目前,針對大尺度區域極端降雨事件的研究仍然較少。因此,本文以西南地區為研究區域,基于混合深度學習理論構建大尺度區域極端降雨事件預測模型,為區域防汛抗旱政策的制定提供參考。
西南地區主要包括四川、貴州、重慶、云南、廣西5省(自治區、直轄市),區域地形復雜,氣候多變。為尋找區域極端降雨事件的最優預測模型,本文選擇了西南地區共計113個氣象站點的逐日氣象數據進行研究,研究區域基本情況及站點分布見圖1。

圖1 研究區域概況
本文共選擇西南地區113個氣象站點1961—2018年的逐日氣象數據,包括日降雨量、最高溫度、最低溫度、日照時數、風速和相對濕度等數據,數據均來自國家氣象中心,數據序列質量良好。為構建區域極端降雨事件預測模型,本文選擇了中雨日數R10、大雨日數R20、濕日降雨量PRCPTOT、1日最大降雨量RX1共4種極端降雨指數進行研究,不同指數的具體含義可見文獻[8]。
卷積神經網絡模型(CNN)是深度學習算法的一種[9],該模型具有卷積層和池化層結構,可實現對數據的卷積、提取和采樣壓縮。該模型通過對輸入數據的逐層卷積和池化,提取數據特征,從而提高模型計算精度。
長短期記憶神經網絡模型(LSTM)是一種考慮了時間序列的循環神經網絡模型,其主要特點可通過門結構實現對數據的處理和計算,從而提高模型訓練速度[10]。
為綜合運用以上兩種模型的優點,本文將CNN模型和LSTM模型進行組合,采用CNN模型結構分析訓練數據的內在規律,采用LSTM模型進行極端降水事件預測,從而進一步提高模型精度。
為進一步提高算法精度,本文采用孔雀優化算法(POA)對CNN-LSTM模型進行優化。POA算法主要通過模擬雌雄孔雀的求偶、覓食行為來實現種群位置的更新,算法具體步驟可見文獻[11]。
為驗證POA-CNN-LSTM模型的精度,采用粒子群算法(PSO)和遺傳算法(GA)對CNN-LSTM模型進行優化,同時將模型精度與隨機森林模型(RF)和廣義回歸神經網絡模型(GRNN)進行比較。選擇均方根誤差RMSE、相對均方根誤差RRMSE、納什系數NS、決定系數R2來綜合評價模型精度,具體公式如下:
(1)
(2)
(3)
(4)

不同模型模擬R10的精度箱線圖見圖2。由圖2可知,優化后的模型和組合模型均可提高模型精度,在所有模型中,POA-CNN-LSTM模型的精度最高,該模型模擬R10的RMSE和RRMSE分別為1.503d和1.544%,NS和R2分別為0.981和0.973,PSO-CNN-LSTM模型和GA-CNN-LSTM模型精度次之;未組合的模型精度較組合模型有所降低,但仍高于傳統模型,其中POA-LSTM模型的精度較高,表明POA算法的性能優于PSO算法和GA算法,該模型模擬R10的RMSE和RRMSE分別為3.422d和6.931%,NS和R2分別為0.905和0.879。傳統模型中,LSTM模型精度最高。

圖2 R10精度箱線圖
不同模型模擬R20的精度箱線圖見圖3。由圖3可知,優化后的模型和組合模型均可提高模型精度,在所有模型中,POA-CNN-LSTM模型的精度最高,該模型模擬R20的RMSE和RRMSE分別為1.997d和1.867%,NS和R2分別為0.983和0.976,PSO-CNN-LSTM模型和GA-CNN-LSTM模型精度次之;未組合的模型精度較組合模型有所降低,但仍高于傳統模型,其中POA-LSTM模型的精度較高,表明POA算法的性能優于PSO算法和GA算法,該模型模擬R20的RMSE和RRMSE分別為5.548d和8.309%,NS和R2分別為0.910和0.869。傳統模型中LSTM模型精度最高。

圖3 R20精度箱線圖
不同模型模擬RX1的精度箱線圖見圖4。由圖4可知,優化后的模型和組合模型均可提高模型精度,在所有模型中,POA-CNN-LSTM模型的精度最高,該模型模擬RX1的RMSE和RRMSE分別為2.642mm和1.272%,NS和R2分別為0.980和0.978,PSO-CNN-LSTM模型和GA-CNN-LSTM模型精度次之;未組合的模型精度較組合模型有所降低,但仍高于傳統模型,其中POA-LSTM模型的精度較高,表明POA算法的性能優于PSO算法和GA算法,該模型模擬RX1的RMSE和RRMSE分別為5.556mm和5.309%,NS和R2分別為0.865和0.879。傳統模型中,LSTM模型精度最高。

圖4 RX1精度箱線圖
不同模型模擬PRCPTOT的精度箱線圖見圖5。由圖5可知,優化后的模型和組合模型均可提高模型精度,在所有模型中,POA-CNN-LSTM模型的精度最高,該模型模擬RX1的RMSE和RRMSE分別為7.599mm和1.726%,NS和R2分別為0.976和0.975,PSO-CNN-LSTM模型和GA-CNN-LSTM模型精度次之;未組合的模型精度較組合模型有所降低,但仍高于傳統模型,其中POA-LSTM模型的精度較高,表明POA算法的性能優于PSO算法和GA算法,該模型模擬PRCPTOT的RMSE和RRMSE分別為15.746mm和9.145%,NS和R2分別為0.823和0.869。傳統模型中,LSTM模型精度最高。
為進一步驗證不同模型精度,本文繪制了4種極端降水指數不同模型模擬值的泰勒圖,結果見圖6。可知POA-CNN-LSTM模型與標準值最為接近,表明該模型計算結果的一致性最高,誤差最低,可作為區域極端降水事件的推薦模型使用。

圖6 不同模型模擬值泰勒圖
為進一步驗證POA-CNN-LSTM模型的精度,對該模型的普適性進行分析。在模擬4種指標時,隨機選擇四川、貴州、云南、廣西4省(自治區)5個站點,隨機以其中4個站點為訓練站點,第5個站點為預測站點,模擬的4種極端降水事件精度見表1~表4。從中可知,在模擬4種極端降水事件時,誤差較低,且一致性指標均在0.9以上,表明POA-CNN-LSTM模型具備較好的普適性,進一步證明了該模型的精度。

表1 POA-CNN-LSTM模型模擬R10普適性分析

表2 POA-CNN-LSTM模型模擬R20普適性分析

表3 POA-CNN-LSTM模型模擬RX1普適性分析

表4 POA-CNN-LSTM模型模擬PRCPTOT普適性分析
本文基于組合模型思想,構建了CNN模型和LSTM模型的組合深度學習模型,并基于POA算法對CNN-LSTM模型進行了優化,與其余模型精度進行了對比,結果表明:POA-CNN-LSTM模型在所有模型中精度最高,在泰勒圖中與標準值最為接近;且具備較高的普適性,可推薦其用于估算西南地區極端降水事件。