劉 偉 王云雷 宋家俊
(西藏大學工學院, 西藏 拉薩 850000)
伊犁河谷被譽為新疆的“塞外江南”,但同時也是新疆地區山洪的易發區、高發區和重災區[1]。由山洪及其引發的滑坡、泥石流等次生地質災害,對當地人民的生命財產安全、農林牧業的生產、交通運輸和基礎設施都造成了嚴重影響和極大損失。伊寧縣是伊犁河谷的經濟、政治、文化中心,預測該地區山洪暴發的主要影響因素降水量值,對于預防該地區山洪以及由山洪引發的滑坡、泥石流等次生災害發生具有重要意義。
近年來,新疆的總體氣候特征由暖干向暖濕過渡,降雨日數及強度呈現增加的趨勢,直接導致洪災發生頻率顯著增加[2-3]。現有針對伊犁河谷地區山洪影響因素的研究已較為全面,都有相關的研究論證。例如,從氣候背景、天氣診斷分析[4],得出冬春季溫度回升是山洪發生的主要氣象因素之一;從地形地貌特征研究出發[5],可知山麓、山前平原和河谷地帶洪水較為易發;通過分析歷年降水量數據,確定臨界致災雨量指標,對洪災易發區進行等級劃分[6]。
本文基于深度學習,搭建不同的神經網絡模型,即反向傳播神經網絡(Back Propagation Neural Network,BP)、循環神經網絡(Recurrent Neural Network,RNN)、長短期記憶網絡(Long Short Term Memory,LSTM)、門循環單元網絡(Gate Recurrent Unit,GRU),然后通過比較分析不同的神經網絡對降水量值模擬的性能,選擇最優的神經網絡模型,從而預測山洪產生的主要影響因子[7]即降水量的值,為預測伊寧地區山洪災害的發生提供有力參考。
采用數據為NOAA提供的2015年至2022年5月19日伊寧縣站點的氣象監測數據,包括溫度、露點溫度、海平面氣壓、本站氣壓、能見度、風向風速、最大風速、陣風、最高溫、最低溫、降水量等氣象要素。所用數據實驗前都將進行缺失值和歸一化等預處理,保證實驗結果的可靠性。
神經網絡通過模擬人腦機理,使輸入樣本數據在通過神經網絡模型計算后獲得不同的權重參數,最后輸出數據進行推理預測。本文將2015—2021年伊寧縣7年的氣象數據作為訓練集,將溫度、露點溫度、本站氣壓、能見度、風向風速、最大風速、最高溫、最低溫8個影響因子輸入BP、RNN、LSTM、GRU 4種不同的神經網絡模型,使損失函數趨近于0,從而得到4種不同的預測降水量值的網絡模型。再以截至2022年5月19日的氣象數據作為測試集,將降水量值的8個影響因子放入模型預測降水量,以均方誤差作為檢驗模型性能的標準,均方誤差越小,模型性能越好,從而得到伊寧地區降水量預測的最佳神經網絡模型。
1.2.1 BP算法模型
BP神經網絡算法的學習過程中包含信息前向傳播和誤差反向傳播兩個階段。在信息前向傳播階段,從輸入層開始,輸入元素經隱藏層逐層傳輸到輸出層。如果輸出層的實際輸出結果與所期望的輸出結果不一致,網絡將進行誤差反向傳播。誤差從輸出層傳輸到第一個隱藏層,并分配給每一層的所有單元。誤差信息是修正各單位權重和偏置的依據。信息前向傳播和誤差反向傳播階段的權重調整周期一直持續到收斂為止。在權重和偏置不斷調整的過程中,網絡一直處于學習的過程中。這個過程循環進行,直到網絡的輸出誤差達到預期要求的計算精度,或者進行到學習次數達到預設值為止[8-9]。
前向傳播階段是典型的3層BP神經網絡,輸入信息從第一個隱藏層開始,經過第二個隱藏層,傳輸到輸出層,在輸出端產生輸出信息。如果輸出信息滿足要求,則終止計算。否則,網絡將被轉移到誤差的反向傳播階段。其中,輸入樣本X=[x1,x2,…,xn],權重W=[w1,w2,…,wn],偏置B=[b1,b2,…,bn],輸出Y=[y1,y2,…,yn]。3層BP網絡結構見圖1。

圖1 3層BP網絡結構
1.2.2 RNN算法模型
RNN神經網絡是深度學習算法的重要組成部分。與全連接神經網絡相比,最大的不同在于隱藏層單元之間不是相互獨立的。隱藏層神經元不僅相互關聯,而且當前隱藏層細胞的狀態也受到歷史輸入數據的影響。這個特性使得提取時序數據結構的時序關系非常有效。RNN是一種用于處理序列數據的神經網絡。在不同的時間步,RNN循環權重并跨時間步連接[10]。
由圖2可知,當用RNN計算當前狀態時,它不僅取決于當前的輸入,而且取決于前一狀態的輸出,即當前輸入xt和前一狀態輸出st-1共同決定當前狀態st,即

圖2 RNN神經網絡結構
ot=g(Vst)
st=f(Uxt+WSt-1)
式中:V為隱藏層到輸出層之間的權重矩陣;U為輸入層到隱藏層之間的權重矩陣;f、g均為激活函數;W為隱藏層和隱藏層之間不同時間的權重矩陣。循環迭代代入,便可得到
ot=g(Vst)=g[Vf(Uxt+WSt-1)]
1.2.3 LSTM算法模型
LSTM是RNN循環神經網絡的一種優化形式,因為標準的RNN不會對以往的信息進行選擇,而是機械地疊加以往的信息,導致RNN存在著梯度消失和梯度爆炸的問題,LSTM可有效解決這兩個問題。相較于RNN,LSTM引入了輸入門、遺忘門、輸出門3個結構[11]。LSTM結構見圖3。其中,f、g為激活函數,Z為輸入樣本。Zi對輸入門進行表達,在這個部分對輸入進行選擇性的記憶,重點記錄相關性強的信息;Zf對遺忘門進行表達,選擇性地錄入重要信息,遺棄次要信息;Zo對輸出門進行表達,過濾出需要得到的輸出部分。LSTM模型表達式如下:

圖3 LSTM結構(某時間節點)
Z=tanh(W[xt,ht-1])
Zi=σ(Wi[xt,ht-1])
Zf=σ(Wf[xt,ht-1])
Zo=σ(Wo[xt,ht-1])
1.2.4 GRU算法模型
GRU也是RNN的一種優化形式,但是相較于LSTM,GRU的結構更加簡單,也可以理解為LSTM的一種變體,LSTM有3個門結構,GRU只有重置門和更新門2個門結構[12]。GRU模型結構見圖4。

圖4 GRU模型結構
Z對更新門進行表達,更新門幫助模型決定到底要將多少過去的信息傳遞到未來;r對重置門進行表達,重置門決定了怎樣將當前新的輸入信息與之前的記憶信息相結合;h表示重置之后的數據;St是更新記憶之后的表達式,即最終的記憶。GRU模型表達式如下:
Z=σ(xtUz+st-1Wz)
r=σ(xtUr+st-1Wr)
h=tanh[xtUh+(st-1⊙r)Wh]
st=(1-Z)⊙h+Z⊙st-1
圖5~圖8分別為4種神經網絡模型對2015—2021年降水量值訓練的結果。從圖中可以看出,BP神經網絡的訓練結果最差,對原始數據擬合效果并不理想,擬合曲線大致為一段弧線。RNN神經網絡相對于BP神經網絡的擬合能力有了一些提高,但在擬合時時間損耗較多,整體擬合效果不理想。LSTM神經網絡的擬合效果比較理想,基本能擬合原始曲線且時間損耗較小。GRU神經網絡的擬合效果較之于LSTM差一些,但是比RNN神經網絡效果要好。

圖5 BP神經網絡訓練模型

圖6 RNN神經網絡訓練模型

圖7 LSTM神經網絡訓練模型

圖8 GRU神經網絡訓練模型
同時從表1各個神經網絡的損失函數值的大小來看,LSTM神經網絡是4種神經網絡里面擬合效果最好的。LSTM神經網絡優于GRU神經網絡,GRU神經網絡優于RNN神經網絡,RNN神經網絡優于BP神經網絡。

表1 4種神經網絡模型損失值變化
圖9~圖12為利用訓練過的4種神經網絡模型對截至2022年5月19日降水量值反歸一化的預測情況。從圖中可以比較清楚地看出,4種模型中LSTM的預測效果最好,BP的預測效果最差。

圖9 BP神經網絡測試模型

圖10 RNN神經網絡測試模型

圖11 LSTM神經網絡測試模型

圖12 GRU神經網絡測試模型
4種神經網絡模型預測均方誤差見表2。表2也佐證了訓練集中LSTM模型效果最好的結論。同時發現訓練集中表現較好的GRU模型,在MSE評估上比RNN遜色了一些,這是由于數據量不夠充足的緣故導致出現了一些誤差,如果同時考慮模型評價指標MSE和時間性能的話,GRU依然是優于RNN模型的,BP模型的效果最差。

表2 4種神經網絡模型預測均方誤差
本文通過構建BP、RNN、LSTM、GRU4種不同的神經網絡模型,對伊寧縣日降水量值進行預測分析,實驗結果表明,4種神經網絡模型相比較,LSTM模型對于伊寧縣地區降水量值的預測效果最好,均方誤差可以達到0.06194096,其預測的降水量值可以作為預防山洪的一個重要指標,并能結合其他影響山洪暴發的因素,有效地為當地防災減災提供科學依據。
訓練預測模型中輸入的溫度、露點溫度、本站氣壓、能見度、風向風速、最大風速、最高溫、最低溫等氣象影響因子在某種程度上不能非常確切地表達出與降水量的緊密相關性,因此,也對輸入訓練模型的氣象因子的選擇提出了更高的要求。