羅 宇,羅林艷,范嘉智,段思汝,高文娟
(1.中國氣象局氣象干部培訓學院湖南分院,長沙410125;2.湖南省氣象信息中心,長沙410118)
隨著全球氣候變化加劇和中國經濟社會快速發展,天氣與人類生產生活的關系越來越密切,精細準確的天氣預報在社會經濟、國防軍事等方面作用日益凸顯。氣象科技和信息技術的快速進步,使得天氣預報在過去20年取得了巨大進展,但高時空分辨率的精細化預報技術仍是氣象預測預報領域中的難點問題[1-3]。近年來,機器學習等計算機技術進一步發展為精細化預報預測提供了一種基于數據驅動的新技術和新思路。孫德全等[4]利用LASSO回歸、隨機森林和深度學習3種機器學習方法,對華北地區數值天氣預報結果進行訂正,改善局地預報精度;智協飛等[5]應用貝葉斯模式平均法對多個數值模式預報結果進行集成,獲得更高精度的預報和更全面的預報信息。李寧等[6]利用耦合集合經驗模態分解(EEMD)配合自回歸求和滑動平均自回歸模型(ARIMA)對季節性降水進行建模,以提升預報精度。Singh等[7]等利用BP神經網絡結合遺傳算法對日平均氣溫進行預報,但未涉及精細化預報;王定成等[8]提出一種多元時間序列局部支持向量回歸的預報方法,對日最高、最低氣溫進行預報。這些研究或是利用機器學習方法對多種數值模式預報結果進行優化組合,或是利用基于經典時間序列預報方法(ARIMA等)未涉及多元氣象因子,或是雖結合時間序列分析和機器學習方法但未實現精細化預報。20世紀80~90年代出現的循環神經網絡(RNN),可對序列時間維度上的非線性特征進行挖掘,其中由Cho等[9]提出的GRU(Grated recurrent unit)是最為常見的循環神經網絡之一,已在文本分析、交通流量分析、電力負荷預報及空氣質量預報等方面得到廣泛應用[10-15]。本研究基于深度GRU神經網絡,利用地面氣象數據對湖南省石門縣未來24 h內逐小時氣溫進行預報,并與ARIMA模型預報結果和歐洲中心等數值預報產品對比分析,進一步探索深度學習在精細化預報中的應用。
本研究所用資料由全國綜合氣象信息共享平臺(CIMISS)獲取,選用湖南省石門縣1993年1月1日至2015年6月30日地面氣象觀測站逐小時數據(氣溫、氣壓、露點溫度、相對濕度和水汽壓),進行深度GRU網絡建模,各要素整體情況如表1所示。石門地面氣象觀測站位于石門縣南部,29.583 3°N,111.366 7°E,海拔116.9 m,為國家基準氣候站。為比較深度GRU模型與常用數值模式預報精度,選用2019年4月1日至2019年7月31日石門縣地面氣象觀測逐小時資料(CIMISS平臺中的數值預報產品僅保存近4個月的數據),利用建模所得深度GRU網絡模型進行預報,并與對應時間段歐洲中心(EC)和日本(JAP)數值預報產品進行對比。

表1 石門國家基準氣候站各氣象要素整體情況
石門站為國家基準氣候站,觀測質量穩定,且數據通過質控和審核,觀測數據質量及數據連續性得到保障,因此數據清洗過程只對其中存在的極個別重復記錄進行刪除處理,最終得到197 184個時次的觀測資料序列。相關研究表明[16-18],平穩時間序列相對更容易分析建模,而氣象數據序列多為存在較明顯周期和趨勢的非平穩序列,因此利用一階差分方法對各氣象要素序列進行平穩化處理。為提升模型精度和收斂速度,降低計算負擔,采用Z-score方法對數據進行標準化處理[19,20],消除各氣象要素之間的量綱影響,使其轉化為同一個量級。
相較于原生循環神經網絡(RNN),GRU可以避免長序列訓練過程中的梯度爆炸和梯度消失問題,捕獲任意長度時間序列的自回歸結構,單元結構如圖1所示,其中zt和rt分別為更新門和重置門。由圖1可見,更新門用于控制前一時刻的狀態信息被帶入到當前狀態中的程度,更新門越大,前一時刻的狀態信息被帶入得越多。重置門控制前一狀態有多少信息被寫入到當前的候選集h?t上,重置門越小,前一狀態的信息被寫入得越少。GRU對應的前向傳播公式分別如式(1)至式(5)所示。

圖1 GRU單元結構

式中,xt為t時刻的輸入向量,W為權重矩陣。
將小時地面氣溫(T)、氣壓(P)、露點溫度(DP)、相對濕度(RH)和水汽壓(VAP)數據作為特征向量xt,t為某一特定時刻,利用過去47 h和當前時次的特征向量序列X={x(t-47),x(t-46),…,x(t)}作為輸入,預報未來24 h的逐小時氣溫Y={y(t+1),y(t+2),…,y(t+24)}。預報模型采用4層神經網絡,結構如表2所示。各層神經元數分別為20、15、20和24,其中輸入層和中間層選用GRU層,激活函數為tanh,輸出層選用Dense層(全鏈接層),激活函數為linear,各層的丟棄率均為0.2,以防止過擬合。模型性能度量選用均方誤差,采用RMSProp優化器,學習率為0.001,訓練迭代次數為100。本研究在Windows操作系統下進行,深度GRU網絡建模基于Python語言和Keras深度學習框架中的Sequential模型進行,將數據集按9∶1切割,前90%用作訓練集訓練模型,后10%用作測試集驗證模型精度。ARIMA建模基于R語言中的forecast包進行。采用決定系數(R2)、均方根誤差(RMSE)、平均絕對誤差(MAE)和預報準確率(ACC)對模型預報值和真實值偏離程度進行評價,其中預報準確率考慮預報氣溫與實際氣溫差值絕對值小于等于2.0℃時次所占比例。相關計算公式分別如式(6)至式(8)所示。

表2 GRU網絡模型結構

式中,Tto為t時刻實際氣溫,Ttm為t時刻預報氣溫,-T o為實際氣溫均值。
利用地面氣象要素訓練集數據,基于深度GRU神經網絡對石門縣逐小時氣溫預報模型進行訓練,利用測試集數據對模型精度進行驗證,并與ARIMA逐小時氣溫預報模型精度進行對比,結果如表3所示。由表3可知,GRU逐小時氣溫預報模型的R2為0.909~0.997、MAE為0.358~1.948和RMSE為0.507~2.652℃,相較于ARIMA模型,評價指標均顯著占優。隨著預報時次增加,深度GRU模型預報誤差逐步增大,ARIMA模型預報誤差則呈先逐步增大至18 h后略微下降的趨勢,但其誤差明顯大于深度GRU模型。尤其在預報12 h后的氣溫時,ARIMA模型的RMSE均值達5.870℃,而深度GRU模型對應時次的預報精度明顯更優,RMSE平均僅為ARIMA模型的42.574%。根據精細化氣溫預報業務工作的要求考慮氣溫預報準確率,由表3可知,深度GRU模型逐小時氣溫預報模型準確率隨預報時次的增加逐漸降低至24 h的62.529%,較ARIMA模型準確率提升19.379個百分點。

表3 深度GRU與ARIMA逐小時氣溫預報模型精度對比
為研究深度GRU模型預報結果的季節性差異,基于測試集數據對預報結果RMSE按春季(3月至5月)、夏季(6月至8月)、秋季(9月至11月)和冬季(12月至次年2月)進行分析,結果如圖2所示。除在1 h預報時次上春季精度略高于夏季外,其余所有預報時次上精度均呈秋季>冬季>夏季>春季,其中春季24 h預報精度2.960℃,較秋季24 h預報精度2.229℃偏高0.731℃。該結果也符合中國春季冷暖空氣勢力相當,各物理信號微弱,氣溫預報難度較大的客觀實際[21,22]。

圖2 深度GRU模型不同季節各時效預報精度
由于春季氣溫預報難度較大,因此以2014年春季石門站數據為例,對比氣溫觀測值和GRU模型24 h氣溫預報值(圖3)。由圖3可知,除個別時次外,GRU模型24 h氣溫預報值均能較好對應實際觀測值,且對氣溫轉折性變化有較好體現,進而反映氣溫變化趨勢。

圖3 2014年石門站春季(3月至5月)氣溫觀測值與深度GRU氣溫預報模型24 h預報值對比
為對比深度GRU模型和天氣預報常用數值模式預報精度(預報值與實際值之間的RMSE),選取石門地面氣象站2019年4月1日至2019年7月31日觀測逐小時資料,利用深度GRU模型進行氣溫逐3小時預報,并與同時段的EC和JAP數值預報2 m溫度進行對比,結果如圖4所示。由圖4可知,2019年4月至7月石門站EC和JAP逐3小時2 m溫度預報精度相當,除9、12 h預報時次JAP預報精度略高于EC外,其他預報時次EC預報精度均略高于JAP。深度GRU模型在3、6和9 h預報精度均優于數值預報,誤差較EC和JAP分別偏低28.35%、17.63%、10.12%和35.46%、19.07%、3.63%,12 h后數值預報精度優于深度GRU模型。由此可見,相較于數值預報,本研究中深度GRU模型可能更適用于12 h內的氣溫短臨預報。因此可考慮在預報業務中,引入組合預報等方法,綜合利用深度學習模型和數值模式預報各自優勢,進一步提升氣溫預報準確性。

圖4 深度GRU模型與EC和JAP數值模式預報精度對比
本研究利用地面氣象站逐小時觀測資料,基于深度GRU神經網絡構建24 h逐小時氣溫預報模型,并與ARIMA模型預報和數值模式預報結果進行對比分析。
1)利用湖南省石門縣地面氣象觀測站資料建立的24 h逐小時氣溫預報模型,其精度隨預報時次的增加逐步下降,但各時次預報精度均明顯優于ARI?MA模型,尤其當預報時次大于12 h后,深度GRU模型的RMSE平均僅為ARIMA模型的42.574%??紤]季節因素,深度GRU模型預報在秋季表現最好,冬季、夏季次之,春季表現最差,符合中國春季氣溫預報難度較大的客觀實際。根據氣象部門預報業務工作的要求對深度GRU模型24 h氣溫預報精度進行研究,可知其預報準確率為62.529%,且能較好體現氣溫轉折性變化。
2)基于2019年4月至7月湖南省石門縣地面氣象觀測資料,對比深度GRU模型和數值模式氣溫預報精度,發現本研究中的深度GRU模型更適用于12 h內的氣溫短臨預報,其在3、6和9 h的預報精度均優于數值預報,誤差較EC和JAP分別偏低28.35%、17.63%、10.12%和35.46%、19.07%、3.63%。因此在實際預報業務中,可綜合利用深度GRU模型和數值模式預報,進一步提升氣溫預報準確性。
3)本研究僅選用5種地面氣象觀測要素數據作為輸入向量,對單站進行深度GRU氣溫預報建模,并未更多考慮溫度平流、天氣系統等大氣環流形勢及其上下游關系等空間相關性,因此計劃在后續工作中考慮天氣學和動力氣象相關知識,引入高度場、渦度場等物理量場,并嘗試利用卷積神經網絡等對相關物理量場的空間特征進行提取,改進深度預報模型精度。