龔勛 胡嘉駿 徐年平 邱盼 趙暉
目前主流的短臨降水預報的方法有數值天氣預測模式、外推方法、神經網絡方法。數值模式預報是基于降水的物理形成機制的一種預報方法,需要大量的數據以及復雜的計算量,因此需要大型計算機來支撐,并且對初始條件非常敏感[1-2]。本研究運用采取了5 種較前沿的算法,分別是傳統算法中半拉格朗日光流法和基于深度學習 的PredRNN++、MIM、CrevNet 以 及PhyDNet 模型,對中部某城市的2012-2019 年的降水過程進行訓練和外推預報評估,檢驗傳統算法與機器學習算法的優劣以及幾種算法在中部某城市的適用程度。
實驗研究區域為以中部某城市為中心的城市圈區域,面積為256KM×256KM,分辨率為1KM×1KM,經度從108°30′E到118°E,緯度從18°12′36 ′′N 到27°N 的區域。中部某城市屬北亞熱帶季風性(濕潤)氣候,具有常年雨量豐沛、熱量充足、雨熱同季、光熱同季、冬冷夏熱、四季分明等特點;年平均氣溫15.8℃-17.5℃,年日照總時數1810-2100 小時,年降水量1150-1450 毫米,降雨集中在每年6-8月,約占全年降雨量的40%左右。
研究數據由中部某城市氣象局提供,為2012 年6 月至2019 年4 月的中部某城市SWAN 拼圖產品。本次研究以雷達組合反射率產品為研究對象。
2.1.1 時間選擇
因自動雨量站在冬季降雪天氣過程中可能對真實降水量的測量存在誤差,因而首先剔除了每年的1 月份、2 月份和12 月份的數據,來去掉此測量誤差對本次研究可能造成的偏差影響;
2.1.2 范圍選擇
以中部某城市雷達觀測站為中心,截取256KM*256KM 范圍,以1KM*1KM 為分辨率,最終形成256*256 像素的雷達回波組合反射率的灰度圖片,像素值為向下取整后的dBZ 值。
2.1.3 樣本選擇
通過分析同期降水數據,我們提取了日降水量大于等于10mm(中雨)、時刻降水量大于等于0.6mm,每30 張連續無間斷的雷達回波圖為一組數據。通過篩選所有的雷達回波資料,我們最終獲得了3122 組數據,將其中的80%(2490組)作為訓練集,20%(622 組)作為驗證集。
2.2.1 半拉格朗日光流法的基本原理
光流法是目前運動圖像分析中廣泛應用的方法之一,其光流計算方法大致可以分為四類:基于梯度的方法、基于匹配的方法、基于能量的方法以及基于相位的方法[3]。由于基于相位的光流法和基于能量的光流法的需要復雜的計算和嚴格的時空整合要求,不宜用來進行雷達圖像處理。而基于匹配的交叉相關法雖然對變化平緩的層狀云降水系統比較有效,但對變化較快的強對流降水系統,交叉相關法跟蹤失敗的情況會顯著增加,所給出的運動矢量場的質量會降低。因此半拉格朗日外推法采用的是基于梯度的L-K 光流算法來計算雷達圖像的光流場。
目前在數值天氣預報方面,采用半拉格朗日方法的研究較多,但在短時臨近預報中采用半拉格朗日方法的研究還較少。研究發現,半拉格朗日方法在臨近預報中預報效果較好,優于SWAN 系統中的交叉相關法(韓雷、曹春燕、Bechini)和線性外推[4-5]。因此本次研究選取了半拉格朗日外推方法作為各種機器學習算法的外推效果的對比基準。
本方法的原理是首先運用L-K 光流法計算連續的兩張雷達圖像的運動矢量場,進而用半拉格朗日外推預報方法對雷達回波進行外推。線性外推是在雷達圖像矢量場的基礎上直線外推預報,而半拉格朗日外推方法是在雷達圖像矢量場的基礎上根據雷達回波運動矢量的運動軌跡外推,可以實現曲線外推,這對于風場有旋轉情況的風暴天氣的預報有重要的意義。
老道看王祥一臉陰郁,隱約猜到了王祥的心思,接口說:“小伙子你也別灰心,賣古董,全憑一張嘴,只要你把這樁生意交給我,保管死的也給你說成活的。”
2.2.2 PredRNN++的基本原理
PredRNN++是一種用于時空預測學習的遞歸網絡。為了獲得強大的短期視頻動態建模能力,利用了一種“Causal LSTM”的遞歸結構和級聯雙存儲器,使模型的網絡更加及時。為了減輕深度預測模型中的梯度傳播困難,模型中引入了“Gradient Highway Unit”信息高速公路單元,該單元結構可以為從輸出返回到遠程先前輸入的梯度流提供了替代的快速路線。通過GHU 與Causal LSTM 的無縫協作,從而使PredRNN++模型能夠自適應地捕獲短期和長期視頻依存關系[6-7]。
該模型的Causal LSTM 級聯結構能夠能夠更多學習到短時的一些復雜的非線性變化,而GHU 結構能夠有效的在非常深的網絡中傳遞梯度,從而解決梯度消失的問題。在實際應用中的優勢在于預測的圖片更加清晰,有明顯的輪廓,降低了一定的模糊程度。
2.2.3 MIM 的基本原理
該模型的核心思想在于將數據分為平穩信息與非平穩信息進行處理。平穩信息如大塊區域的整體運動特征;低階的非平穩信息如區域像素點的空間和時間的關系,即小塊區域的時空變換,而高階的變化如在氣象中的雷達回波圖中對應的數據的堆積、變形或耗散等。
MIM 模型的特點是可以更好的學習高階非平穩特征信息中的規律。模型通過將圖片信息分為平穩項和非平穩項,并引入差分,近似的將差分對應于非平穩項,上一時刻的memory cell對應于平穩項。MIM-N 提取出非平穩信息,之后傳遞給MIM-S,MIM-S 利用門控來選擇是否忘記和記住多少的非平穩信息或者近似的平穩信息。將多層MIM blocks 進行層疊,通過不同的差分,使得非平穩項得階次降低,從而更好的預測。
2.2.4 CrevNet 的基本原理
具有可逆架構的CrevNet,在理論上保證特征提取過程中信息不丟失的情況下,大大降低了內存消耗,提高了計算效率。模型輕量級的特性使得作者在使用3D 卷積的時候不需要考慮內存瓶頸,在一定程度上,提高了模型捕獲長短期依賴關系的能力。此外,可逆架構由于其輕量級特性和可設計的信息保存特性而受到關注。
2.2.5 PhyDNet 的基本原理
主要思想是試圖用深度網絡構建物理約束模型,方法是用卷積模擬偏導,用moment loss 作監督,學到物理信息,從而對已有的網絡進行信息補充。
針對雷達回波外推的預報效果進行評估,通常把它看成一個二元事件。本次研究中我們的預報區域為256KM*256KM,每1KM*1KM 可看作256*256 像素灰度圖上的一個像素點,而像素值為該區域的dBZ 值。在外推預報中,如某點的預報值與該點的實際觀測值落在同一區間(比如均大于20dbz,且小于30dbz),則為hit(命中);否則為loss(未命中)。
本文引用了水文氣象研究中比較常用的命中率(POD)、誤報率(FAR)、臨界成功指數(CSI)以及圖片預測中常用的均方差(MSE)及結構相似度(SSIM)等共五個指標來評價雷達回波外推預報的效果。
分回波強度的評分:

整體誤差和形狀的評估:

如表1 所示,上述四種機器學習算法無論是MES、SSIM,還是POD、FAR 和CSI 都明顯好于光流法,各種指數的提升幅度約在20%左右(FAR 達到40%)。
在初始的30 分鐘以內,AI 模型和光流法的預報能力比較接近,都表現出MSE、FAR 的緩慢上升以及SSIM、POD、CSI 的緩慢下降。30 分鐘以后各種機器學習算法和光流法都隨著預報時效的延長,預報能力迅速下降,但所有指標都顯示機器學習模型較光流法下降得更加緩慢,尤其是60 分鐘以后,光流法的降幅進一步增加,而機器模型降幅相對平穩,兩者之間的差距隨著預報時效的延長而顯著增加。
如表2 所示,整體來看各算法隨著回波強度的增加,CSI和POD 都迅速降低,FAR 則陡然上升,但各指標下降和上升最快的區間具有一定的差異:CSI 和POD 在20~30dbz 的區間下降最快,而光流法和CrevNet 的FAR 在20~30dbz 之間上升最快,MIM、PredRNN++和PhyDNet 則在40~50dbz 之間急劇上升。具體到每個指標來看,PredRNN++算法在所有強度上CSI 都表現最佳,MIM、PhyDNet 算法對40dbz 以上強度回波的預報較光流法好,而CrevNet 則對50dbz 以上強度回波的預報較光流法好;POD 方面10dbz 以上強度最高的是PhyDNet 算法,20dbz 以上~40dbz 以上強度最高的都是PredRNN++,50dbz 以上則是CrevNet算法;FAR方面10dbz 以上~30dbz 以上最低的都是MIM 算法,40dbz 以上最低為PhyDNet,50dbz 以上最低則為PredRNN++。
如圖1 所示,大面積回波強度無明顯變化,大范圍回波的移動,說明機器學習算法(AI 算法)對氣象預測的準確性明顯比光流法好(形狀誤差小)。
如圖2 所示,回波有明顯發展趨勢:增強發展,面積變大/消散減弱;這說明機器學習算法對雷達回波生消和發展有較強的預報能力,而傳統的光流法沒有。
本研究運用了中部某城市氣象局的提供的2012 年6 月至2019 年4 月的SWAN 拼圖組合反射率產品數據,對比檢驗了半拉格朗日光流法及PredRNN++、MIM、CrevNet、PhyDNet 深度神經網絡模型對中部某城市的雷達回波外推短臨預報能力(0-2 小時)。
由于大氣發展變化的過程極其復雜,雷達回波的發展存在很多不確定因素,以至于雷達回波數據的質量以及神經網絡訓練過程中設置的各種參數,對雷達回波外推的效果均有著不同的影響。研究者運用已有的檢驗方法,從所做的實驗結果來看,所有的深度神經網絡模型的短臨外推預報效果均好于傳統的半拉格朗日光流法,且整體平均性能提升了20%;其中CrevNet 模型在實際業務應用中表現優秀,具有良好的圖片清晰度和預報準確度,而mim 模型則較為均衡,對回波整體的形狀預測較好,評分最高。

表1 幾種氣象預測方法的比較

表2 幾種氣象預測方法的算法評分比較

圖1 機器學習算法與光流法對氣象預測結果的比較

圖2 機器學習算法與光流法對雷達回波生消和發展預報能力的比較
具體如下:
1) 對于面積較大的回波塊,機器預報的移動方向和速度比光流法好,得分會偏高一些;
2) 如果區域內較大塊的回波有比較明顯的發展或減弱,那么機器大概率能預報出來,而且位置較為準確,這樣的個例得分比光流法好很多;
3) 面積很小的分散性對流,如果后期有合并和發展的趨勢,機器大概率也能正確預報,但由于面積很小,得分也只是好一點點;
4) 面積很小的分散性對流,無明顯的移動和發展特征,機器和光流法都較差,得分都比較低。
由于本次采用的SWAN 數據質控效果不佳,摻雜了大量的噪音回波,而數據質量決定了神經網絡預測的上限,因此也導致本文采用的4 種神經網絡模型一定的性能下降,未來可以采用PUP 基數據進行質量控制后的數據進行訓練,可進一步提升神經網絡模型的預報效果。