鄭宗生,劉敏,胡晨雨,傅澤平,盧鵬,姜曉軼
(1.上海海洋大學 信息學院,上海 201306;2.國家海洋信息中心,天津 300171)
臺風引起的風暴潮災害每年在世界沿海地區造成大量的經濟損失和人員傷亡。因此,精準且及時的臺風強度預測對早期風暴潮的預警預報至關重要。目前,國內外對臺風的預測研究分為2類。第一類是基于數值預報模擬的臺風預測[1-2]。此方法需要大量的臺風觀測資料,并需要對臺風的內部結構變化、臺風的關鍵物理過程及臺風的突變機制有足夠的了解[3]。同時,臺風過程的預測結果受到臺風模型結構、地形、模型的初始場及邊界條件影響[4]。雖然數值預報技術在不斷改進,但是臺風預報模型的分辨率、模型動力框架、物理過程表達仍需進一步提高和完善[5]。另一類是基于遙感衛星云圖與機器學習相結合的方法。遙感圖像具有獲取速度快、覆蓋面廣、空間分辨率高的特點,通過遙感可為臺風識別及預測提供海量的具有時空屬性的遙感衛星云圖。此方法主要集中在氣象災害路徑預測[6-7]、臺風風速[8]及臺風等級分類。Rüttgers等[6]提出基于時間序列衛星云圖和生成對抗網絡模型預測未來6 h的臺風軌跡,利用衛星云圖和深度學習網絡預測臺風中心及臺風中心對云結構的影響。Haghroosta[8]分別利用神經網絡模型和流體動力模型來預測臺風風速,實驗對比結果表明,神經網絡模型的精度高于流體動力模型的精度。鄭宗生等[9]通過改進深度學習中的激活函數,解決了ReLU激活函數“神經元壞死”現象,將臺風等級分類精度提高了2%。
臺風的生命周期從生成到消亡[10],具有明顯時間序列特點。時間序列神經網絡最初主要用于自然語言處理上。Nallapat等[11]提出包含循環神經網絡(recurrent neural network,RNN)的Seq2Seq模型和Attention模型,解決了長文本摘要問題。Ameur等[12]基于Attention的encoder-decoder(編碼-解碼)模型,完成了阿拉伯語與英語之間的翻譯。臺風等氣象現象的生命周期與自然語言處理相比,二者在機理上具有相似性。Stens?等[13]運用基于時間序列的長短期記憶網絡(long short term-memory,LSTM)模型,實現了歷史數據預測未來時刻的雷暴軌跡,模型僅能預測6 h內的雷暴軌跡且不能預測雷暴的生命周期與形狀。Reddy等[14]利用LSTM網絡中的many-to-many結構實現了綠化覆蓋預測,輸入為時間間隔為7 d的MODIS NDVI 時間序列數據,輸出為時間間隔為7 d的預測序列。Hong等[15]基于卷積的Seq2Seq模型和時間序列的歷史云圖,預測未出現或丟失的衛星云圖,并通過加入殘差網絡機制,使得預測圖與真實圖更接近,解決了遙感衛星系統丟失數據的問題。Shi等[16]利用卷積長短期記憶網絡(convolutional long short-term memory,ConvLSTM)和單通道雷達圖像預測降水量,輸入與輸出都是序列。Kim等[17]利用ConvLSTM網絡和多通道雷達圖像進行預測降水量,輸入為歷史時刻的序列圖像,輸出為一個具體數值。但是,由于不同氣象衛星的重復周期即時間分辨率不同,傳感器空間分辨率也不同,這必然造成多模態數據集對預測結果的影響。上述基于時序衛星數據的預測模型均未考慮不同遙感數據、不同時間間隔對預測結果的影響。同時作為預測問題,因預測的步長影響到能夠預測的未來時長,故必然會降低將來的預測精度。因此,預測步長對預測結果也有重要影響,而以上的研究對這方面的影響沒有考慮。注意力機制最初應用于自然語言處理上,并得到了較好的結果,但是語言上下文之間的聯系與氣象災害物理現象前后連接機制也存在不同,目前還沒有研究將注意力機制應用到氣象物理時序的預測問題上。
針對上述問題,本文利用900多個臺風過程,30 000多張時序的臺風衛星云圖作為數據源,基于Attention機制和Seq2Seq模型構建了一個新的臺風等級預測模型SeqTyphoon,通過利用歷史時刻的時間序列衛星圖像,預測未來時刻的臺風圖像,并由臺風等級分類結果及圖像信息熵評價預測圖像的準確率。同時,研究了相鄰圖像間的不同時間間隔、不同預測時長和不同像素大小對臺風預測的影響。
本文所用的自建臺風數據由日本國立情報學研究所(National Institute of Informatics,NII)提供,氣象云圖數據取自Himawari-1~8系列衛星、GOE9氣象衛星,其中Himawari-8更是達到10 min的時間分辨率,高達500 m的空間分辨率。GOES是美國NOAA的靜止軌道業務衛星系列,采用雙星運行體制。紅外圖像的空間分辨率可達到2~5 km。選取近40年的臺風云圖作為數據樣本,均為紅外圖像,原圖像為512像素×512像素。選取959個臺風過程,即959個臺風序列,共35 318張臺風圖像,構建了訓練集、驗證集及測試集,分別為799、99、61個臺風過程,對應29 519、3 804、1 995張臺風圖像。模型輸入為單通道灰色圖像。首先,考慮計算能力情況,將512像素×512像素的圖像重采樣為32像素×32像素和64像素×64像素進行訓練。重采樣采用雙線性內插法,雙線性內插法具有灰度連續且圖像光滑特點,同時保證了圖像保留盡可能多的信息。其次,為網絡處理及避免過擬合問題,對圖像進行歸一化處理,范圍為[0,1]。臺風從生成、成熟到消亡階段具有時間序列特征,并且同一個臺風在不同的生命周期階段,均具有不同的形態,在衛星云圖上表現的旋狀云系也不同[18]。圖1為一個完整的臺風生命周期中的部分圖像,此臺風共持續11 d 18 h。

圖1 200416號臺風過程圖像

鑒于歷史時間序列的每張圖像對未來時刻圖像預測并不是同等的貢獻,因此引入注意力機制[22]來提取對未來時刻圖像預測有重要意義的時間序列圖像,賦予重要圖像不同的權重。最后將這些信息歷史圖像的表征聚合起來形成動態語義向量,作為解碼器部分的一個輸入。通過此設置,模型能夠選擇性地輸入序列的有用部分,將注意力機制結合到輸入數據的某個部分中,以提高任務的準確性,同時可緩解LSTM在捕捉圖像的序列信息時產生的梯度消失問題。最終,編碼器部分輸出是未來6 h至未來48 h的臺風圖像。其中,注意力機制中的動態語義向量的計算如式(1)所示。
(1)
式(1)為編碼器隱藏狀態的加權和來聚合編碼器隱藏狀態,以獲取上下文向量。aij表示輸出的第i個像素對編碼部分第j個輸出hj的權重;Tx表示T時刻,像素輸入序列序號。
卷積神經網絡[23]是提取高級語義特征表現最好的算法,通過對圖像的逐層卷積提取更加抽象的特征,越抽象的特征越能夠表現圖像的語義信息,并在圖像的分類中表現出更好的性能[24]。因此,為進一步衡量預測的臺風云圖質量,利用卷積神經網絡,對預測出的圖像進行臺風等級分類。本文構建的臺風圖像預測模型SeqTyphoon如圖2所示。

圖2 SeqTyphoon模型結構
為評估預測模型的性能,選取均方根誤差、臺風等級預測精度、圖像信息熵3個指標衡量模型的預測精度。
1)均方根誤差(RMSE)。均方根誤差可以很好地反映預測值誤差的真實情況。均方根誤差越小,網絡訓練越好。
2)臺風等級預測精確度。依照國際臺風分類標準,根據臺風中心風速將數據集分為5類:熱帶低壓、熱帶風暴、強熱帶風暴、臺風、強臺風,如表1所示。

表1 臺風等級標準
臺風云圖數據集采用5類標簽標記,即熱帶低壓、熱帶風暴、強熱帶風暴、臺風、強臺風5個臺風等級,對應文中的臺風二等級至臺風六等級。
將預測出的臺風圖像,通過卷積神經網絡進行臺風等級預測,以進一步評估不同條件下預測的臺風圖像質量。①訓練臺風等級分類模型,將35 000多張臺風云圖分為5個等級進行卷積神經網絡模型訓練;②將測試集圖片進行等級預測,記錄可正確預測臺風等級的圖片;③對于不同時間間隔、不同預測時長、不同像素等條件預測出來的圖片,對應第②步中的標記圖片進行篩選;④針對篩選出的圖片同樣進行臺風圖片等級分類預測;⑤計算出可正確分類的預測的臺風圖片準確率。預測臺風準確率=預測臺風圖像正確數/臺風圖像總數。臺風等級預測流程如圖3所示。

圖3 臺風等級預測精度計算流程圖
3)圖像信息熵。圖像信息熵是一種圖像特征的統計形式,它反映了圖像中平均信息量的多少。圖像的一維熵表示圖像中灰度分布的聚集特征所包含的信息量。
本文實驗環境為Ubuntu操作系統,AMD Ryzen Threadripper1950X 16-Core Processor,內存32 GB,雙顯卡(GTX1080Ti)。軟件使用python3.6版本,實驗基于Pytorch框架。
SeqTyphoon模型經實驗得出,最佳LSTM層和最佳隱藏神經元個數,即編碼器和解碼器各含有1層LSTM網絡,10個隱藏神經單元。為避免過擬合現象,采用dropout機制來提高模型的泛化能力。模型主要參數如表2所示。

表2 訓練參數選取
為了分析不同時間間隔和不同預測步長對預測臺風圖像精度的影響,進行了如下實驗:①臺風圖像時間間隔為6 h,圖像為32像素×32像素時,進行未來6~48 h的臺風圖像預測;②臺風圖像時間間隔為12 h,圖像為32像素×32像素時,進行未來12 h的臺風圖像預測;③臺風圖像時間間隔為6 h,圖像為64像素×64像素時,進行未來6 h的臺風圖像預測。
1)臺風圖像時間間隔為6 h,圖像為32像素×32像素時,進行未來6~48 h的臺風圖像預測。模型訓練性能如圖4所示。

圖4 預測未來6~48 h的模型訓練性能圖
由圖4中的損失值變化曲線可得,網絡每次訓練迭代100次,實驗均沒有發生過擬合現象,且模型已經訓練到最優性能。模型訓練過程快速,模型的訓練和驗證損失值在迭代20次左右時開始趨于收斂,之后,訓練集損失值和驗證集損失值開始平穩收斂,在迭代95次左右時趨于最終收斂。
2)臺風圖像時間間隔為12 h,圖像為32像素×32像素時,進行未來12 h的臺風圖像預測。模型訓練性能如圖5所示。

圖5 預測未來12 h的模型訓練性能圖
由圖5可以看到,模型訓練過程快速,模型的訓練和驗證損失值在迭代6次之后開始趨于收斂,整個過程沒有發生過擬合現象。
表3為在迭代100次時,不同時間間隔、不同預測時長、不同像素的預測誤差結果。圖像為64像素×64像素,時間間隔為6 h,預測未來6 h臺風圖像的均方根誤差結果最小,訓練集均方根誤差為0.089 6,驗證集均方根誤差為0.091 1,預測結果最好。其次是32像素×32像素,時間間隔為6 h,預測未來6 h的臺風圖像,訓練精度和驗證精度分別提高0.26%和0.43%,但前者的計算時長是后者的4倍。

表3 不同像素、不同時間間隔及不同預測時長的訓練集及驗證集均方根誤差對比
圖像為32像素×32像素,時間間隔為6 h,預測未來6~48 h的臺風圖像均方根誤差結果可知,預測時長越大,均方根誤差越大。得出這一結果是由于當預測時長增加,神經網絡對距離稍遠時刻的狀態敏感度降低,從而預測的結果變弱。
同等起始時間,圖像為32像素×32像素,時間間隔為6 h的臺風預測第30 h,時間間隔為12 h的預測未來12 h的結果,訓練集均方根誤差、驗證集均方根誤差分別為0.128 2、0.131 3和0.146 3、0.152 6。可見,前者的均方根誤差明顯小于后者。顯然,時間間隔的誤差大于預測時長引起的誤差,即時間間隔對臺風圖像預測影響大于預測時長對其的預測影響。
由表4可知,圖像為64像素×64像素,時間間隔為6 h預測的臺風圖像,再通過卷積神經網絡進行等級預測準確率最高,等級預測準確率達到83.20%。其次為圖像為32像素×32像素,時間間隔為6 h預測的臺風圖像,等級預測準確率達到79.51%。

表4 不同像素、不同時間間隔及不同預測時長的臺風圖像等級預測準確率
圖像為32像素×32像素,時間間隔為6 h預測的未來6~48 h的臺風圖像等級預測準確率,預測時長越大,準確率由79.51%遞減至65.15%。可得時間間隔越長,預測圖像質量越下降。
同時可得,圖像為32像素×32像素,時間間隔為12 h預測的臺風圖像,臺風等級預測準確率為39.20%,是最低的。如果從同等起始時間,圖像為32像素×32像素,時間間隔為6 h預測的第5張圖片(預測時長為30時),是前者預測的第一張圖片,但二者準確率相差29.36%。因此時間間隔大小對于圖像預測的影響遠大于預測時長因素。
結合表3和表4可得出,影響臺風圖像的主要因素是時間間隔,其次是預測時長。即時間間隔愈小、預測時長愈小,預測出的臺風圖像就愈接近真實臺風圖像(圖6)。

圖6 原始圖和預測圖對比
2張圖像的熵越接近,說明其越相似。表5為不同像素、不同時間間隔及不同預測時長的預測臺風圖像和原圖像的熵均值。

表5 不同像素、不同時間間隔及不同預測時長預測的臺風圖像和原臺風云圖的熵均值對比
由表5可以得出,圖像為64像素×64像素,時間間隔較小(6 h),且進行未來一個時刻(6 h)的臺風圖像預測的熵均值與原臺風圖像的熵均值最接近。這說明了像素較高、時間間隔較小,進行未來一個時刻的臺風圖像預測結果最精準。
Seq2Seq網絡是一種序列對序列的生成網絡,解決了LSTM固定輸入和輸出序列問題。Attention解決了在時間序列較長時,僅使用最后一個隱藏層狀態作為上下文向量,訓練效果不佳的問題。本文針對序列的臺風衛星云圖,提出了一種基于引入Attention機制和Seq2Seq網絡模型的新模型SeqTyphoon。將同一臺風生命周期中,具有時間序列屬性的歷史時刻臺風衛星云圖作為輸入,預測未來6~48 h內的臺風圖像,并使用均方根誤差、臺風災害等級預測精確度及圖像信息熵作為實驗結果的評價指標。實驗表明,在硬件平臺允許的情況下,使用像素較高、時間間隔小的相鄰序列臺風圖像,預測未來時刻的臺風圖像結果更精確。后期的研究工作主要是時間序列的臺風衛星圖像與深度學習方法相結合,實現更精確的臺風圖像預測,以及消除累積誤差。由于多步預測時,預測后一時刻圖像會使用前一時刻預測的圖像,而前一時刻預測的結果就存在誤差,故再預測后面的圖像時定會產生累積誤差,所以必須加以消除。