999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于改進的VGG16模型的副熱帶高壓相似識別及應用評估*

2022-02-14 12:24:54周必高魯小琴黃克慧洪水潔謝海華趙兵科
氣象 2022年12期
關鍵詞:模型

周必高 魯小琴 鄭 峰 黃克慧 洪水潔 謝海華 趙兵科

1 浙江省溫州市氣象局,溫州 325000 2 浙江省溫州市臺風監測預報技術重點實驗室,溫州 325000 3 中國氣象局上海臺風研究所,上海 200030 4 四創科技有限公司,福州 350000

提 要: 臺風預報除常規方法外,查找歷史相似作為預報和決策的參考依據是常用手段,但從海量歷史臺風中檢索相似費時費力。提出了一種基于改進的視覺幾何組模型VGG16的副熱帶高壓(以下簡稱副高)相似檢索方法,進行基于副高相似的歷史相似臺風查詢。通過對1979—2020年臺風季19 736個對應時次的副高圖像提取、數據增強、模型學習和優化,并以學習感知圖像塊相似度(learned perceptual image patch similarity,LPIPS)作為副高相似的度量指標,最終建立了改進的VGG16模型。試驗結果表明,使用該模型可以找出較為相似的歷史臺風,模型檢索得到的排名第一的歷史相似臺風與目標臺風相似度高達92.55%,該方法可為臺風預報業務人員提供了積極參考。同時,該模型相較于傳統的人工識別,識別時間較短、檢索效率高,可在業務及科研中推廣應用。

引 言

我國地處太平洋西岸,海岸線漫長,從廣西到遼寧常年都會受到臺風的影響(陳聯壽和丁一匯,1979)。尤其在夏季,沿海及內陸受臺風影響地區常常會因臺風襲擊而造成人員傷亡和重大財產損失,因此精準的臺風路徑、強度及風雨影響預報對保障人民的生命財產安全具有重大的現實意義。臺風路徑預報的準確性是開展防臺減災服務的基礎。氣象學家們針對臺風路徑預報的方法發展了大量統計或動力模型,同時也發現歷史相似臺風能夠為臺風路徑、強度和風雨預報提供非常有價值的參考信息。已有的歷史臺風相似檢索大多基于人工主觀判別進行或者針對臺風路徑空間相似開展(劉勇等,2006;王遠飛等,2006;魯小琴等,2013;徐高揚和劉姚,2019),但存在以下問題:(1)歷史數據中采用人工識別查找歷史相似臺風。該方法判別時間長,不能滿足預報決策的實時性需求。(2)基于空間相似的歷史臺風自動檢索。該方法速度快,但找到的歷史相似臺風,大部分由于和目標臺風所對應的大尺度環境流場存在差異,并且造成的風雨影響及災害也各異,因而此類相似臺風并不一定屬于氣象意義上的相似臺風。在此基礎上,預報員們提出能否根據臺風環境場的相似去查找歷史相似臺風,進而為當前臺風預報和防臺減災決策提供更為科學且專業的參考。

臺風的移動受到各種復雜因素的影響,但實踐表明牽引運動是最主要的因素,因此大型氣壓場的分布及與此相應的大范圍深厚的基本氣流是臺風路徑預報的重要根據(陳聯壽和丁一匯,1979)。其中,副熱帶高壓(以下簡稱副高)就是影響臺風移動路徑的一個非常重要的大型環流系統,其周期變化、形狀特征及與西風槽的相互作用等,很大程度上引導著未來臺風走向及可能帶來的風雨影響。因此以副高相似來查詢得到的歷史相似臺風,可能可為當前臺風的路徑及風雨影響預報提供較為精準的輔助資訊。

科學家們已經開展了很多有關氣象要素場的相似研究,大多基于格點數據進行距離或相關分析(李開樂,1986;羅陽,1996;羅陽和趙偉,2008;丁晨晨等,2019;黃小玉等,2019;宋文彬等,2020),并未針對某個特定的環流系統開展。事實上影響臺風移動的副高具有特定的形狀和相對的地理空間分布(如距離大陸遠近等),因此具有圖像特征識別功能的神經網絡技術對實現大區域環境場中副高的識別和提取,并進行相似判定具有非常大的優勢。且神經網絡技術已在各行各業開展了大量的研究和應用,如人臉識別(吳素雯和戰蔭偉,2017)、字符識別(葛明濤等,2014)和語音識別(Xue et al,2014)等。氣象領域中,黃小燕和金龍(2013)在綜合考慮臺風移動路徑的氣候持續因子和數值預報產品動力預報因子的基礎上,建立了基于主成分分析的人工智能臺風路徑預報模型,預報精度高于氣候持續法;葉小嶺等(2014)基于主成分分析及RBF神經網絡開展了浙江省臺風災害損失預測;代刊等(2013)基于自組織神經網絡算法分析了華北區域夏季天氣氣候學特征;陳文兵等(2019)利用G-CNN模型開展了濃霧天氣形勢識別。以上研究表明基于一般神經網絡技術在氣象領域進行天氣特征識別(如濃霧)或預報預測(如臺風路徑和強度、災害等)已取得了一些成效,但采用神經網絡技術對臺風大尺度環境場中的副高進行識別和判定,成果鮮見。

本文擬基于卷積神經網絡(convolutional neural network,CNN)的視覺幾何組模型(visual geo-metry group,VGG16)(Lecun et al,1998;Simonyan and Zisserman,2016)來識別臺風大尺度環境場中的副高,并以學習感知圖像塊相似度(learned perceptual image patch similarity,LPIPS)(Wang et al,2004)作為圖像相似度量指標,建立副高相似的識別算法,進而開展對應歷史相似臺風查詢,以期為臺風路徑預報提供更高效而精準的參考信息。

1 數據及預處理

1.1 數據說明

本文中大尺度環境場主要用500 hPa位勢高度來表征,資料來自ERA5再分析數據集(https:∥cds.climate.copernicus.eu/)。資料集覆蓋時間范圍為1979—2020年,時間分辨率為6 h(逐日00、06、12和18時,世界時,下同);空間范圍為90°S~90°N、180°E~180°W,空間分辨率為1°×1°。為節約計算資源,只截取本研究關注的西北太平洋區域(10°S~75°N、75°E~165°W),用于開展對歷史副高的識別和相似檢索分析。

臺風路徑數據(Ying et al,2014;Lu et al,2021)來自中國氣象局熱帶氣旋資料中心的臺風最佳路徑數據集(https:∥tcdata.typhoon.org.cn/zjljsjj_zlhq.html),包含1979—2020年發生在西北太平洋及南海地區的逐臺風記錄時間、中心經度和緯度、中心最大風速和最低氣壓,時間分辨率為6 h(逐日00、06、12和18時)。

1.2 數據預處理

為了便于后續算法模型對副高的識別,對ERA5再分析數據進行預處理:(1)數據提取。讀取500 hPa位勢高度層網格數據,并提取大于5880 gpm的格點數值用來表征副高。(2)數據清洗。采用圖像形態學算法中的腐蝕和膨脹運算等技術,對部分孤立點、邊緣處裂痕等異常數據進行剔除或彌補,對提取得到的副高圖像進行邊緣光滑,以提高副高相似分析的準確性。(3)近似多邊形提取。采用Canny邊緣檢測技術,提取副高邊緣上的離散點并連接形成多邊形,將其作為最終副高輪廓。圖1為2019年8月5日00時臺風環境場和預處理提取得到的副高對照圖,可見該時刻臺風中心位于副高西南側,在副高的影響下呈西北行趨勢;而預處理提取到了完整的副高形態和分布。

圖1 2019年8月5日00時(UTC)(a)臺風環境場和(b)預處理提取的副高(黑色三角形:臺風中心位置) Fig.1 Comparison of (a) environmental field of typhoon and (b) extracted subtropical high at 0000 UTC 5 August 2019(black triangle: typhoon center)

2 神經網絡模型及相似度量指標

2.1 CNN基本結構

CNN由輸入層、隱含層和輸出層組成(圖2),隱含層中又包含卷積層、池化層和全連接層(Zeiler and Fergus,2014)。其中,在卷積層中,利用設定大小的卷積核和指定步長在輸入圖像(原圖或特征圖)上進行滑動并做卷積計算,該層的作用是提取輸入圖像的主要關鍵特征;池化層的作用是對提取的特征進行抽樣,在減輕網絡模型過擬合程度(Matsugu et al,2003)的同時可以減小后續運算量。卷積層和池化層合作,實現對輸入圖像的特征提取并抽樣降維,能提取出副高形態中最具有代表性的關鍵特征;卷積層和池化層一般交替出現在網絡中,一個卷積層加一個池化層被稱為一個特征提取過程。最后,全連接層負責把提取的特征圖連接起來,通過分類器得到最終的分類估算結果(鄭澤宇等,2018)。

圖2 卷積神經網絡結構示意圖Fig.2 Structure diagram of convolutional neural network

2.2 VGG16模型

VGG16是CNN的一個經典模型,該模型具有5個卷積組(13個卷積層)和3個全連接層(圖3),在使用同等大小卷積核的條件下,提升了網絡的深度和效果(Simonyan and Zisserman,2016)。其網絡結構非常一致,全部使用3×3卷積和2×2池化。該模型相比于其他卷積神經網絡模型,主要采用連續的3×3的小卷積核代替較大卷積核。對于給定的特征圖,連續采用小卷積核堆積的策略要優于大的卷積核,因為較高深度的多層非線性層能使卷積神經網絡學習更復雜的模態,并且需要的參數較少,模型的計算代價更小,一定程度上提升了神經網絡的效果。

圖3 VGG16網絡架構Fig.3 Network architecture of VGG16

2.3 LPIPS度量指標

LPIPS也被稱為“感知損失”,用于度量兩張圖像之間的相似程度。本研究當中主要使用LPIPS來度量兩幅副高圖像的相似程度。該指標在視覺相似性判斷上更接近人類感知(Zhang et al,2018)。其計算公式如下:

(1)

為了便于比較輸出圖像相似度,副高x與x0的圖片相似度P定義為:

P(x,x0)=[1-d(x,x0)]×100

(2)

3 模型的建立

3.1 改進的VGG16副高識別模型構建

VGG16模型是基于大圖像數據庫(ImageNet)訓練而成的,具備較強的深度特征學習能力的參數和權重網,特別是對卷積層輸入的圖像輪廓、邊緣、曲線等特征提取具有較強的能力。因此,為減少網絡訓練時間和提高網絡訓練效率,將已訓練好的VGG16模型作為預訓練模型,采用遷移學習的方式(關胤,2019),引入副高識別模型進行卷積層、池化層再訓練。VGG16模型的輸入和網絡架構參數設置改進如下文所述,模型訓練流程如圖4所示。

圖4 副高相似識別模型訓練流程圖Fig.4 The training flow chart of similarity recognition model of subtropical high

3.1.1 訓練樣本

將輸入的三通道彩色圖改變為單通道灰度圖,輸入尺寸由224×224×3改為86×44×1。圖像灰度化并框定小區域之后可以大幅減少計算量,同時可重點突出副高在大尺度環境場中的空間位置和大小。設置數據集中用于學習和測試的樣本比例分別為80%和20%。

3.1.2 數據增強

為彌補CNN訓練需要海量的數據樣本而當前歷史副高圖庫中的樣本數量較少的缺陷,采用數據增強的方法,對已有的數據樣本進行翻轉、剪裁、高斯噪聲等處理,并生成新的數據樣本來補充原圖庫樣本資料集,由此擴大了訓練集和測試集的樣本數量,同時提高了模型的泛化能力,并減少過度擬合。

3.1.3 網絡架構參數設置

設定本模型中使用3個卷積組,網絡架構的輕巧化有利于快速提取副高圖像的特征數據;每個卷積組設定只含2個卷積層和1個池化層,但為充分提取副高細微圖像特征,在個別卷積組中增加卷積核的數目;同時只進行圖像特征提取,即去掉分類器,只包括卷積層、池化層和全連接層。

3.2 模型訓練

模型訓練采用Tensorflow深度學習框架,處理器使用Intel酷睿i7—9700,機器內存為16 GB,優化器使用Adam,批大小為30,學習率為4×10-3,損失函數采用Cross Entropy Loss計算。

針對1979—2020年臺風季19 736個對應時次的副高圖像樣本,設定8∶2的樣本劃分比例確定訓練集和測試集,對模型進行學習訓練(圖5)。由圖5a 可見,當迭代次數到達20次,該模型的訓練集和測試集準確率都明顯增加,迭代達80次之后,該模型的訓練精準度和損失函數值趨于平衡,其訓練集和測試集準確度峰值分別為89.7%和86.5%。從圖5b中可以看出,迭代80~100次后,損失函數值達到最小,表明模型已收斂并穩定。保存此時模型結構參數及網絡權重為最終副高相似識別模型。

圖5 1979—2020年臺風季樣本訓練過程(a)準確率,(b)損失函數Fig.5 Training process of samples in typhoon season from 1979 to 2020(a) accuracy, (b) loss function

4 模型的試驗及檢驗

4.1 模型的試驗

以0309號臺風為例(以下稱為目標臺風),選2003年8月4日06時副高圖像(圖6a)作為檢索目標,利用改進的VGG6模型進行相似檢索試驗。

圖6 (a)2003年8月4日06時0309號臺風及其對應副高,(b~f)相似檢索得到的歷史相似臺風及其對應副高(b)1713號,(c)0708號,(d)0108號,(e)1617號,(f)1319號(黑點:臺風中心位置,黑線:前后36 h臺風路徑)Fig.6 (a) Typhoon No.0309 and its corresponding subtropical high at 06:00 UTC 4 August 2003, (b-f) historical similar typhoons and the corresponding subtropical high obtained by similar retrieval(b) No.1713, (c) No.0708, (d) No.0108, (e) No.1617, (f) No.1319(black dot: location of typhoon center, black line: typhoon track before and after 36 h)

4.1.1 相似副高圖像比較

利用本模型檢索得到的歷史相似臺風排名前五位的分別為1713號(圖6b)、0708號(圖6c)、0108號(圖6d)、1617號(圖6e)和1319號臺風(圖6f)。圖6顯示,相似臺風對應時刻的副高形狀(西伸型)、副高分布范圍大小(南北跨度及東西長度)及伸至大陸以西時的略微南掉都非常一致。就視覺感知情況而言,其中1713號臺風的對應時刻副高最為相似(圖6b),0108號臺風的對應時刻副高(圖6d)相似度略差。

4.1.2 LPIPS相似度值的比較

計算檢索得到的排名前五位臺風對應時刻副高相似度LPIPS值(表1)。發現1713號臺風的對應LPIPS值最高,同視覺感知情況一致;但是LPIPS值排在前五位的臺風就視覺感知而言其相似程度排序會有不同,這與人眼識別和客觀判據的差異有關。

表1 前五位相似臺風對應副高間的LPIPS值Table 1 The LPIPS value of corresponding subtropical high of top 5 similar typhoons

綜上所述可見,利用改進的VGG16模型識別檢索到的歷史相似臺風對應的副高,從視覺特征上看與目標臺風的副高大小、位置、形狀是一致的,且對應的LPIPS值的大小與視覺特征的相似度也基本匹配。

4.2 模型效果檢驗

為了檢驗VGG16模型檢索到的歷史相似副高與目標副高的相似程度,以目標臺風對應的2003年8月4日06時副高的相似檢索結果為例,針對目標臺風和歷史相似臺風對應時刻的副高區域分別提取近似多邊形,分別定義為A和B,通過幾何圖像算法分別分析其大小(面積)、重心(位置)和形狀(輪廓)等幾何特征差異 (周必高等,2021),從幾何學的角度綜合比較其相似程度。

4.2.1 大小相似度

采用面積作為參數來衡量副高大小相似程度。獲取A和B的面積SA和SB,使用式(3)計算面積相似度:

SimArea(A,B)=1-abs(SA-SB)/Max(SA,SB)

(3)

式中:SA、SB分別為A和B的面積,abs(SA-SB)表示求取SA、SB差的絕對值,Max(SA,SB)為取SA、SB最大值,SimArea(A,B)為A和B間的面積相似度值。以目標副高的相似檢索結果為例,面積大小相似度排名前五位如表2所示。

表2 同表1,但為面積相似度 Table 2 Same as Table 1, but for area similarity

4.2.2 位置相似度

提取A和B的質心坐標A(Xa,Ya)、B(Xb,Yb)作為副高中心位置,其中質心定義為副高多邊形的幾何中心;通過歐氏距離計算兩質心間的距離,并將距離歸一化到[0,1]范圍之內,作為位置相似度衡量指標。

歐氏距離計算公式如下所示:

(4)

位置歸一化算法如下所示:

SimDis(A,B)=1/[Dis(A,B)/C+1]

(5)

式中:Xa、Ya和Xb、Yb分別為副高質心A和B的坐標,Dis(A,B)為A和B質心間的距離;C為A和B的任意邊界點間距離的最大值,SimDis(A,B)為歸一化后的位置相似度值。位置相似度排名前五位如表3所示。

表3 同表1,但為位置相似度Table 3 Same for Table 1, but for location similarity

4.2.3 輪廓相似度

基于射線的幾何匹配方法,以副高近似多邊形的幾何中心為原點,從原點發出射線與x軸的夾角為Qi,將Qi作為幾何形狀描述函數的參數,Qi∈[0,2π]。射線分別相交于近似多邊形A和B的輪廓邊界于點PAi和PBi,分別計算交點PAi和PBi到原點的距離:LA(Qi)=|PAiO|和LB(Qi)=|PBiO|。則A和B在Qi方向上的相似度為:

(6)

式中:Max[LA(Qi),LB(Qi)]為取這兩個距離中的最大值,Simangle(Qi)則為A和B在Qi方向上的相似度值。

旋轉射線角度與近似多邊形A、B連續相交,則A和B的形狀輪廓相似度計算公式如下:

(7)

式中:M表示射線數量,A(M)=2e-1/M,用來調節差異距離大小,|LA(Qi)-LB(Qi)|為A和B在Qi方向的差距,SimShape(A,B)即為A和B的輪廓相似度。以目標副高的相似檢索結果為例,輪廓相似度排名前五位如表4所示。

表4 同表1,但為輪廓相似度Table 4 Same as Table 1, but for shape similarity

4.2.4 綜合相似度

利用A和B之間的面積、位置和輪廓相似度進行綜合相似度計算,計算公式如下:

SimLand(A,B)=aSimArea(A,B)+

bSimDis(A,B)+cSimShape(A,B)

(8)

式中:SimLand(A,B)為計算得到的A和B的綜合相似度。a、b和c分別表示對應維度的權重值,根據業務應用經驗設定a、b和c權重值分別為0.5、0.3 和0.2,綜合相似度排名前五位如表5所示。

表5 同表1,但為綜合相似度Table 5 Same as Table 1, but for comprehensive similarity

綜上所述,通過對目標副高和相似副高的幾何圖像學大小、中心位置和輪廓各維度的比對,發現排名前五位的相似臺風的面積如表2所述,相似度排序和VGG16模型檢索出的結果完全一致。而相似副高的質心位置如表3所示,相似度排序和VGG16模型得出的結果也基本一致。輪廓相似度排序與模型檢索稍有差異,一方面因為對副高本身外圍邊界的描述算法不盡完善;另外副高形態變化快,導致檢索得到的相似副高與目標副高輪廓會略有差異。總而言之,基于綜合的幾何圖像學比較了VGG16模型檢索得到的相似副高與目標副高的相似度高度一致。表明改進后的VGG16模型在識別副高及查找歷史相似副高和對應相似臺風的分析中是非常有效的。

5 結論與討論

本文針對影響臺風路徑移動的一個非常重要的大型環流系統——副高的相似度判別,提出了一種基于CNN技術的改進VGG16模型。利用1979—2020年臺風季歷史樣本對模型進行訓練和測試,使用LPIPS作為相似度量標準,進行歷史副高相似識別。試驗表明,通過該方法可以找到歷史相似副高所對應的歷史相似臺風,解決了針對海量歷史臺風數據進行人工相似識別的難題;同時通過幾何圖像學相似檢驗其檢索效果,結論基本一致。改進的VGG16模型檢索效率高,可為預報員開展臺風預報和防臺減災決策提供快速且更科學的參考。

但影響臺風移動的副高在時刻發生變化,當前時次相似,下一個時次可能發生較大的改變,故需要綜合考慮某個時間段內平均環境場的相似,對臺風未來的移動走向趨勢引導才具有更重要的預報決策參考意義。另外,本文僅考慮了位勢高度值為5880 gpm的副高主體對臺風路徑移動的影響,實際上有時副高主體的西北側會向外伸出高壓壩或高壓脊(位勢高度值不等于5880 gpm),其對臺風移動也有很好的指示意義。因此,下一步將結合高壓壩和高壓脊,開展對確定時段內副高區域平均場的相似或者24、48、72 h預報場的相似檢索,以期給出綜合性更高,更為合理和科學的歷史相似臺風,為預報決策提供支撐。

猜你喜歡
模型
一半模型
一種去中心化的域名服務本地化模型
適用于BDS-3 PPP的隨機模型
提煉模型 突破難點
函數模型及應用
p150Glued在帕金森病模型中的表達及分布
函數模型及應用
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 欧美啪啪视频免码| 综合色88| 蜜桃视频一区二区| 伊人狠狠丁香婷婷综合色| 久久国产V一级毛多内射| 曰韩人妻一区二区三区| 国产成人精品在线1区| 久久久久久久蜜桃| 国产亚洲精品精品精品| 国产成人精品亚洲77美色| 最新亚洲人成网站在线观看| av性天堂网| 国产99视频精品免费视频7| 狠狠五月天中文字幕| 欧美精品综合视频一区二区| 99在线观看国产| 国产精品亚洲а∨天堂免下载| 亚洲精品爱草草视频在线| 欧美激情综合| A级毛片无码久久精品免费| 色亚洲激情综合精品无码视频| 91青青在线视频| 午夜福利视频一区| 日韩不卡高清视频| 亚洲二三区| 91丨九色丨首页在线播放| 国产高清毛片| 99尹人香蕉国产免费天天拍| 亚洲日韩欧美在线观看| 成人午夜视频在线| 色哟哟国产精品一区二区| 欧美日本中文| 日韩A级毛片一区二区三区| 日韩激情成人| 91极品美女高潮叫床在线观看| 国产丝袜第一页| 香蕉久久国产超碰青草| 亚洲中文字幕手机在线第一页| 午夜国产理论| 3p叠罗汉国产精品久久| 色哟哟国产精品| 男女猛烈无遮挡午夜视频| 一本大道无码高清| 亚亚洲乱码一二三四区| 亚洲人成亚洲精品| 成人在线不卡| 欧美成人在线免费| 午夜久久影院| 中文字幕一区二区人妻电影| A级毛片高清免费视频就| 亚洲欧美自拍中文| 国产成人亚洲无吗淙合青草| 999精品免费视频| 亚洲熟女偷拍| 高清色本在线www| 午夜少妇精品视频小电影| 九九热在线视频| 欧美一区二区啪啪| 伊人久久久大香线蕉综合直播| 奇米精品一区二区三区在线观看| 中文字幕日韩丝袜一区| 熟妇丰满人妻| yjizz国产在线视频网| 亚洲精品午夜天堂网页| 亚洲欧洲自拍拍偷午夜色| 欧美成人第一页| 国产精品一区二区无码免费看片| 亚洲婷婷在线视频| 亚洲成人免费看| 国产剧情伊人| 精品国产99久久| 色综合天天操| 国产视频一二三区| 亚洲VA中文字幕| 特黄日韩免费一区二区三区| 中文字幕 欧美日韩| 国产欧美亚洲精品第3页在线| 亚洲成人福利网站| 欧美中文字幕一区| 国产一级妓女av网站| 欧美精品成人一区二区视频一| 久久久精品久久久久三级|