植耀玲,周利發,盧炳夫,黃丹,伍華麗,吳浙,毛秋菊
(1.廣西壯族自治區氣象災害防御技術中心,廣西 南寧 530022;2.廣西電力職業技術學院,廣西 南寧 530007;3.北海市氣象局,廣西 北海 536006)
雷暴是熱帶和溫帶地區常見的局地性強對流天氣,雷暴發生時可伴隨雷擊、閃電、強風和強降水等惡劣天氣,是我國最大的災害性天氣之一。北海市為廣西強雷區,每年強雷天氣可造成大量的人員傷亡和財產損失[1-2]。雷暴路徑是反映某一區域雷電活動規律的主要內容之一,雷暴移動路徑的分類對研究雷暴生成、發展、消亡等過程具有指導意義[3-4]。天氣雷達是監測雷暴活動的重要手段之一,通過算法識別雷達資料中的暴風單體,然后通過外推其運動路徑得到預測結果是雷暴臨近預報常用的方法[5-6]。也有學者選取閃電定位數據進行雷暴路徑特征分析,例如崔雪東等[7]通過密度極大值快速搜索算法和Kalman濾波算法識別追蹤雷暴路徑。近年來,機器學習在氣象領域研究中得到廣泛應用。潘巧等[8]利用各類雷暴追蹤算法進行雷暴識別研究,解決無法區分不同單體、識別結果過于零散等問題。FMM(Finite Mixture Model)算法即有限混合模型算法,是利用混合多項式回歸模型擬合曲線的形狀和長度,通過分析其相似度進行聚類,屬于空間數據挖掘中聚類算法的分支。研究表明,采用該算法對天氣系統路徑進行聚類分析能達到良好的效果[9-12]。
本文選取2018—2023年的二維、三維雷電定位數據和廣西雷達組合反射率產品,提出一種基于YOLOv7目標檢測算法的雷暴識別方法,并結合Deep-SORT多目標追蹤算法進行目標追蹤,將目標檢測和目標跟蹤分離,以此提高雷暴單體識別的精度和雷暴路徑追蹤的準確性。通過FMM算法對北海市雷暴路徑進行客觀分類,著重分析各類路徑的時空變化規律,可在一定程度上避免主觀誤差,豐富雷暴研究的技術手段。本文旨在進一步探索影響北海市高影響區域的不同路徑雷暴的氣候特征,可為雷電監測預警及防災減災工作提供參考。
統計雷暴過程采用的是廣西壯族自治區防雷中心提供的2018年1月1日至2023年8月31日的二維雷電定位數據(廣西ADTD二維閃電定位系統,建于2009年,僅含地閃,不含云閃)、三維雷電定位數據(廣西雷電綜合監測網,建于2016年,含地閃及云閃)和廣西雷達組合反射率產品。
1.2.1 定義標準
(1)高影響區域:將北海市行政區域邊界的外接矩形外擴15 km得到的矩形區域。
(2)高影響區域雷暴過程:在影響區域內生成、發展、成熟或消散的雷暴過程,并且該過程需持續20 min以上,若目標分析區域只有消散過程,則可能是該過程短暫而被遺漏。
(3)過程雷暴路徑:把雷暴初生、發展、消散過程中雷達回波組合反射率最高值移動路徑作為雷暴路徑,利用逐6min一次的雷達組合反射率產品統計雷暴高影響區域內每隔12~18min對應的雷達回波高組合反射率的質心連線及其移動方向。
1.2.2 冷啟動下的雷暴路徑自動識別追蹤方法
針對雷達加閃電數據視頻序列中可能無法識別不同雷暴單體、識別結果過于零散及無法追蹤等問題,本文結合YOLOv7算法與DeepSORT算法提出一種冷啟動方式下的雷暴路徑自動識別追蹤方法。該方法將雷暴質心識別與追蹤相結合,通過引入YOLOv7算法識別檢測雷暴中心,提高識別的精度,將雷暴質心移動的方向差因素加入DeepSORT算法關聯代價中,實現雷暴中心的目標追蹤。
雷暴路徑自動識別追蹤方法的具體步驟(如圖1所示)如下:首先利用DarkLabel視頻標注軟件對目標區域2022年6月至2023年6月的歷史雷暴數據進行逐幀框選標注冷啟動方式,制作MOT(多目標追蹤)數據集格式作為訓練集;其次使用YOLOv7算法訓練出能識別雷暴質心位置的模型,引入多目標算法中的DeepSORT對剩余數據的雷暴質心進行連續追蹤,進而繪制出近6年的雷暴移動路徑;最后使用FMM聚類算法對路徑進行聚類,得到雷暴路徑的類型。

圖1 雷暴路徑自動識別追蹤方法的具體步驟
1.2.3 雷暴過程訓練集選取標準
雷暴過程訓練集選取標準如下:①過程當日三維閃電日頻次高于1 000次;②過程當日二維閃電日頻次高于100次;③過程中雷達回波組合反射率持續18min(連續4幀)高于35 dBz;④過程中連續6min內,三維閃電頻次大于5次。
(1)單一路徑繪制。確定路徑起始點,用實心點和編號標記,沿著路徑每隔12~18min(2~3幀)以實心圓標記雷暴發生區域質心,用黑色實線依次連接實心圓,在雷暴消散區或高影響區域邊界用箭頭標記代表雷暴消散或路徑越過高影響區域的位置及方向。
(2)多路路徑繪制。對于多路路徑匯成一路路徑的繪制,分別繪制多路路徑的起始點,用實心點和同一編號標記,多路路徑起始時間可能不一致,沿著路徑每隔12~18min(連續2~3幀)以實心圓標記雷暴發生區域質心,在路徑交匯處用同一個實心點標記后按照單一路徑繪制方法繪制。對于單路路徑分裂為多路路徑的繪制及編號,首先按照單一路徑繪制方法繪制,其次在分裂處分別繪制多路路徑,在雷暴消散區或高影響區域邊界用箭頭標記,多路路徑消散時間可能會不一致。
通過該路徑繪制方法得到從2018年1月1日至2023年8月31日北海市高影響區域的雷暴路徑數據,共計90條路徑(如圖2所示)。從雷暴的生、消位置看,外地生成經過北海的雷暴有56次,占比為56.6%;本地生成外地消散的雷暴有14次,占比為15.5%;外地生成本地消散的雷暴有17次,占比為18.8%;北海本地生成并消散的雷暴有8次,占比為8.8%。

圖2 2018—2023年雷暴移動路徑線路匯總圖
對90條雷暴路徑數據進行多目標算法聚類,聚類結果如圖3所示。由圖3可知,從雷暴路徑方向得到的5類主要影響北海市的路徑基本是外地生成的雷暴,含71次過程,占總路徑的78.9%。雷暴起始位置及影響范圍等方面有明顯差異,本文主要針對該5類主要路徑進行分析。

圖3 多目標算法聚類得到的北海市高影響區域雷暴路徑示意
第一類西南—東北向雷暴自西南方向從北部灣海域向東北影響北海市合浦縣東部地區,共有23次過程;第二類西—東向雷暴自偏西方向從合浦縣西部向東一路移動,有18次過程;第三類西北—東南向雷暴由欽州市西部從西北向東南方向影響北海,有13次過程;第四類東北—西南向雷暴從玉林市南部由東北向西南方向移動至北部灣海域,有9次過程;第五類南—北向雷暴從北部灣海域經銀海區南部向北影響至內陸地區,有8次過程。
從5類雷暴路徑頻次(見表1)及頻次月份分布(如圖4所示)來看,5類路徑的統計特征各有差異。第一類雷暴發生次數最多,占總頻數的32.39%,并且多集中在5月,其他月份明顯減少;在08:00-20:00和20:00-08:00(次日)2個時段占比最多,均超過30%。第二類雷暴出現頻次較多,多發生在6月,其他月份明顯減少;在20:00-08:00(次日)時段占比較多,超過30%。第三類雷暴頻次較少,多發生在7月且多發生在08:00-20:00時段。第四類雷暴在6月至9月出現頻次差不多,但在20:00-08:00(次日)時段發生最少。第五類雷暴出現次數最少,主要發生在6月,其他月份明顯減少;在08:00-20:00和20:00-08:00(次日)2個時段發生概率差不多。

表1 5類雷暴路徑頻次特征統計表

圖4 5類雷暴路徑頻次月份分布圖
總體上看,第一類、第二類和第三類雷暴是北海市常見的雷暴路徑類型。北海市雷暴活動多發生在白天時段(08:00-20:00),占比約63.38%,其中第一類雷暴全天發生概率最高,第四類晚上發生概率最低。北海市雷暴活動多發生在5月至7月,占比約73.24%,各類型雷暴頻次、月份間差異明顯,都有其各自發生頻次高的月份,其中僅有第一類和第二類雷暴會發生在冬季(1月至2月)。
對比閃電密度(如圖5所示)和雷暴路徑分布情況(如圖2和圖3所示)可知,閃電密度高值區集中在北海市高影響區域的西南部和東北部地區,在中部和東南部閃電密度較低,說明影響北海市的雷暴多為外來路徑,并且這些路徑很少從北海市東南部侵入,閃電密度分布特征與5類主要影響北海市的雷暴路徑分布區域基本一致。這也驗證了基于多目標追蹤算法與聚類算法統計得到的雷暴路徑能較準確地體現影響北海市高影響區域的主要雷暴的路徑方向和影響范圍,對雷電災害風險普查、雷電監測預警預報等工作的開展有一定的可行性、互補性和實用性。

圖5 2018—2023年北海市閃電密度分布圖[單位:次/(年·km2)]
綜上所述,本文得出的主要結論如下:①從雷暴路徑移動的方向看,主要有5條路徑影響北海市(除潿洲島),含71次過程。②各類雷暴路徑活動特征差異明顯。近6年來,第一類雷暴發生頻次最高,第五類頻次最低;各類雷暴路徑次數極大值所在的月份均不一樣,并且僅有第一類和第二類雷暴會發生在冬季;08:00-20:00時段發生雷暴過程最多,其中第一類雷暴白天發生概率最高,第四類晚上發生概率最低。③影響北海市的雷暴多為外來路徑,閃電密度分布特征與主要影響北海市的雷暴路徑分布區域基本一致。
本文提出的基于多目標追蹤算法與聚類算法的雷暴識別方法,能較準確地識別和追蹤北海市高影響區域的雷暴過程,有利于掌握北海市的雷電風險情況,為雷電的預警預報提供參考意義,并為區域雷電災害風險評估工作提供理論依據。在雷暴活動中有許多系統的發展趨勢會影響雷暴的生、消過程,關于熱力、動力和地形地貌等因子對各類雷暴過程產生的作用本文并未涉及,影響各類雷暴路徑選擇的機制也未深入研究,這些問題將是下一階段研究工作的重點。