999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于LightGBM的氣象目標分類技術

2023-12-18 08:20:16歐陽彤朱岱寅
雷達科學與技術 2023年6期
關鍵詞:分類模型

歐陽彤,汪 玲,朱岱寅,李 勇

(南京航空航天大學雷達成像與微波光子技術教育部重點實驗室,江蘇南京 211106)

0 引 言

天氣雷達是氣象目標分類的基礎,它通過回波信息對氣象目標進行識別判斷,對大氣中雨、雪、冰雹等天氣現象的檢測具有極其重要的作用[1]。常規多普勒氣象雷達依靠發射單一極化方向電磁波,通過回波只能獲取反射率因子、速度譜寬等單一極化方向參量,而僅靠單一極化方向的參量很難具體了解氣象目標在幾何大小、形態、空間取向等方面信息,因而經常對氣象目標造成誤判。為得到更多氣象目標信息,雙極化雷達由此誕生,雙偏振氣象雷達是常規多普勒氣象雷達的進一步發展,采用同時或交替發射水平和垂直方向的電磁波,可額外獲取兩種不同偏振方向電磁波之間的差分反射率、相關系數、差分相移率等差異極化參量。這些極化參數使得雙偏振氣象雷達具有對氣象目標相態、類型、幾何形態等信息敏捷感應的能力,雙偏振氣象雷達的出現大大促進了氣象雷達在氣象目標識別上的發展[2-5]。

1996年,Straka等人最先將模糊邏輯算法應用于氣象目標分類領域,構建了可有效對降水粒子分類的模糊邏輯降水粒子分類算法[6],但是模糊邏輯算法的隸屬函數需要依賴于專家經驗。雖然經過研究者們多年改進[7-10],但隸屬函數參數設置依然需要依賴于專家經驗,從而使得該算法具有很強的局限性和較高的目標誤判率。

為解決傳統模糊邏輯降水粒子分類算法的局限性,大量基于機器學習的氣象目標分類方法被陸續提出。2017 年ROBERTO 等人將支持向量機應用至水凝物分類領域,此模型能有效地完成氣象目標識別過程,但是識別精度等方面有待進一步提升[11]。2020 年MA 等人采用貝葉斯算法改進了X 波段天氣雷達對融化層觀測能力,能有效區分小雨和干雪粒子,但僅提升了干雪和小雨之間的區分,其他類別的識別并未納入研究[12]。2021年Shin 等人提出利用隨機森林模型來估計降雨量,有效地完成降雨量估計,但是僅僅預測了降雨量[13]。2022 年李海團隊提出一種將決策樹支持向量機與貝葉斯網絡協同訓練的氣象目標分類方法,將兩個分類器協同訓練,從而得到比單個分類器可信度更高的識別結果,但是在精度方面依然有較大的提升空間[14]。2022 年,李海團隊又提出一種基于增量貝葉斯的氣象目標分類算法,此算法有效利用增量學習完成動態調節樸素貝葉斯分類器,得到在各種干擾下,性能依然優越的樸素貝葉斯分類器[15],但是精度方面有待加強。2022 年張舒娜等人提出使用極端梯度提升算法,有效地從雷達回波信息中提取地雜波,實現了對天氣信號和雜波信號的二分類。然而,此算法的氣象目標識別效率較低,對大型復雜的氣象信息數據處理能力存在不足[16]。

上述機器學習類算法基本以離散屬性數據為訓練集,能得到細粒度的識別結果,但是在識別準確性能上還有待加強。為進一步提高識別準確度,一些研究者開始將深度學習應用于氣象目標識別領域。2019年Lu 等人建立了5種卷積神經網絡的四分類氣象目標檢測模型,并選取其中效果最佳的殘差卷積神經網絡完成對4 種氣象目標粒子有效識別[17]。2021 年喻慶豪等人提出利用基礎卷積神經網絡完成對機載氣象雷達氣象目標的檢測[18]。2022 年高涌荇等人提出一種基于殘差卷積神經網絡的雙極化氣象雷達天氣信號檢測算法,有效區分天氣信號與雜波信號[19]。但是這種基于深度學習的氣象目標分類,需要將雷達參數類比于圖像通道,輸入數據以塊狀矩陣為樣本,識別結果是塊狀的,塊內其他類別被忽視,無法得到細粒度分類結果,在各種類分界線上會出現與實際天氣分布不符的識別結果。

為能細粒度并且高精度地識別氣象目標,本文聚焦傳統機器學習類氣象目標分類研究,提出一種基于LightGBM 算法的氣象目標分類模型[20]。該模型是基于離散屬性實現分類的分類模型,能高效并且細致到點對點地完成對氣象目標準確識別,減少誤判。該模型首先將雙極化氣象雷達極化參量數據與分類標簽數據處理轉換為離散化向量數據。然后構建一種基于離散屬性的LightGBM分類器,實現對氣象目標點對點的分類。其中構建LightGBM 模型主要包括數據集制作,模型初步構建,參數調優,最佳模型訓練4個部分。

1 數據集制作

文中模型數據均取自美國國家海洋和大氣管理局(National Oceanic and Atmospheric Administration,NOAA)提供的雷達氣象數據記錄。選取KVNX 雙極化氣象雷達2021 年全年觀測數據,從中提取雷達仰角為0.5°的各極化參數及分類結果數據:N0Q、N0X、N0C、N0K、N0H 文件。這些數據文件分別對應反射率因子、差分反射率、相關系數、差分相移率、NOAA 分類標簽,記為Zh、Zdr、Kdp、ρhv、C1s。其中Zh為360 × 460 的二維矩陣,其余數據均為360 × 1 200 的二維矩陣,所以需要對Zh作數據訂正,使得Zh在矩陣大小與方位上與其他數據對應,保證數據準確性。

傳統機器學習類氣象目標識別方法大部分以離散屬性為基礎,識別數據是點對點識別,可得到細粒度的識別結果,與實際氣象目標分布相符。LightGBM 識別也具有離散特性,使用離散數據表示參數與標簽之間關系,由此需要將極化參數與分類標簽作離散化處理,將極化參數與分類標簽數據一一取出生成(xij,Ci)的向量數據,其中j取(0,1,2,3),xij表示對應原數據位置i上的4 個極化參數,Ci表示對應位置i上的分類標簽。

極化參數中存在無效值,本文選擇使用對應類別的各極化參數均值進行填充,濾除無效值對識別分類的影響。

為保障模型有效訓練,需要保持各類別樣本均衡,等量選取雜波、冰雹、中小雨、濕雪4 種氣象目標向量數據,選取的4種氣象目標數據樣本數量為100 000,再將選取的數據樣本進行合并。

此外,極化參數數值分布存在差異,直接用于模型訓練將使得某個參數在訓練過程中增大或減少對分類的作用,故需要對極化參數再做一個歸一化處理,如式(1)所示,將極化參數數值分布轉換為0~1 之間分布。式中,x表示原極化參數,xmin表示對應極化參數最小值,xmax為對應極化參數最大值,y為歸一化處理后輸出數據。將處理好的數據集隨機切割為以8∶1∶1 為比例的訓練集、驗證集、測試集,由此數據集制作完成。

2 LightGBM模型與參數優化

2.1 LightGBM 模型

由決策樹與梯度提升結合而來的梯度提升決策樹(Gradient Boosting Decision Tree,GBDT)是一種極易可視化,同時具有強大泛化能力的集成類算法,但是在處理大型數據或高維特征時,效率低,擴展性也不佳[21]。為提高GBDT對復雜數據的處理效率,微軟于2017 年提出了LightGBM 算法。LightGBM 由傳統的GBDT 發展而來,是GBDT 的一個進化版本,主要加入了基于Leaf-wise 算法的生長策略構建樹,基于梯度的單面采樣算法(Gradient-based One-Side Sampling,GOSS)和特征捆綁算法(Exclusive Feature Bunding,EFB)等優化算法。通過基于Leaf-wise 算法的生長策略構建樹,可避免多余的計算量,減少誤差。GOSS 算法先根據數據梯度絕對值將數據排序,按一定比例保留對信息增益影響更多的大梯度樣本,再對剩余小梯度樣本隨機抽樣。實現保留原數據分布的條件下,降低數據量,在保證信息增益評估精度的同時,有效增強模型分類速度。EFB通過互斥特征的捆綁,合并生成新的特征,降低數據特征維度,提高模型運算效率。

1)初始化極化參數xij在第k類的預測狀態,氣象目標分類標簽為k=1,2,…,K。

2)迭代計算,迭代次數m=1,2,…,M。

①計算極化參數xij在各類別上的概率。

②計算極化參數xij的負梯度y?i,k,極化參數xij的真實概率為yi,k。

③獲取葉子節點分裂后葉子節點值γh,k,m,葉子節點上的樣本集合是Rh,k,m,葉子節點數h=1,2,…,H。

④ 模型優化刷新,學習率設置為η。

3)獲取最終模型

2.2 參數優化

LightGBM 分類算法具有許多超參數,超參數的設置會對模型分類效果造成很大影響,因此,必須對LightGBM 參數進行選擇優化,得到使得算法分類效果最佳時的超參數組合,將其作為模型訓練的參數。常見的參數調優方法有網格搜索、隨機搜索以及貝葉斯優化。本文參數優化方式為基于Hyperopt 的貝葉斯優化[22],其核心思想為根據資料搭建初始模型,即使未知算法的內部數學邏輯關系,也可以根據給定的優化目標,先擬定參數組合的搜索范圍,算法自動在給定范圍內隨機獲取初始候選解集合,以尋求更佳目標函數為目的,當下一個點目標函數更優時,將此超參數組合加入搜索集合中,并在更新點參數周圍尋找更優點,如沒有則尋找下一個較遠范圍。一直重復該過程,直到迭代結束。最后,在搜索集合中得到目標函數最佳時的模型參數組合,作為優化問題的解。貝葉斯優化算法主要包括兩個過程:1)先驗函數,先驗函數經過高斯過程回歸,對目標函數建模,進而獲取其后驗分布;2)采集函數,采集函數一般選取POI(Probability of Improvement),其公式如公式(8)所示,其內核為通過后驗模型估計未知點目標函數值大于現有最大值的概率,選擇概率最大的點x為下一個搜索點。利用采集函數可以保證優化過程中高效采樣,由此避免在局部最優解上不斷采樣的情況。

式中:x表示下一個搜索點;f(x)為x的目標函數值為現有目標函數最佳值;θ≥0,為用于探索未知的點或者利用已知點探索其附近最大值的平衡函數;P(·) 為概率;Φ(·)表示標準正態分布累計密度函數;μ(x)表示目標函數在高斯過程中的均值;σ(x)表示目標函數在高斯過程中的標準差。

3 模型訓練流程

結合前文,基于LightGBM 的氣象目標分類算法流程如圖1所示。

圖1 LightGBM的氣象目標分類算法流程圖

第1步:從NOAA 官網獲取KVNX 氣象雷達數據集;

第2步:選擇提取所需要的N0Q、N0X、N0C、N0K、N0H 文件,讀取文件,獲取Zh、Zdr、Kdp、ρhv、C1s 5 類數據。先進行數據預處理,再制作成離散化模型輸入數據集

第3步:搭建初始LightGBM 模型,將數據集D輸入初始模型,得到初始模型分類效果;

第4步:利用貝葉斯調參算法對模型超參數進行搜索,獲取最優超參數組合;

第5步:根據調優獲得的最佳超參數模型,將數據集D輸入最優LightGBM 模型,訓練得到最優模型。

通過上述步驟1~3 即可得到對LightGBM 氣象目標分類模型的初始模型構建,經過參數調優后,訓練獲取最優模型。其中,參數調優后得到的最佳參數模型相對于初始模型具有更佳的識別準確率,如表1所示。

表1 調參前后模型準確率

以驗證集負值準確率為參數搜索目標函數,將制作好的數據集輸入模型,開始搜索超參最優組合,調優搜索過程如圖2 所示,隨著迭代次數增加,Hyperopt優化參數算法根據上一次的結果來確定下一次帶入參數,經過多次迭代,得到最優超參數設置,超參數調參后得到的最優模型超參數設置如表2所示。

表2 調參后最優超參數組合

圖2 超參搜索過程中測試集準確率負值

4 模型訓練性能驗證

4.1 LightGBM 模型訓練結果分析

最佳參數模型訓練過程準確率曲線如圖3 所示,損失函數曲線如圖4 所示。由圖3 可見,隨著訓練次數增加,訓練集與驗證集準確率迅速提升收斂,訓練集準確率最終穩定于0.950 3,驗證集準確率穩定于0.948 6。由圖4 可見隨著訓練次數增加,訓練集、驗證集損失函數不斷優化降低,訓練集損失函數最終穩定于0.128 9,驗證集最終穩定于0.135 3。圖5為測試集在LightGBM 最優模型上的測試混淆矩陣,由測試集的表現可知,LightGBM模型對各個粒子的平均識別精度可達95%,尤其是對雜波信號檢測性能極高,減少了對氣象粒子識別的干擾,同時,對冰雹、中小雨、濕雪的識別精度也都能滿足93%以上,整體識別性能優越。

圖3 LightGBM模型準確率訓練過程曲線

圖4 LightGBM模型損失函數訓練過程曲線

圖5 LightGBM模型測試集混淆矩陣

4.2 LightGBM 與xgboost訓練結果對比

為充分評測LightGBM 算法對氣象目標的分類預測性能,本文使用同樣的數據集D,搭建同屬集成類的xgboost 分類模型[23],在相同的訓練次數的情況下,對比二者在氣象目標識別分類上的優劣。xgboost算法訓練過程準確率曲線如圖6所示,損失函數曲線如圖7 所示。由圖6 可見,隨著訓練次數增加,訓練集與驗證集準確率迅速提升收斂,訓練集準確率最終穩定于0.948 7,驗證集準確率穩定于0.947 5。由圖7 可見,隨著訓練次數增加,訓練集、驗證集損失函數不斷優化降低,訓練集損失函數最終穩定于0.139 9,驗證集最終穩定于0.143 3。對比圖3、圖4 和圖6、圖7 可見,LightGBM 穩定所需訓練次數遠小于xgboost。LightGBM 與xgboost兩者以準確率、損失函數以及模型訓練時間、模型平穩訓練次數作為兩算法性能對比的評價指標,結果如表3 所示。由表3 可見,無論是在訓練集、驗證集上,LightGBM 的性能都略優于xgboost,從模型訓練時間和模型平穩訓練次數來看,LightGBM模型效率明顯比xgboost 更加高效,訓練處理時間更快,大大提高識別速率。綜上,LightGBM 模型能在識別精度達到甚至高于xgboost 模型的同時,識別效率大大提升,這表現了LightGBM 對大數據集的強大處理能力,與模型理論效果相符。

表3 LightGBM 與xgboost識別性能比較表

圖6 xgboost模型準確率訓練過程曲線

圖7 xgboost模型損失函數訓練過程曲線

4.3 實測數據分析驗證

為驗證模型對雷達實際觀測數據的預測能力,本文選取非訓練數據集數據:NOAA 網站上KTLX雙極化天氣雷達2021年1月1日6時19分的雷達0.5°仰角觀測回波數據進行測試。制作僅含反射率因子、差分反射率因子、相關系數、差分相移率無標簽向量數據集,圖8為已校準的反射率因子、差分反射率因子、相關系數、差分相移率原始數據圖像。

圖8 KTLX雷達4個極化參量圖

利用訓練好的LightGBM 和xgboost 模型識別,得到數據標簽,處理得到如圖9、圖10、圖11 所示分類結果圖。圖9 為NOAA 參考氣象目標分類結果,圖10 為LightGBM 分類結果,圖11 為xgboost 分類結果。由圖9~11 可知,整體上兩個分類模型都能比較有效地完成氣象目標分類,效果相當,這也與表3 表現結果相符。圖10、圖11 中標注紫色圓圈可以看出,集成類算法主要將一部分塊狀中小雨誤識別為冰雹。此外,在冰雹與中小雨交界線處,也存在一定的中小雨被識別為冰雹,這應該主要由于氣象分布具有連續性,導致中小雨、冰雹分界線處雷達參量數據相近,從而使得中小雨、冰雹兩種粒子發生誤判。此外,從圖10、圖11中黑色矩形標注內容可以看出,還存在一些離散的濕雪也被識別為冰雹,這與測試集混淆矩陣表現效果一樣,誤判主要存在于中小雨、冰雹、濕雪3種氣象目標之間。

圖9 NOAA參考分類

圖10 LightGBM分類結果

圖11 xgboost分類結果

再選取非數據集信息KTLX雙極化天氣雷達5月27 日23 時50 分的雷達0.5°仰角觀測回波數據繼續進行測試,測試結果如圖12、圖13 所示,圖12為NOAA 參考氣象目標分類結果,圖13 為Light-GBM 分類結果。對比圖12、圖13,如圖13 中標注紫色橢圓所示,LightGBM 模型存在將少量塊狀的中小雨誤判為冰雹,如圖13 中黑色框圈中部分所示,此時刻同樣存在少量離散分布的濕雪被識別為冰雹,這也與圖5測試集所示混淆矩陣表現結果相符。

圖12 NOAA參考分類

圖13 LightGBM分類結果

結合兩次不同時刻非訓練數據集雷達實際觀測信息對LightGBM 模型的測試可知,雖然存在少量誤判,但本模型對非訓練數據集雷達數據整體上也能十分有效地識別出雜波、冰雹、中小雨、濕雪等氣象目標,表現出該模型強大通用性、魯棒性。通過與xgboost 相比較,表現也與表3 結論相符,LightGBM 模型能更高效率地識別出氣象目標的同時甚至略高于xgboost模型的識別效果。

5 結束語

本文針對傳統氣象目標分類算法對人為設置模糊函數的依賴性,提出一種基于LightGBM 的氣象目標分類技術。將KVNX 氣象雷達獲取的4 個極化參量作為氣象目標的特征參數與參考分類標簽,制作離散化向量數據集,再進行預處理,去除無效值對模型訓練影響,構建一種基于LightGBM算法的氣象目標四分類模型,能細致有效地識別3種氣象目標(中小雨、冰雹和濕雪)及雜波。選取xgboost 分類模型作為參照,實驗結果表明,相對于xgboost 分類模型,本文分類模型能在高識別精度的同時具有極高的識別速率,對大數據處理更加高效。選取KTLX 雷達兩個不同時刻的實際觀測數據對本文所建分類模型進行驗證,結果表明該模型能有效識別4 種氣象目標,識別效果與NOAA參考結果大體相符,表現良好的通用性、魯棒性,但是,依然存在少量的塊狀中小雨區域被誤判為冰雹、少量離散分布的濕雪被識別為冰雹的情況。

猜你喜歡
分類模型
一半模型
分類算一算
垃圾分類的困惑你有嗎
大眾健康(2021年6期)2021-06-08 19:30:06
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
分類討論求坐標
數據分析中的分類討論
教你一招:數的分類
3D打印中的模型分割與打包
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
主站蜘蛛池模板: 国产精品无码制服丝袜| 国产成人精品一区二区免费看京| 精品久久久久久久久久久| 国产成人艳妇AA视频在线| 亚洲成在人线av品善网好看| а∨天堂一区中文字幕| 永久天堂网Av| 四虎影视无码永久免费观看| 青青国产视频| 亚洲Av激情网五月天| 熟女成人国产精品视频| 免费网站成人亚洲| 国产传媒一区二区三区四区五区| 亚洲男人天堂久久| 亚洲天堂网站在线| 亚洲色图欧美在线| 91视频99| 亚洲一级毛片在线观| 精品一区二区三区视频免费观看| 喷潮白浆直流在线播放| 国产欧美视频在线| 免费无码AV片在线观看中文| 少妇露出福利视频| 亚洲成A人V欧美综合| 夜夜高潮夜夜爽国产伦精品| 国产v欧美v日韩v综合精品| 国产精品毛片一区| 成人国产免费| 美女内射视频WWW网站午夜| 色天堂无毒不卡| 99草精品视频| 国产性精品| 天天综合网色中文字幕| 理论片一区| 91精品国产91欠久久久久| 在线观看亚洲精品福利片| 99视频在线免费| 亚洲精品福利视频| 日本成人在线不卡视频| 成人小视频在线观看免费| 99视频国产精品| a级毛片网| 精品国产免费观看| 久久天天躁夜夜躁狠狠| 久久久久久久蜜桃| 久久动漫精品| 欧美精品二区| 人妻丰满熟妇αv无码| 高清免费毛片| 一区二区三区国产| 午夜精品久久久久久久2023| 亚洲福利一区二区三区| 综合成人国产| 国产精品三级av及在线观看| 99999久久久久久亚洲| 国产高清在线精品一区二区三区| 国产极品嫩模在线观看91| 91精品国产丝袜| 狠狠色噜噜狠狠狠狠奇米777| 欧美一级在线| 91九色国产porny| 国产视频久久久久| 玖玖免费视频在线观看| 玩两个丰满老熟女久久网| 国产欧美日本在线观看| 日韩少妇激情一区二区| 亚洲人成网站日本片| 午夜欧美理论2019理论| 久久天天躁狠狠躁夜夜躁| 亚洲成人一区在线| 大香网伊人久久综合网2020| AV无码无在线观看免费| 亚洲人成高清| 欧美精品导航| 日本免费高清一区| 91口爆吞精国产对白第三集| 久久免费视频播放| 久久国产V一级毛多内射| 国产原创演绎剧情有字幕的| 广东一级毛片| 四虎永久免费地址在线网站| 91色在线观看|