杜維柱,張曉華,盧毅,王書淵,沈彥伶
(國網冀北電力科學研究院,北京 100045)
電網短期臨近氣象預警是對災害性強對流天氣進行及時、精準的預警,提前預測其發展趨勢,從而及時采取預防措施來減小電力設施的損失[1-2],這也是近年來新的研究熱點。目前,常見的預警方法是通過數值模式預報等方式進行粗略地統計與測算。典型的TITAN 算法是基于三維雷達數據對災害性天氣進行識別、跟蹤與預警,其為氣象預警研究奠定了良好的基礎[3]。但由于雷達收集數據及本身技術水平的限制,數據采集無法大范圍開展。隨著氣象衛星的發展與數據分辨率的提高,利用衛星數據進行短期臨近預警的研究成為了可能[4-6]。文獻[7-8]利用前沿的人工智能算法對數據進行分類統計,并采用特征識別技術量化衛星數據,故可有效對強對流天氣進行實時預測。文獻[9]提出CI 預警方法,通過采集衛星通道的數據指標提出相應的閾值,并通過閾值確定CI,進而解決了衛星數據零散的問題。與此同時,基于遙感數據與機器學習(Machine Learning,ML)的分析方法不斷出現,其能根據采集到的數據特征進行實時訓練,并可達到對強對流天氣的短時臨近預警[10]。該文根據氣象觀測信息,對收集到的各類數據進行預處理及三性分析,將數據轉換為網格數據,然后通過所設計的氣象模型實現預警。
根據氣象站觀測到的風速、風向、溫度和濕度等信息,捕捉地區的各種天氣數據。但環境的限制,導致觀測到的數據受設備儀器的影響,使得其收集的數據質量也參差不齊。因此,這些數據必須經過嚴格的質量控制與管理,并對其進行預處理及三性分析。其中,數據的質量控制流程如圖1 所示。

圖1 數據質量控制流程
采用機器學習中的監督學習方法,首先需要對采集到的數據進行預處理[11-12]。由于衛星接收站的原始數據與經緯度呈現非線性分布,故數據的分辨率與衛星云圖的距離呈正相關。因此,需將上述數據轉換為經緯度網格的數據。通常衛星每隔15 min對天氣狀況進行一次加密觀測,而該文方法僅需采集到每隔30 min 的加密數據即可滿足需求。同時考慮到強對流天氣易出現的時段,文中選擇的加密數據觀測時間如表1 所示。

表1 衛星數據加密觀測時間
最新的天氣雷達信息由計算機控制[13],所采集到的信息是完全基于極坐標系的。由于使用笛卡爾坐標系的數據較為便捷,故該文在使用過程中所采用的數據均需轉換為笛卡爾坐標系。此外,還需將采集到的雷達數據進行濾波處理。但上述數據并非完全正確,可能仍存在一定誤差,因此需要將誤差控制在合理范圍內。
針對數值特征,基于雷達反射樣本標簽,將比樣本數值大的數據記錄為正數據;反之,記錄為負數據。處理步驟的主要目的是利用差分法(Difference Methods,DM)將數據的增量信息記錄下來,對于t時刻的信息δ采用的計算公式為:
由于數值樣本種類較多且標準未統一,故需通過歸一化處理上述數據。采用梯度下降法(Gradient Descent)預測數據趨勢,其對參數λ的歸一化處理應用方式如下:
應用機器學習算法對電網短期臨近預警的核心,是通過卷積及池化操作實現對數據的識別與預測。而其精度的高低與分類器的選擇信息相關,分類器實質上是一種數學意義上的回歸方法,可精確感知模型的概率。
假設獲得的氣象數據為x1、x2、…、xn,則其對應的輸出數據分別為y1、y2、…、yn,通過卷積與池化操作,能夠得到yi與xi之間的函數關系為:
式中,f的取值范圍為[0,1],則yi的似然函數可表示為:
兩邊取對數,可得:
通過求解β0,β1,…,βn的估計值,即可得到函數的極大值。
根據氣象模型設計預警流程圖,整個流程采用VC++6.0 平臺來完成雷達數據的輸入與處理,并利用小波融合算法提高紅外數據的準確度。通過設計評價指標對整個流程進行初始評價,該流程如圖2所示。

圖2 氣象預警流程圖
在預警CI 部分,采用指標提取法對各個圖像像素進行統計。通過對采集到的數據進行分析,并調整指標閾值,從而提高預警的精度。
隨著氣象檢測分辨率的增強,對強對流天氣臨近預警的精度提出了更高的要求[14-15]。但由于對流演變是一個非線性的動力過程,且該過程缺乏對流體運動的觀測,同時對時間與空間的要求也較高,故無法完全準確地預報天氣狀況。
通過紅外算法將模擬信息反映為數值信息,并與溫度、濕度、濃度等信息相融合,進而從多種信息來源增加信息庫。所得到的電網短期臨近預警算法流程如圖3 所示。
在上述算法流程中,大量的實驗數據表明,當小波分解到第三級時效果最佳。而在融合規則中,采用紅外云圖低頻信息可提高紅外采集數據的真實性。而針對高頻信息則采用區域求和與局部比較的方式進行選擇,最終便可得到所需的融合信息。

圖3 算法流程圖
經過小波融合算法處理之后,紅外數據的準確率得以提升,從而能夠基于高清詳細數據解決數值預報技術所存在的短時預報問題。
采用計分統計方法設計電網短期臨近預警算法時,需首先選取分類指標及閾值。分類指標需根據各個衛星數據間的相互關系依次確定??梢罁t外數值與其波段的檢測反映輻射信息,并利用溫度、濕度和云端粒子尺度等參數為短時預警提供參考。但并非所有數據均可為臨近預警算法提供有效的數據,因此當紅外波段數據的變化幅度較大時,可設置其價值數值為零。若將多個數值預報信息綜合起來進行預警分析,能夠提高短期臨近預警的準確率。經過大量測試,可得到八個分類指標的三通道信息,具體如表2 所示。

表2 評判指標定義與權重
根據評判指標可知,在不同時刻的相同位置,通過比較相鄰時刻的天氣數值信息,可得到云團的運動矢量,用于解決像素在時間序列的追蹤問題。采用交叉算法可解決上述問題,其原理是將采集到的云團活動區域分為若干個小區域,根據相鄰兩個時刻的關系確定像素的對應關系,其原理如圖4 所示。
假設t1、t2時刻對應的子區域分別為A、B,二者均由同一云團區域劃分而來。將A與B做相關系數計算,可得到二者間的運動矢量,其中相關系數ζ可表示為:
式中,N為總數據量,t1、t2時刻的反照率分別用M1、M2表示。交叉相關算法即將圖像劃分為m個子區域,其計算量與圖像信息的大小存在直接關系。根據文獻[16]中總結的經驗值可知,當子區域選擇5×5 矩陣時可達到較為理想的識別效果,同時其計算精度也有顯著提高。
該文主要對某地區電網臨近氣象的歷史數據進行收集與整理分析,涉及的氣象時間分別為2020 年6 月13 日、8 月6 日及7 月28 日。應用該文所述方法對該地區的臨近氣象進行預警與分析,此次強對流天氣發生的時間通常為午后至傍晚時段。根據地面氣象站風速記錄,此次強對流天氣下,該地區共有20個地面觀測記錄到陣風風速超過10 級,其中有五個觀測站風力等級達到了12級,風速分別為42.1、51.6、39.1、34.8、37.8 m/s。此外,6 月13 日的多個氣象監測站打破了6 月的歷史極大風速記錄。當日的風速變化如圖5 所示,其是一次典型的強對流活動天氣。

圖5 2020年6月13日風速變化
根據國家氣象站6 月13 日08 時的探空資料分析可知,8 時左右對流有效位能(Convective Available Potential Energy,CAPE)為477.8 J/kg。且在對流活動發生前,隨著溫度的升高,對流的有效位能也會進一步增加,導致前期積累能量持續增多。850 hPa 與500 hPa 溫差為34.7 ℃,抬升凝結溫度13.6 ℃,凝結壓強則為862.7 hPa,整體環境參數有利于對流進一步積累能量。對流活動發生后,能量可得到大量釋放,此時對流有效位能較低,整體的大氣溫濕環境趨于穩定。但分別從500、700、850 hPa 的氣象信息來看,西北一帶850 hPa 與500 hPa 的溫度差大于30 ℃,大范圍地區內大氣上冷下暖的結構較為明顯,利于出現不穩定的層結。
進一步對2020 年6 月13 日該地區的短期強對流天氣設置三種情形進行模擬分析。情形一為東北部發生強對流天氣,情形二為西南部發生強對流天氣,情形三則為兩地交界處發生強對流天氣?;谠撐乃龇椒ǎ瑢ι鲜鋈N強對流天氣進行預警,并分析由于小波融合過程中產生的誤差,其結果如表3所示。

表3 三種情形預警結果及誤差
為檢測該文所述方法的有效性及精度,采用不同的損失函數(Loss Function)在各場景下測試預警模型的效果。表4 為四種方法的檢測精度對比。從表中可以看出,該方法可有效檢測極端天氣,且其預測精確率可達96.88%。

表4 不同方法下的預測精度對比
針對電網短期臨近預警問題,該文基于機器學習與數值預報技術開展了面向電網的短期臨近氣象預警模型設計。在將多類信息進行預處理及三性分析的基礎上,根據氣象分析技術設計了一套強對流天氣預警模型。通過小波融合算法映射云團間像素點的聯系,并分析時間關聯度,解決了短時預警問題。實際算例結果表明,該文所提方法可以有效預警極端天氣,且其預測精準率達到了預期水平。在下一步的工作中,將對模型進行改進,并解決預警過程中數據不穩定的情況,同時消除不利因素的影響。