王 楠,朱 蕾,周建軍,劉 倩,楊洪儒
(1.民航新疆空管局空管中心氣象中心,新疆 烏魯木齊830016; 2.民航新疆空管局空管中心培訓中心,新疆 烏魯木齊830016; 3.民航新疆空管局空管中心飛服中心,新疆 烏魯木齊830016)
對于烏魯木齊機場霧的研究, 前人多集中在基于天氣學、統(tǒng)計學的預報方法的研究上[2-6],研究成果揭示了機場大霧多是在偏西氣流型、弱暖脊型、巴湖槽前型的天氣背景下產(chǎn)生, 配合適宜的溫度、濕度、風場等低空氣象要素,結(jié)合低洼的地勢、冷湖及山谷風的共同效應, 使得機場冬季大霧多發(fā)且能見度偏低。近年來隨著全球氣候變化,烏魯木齊機場大霧又表現(xiàn)出了不同的特征,生消規(guī)律有所變化,從而使霧的預報更難把握。 實際工作中預報員對霧的天氣形勢的掌握和適宜條件的認知, 多是基于一天僅有的兩次探空觀測數(shù)據(jù)、 新疆加密自動站數(shù)據(jù)和機場的微波輻射計數(shù)據(jù)中得到參考, 對預報霧有一定的指導作用。 但對霧的生消精細化預報的前瞻性不夠,準確性較差[7-8],為空管運行決策所提供的服務質(zhì)量有待提高。 故而加強高時空分辨率的數(shù)值預報產(chǎn)品對機場大霧天氣中釋用性研究,滿足時間尺度和準確性的雙重要求顯得極為迫切。
隨著預報技術(shù)的發(fā)展, 國內(nèi)外的天氣數(shù)值預報水平不斷提升, 數(shù)值預報產(chǎn)品已成為預報員預報天氣的主要參考依據(jù)[9-12]。傳統(tǒng)的針對于數(shù)值預報產(chǎn)品的釋用多集中在基于多模式集成技術(shù)的氣象要素的對比分析上[13-15],對單站能見度的預報研究不多,民航氣象對該方面的研究更為少見。 所以通過挖掘數(shù)值預報產(chǎn)品中與大霧相關(guān)性較好的預報因子, 利用特定的方法建立預報模型對能見度的變化進行預測[16-17],預報因子的物理意義明確,且準確性較高,因此成為當前業(yè)務中應用較為廣泛的大霧客觀預報方法。 因此,針對所研究區(qū)域的大霧天氣特征,選擇合適的影響因子和建模方法成為影響模式預測準確度的關(guān)鍵因素。
隨著計算機技術(shù)的發(fā)展和人工智能技術(shù)的進步,機器學習得到了廣泛的應用。其中基于支持向量理論的支持向量機(Support Vector Machine 簡稱SVM)方法[18-20],具有從海量的信息中自動識別并提取關(guān)鍵信息的特點, 適合處理本質(zhì)上的非線性問題[21-22],在氣象領(lǐng)域有較好的應用效果[23-24]。 周明薇等[25]和黃威等[26]基于ECMWF 和NCEP 資料,應用SVM 方法分別對邵陽地區(qū)雷暴潛勢、淮河流域及其以南地區(qū)的強降水進行建模, 通過樣本檢驗均取得不錯的效果。 在單站預報方面,很多學者運用SVM技術(shù)對單站低能見度預測開展了建模試驗[27-29],均取得了較高的TS 評分。
由于SVM 方法有不必知道因變量和自變量之間的關(guān)系, 通過對樣本的學習即可獲得因變量和自變量之間非常復雜的映射關(guān)系的特質(zhì), 以往應用SVM 建模的研究因變量多為無差別選取,有時會造成模式過度擬合,可解讀性差,影響建模的速度和預測準確度。 因此,本文按照民航運行標準,將由于霧原因?qū)е轮鲗芤姸鹊陀?00 m(含)的天氣定義為低能見度天氣(下同),作為本文的研究對象。應用天氣學方法, 給出與機場低能見度天氣關(guān)系較好的預報因子, 統(tǒng)計分析低能見度天氣發(fā)生時各預報因子的分布特征,確定預報因子區(qū)間分類和閾值,然后基于SVM 方法,利用機場實際應用較好且數(shù)據(jù)較完整的EC 細網(wǎng)格數(shù)值預報產(chǎn)品開展未來21 h 能見度預報模型, 旨在為提高機場能見度的預報準確率提供參考。
烏魯木齊地窩堡國際機場跑道中心點坐標為87°28′E,43°54′N,海拔高度647 m。 新疆的霧主要出現(xiàn)在北疆,尤以天山山區(qū)最多[30],機場正在此大霧多發(fā)區(qū)中, 本文以機場為中心,0.5°為半徑, 在43.75°~44.25°N , 87.25°~87.75°E 范圍內(nèi), 每隔0.25°取1 個點,共計9 個點(圖1),作為本文因變量選取的地理范圍。
使用的資料主要包括:(1)2015 年11 月—2018年12 月,逐日20 時(北京時,下同)起報EC 細網(wǎng)格數(shù)值預報產(chǎn)品(0.25°×0.25°),時效為21 h,時間間隔為3 h;(2)同期烏魯木齊站(51463)逐日08、20 時探空資料;(3) 同期烏魯木齊機場METAR 報文;機場民航自動氣象觀測系統(tǒng)(AWOS)主降跑道(25 號跑道)方向資料;(4)NCEP/ NCAR 1°×1°再分析資料分析SVM 建模預測準確時對應的天氣形勢。

圖1 EC 細網(wǎng)格資料提取格點位置示意圖
由2015—2018 年烏魯木齊機場低能見度累計出現(xiàn)時次的逐月分布(圖2)可知,機場低能見度天氣11 月開始出現(xiàn),12 月—次年2 月最多, 初春時節(jié)開始減少,3—10 月則很少出現(xiàn)。 1 月低能見度累計出現(xiàn)時間最多為729 h,距平百分率為143%,其次為12月,共計620 h,距平百分率為106%。 11 月—次年2月低能見度出現(xiàn)次數(shù)累計概率為96.15%, 因此本文應用上述4 個月的數(shù)據(jù)來表征機場低能見度的特點,并建立能見度預測模型,具有合理性。
合伙形式的評估機構(gòu),應當有兩名以上評估師;其合伙人三分之二以上應當是具有三年以上從業(yè)經(jīng)歷且最近三年內(nèi)未受停止從業(yè)處罰的評估師。

圖2 2015—2018 年烏魯木齊機場逐月累計低能見度出現(xiàn)時次
預報因子的選取是大霧預報的關(guān)鍵, 大霧形成所需的靜穩(wěn)結(jié)構(gòu)與低層大氣垂直分布狀態(tài)和地面氣象要素分布有關(guān)。 通過參考以往機場低能見度天氣氣候特征的研究成果, 結(jié)合高空探測數(shù)據(jù)和METAR 報文特征, 選取距離機場20 km 的烏魯木齊站(51463)一天2 次850 hPa 的探空數(shù)據(jù)作為表征低能見度天氣出現(xiàn)時周邊氣象條件的分布情況。用烏魯木齊站(51463)850 hPa 的溫度(T850hPa)與同時次機場的觀測溫度之差表征逆溫情況,用850 hPa的相對濕度(RH850hPa) 表征機場上空濕度情況,用850 hPa 的風向風速(WIND850hPa)表征機場上空風場情況;選取機場METAR 報文中的溫度、風向風速及對應時次的AWOS 觀測數(shù)據(jù)中相對濕度表征機場近地面氣象要素情況。
由圖3a 可知,低能見度天氣對應的逆溫多集中在6 ℃(含)以上(為75.7%),隨著逆溫增強,低能見度天氣出現(xiàn)的比率迅速增長; 而非低能見度天氣發(fā)生時對應的逆溫多集中在6 ℃(含)以下(為58.4%),兩者在(3 ℃,6 ℃]逆溫區(qū)間交匯,呈反相關(guān)趨勢變化。 低空相對濕度情況顯示(圖3b)850 hPa 的相對濕度主要集中在(20%,80%]區(qū)間,且低能見度天氣與非低能見度天氣與相對濕度的對應關(guān)系呈反相關(guān)趨勢,高濕度場對應非低能見度天氣的多,低濕度場對應低能見度天氣的多, 即850 hPa 相對濕度較小時,低能見度天氣較易發(fā)生。其原因為冬季天山山區(qū)中段上空極易出現(xiàn)偏東或東南風, 使850 hPa 變干變暖,形成干暖蓋,使機場能見度持續(xù)走低。
這種情況在圖3c~3d 中也有所反映: 低能見度天氣形勢下,850 hPa 為偏東或東南風(風向角100~200°)次數(shù)偏多且風速較大,西北風(風向角250~350°)偏少且風速基本維持在10 m/s 以下;與此對應,非低能見度天氣下,西北風明顯變強,次數(shù)增多且風速較大,東南風相對減弱。 即東南風風速大,機場能見度低且維持時間長, 其原因為東南風層有助于逆溫層和850 hPa 干層的建立和維持, 靜穩(wěn)結(jié)構(gòu)更加深厚, 所以東南風對機場低能見度天氣的出現(xiàn)及維持有著較為重要的作用。 如果機場上空為西北風且風速較大,則說明有擾動系統(tǒng)影響機場,有利于靜穩(wěn)結(jié)構(gòu)的破壞,能見度轉(zhuǎn)好。

圖3 烏魯木齊機場低能見度天氣與非低能見度天氣對應的逆溫(a)、850 hPa相對濕度(b)、850 hPa風場(c、d)的變化曲線
除了低層大氣垂直要素分布狀態(tài)以外, 地面空氣飽和情況也是大霧發(fā)生的重要條件。 由圖4a 可知,11 月—次年2 月機場氣溫多在-20~0 ℃,低能見度和非低能見度天氣對應的氣溫變化趨勢較為一致,未表現(xiàn)出明顯的差異。 地面相對濕度也表現(xiàn)有同樣的特點(圖4b), 相對濕度多集中在60 %以上,40%以下的相對濕度出現(xiàn)的概率較小。值得注意的是,93.5%的低能見度天氣出現(xiàn)時地面相對濕度>80%。配合地面風場的分布特點(圖4c),風速≤2 m/s出現(xiàn)概率為93.4%,低能見度天氣下,風速≤2 m/s出現(xiàn)累計概率為96.2%, 其中又以風向不定的情況居多, 累計概率為43.4%。 但就風向和風速的分布上, 低能見度和非低能見度天氣上并沒有較為明顯的區(qū)別,一致性較強。 故選取>5 ℃和<-20 ℃作為地面溫度的閾值,>80%作為地面相對濕度的閾值,風速≤2 m/s 風向任意作為地面風場的閾值。
基于上述各因子與能見度之間的關(guān)系, 結(jié)合機場實際工作和數(shù)值預報產(chǎn)品類型, 最終確定表征低層氣象要素的因子, 包括925、850 hPa 的相對濕度和風場;選取T850hPa-T1000hPa、T850hPa-T2m、T925hPa-T1000hPa、T925hPa-T2m溫差表示逆溫,共計8 個氣象因子;表征地面氣象要素因子包括10 m 風場,2 m 溫度場及1000 hPa 相對濕度,共計3 個氣象因子。
利用程序讀取數(shù)值預報產(chǎn)品, 提取圖1 各點對應的11 個氣象因子, 計算99 個診斷量, 共同構(gòu)成備選因子庫,計算各因子與機場能見度的相關(guān)系數(shù),在與預報時效對應的預報場單站位置及小幅影響范圍內(nèi),選取物理意義好、相關(guān)性高、獨立性強的因子進入模型。表1 列出了相關(guān)系數(shù)超過α=0.01 顯著性檢驗的因子共計7 個,進入樣本建模。值得注意的是地面3 個要素場均未進入到模型中, 分析原因可能為EC 產(chǎn)品對近地面層氣象要素的預報準確度不高,尤其在地面風場上,風速≤2 m/s 與風速>2 m/s對應的能見度不同的特點,EC 產(chǎn)品對此很難分辨;由圖4 可知,11 月—次年2 月機場低能見度與非低能見度天氣對應地面要素場變化沒有低層氣象要素變化明顯, 且基本保持了較為一致的變化趨勢和數(shù)值范圍,故而在相關(guān)性的計算中未通過檢驗。
將2015—2018 年機場METAR 報文中能見度作為建模樣本,除去非霧原因引起的能見度≤800 m的時次, 樣本總數(shù)為2037 個, 其中低能見度個例270 個,氣候概率為13.25%;保持低能見度與非低能見度天氣個數(shù)比例(1∶7.5) 抽取樣本總數(shù)70%(1426 個樣本) 作為訓練樣本,30%(176 個樣本)作為檢驗樣本進行建模和檢驗。 然后將訓練樣本的各個預報因子按照表1 的規(guī)則進行轉(zhuǎn)化,再將預報因子分別作歸一化處理, 使每一個因子的數(shù)據(jù)落入?yún)^(qū)間[0,1]。 公式為:

圖4 烏魯木齊機場低能見度天氣與非低能見度天氣對應的機場溫度(a)、機場相對濕度(b)、機場風場(c)的變化曲線

其中xki是第k 個因子的第i 個數(shù)值,Xki′是該因子歸一化后的值, min(xk)、max(xk)分別為第k 個預報因子數(shù)值序列的最小值和最大值。其中k=1,2,…,7;公式(1)中i=1,2,3,…,1426;公式(2)、(3)中i=2,3,…,1426。 同理將預報對象也做歸一化處理。

表1 與能見度高相關(guān)性的預報因子列表
本文選取SVM 建模中穩(wěn)定性較好且處理非線性問題較為常用的多項式核函數(shù)(Poly)和徑向基核函數(shù)(RBF)進行建模實驗及對比分析,表2 給出基于上述2 種核函數(shù)建模的訓練樣本結(jié)果。 表3 為其對應的檢驗樣本結(jié)果。

表2 預報模型試驗結(jié)果

表3 預報模型檢驗結(jié)果
在模型建立中,采用了TS 評分機制,選用訓練樣本TS 最高作為最優(yōu)模型的選取標準,最終確定2種核函數(shù)的最優(yōu)參數(shù)匹配如表2 所示。 分析訓練結(jié)果可知,2 種核函數(shù)評分均較高, 其中RBF 作為核函數(shù)的預報準確率為89.20%,空報率和漏報率分別為6.25%和10.79%,TS 評分為0.84, 遠高于低能見度天氣出現(xiàn)的氣候概率。 Poly 作為核函數(shù)進行SVM分析的TS 評分為0.80,準確率84.09%,空報率和漏報率分別為6.25%和15.90%。相對于RBF 核函數(shù)而言,漏報率偏高。綜合分析模型預報準確樣本和漏報樣本可知,模型對于實況為[500 m, 800 m]范圍內(nèi)的低能見度的天氣檢驗效果相對平穩(wěn), 對于實況為≤300 m 的低能見度天氣表現(xiàn)出較為明顯的振蕩特點:預報準確時誤差較小,漏報時誤差較大。
RBF 核函數(shù)表現(xiàn)出了更為準確的預報效果,分析其原因為:對于不同目標量建模或是相同目標量,選取不同時次的樣本做訓練樣本都有可能得到不同的最佳核函數(shù)。RBF 核函數(shù)與Poly 核函數(shù)相比具有參數(shù)少的優(yōu)點。 因為參數(shù)的個數(shù)直接影響到模型選擇的復雜性,本文建模引入因子7 個,對于機器學習來說,因子很少;再有RBF 核函數(shù)具有唯一最佳逼近的特性,且無局部極小問題存在,并且具有很強的聚類分析能力。 低層是否存在東南風與機場能見度變化有比較顯著的關(guān)聯(lián), 在能見度的預測中權(quán)重較大,聚類分析效果明顯;另外當Poly 核函數(shù)階數(shù)比較高的時候, 核矩陣的元素值將趨于無窮大或者無窮小,易出現(xiàn)“維數(shù)災難”。所以就本文選取的訓練樣本及檢驗樣本而言,以RBF 為核函數(shù)的建模對烏魯木齊機場能見度的變化有較好的預測能力且準確性較平穩(wěn)。
為了進一步分析基于SVM-RBF 建模產(chǎn)品在機場實際工作中的應用價值, 對模型的檢驗樣本進行預報誤差分析。定義800 m(含)為評判標準:實況值低于(含)800 m,模式預測值為低于(含)800 m 則為預報準確,空報和漏報原則以此類推。
檢驗樣本中模型預測準確次數(shù)73 次,具體分布如圖5a 所示。 在預報準確的檢驗樣本中,模型預測值整體偏小,偏小最大值為721 m;模型預測值偏大9 次,偏大最大值為200 m。 實況與模型預測值偏差主要集中在(-100 m,100 m)區(qū)間內(nèi),共計出現(xiàn)24個時次,其次為(300 m,500 m]區(qū)間,共計出現(xiàn)17 個時次。且比較不同能見度級別實況與預測值誤差,具體表現(xiàn)為: 實況能見度≤300 m 的模型絕對平均誤差為64.9 m; 能見度≤500 m 的模型絕對平均誤差為136.3 m;能見度≤800 m 的模型絕對平均誤差為274.1 m,基于上述分析模型準確度整體平穩(wěn)且誤差較小。

圖5 RBF 預測能見度值與實況能見度值對比
低能見度天氣檢驗模型漏報次數(shù)21 次,其與實況能見度的對比分析如圖5b 所示。 在漏報的樣本中, 模型預測值與實況值相差較大, 偏差最大值為1470 m,偏差最小值為280 m。 且比較不同能見度級別實況與預測值誤差,具體表現(xiàn)為:實況能見度≤300 m 的模型絕對平均誤差為1166 m;能見度≤500 m 的模型絕對平均誤差為917.6 m; 能見度≤800 m 的模型絕對平均誤差為683.7 m。由此可見模型對于能見度≤300 m 的預報誤差大, 隨著實況能見度的增加絕對誤差有所減小。 綜合分析模型預報準確樣本和漏報樣本可知,模型對于實況為[500 m,800 m] 范圍內(nèi)的低能見度的天氣檢驗效果相對平穩(wěn), 對于實況為≤300 m 的低能見度天氣表現(xiàn)出較為明顯的振蕩特點:預報準確時誤差較小,漏報時誤差較大。
為了進一步研究模型在天氣過程預報的應用情況,本文選取模型預報效果較好的2017 年11 月18日20 時起報的21 h 預報產(chǎn)品與實況進行對比(圖6)。其中實心三角標注的時刻是檢驗模型輸出數(shù)據(jù),其余為訓練模型輸出數(shù)據(jù)。 除了12 h 和15 h 預報場中能見度值相差較大, 其余各時次數(shù)值及變化趨勢預報準確。

圖6 2017 年11 月18 日天氣過程實況及模型預測能見度對比
2017 年11 月16—17 日,烏魯木齊機場出現(xiàn)持續(xù)30 h 的降雪天氣, 為近地層提供了充足的水汽。后續(xù)新疆地區(qū)500 hPa 形勢場為偏西氣流轉(zhuǎn)弱脊控制,850 hPa 形勢場有暖舌自伊犁河谷東伸并緩慢
加強。 至18 日20 時—19 日08 時(圖7),850 hPa風場顯示機場低空東南風場建立并持續(xù)加強, 近地面逆溫層深厚且穩(wěn)定的形勢。
按照表1 的物理量及相應格點, 調(diào)取EC 細網(wǎng)格本次預報場資料如表4 所示, 可見在中低層東南風及近地面逆溫建立、 中低層濕度場的預測上,EC細網(wǎng)格產(chǎn)品總體預報較為準確。 具體分析本次天氣過程可知, 在9 h 預報中925 hPa 東南風停止并轉(zhuǎn)為西北風,850 hPa 仍在維持, 近地面逆溫有所減弱, 至12 h 預報開始925 hPa 西北風加強,850 hPa東南風漸弱,15 h 預報顯示850 hPa 干層逐漸減弱,濕度加強,850 hPa、925 hPa 西北風層建立, 模型預報能見度有所上升。 與實況氣象要素分布相比,在12 h(圖7c)風場的變化中EC 模式預報東南風轉(zhuǎn)西北風較早,從而導致SVM 預測模型結(jié)論的偏差。 所以,SVM 預測模型輸出能見度與實況的偏差來源于EC 細網(wǎng)格產(chǎn)品準確度的偏差, 而SVM 預測模型建立起來的能見度預報模型相對來說較為合理和穩(wěn)定,隨著EC 細網(wǎng)格產(chǎn)品準確率的提升,SVM 預測模型輸出的能見度產(chǎn)品也將有進一步的改進。
(1)機場低能見度天氣對應低層大氣相對濕度較小,逆溫較大,東南風較多且風速較大。 依據(jù)各因子對能見度變化的敏感程度進行區(qū)間分類的SVM建模預測效果較好。
(2)基于Poly 和RBF 所建的SVM 推理模型對低能見度天氣均具有一定的預測能力,TS 評分分別為0.80,0.84,均超過低能見度出現(xiàn)的氣候概率。 檢驗樣本中,Poly 和RBF 的TS 評分0.50,0.64, 整體預測效果良好,且RBF 建模效果更佳。
(3)分析SVM-RBF 模型輸出產(chǎn)品的預報誤差,在預測準確的檢驗樣本中, 預報誤差主要集中在(-100 m,100 m],其次為(300 m,500 m],且模型在不同級別能見度的預報誤差整體偏小。 但針對模型漏報的低能見度天氣則有能見度越低, 預報誤差越大的特點, 即模型的振蕩性在漏報的樣本中表現(xiàn)顯著。
(4)分析模型預報效果較好的2017 年11 月18日20 時起報的21 h 低能見度天氣預報可知,SVMRBF 模型預測效果較好且模型穩(wěn)定, 隨著EC 細網(wǎng)格產(chǎn)品準確性的提升,SVM-RBF 預測模型輸出的能見度產(chǎn)品也將有進一步的改進。
最后需要指出的是,EC 細網(wǎng)格預報產(chǎn)品對近地面氣象要素預報準確性不高, 未能與機場的能見度建立很好的關(guān)系; 再者模型預報產(chǎn)品中沒有輸入前一個時次實況能見度數(shù)值作為訓練因子, 使得模型的輸出產(chǎn)品具有較大的離散性, 本文曾嘗試將前一時次的實況能見度作為因子進入模型進行計算,得到的結(jié)論顯示前一時次的能見度在模型中占有過大的比重, 致使整個模型成為了前一時次能見度的外推,對能見度的預測,尤其是生消沒有太好的實際價值,如何將實況能見度較好地引進模型中,還需要更合理的方法。

圖7 基于再分析資料的2017 年11 月18 日天氣過程中氣象要素的垂直分布

表4 2017 年11 月18 日20 時起報的21 h 數(shù)值預報產(chǎn)品