林曉霞,馮業榮,陳子通,簡云韜
(1. 中國氣象局廣州熱帶海洋氣象研究所/廣東省區域數值天氣預報重點實驗室,廣東廣州510641;2. 香港城市大學能源與環境學院/佳達亞太氣候研究中心,中國香港)
GRAPES(Global and Regional Assimilation and PrEdiction System)模式是在國家科技部和中國氣象局共同支持下我國自主研發的新一代全球/區域通用數值天氣預報系統,近年來得益于該模式的大力發展和改進,填補了我國數值天氣預報領域的多項技術空白[1-4]。對臺風、暴雨、大雪等實時應用結果表明GRAPES 模式對中尺度系統有較好的預報表現[5-9]。 GRAPES_GZ_R 1 km(GRAPES Guangzhou Regional Modeling System)華南短臨預報模式是中國氣象局廣州熱帶海洋氣象研究所區域數值天氣預報重點實驗室基于現有的中尺度華南模式(GRAPES_GZ 3 km),結合局地資料同化、模式動力過程和模式物理方案多年研究成果,逐漸形成具有區域特色的公里尺度區域模式,該模式具有三維參考大氣動力框架,結合了高分辨率華南區域地形數據集以及雷達資料云分析技術等具有華南區域特色的模式技術方案,建立了穩定、合理、準確的業務模式預報系統,為廣東省氣象部門短時數值智能網格預報業務提供強有力的支撐。但是目前針對該模式產品性能的客觀檢驗較少,對超高分辨率的短臨模式目前仍沒有合理的評估方法,模式對降水及其他要素的預報能力究竟如何,其預報產品能否為預報員提供一定的應用和指導價值仍需要分析探索。
近年來,針對國內外中尺度模式降水模擬的評估工作已有不少,潘留杰等[10]利用日本高分辨率模式產品,結合泰勒圖等多種技巧評分,對不同預報時效降水預報產品進行評估,發現模式對我國東部沿海降水具有一定模擬能力。此外,潘留杰等[11]還利用鄰域法(Fractions Skill Score)[12]和ETS(Equitable Threat Score)評分指數對歐洲數值天氣預報中心(ECMWF),日本以及我國T639模式降水產品在夏季不同空間尺度的預報能力進行評分,發現不同模式對應的最佳空間尺度各有不同,但ECMWF 模式在系統和整體降水模擬上最好,且各家模式在7 月的預報表現最好。曹越等[13]利用標準差和期望重新定義一個R指數并應用于ECMWF 高分辨率模式(ECMWF-Hi)和ECMWF集合預報(ECMWF-EPS)產品中,評估表明盡管ECMWF-Hi 在降水預報準確度上沒有更優于ECMWF-EPS,但在預報離散度上存在優勢,尤其是在極端降水的量級上。另外一些研究[14-16]同樣表明高分辨率模式在暴雨預報上存在較好的模擬能力。對于GRAPES 模式的評估,也有一些研究針對不同的區域以及不同分辨率版本進行分析。結合熱力和動力檢驗,彭新東等[17]對GRAPES 模式在2008年華南地區的兩次夏季暴雨過程進行數值預報檢驗,評估模式對降水的總體刻畫準確,但對局部降水的空間分布細節等仍存在一定不足。許 晨 璐 等[18]基 于 GRAPES-Meso4.0_10 km 和GRAPES-Meso4.0_3 km 兩個模式,對比我國東南地區夏季定量降水預報,評估發現GRAPESMeso4.0_3 km模式在日平均降水量和強降水過程相比GRAPES-Meso4.0_10 km 模式有一定提高,但在空間相關系數和弱降水過程頻率表現仍存在較大不確定性。
本文以GRAPES_GZ_R 1 km 模式(下文簡稱“1 km 模式”)預報結果為評估對象,采用傳統點對點評估方法、空間檢驗方法以及統計分析等手段,對GRAPES_GZ_R 1 km 模式預報的降水、溫度和風場等要素進行評估。研究時段為2019 年6 月5日—7 月14 日,期間廣東省持續性暴雨多發,又恰逢龍舟競渡高峰期,其中6月9—14日、22—25日、7月9—11日等廣東全省多次出現大范圍大雨到暴雨局部大暴雨的降水過程,能夠代表模式在不同天氣過程下的預報表現,同時與GRAPES_GZ 3 km模式(下文簡稱“3 km 模式”)的預報評估結果對比,以期通過對該模式預報結果的檢驗,分析不同分辨率中尺度模式的預報水平。
本文使用的1 km模式是基于GRAPES區域模式[2]開發的版本。該模式是一個非靜力經緯網格模式,時間差分格式為半隱式半拉格朗日方案,水平網格為ARAKAWA-C 網格,垂直方向采用Charney-Philips分層設計,垂直坐標為高度地形追隨坐標。目前3 km模式和1 km模式使用的物理方案包括:WSM6云微物理參數化方案、RRTMG長短波輻射方案、MRF 邊界層方案和SLAB 陸面方案。由于1 km 模式分辨率較高,所以關閉對流參數化方案,3 km模式則采用NSAS對流參數化方案。模式側邊界通過Davies松弛邊界條件來處理[19]。
在本文的回算試驗中3 km 模式使用0.125 °分辨率的ECMWF(European Centre for Medium-Range Weather Forecast)分析場和預報場提供初始場和邊界條件,模式分辨率為0.03 °,起始經緯度為93.04 °E,16 °N,水平網格數為566×459,垂直層數為65 層,模式頂高度為30 km。而1 km 模式的初、邊界條件由3 km 模式的預報場提供,模式分辨率為0.01 °,起始經緯度為107 °E,18 °N,水平格點數為1 201×901,垂直層數為65 層,模式頂高度為60 km。
模式 資料 選取 2019 年 6 月 5 日 —7 月 14 日 1 km 模式和3 km 模式的預報場,模式每天00 時、12時啟動,向前積分24 h。觀測資料來自中國氣象局預報業務平臺MICAPS 提供的華南地區逐小時觀測實況。
2.2.1 經典評分方法
傳統的降水檢驗通常是基于觀測和預報按分類后列出的頻數表統計結果來計算各統計量,該表成為二分類列聯表(表1),相應公式(1)~(3)如下,式中NA 為預報命中頻次,NB 為漏報頻次,NC為誤報頻次,ND 為命中“否”頻次。原始觀測資料為自動站逐時降水站點資料,為了方便評估,采用鄰近點插值法將模式數據插值到對應的站點上,形成模式站點預報場,對站點進行逐一評分。


表1 降水的檢驗分類
2.2.2 分數技巧評分方法
傳統預報檢驗具有一定的參考意義,但是隨著模式分辨率的提高,微小的位置變化和形態改變都會對評分的結果造成很大的影響。分數預報技巧FSS(Fraction Skill Score)是屬于模糊檢驗法中的一種,通過對比預報和觀測相應鄰域內的特征差異,是“面對面”的檢驗,衡量空間場的相似性[12]。通過計算給定范圍的窗區中心格點的概率值,即某一物理量超過給定閾值q的格點數占窗區總格點數的比值,將實況場和預報場轉化為概率分布場,通過式(4)計算給定鄰域半徑和閾值的FSS評分。

式中M(i,j)為窗區內預報概率值,O(i,j)為窗區內觀測概率值,Nx和Ny分別表示評分區域內x方向和y方向窗口的數量。與TS 評分不同,計算過程中將原始站點數據插值到與相應模式分辨率相匹配的網格上進行計算。FSS分值為0~1,其中0表示預報和觀測完全不匹配,1 表示完美匹配。同時,類似確定性預報形勢場指標(ACC),FSS 也存在如ACC大于0.6即可表示預報效果可用的標準,本文簡單定義對于不同給定降水閾值下,FSS 大于0.5的空間尺度即為具有預報技巧的最低尺度大小。預報技巧尺度是衡量預報對于所檢驗的對象在空間位置上的把握能力,預報技巧尺度越小,表示預報結果相對于實況位移偏差越小,在較小的窗區尺度就能體現出有用的預報信息;反之則表示預報誤差越大。
圖1 是 2019 年 6 月 5 日 —7 月 14 日 1 km 模式預報與觀測的廣東省日平均雨量序列,本文為了對比不同起報時刻的預報效果,將不同起報時間的預報結果放在一起分析。從廣東省日平均降水上看,1 km 模式在該時段內預報的降水演變趨勢和量級都與實況整體相符,尤其幾次廣東省較強降水過程,模式均有很好體現,說明1 km 模式對廣東地區降水具有較好的模擬能力,預報結果穩定可信。此外,從降水的空間分布上來看(圖2),1 km 模式的兩個起報時次模擬的降水分布都與實況大體相近,但00時的預報結果更優,尤其是在珠三角到粵東北一帶。降水誤差集中分布在珠三角北部至粵東北一帶,12 時的誤差范圍和量級均大于00 時的預報結果,模式在12 時起報結果中可能存在較多虛假降水和模擬降水量級偏強等問題,與圖1 反映的結果相對應。對比不同模式預報結果,不管是00 時還是12 時起報,1 km 模式的預報效果均優于3 km 模式。3 km 模式的預報在肇慶、云浮一帶存在明顯的偏差,而1 km 模式則更接近實況,在珠三角到粵東北的誤差量級也明顯比3 km 模式小,3 km 模式預報存在大范圍明顯的過度預報或漏報的情況。

圖1 GRAPES_GZ_R 1 km模式預報與實況的廣東全省日平均雨量序列
Taylor等[20]針對多統計量的集成問題,設計了Taylor分析,泰勒圖能有效將多個統計量在同一個二維平面展示出來,更直觀反映模式評估結果。圖 3a、圖 3b 是 1 km 模式和 3 km 模式不同起報時次的24 h 預報降水泰勒圖,可看出在空間相關系數上1 km模式總體表現與3 km模式十分接近,均為0.5 左右。而通過對比觀測和模式的標準差比值(預報場到原點距離)以及對應均方根誤差(預報場到Ref 的距離),發現兩個模式在降水量級上仍有一定的不確定性,相比之下1 km 在量級的預報能力上有一定改進。00 時起報1 km 模式標準差比值為0.99,總體模擬與觀測十分接近,而3 km的標準差比值為1.23,存在明顯的過度預報。12 時情況與00 時類似,1 km 模式和3 km 模式的預報在空間形態上總體接近,但1 km 模式在量級模擬上表現略優,不過兩個模式的表現都較00 時有所下降。這里結合之前分析(圖2),我們考慮1 km模式在量級預報上有優勢,但降水的空間分布上沒有較明顯的改進,這一問題在之前研究也類似指出[21],至于其原因是否與分辨率有關,還有待進一步研究。在這里,所給出泰勒圖的計算結果均為研究時段內的平均態,文中其余泰勒圖也是如此。

圖2 00時實況日平均降水(a)、12時實況日平均降水(b)、00時起報(c~f)和12時起報(g~i)的GRAPES_GZ_R 1 km模式(c、d、g、h)和GRAPES_GZ 3 km模式(e、f、i、j)不同預報時效的過程累積日平均降水和偏差分布

圖3 GRAPES_GZ_R 1 km模式和GRAPES_GZ 3 km模式00時起報(a、c)和12時起報(b、d)的24 h降水預報泰勒圖(a、b)和2 m氣溫預報泰勒圖(c、d)
以插值后的模式站點預報數據為基礎,采用傳統的二分類時間檢驗方法,利用同時段的站點觀測資料對1 km 模式和3 km 模式的降水預報進行整體評估。從廣東全省日平均雨量和兩個模式的晴雨準確率(圖4a~4b)可看到,研究時段內1 km模式的晴雨準確率均明顯優于3 km模式,平均達0.8 以上,而3 km 模式評分結果維持在0.5 左右,同時也可看出不同日期的預報能力,對于較大降水的日期晴雨準確率更高。圖4c、圖4d 給出1 km 模式和3 km 模式24 h 預報的不同降水量級的TS 評分結果,對于不同起報時次和降水閾值,1 km 模式的結果都明顯優于3 km 模式,其TS 評分是3 km 模式的兩倍以上,隨著降水閾值的增大差異更加明顯,說明1 km 模式對強降水預報的表現能力優于3 km模式。
溝通和合作能力培養有待進一步加強 班級授課形式注重講授,學生之間、學生與教師之間溝通交流機會少。模式化的教學實踐難以適應學生個體差異性,學生之間的團隊合作意識和溝通意愿不足;難以適應創新型國家建設對勞動者團隊精神、協作意識等創新能力的要求。
預報偏差評分結果(圖4e~4h)上看,0.1 mm預報1 km 模式評分結果多數集中或等于1,說明模式預報與觀測較相符,空、漏報較少,僅有個別時段存在過度預報的情況(BIAS>1),相比之下3 km 模式預報明顯偏弱(BIAS<1),存在較多的漏報。對于5 mm 預報,兩個模式都存在一定程度上的空、漏報,不同起報時次的評分變化趨勢不一樣,間接反映了模式不同起報時間的預報對降水過程的刻畫是有區別的。

圖4 2019年6月5日—7月14日GRAPES_GZ_R 1 km模式和GRAPES_GZ 3 km模式不同起報時次預報晴雨準確率時間序列及實況24 h累積降水(a~b)、24 h累積降水平均TS評分(c~d)、BIAS評分(e~h)
綜上所述在傳統評分方法嚴格遵守點對點的情況下,兩個模式的TS 評分均能超過0.1,尤其是1 km模式對于25 mm以上降水評分平均大于0.2,說明該模式對于強降水過程具有較好的預報能力。對比之下,1 km 模式預報能力強于3 km 模式,這與模式對于降水的位置和強度的預報偏差有關。
對于高分辨率中尺度模式,業務上也更加關心模式的短臨預報效果。圖5是1 km 模式不同起報時次前6 h TS 評分結果,從逐小時的評分變化上可看到模式起報的前3 h 預報評分最高,3 h 后評分明顯下降,這與模式初值場加入云分析有關,云分析能夠有效緩解模式需要運行幾個小時才能成云致雨的過程,縮短了模式“spin-up”時間。同時也可看出1 km 模式對5 mm 以上的降水評分明顯偏低,起報3 h 后TS 評分小于0.1,預報偏差也明顯大于其他降水量級。對比不同起報時次,00時起報的評分要優于12 時起報,這一結果在前文分析中也多次體現,其原因可能是夜間起報(12時)模式初值場對華南地區海陸熱力性質差異刻畫不到位有關。本文主要針對預報結果進行檢驗評估,對于結果差異的原因暫未做深入分析。

圖5 GRAPES_GZ_R 1 km模式前6 h預報00時起報(a、c)和12時起報(b、d)的逐時降水TS評分(a、b)和BIAS評分(c、d)
傳統檢驗手段嚴格遵守點對點規則,往往會漏掉預報中一些積極的對預報員有價值的空間信息特征。隨著數值模式空間分辨率的提高以及探測手段的豐富,天氣系統的中小尺度越來越受到關注,較之大尺度而言,中小尺度系統局地性強,分布不規則等特點。從前文分析中可看出,傳統檢驗評分結果上看,1 km 模式普遍優于3 km 模式,但是多統計量集成圖體現出來1 km 模式對研究時段內雨帶的整體分布上卻沒有明顯的優勢,這可能和統計變量計算過程中遵循點對點原則有關。FSS 通過給定不同閾值,改變窗區(鄰域)的大小,評估模式預報和實況在鄰域內的發生概率差異來評估模式的預報能力,當模式預報結果相對于觀測存在可接受的位置偏差時仍能給出有價值的評分結果。
本文采用空間鄰域法對1 km 模式和3 km 模式降水預報結果進一步評估,圖6 給出兩個模式6 h 累計降水FSS 評分在不同的鄰域空間尺度以及降水閾值下的結果。可以看出隨著降水閾值的增加,兩個模式6 h 預報累積降水的FSS 評分均呈現下降趨勢。對同一模式而言,00 時起報的評分均高于 12 時,24 h 評分結果與 6 h 類似(圖略)。相比之下,兩個模式在選擇相同降水閾值和鄰域范圍時,各起報時次1 km 模式FSS 評分結果都明顯優3 km模式。

圖6 GRAPES_GZ_R 1 km模式(a、c)和GRAPES_GZ 3 km模式(b、d)00時(a、b)和12時(c、d)起報的不同閾值、不同鄰域半徑下6 h累積降水FSS評分熱力圖
隨著鄰域空間尺度的增加,同一降水閾值上預報和觀測降水發生的概率差異在逐漸減小,降水預報向著較高技巧發展。其中對于0.1 mm、1 mm 及 5 mm 以上的降水,1 km 模式均可在較小的空間尺度上(15 km)呈現較高的預報技巧(FSS≥0.5),遠小于3 km的預報技巧尺度(>35 km),說明1 km模式對所檢驗降水對象的空間位置把握能力更強,可在較小的預報技巧尺度下表現出較好的降水預報能力。隨著降水閾值的增大(>25 mm),可用的預報技巧尺度有所增加,FSS 評分較低,未能達到具有可用預報技巧尺度的要求,需要用更大的空間尺度才能捕捉到對應量級的降水信息。
圖7給出了1 km模式回算試驗在模式區域2 m氣溫和10 m 風場預報偏差(BIAS)和均方根誤差(RMSE)隨時效的變化,可看到1 km 模式對2 m 氣溫的預報整體偏低1~2 ℃。00 時起報對2 m 氣溫的預報效果優于12 時,尤其在前6 h 預報,體現了模式在不同起報時間的預報對于要素預報的刻畫是有區別的,環境場的差異對降水預報結果有直接影響,一定程度上解釋了前文對于不同起報時效模式降水預報結果的差異。風場預報上,不同起報時效無明顯差異,一致表現為風場預報過強。

圖7 GRAPES_GZ_R 1 km模式2 m氣溫(a、c)和10 m風速(b、d)預報平均偏差(預報減去觀測)(a、b)和均方根誤差(c、d)
對比兩個模式的預報結果(圖8),1 km 模式和3 km 模式對于研究時段內廣東省從粵北到沿海日平均溫度逐漸升高的總體趨勢均把握良好。從預報分布上看,粵北地區溫度預報普遍偏低,模式對珠三角地區的高溫區沒有體現出來,預報結果較觀測偏低。對比兩個模式的情況,1 km 模式對珠三角的溫度大值區預報表現優于3 km 模式,對溫度場的局部分布特征把握略優,1 km 模式預報偏差的絕對值基本維持在1 ℃左右。從溫度泰勒圖(圖3c~3d)上也可看出,無論是00 時還是12時,兩個模式都能較好地模擬出溫度的空間分布,總體的空間相關系數均超過0.6,而1 km模式在量級模擬上依然存在一定優勢,溫度的總體偏差較3 km模式小。

圖8 2019年6月5日—7月14日觀測(第一列)、GRAPES_GZ_R 1 km模式預報(第二列)和GRAPES_GZ 3 km模式預報(第三列)的日平均2 m氣溫(第一行)和10 m風速(第二行)的分布
風場的預報上可看出1 km 模式和 3 km 模式在風場模擬上均存在較大偏差,1 km 模式和3 km模式10 m 風速的預報均表現為正偏差(圖9),但 3 km 模式對10 m 風速的預報偏差更小,基本在1 m/s附近波動,1 km模式預報偏差則大多介于1 ~2 m/s 之間,在部分時間段甚至超過了3 m/s。均方根誤差(圖9d)的評估結果與偏差一致,3 km 模式的10 m風預報的均方根誤差更小。與2 m氣溫的預報結果不同,3 km 模式對風速的預測要明顯優于1 km 模式,表現為較小的絕對誤差以及均方根誤差。

圖9 GRAPES_GZ_R 1 km模式和GRAPES_GZ 3 km模式2 m氣溫(第一列)和10 m風速(第二列)預報平均偏差(預報減去觀測)(第一行)和均方根誤差(第二行)
結合降水可看到,1 km 模式氣溫和風速預報偏差隨降水過程存在明顯的波動,出現較強降水過程之后溫度和風場預報誤差明顯增大,溫度整體較實況偏低,風速預報偏強。6—7 月華南地區處于前汛期向后汛期轉變的時期,受冷空氣、切變線以及西南季風等多種系統影響,天氣形勢復雜。模式預報對天氣形勢轉變的刻畫可能存在一定的偏差,未能及時把握主要天氣系統的演變和發展,導致預報結果出現較大的誤差,在模式產品訂正、釋用等需要考慮天氣系統的影響。
選取廣東省內各區域4個國家站作為代表站,分別為韶關、廣州、汕頭、湛江,計算1 km 模式和3 km 模式00 時和12 時起報的24 h 預報結果與觀測資料的絕對誤差(AE),得到研究時段內4 站點2 m氣溫和10 m 風速AE 的時間序列(圖10)。從2 m氣溫的站點時間序列對比可看到3 km 模式預報的氣溫站點AE 存在較大的波動,尤其是沿海測站。比較兩個模式之間預報結果,3 km 模式00 時起報的4 站點在研究時段內的最小AE 為0.08,最大 AE 為 9.28,平均 AE 為 2.97,對應的 1 km 模式 4站點在研究時段內AE 的整體趨勢表明1 km 模式預報與實況較接近,最小AE 為0.01,最大AE 為3.82,平均 AE 為 1.22,相比 3 km 模式有明顯改善。12時起報預報結果與00時類似,1 km 模式整體預報效果優于3 km 模式。相比其他站點,沿海測站(汕頭、湛江)2 m 氣溫預報較實況存在較大偏差,模式對降水、云量以及主要系統的預報效果會影響到氣溫的預報效果,在預報產品氣溫訂正中也要考慮不同地區海拔差異、緯度高低、環流形勢預報等因素的影響。

圖10 GRAPES_GZ_R 1 km模式和GRAPES_GZ 3 km模式24 h預報時效站點2 m氣溫和10 m風速AE時間序列
從10 m風速的站點AE時間序列可看出3 km模式 00 時起報的 AE 整體小于 1 km 模式,4 站點在研究時段內的最小AE 為0.01,最大AE 為5.28,平均 AE 為 1.22,相應的 1 km 模式,最小 AE 為0.1,最大 AE 為 6.09,平均 AE 為 1.97。12 時起報 1 km模式和3 km模式預報結果AE整體趨勢一致。
基于華南地區自動站逐小時觀測資料,采用傳統站點評分、鄰域法等評估華南區域高分辨率數值模式(包括GRAPES_GZ_R 1 km 模式和GRAPES_GZ 3 km 模式)對降水、地面溫度和風場等要素的預報能力。
(1) GRAPES_GZ_R 1 km 模式的降水預報技巧優于GRAPES_GZ 3 km 模式,模式預報以正偏差為主。對于不同起報時間的預報,00 時起報的預報效果優于12 時。GRAPES_GZ_R 1 km 模式的TS 評分是GRAPES_GZ 3 km 模式的兩倍以上,對不同降水閾值的評分均較高。
(2) 分數技巧評分(FSS)顯示GRAPES_GZ_R 1 km 模式 6 h 累計降水預報在 0.1 mm、1 mm 及 5 mm以上的降水均可達到最低預報技巧尺度,對所檢驗降水對象的空間位置把握能力更好。
(3) 2 m 氣溫和10 m 風速檢驗結果表明兩個模式均能較好把握廣東省溫度的分布特征,GRAPES_GZ_R 1 km模式對2 m氣溫預報結果優于GRAPES_GZ 3 km 模式,預報絕對誤差更小;兩個模式對風速的預報整體偏強,預報偏差在1~4 m/s之間,但相比之下GRAPES_GZ 3 km模式在風場預報上表現更好。
(4) GRAPES_GZ_R 1 km 模式的 2 m 氣溫和10 m 風速預報偏差隨降水過程存在明顯波動,出現較強降水過程之后溫度和風場預報誤差明顯增大,溫度整體較實況偏低,風速預報偏強,在模式產品訂正、釋用等需要考慮模式對主要天氣系統的預報情況。
需要指出的是由于模式預報數據的限制,本文評估只針對 2019 年 6 月 5 日—7 月 14 日的預報結果,要想得到更加全面的模式性能評估結果還需要更多的樣本,并針對不同類型的過程進行分類歸納。