葉 茂 吳 鉦 高 松 陳貴川 翟丹華
1 重慶市氣象科學研究所,重慶 401147 2 重慶市氣象臺,重慶 401147
提 要:利用四川盆地東部站點觀測數據和對流可分辨集合預報系統模式數據,評估了該系統各成員及不同物理過程參數化方案在2017—2019年4—9月的降水預報效果。結果表明:概率匹配平均和集合平均相比于各個集合成員存在明顯的預報優勢。Kain-Fritsch(KF)和Betts-Miller-Janjic(BMJ)積云參數化方案的預報效果相對較好,Grell 3D ensemble(G3)方案在48 h 之后的臨界成功指數(critical success index,CSI)評分偏低。Thompson和Morrison微物理參數化方案對小雨量級降水的預報效果較好,WRF Single-Moment 6-class(WSM6)方案對中雨量級降水的預報效果較好,三種方案對大雨和暴雨量級降水的預報效果相當。Mellor-Yamada-Janjic(MYJ)和Mellor-Yamada-Nakanishi-Niino(MYNN)邊界層方案的CSI評分相對較高,Yonsei University(YSU)方案在48 h之后的預報評分較低,但YSU方案多和G3方案搭配使用,其評分偏低主要受G3方案影響。各參數化方案均能把握四川盆地東部的降水分布特征,但對華鎣山、武陵山和大婁山的降水存在高估,對渝中至渝東北的降水存在低估。四川盆地東部的降水預報對積云參數化方案最為敏感。將一個成員的G3方案調整為KF方案后,降水預報評分顯著提升,且集合離散度有所增加,概率預報技巧得到提高。
20世紀90年代以來,集合預報技術得到迅速發展和廣泛應用,在中短期數值天氣預報中發揮著重要作用。全球和區域集合預報技術已相對成熟(陳靜等,2005;Ferranti et al,2015),隨著高性能計算機的發展和對災害性天氣預報技術需求的提升,高分辨率的對流尺度集合預報引起越來越多的關注(Baldauf et al,2011;Schwartz et al,2015;Golding et al,2016;Mengaldo et al,2019)。Clark et al(2012)、Duc et al(2013)、Schellander-Gorgas et al(2017)、王璐和沈學順(2019)研究表明,對流可分辨集合預報能顯著提升區域降水強度和強降水落區的識別能力,在降水日變化、對流系統發生發展等方面提供了更準確的指示信息。四川盆地受東亞季風系統、孟加拉灣西南氣流、西南渦、高原渦等多尺度天氣系統和青藏高原、盆地周邊多尺度地形的共同影響,暴雨災害多發且預報難度大(李強等,2020;方德賢等,2020),因此重慶市氣象局建立了一個多初值、多物理過程的對流可分辨集合預報系統,以期提高四川盆地東部地區的降水預報能力。
李俊等(2015)、Snook et al(2019)、包慧濛等(2019)和徐致真等(2019)研究表明,物理過程方案對降水有顯著影響。Zhang et al(2006)開展了不同模式分辨率、初始條件、邊界條件和物理過程參數化的集合研究,結果表明積云對流參數化方案在夏季極端降水集合研究中發揮著重要作用。Zhu and Xue(2016)通過采用多種物理過程參數化的對流可分辨集合預報系統對北京“7·21”極端降水事件進行模擬研究,結果表明相比于區域平均降水量,降水極值和落區對物理過程參數化方案更為敏感。許建玉(2018)對鄂東一次暖區暴雨過程的模擬表明,不同邊界層方案主要通過影響強對流觸發造成短時強降水的模擬差異。以上研究推動了物理過程參數化方案的改進和發展,但由于參數化方案具有很強的區域性,不同方案對降水發生時間、地點、強度的預報存在差異,不同學者的研究結果也并不一致(Giorgi et al,1993;潘勁松等,2002;楊揚等,2021)。
對于一個完美的集合預報,不同集合成員的預報能力是相當的,但由于集合成員同時采用了不同積云對流、微物理和邊界層等復雜物理過程的參數化方案,不同成員的預報性能會受方案影響而產生一定差別。基于以上考慮,本文評估了2017—2019年4—9月的對流可分辨集合預報系統各成員以及不同物理過程參數化方案在四川盆地東部的降水預報效果,旨在理解不同物理過程參數化方案的預報性能和影響能力,為提高集合數值預報在四川盆地東部的預報能力提供一些參考。
以WRF-ARWv3.5.1模式為基礎構建集合預報系統,垂直方向共分為51層,水平方向采用3層單向嵌套網格,分辨率分別為27、9、3 km。3 km網格距區域滿足對流尺度預報模式的高分辨率要求(Clark et al,2009),未使用積云對流參數化方案,可以顯式地表征對流。最外層區域覆蓋了中國及周邊地區,最內層區域從青藏高原以東延伸至長江中下游平原以西(24.5°~34.5°N、99°~113°E)。系統每日于08時和20時(北京時,下同)啟動,預報時效為96 h。本文的檢驗評估工作主要針對最內層3 km網格距區域進行,檢驗時效為24~96 h。
本系統共設計11個集合成員,采用不同的初值和物理過程參數化方案組合。為體現初值的不確定性,采用美國國家環境預報中心(National Centers for Environmental Prediction,NCEP)提供的0.5°×0.5°分辨率的全球預報系統(Global Forecast System,GFS)和1°×1°分辨率的全球集合預報系統(Global Ensemble Forecast System,GEFS)驅動各集合成員。成員m00為控制預報,背景場和側邊界條件來自GFS;其余10個集合成員的背景場和側邊界條件來自隨機選擇的10個GEFS擾動成員。為體現模式物理過程的不確定性,各集合成員采用不同的積云對流、微物理、邊界層參數化方案組合,具體包括KF、BMJ、G3三種積云對流參數化方案,Thompson、Morrison和WSM6三種微物理參數化方案,MYNN、MYJ和YSU三種邊界層方案(表1)。

表1 集合系統各成員的物理過程參數化方案
利用對流可分辨集合預報系統在2017—2019年4—9月的逐日20時起報的模式數據及相應的觀測數據進行檢驗評估和綜合分析,檢驗要素為24 h累計降水。具體檢驗區域為四川盆地東部,該區域自西向東地形錯綜復雜,依次是川東平原、大巴山山脈、巫山山脈、大婁山山脈以及長江中下游平原西部等地區。檢驗針對此區域內的7 213個觀測站點進行(圖1),觀測數據經過氣象資料業務系統(Meteo-rological Data Operatuional System,MDOS)質量控制(李奇臨等,2018)。

圖1 檢驗站點分布
模式檢驗工具(model evaluation tools,MET)是美國國家大氣研究中心(National Center for Atmospheric Research,NCAR)數值預報發展試驗中心(Developmental Testbed Center,DTC)研發的數值預報檢驗、評估系統(Brown et al,2009)。基于MET計算了24 h累計降水在小雨(≥0.1 mm)、中雨(≥10 mm)、大雨(≥25 mm)和暴雨(≥50 mm)量級的臨界成功指數(critical success index,CSI)和頻率偏差(frequency bias,FBIAS)評分(Gandin and Murphy,1992)。所有模式預報數據均采用臨近點插值方法匹配到觀測站點,并通過1 000次隨機取樣的bootstrap方法計算了2.5%~97.5%的0.05顯著性水平檢驗區間(Pan et al,2014)。
為了全面了解對流可分辨集合預報系統對四川盆地東部降水的預報性能,首先對各集合成員及其集合平均、概率匹配平均的降水預報效果進行檢驗評估(圖2)。概率匹配平均的降水預報效果整體優于集合成員,集合平均對小雨至大雨量級降水的預報效果也好于多數集合成員,說明集合預報對提高預報準確率有顯著作用。但集合平均的暴雨量級降水預報評分相對多數集合成員偏低,這是因為平滑作用造成強降水區的減小(李俊等,2010;傅娜等,2013;杜鈞和李俊,2014)。在11個集合成員中,由GFS驅動的控制預報的預報評分較高,這是因為相比于GEFS驅動場,GFS的初值是統計意義上分析最優的結果,其初始誤差在統計意義上更小,提供了最可能的真實大氣分布;由GEFS驅動的10個成員間的評分差異在小雨和中雨量級隨時效逐漸增大,而在大雨和暴雨量級隨時效的變化特征不明顯,閔錦忠和吳乃庚(2020)指出對流尺度強天氣個例中小尺度擾動受濕對流影響會造成誤差快速增長,對于對流尺度強天氣帶來的暴雨過程,參數化方案差異造成的誤差也會由于濕對流過程快速增長,從而顯示出與預報時效不相關的特征,而小雨量級降水更多受大尺度天氣系統強迫,誤差在短期內近線性增長,因此顯示出隨預報時效線性增加的特征。

圖2 集合成員及其集合平均和概率匹配平均對(a,d,g,j)2017年,(b,e,h,k)2018年和(c,f,i,l)2019年4—9月的24 h累計降水不同預報時效的(a~c)小雨,(d~f)中雨,(g~i)大雨,(j~l)暴雨量級的CSI評分(短豎線為2.5%~97.5%的bootstrap顯著性檢驗區間)
積云對流參數化方案通過局地溫度擾動影響垂直運動,對降水模擬非常重要(陳靜等,2003)。雖然模式最內層區域可以顯式表征對流,但外層區域設置的積云對流參數化方案會通過邊界影響最內層的降水。本文評估的2017—2019年,GEFS是通過EnKF同化方案來進行模式初始化,并采用了SPPT、SKEB、SHUM等隨機擾動物理過程(Zhou et al,2017),因此可以認為GEFS驅動的集合成員的初始擾動具有相同分布特征,不同成員初值場的預報性能在統計意義上相當。基于以上考慮,對GEFS驅動的m01~m10這10個成員展開分析,通過對采用相同積云參數化方案的成員的預報評分進行平均來評估該方案在四川盆地東部的降水預報效果,并利用bootstrap方法進行顯著性檢驗。
圖3為不同積云參數化方案的降水預報CSI評分,評分隨降水量級的增加而逐漸降低,方案之間的評分差異在48 h之后更為顯著。相比于2017年,三種方案對2018年和2019年的評分有所下降,尤其對2019年暴雨量級降水的評分偏低,這和天氣形勢以及GEFS預報場的年際變化有關。對于小雨量級降水,KF和BMJ方案的預報評分較高,其中BMJ方案對2018年和2019年的降水預報更具優勢,在48 h之后的評分始終最高,而G3方案的預報評分相對較低,48 h之后在0.05顯著性水平檢驗上顯著低于KF和BMJ方案。對于中雨和大雨量級降水,三種方案在前48 h的評分接近,之后整體呈現BMJ方案最高、KF次之、G3最低的評分分布特征。對于暴雨量級降水,2017年的前48 h預報以KF方案最好,之后以BMJ方案最好,G3方案的評分在48 h之后偏低;2018年的前72 h預報以KF方案最好,之后以BMJ方案最好,G3方案的評分在72 h顯著偏低;2019年的預報以BMJ方案最好,KF方案次之,G3方案的評分在48 h之后偏低。

圖3 不同積云參數化方案對(a,d,g,j)2017年,(b,e,h,k)2018年和(c,f,i,l)2019年4—9月的24 h累計降水不同預報時效(24~96 h)的(a~c)小雨,(d~f)中雨,(g~i)大雨,(j~l)暴雨量級的CSI評分(黑色實線為2.5%~97.5%的bootstrap顯著性檢驗區間)
進一步對比觀測以及各方案預報的24 h累計降水分布(圖4)。上述研究表明,方案之間的預報差異在48 h之后更為顯著,因而主要對比不同方案60 h時效的預報結果。由觀測可見,降水分布存在年際差異。2017年的降水呈東多西少的分布形式,渝東北至鄂西南、渝東南至湘西北的降水偏多,四川盆地西部的降水相對較少。2018年的降水大值區主要位于龍門山、大巴山脈和武陵山脈,盆地和丘陵地區的降水相對較少。2019年的降水分布較為分散,大值區主要位于大巴山脈、黔渝交界處以及湘西北,巫山至鄂西的降水偏少。

圖4 (a,d,g,j)2017年,(b,e,h,k)2018年和(c,f,i,l)2019年4—9月的(a~c)觀測以及(d~f)KF,(g~i)BMJ和(j~l)G3方案60 h預報時效的24 h累計降水分布
由圖4d,4g,4j可見,三種方案大體模擬了2017年東多西少的降水分布特征,但對東部的降水大值區有所低估,尤其G3方案預報的降水偏少,而對西部的降水低值區有所高估,尤其BMJ方案預報的降水偏多。三種方案均沿華鎣山、武陵山和大婁山預報了東北—西南走向的虛假強雨帶,說明模式過強地體現了地形的作用。圖4e,4h,4k為預報的2018年降水分布,各方案對渝中至渝東北的降水存在低估,對其余地區的降水存在高估,在海拔高度較高的山區高估明顯。圖4f,4i,4l為預報的2019年降水分布,各方案預報的降水大值區由米倉山西移至摩天嶺附近,對湘西北的降水大值區存在漏報。總體而言,各方案能夠把握降水空間分布特征,但預報的降水落區和量級與觀測存在一定偏差。結合各方案對2017—2019年4—9月的24 h累計降水的FBIAS評分可見(圖略),BMJ方案預報的降水整體偏多(FBIAS評分大于1),G3方案預報的降水整體偏少(FBIAS評分小于1),KF方案預報的降水頻率和觀測更為吻合(FBIAS評分最接近1)。
研究表明,微物理過程對降水模擬十分重要(馬嚴枝等,2012;滕方達等,2020)。無論在中小尺度模式還是在全球尺度模式中,云和降水的微物理過程方案都決定著定量降水預報的準確性。本系統采用了Thompson、Morrison和WSM6三種微物理參數化方案(表1),對采用相同微物理參數化方案的成員的預報評分進行平均,從而評估該方案在四川盆地東部的降水預報效果。
圖5為各方案的降水預報CSI評分,評分隨降水量級的增加而降低,且2017年的評分整體高于2018年和2019年。各微物理參數化方案均有一定的預報優勢,對于小雨量級降水,Thompson和Morrison方案的評分較高且接近,WSM6方案的評分相對較低;對于中雨量級降水,WSM6方案的評分相對較高,尤其在48 h之后的評分偏高;對于大雨和暴雨量級降水,2017年前48 h預報以Morrison方案評分最高,之后以WSM6方案評分最高,2018年和2019年不同方案的評分較為接近,方案之間的評分差異在0.05顯著性水平內并不顯著。

圖5 同圖3,但為不同微物理參數化方案的CSI評分
考慮到不同微物理參數化方案搭配了不同的積云和邊界層參數化方案(表1),為了驗證這一結論是否受其他方案的影響,對比了成員m03、m10和m07的預報效果。m03、m10和m07分別采用了Thompson、Morrison和WSM6微物理參數化方案,而其他參數化方案的設置完全一致。由這三個成員的降水預報CSI評分可以得到和圖5類似的結論(圖略),說明對采用相同參數化方案的成員評分進行平均的分類方法對于長期統計檢驗是可行的。
由圖6可見,Thompson和Morrison方案預報的降水分布特征較為一致,WSM6方案預報的降水相對較多。三種方案對渝中至渝東北的降水存在低估,在華鎣山、武陵山和大婁山預報了虛假的強雨帶,尤其WSM6方案過強地體現了山地地形的作用。
行星邊界層直接受下墊面影響,其中的湍流垂直交換十分顯著,合理地描述邊界層對降水模擬非常重要(王璐璐等,2020)。本系統采用了MYNN、MYJ和YSU三種邊界層方案,對采用相同邊界層方案的成員的預報評分進行平均,以此探討該方案在四川盆地東部的降水預報效果。
圖7為各方案的降水預報CSI評分,評分隨降水量級的增加而降低,小雨量級降水的預報評分介于0.40~0.65,暴雨量級降水的預報評分下降至0.05~0.15,且各方案在2018年和2019年的評分低于2017年,說明各方案對暴雨量級降水以及降水年際變化的把握能力還有待提高。對于小雨量級降水,MYJ和MYNN方案的評分相對較高,其中MYJ方案在2018年和2019的預報效果更好,而YSU方案的評分在2017—2019年均偏低。對于中雨和大雨量級降水,2017年前48 h預報以MYNN方案最好,之后以MYJ方案最好,YSU方案在48 h之后評分偏低;2018年和2019年MYNN和MYJ方案的預報評分接近且高于YSU方案,評分差異在48 h之后更顯著。對于暴雨量級降水,2017年前48 h的評分以MYNN方案最高、YSU方案次之、MYJ方案最低,之后以MYJ方案最高、MYNN方案次之、YSU方案最低;2018年72 h時效的評分以YSU方案最低,其余時效的方案之間無顯著的評分差異;2019年以MYJ方案的評分最高,YSU方案的評分在48 h之后偏低。
王晨稀和端義宏(2003)的研究指出,邊界層方案對降水的影響小于積云參數化方案。由表1可見,本系統中選用YSU邊界層方案的成員有m02、m03、m07和m10,其中m03、m07和m10均采用G3積云參數化方案。那么m02、m03、m07和m10平均后得到的低評分主要受YSU方案的影響,還是受G3方案的影響?
為了探討YSU和G3方案對降水預報效果的影響,對比分析成員m02、m05和m10的CSI評分(圖8)。m02和m05分別采用YSU和MYNN邊界層方案,m02和m10分別采用KF和G3積云參數化方案,其他參數設置完全一致(表1)。由圖8可見,m02與m10的評分分布與圖3呈現的KF和G3方案的評分分布相似,m02的評分整體高于m10,進一步驗證了KF方案預報效果優于G3方案這一結論。而相對于圖7呈現的YSU方案顯著低于MYNN方案的評分分布,圖8中m02和m05的評分差異有所減小,m02的評分甚至高于m05,可見YSU方案本身的預報效果并不差,m02、m03、m07和m10平均后的評分偏低主要受G3方案的影響。

圖7 同圖3,但為不同邊界層方案的CSI評分

圖8 同圖3,但為成員m02,m05和m10的CSI評分
圖9為三種邊界層方案預報的24 h累計降水。MYNN、MYJ和YSU方案預報的降水分布和觀測較為一致,但對降水落區和量級的把握還不夠準確,對研究區域西部的降水有所高估,尤其MYJ方案預報的降水偏多,主要偏差位于大巴山脈、華鎣山和大婁山;對東部的降水有所低估,尤其YSU方案預報的降水偏少,主要偏差位于渝中至渝東北地區。

圖9 同圖4,但為(a~c)觀測以及(d~f)MYNN,(g~i)MYJ和(j~l)YSU方案
為了更直觀地對比積云、微物理、邊界層參數化方案的預報差異,繪制了各方案的CSI評分散點分布(圖10)。可見KF或BMJ方案的預報評分在各年份均為最高,而G3方案的預報評分在各年份始終為最低,即積云參數化方案的評分離散度大于邊界層和微物理參數化方案,這一現象在中雨至暴雨量級降水預報中更明顯,說明降水預報對積云參數化方案最敏感,這和Jankov et al(2005)的研究結論一致。

圖10 積云(CU)、微物理(MP)、邊界層(PBL)參數化方案對2017—2019年4—9月的24 h累計降水60 h預報時效的(a)小雨,(b)中雨,(c)大雨,(d)暴雨量級的CSI評分
進一步分析不同積云參數化方案預報差異的可能原因。利用研究區域內的7個探空站點,通過臨近點插值的方法對比KF、BMJ和G3方案預報的850 hPa風速值與觀測的平均絕對誤差(表2)。G3方案預報的風速與觀測的誤差較大,有4個站點的緯向和經向風速誤差大于KF和BMJ方案。圖11為不同積云參數化方案預報的850 hPa水汽通量和水汽通量散度,可見三種方案預報的空間分布基本一致,均與地形密切相關。南方的水汽向北輸送,水汽通量在盆地輻散,而在大巴山、華鎣山和武陵山脈輻合。由預報差值場可見,相對于KF和BMJ方案,G3方案預報的經向水汽通量偏弱,在盆地的輻散和山地的輻合都偏弱,因此其預報效果相對較差。

圖11 2017—2019年4—9月的(a)KF,(b)BMJ和(c)G3方案60 h預報時效的平均850 hPa水汽通量和水汽通量散度空間分布,以及(d)KF與G3方案,(e)BMJ與G3方案之間的差值場(矢量:水汽通量,單位:g·s-1·cm-1·hPa-1;填色:水汽通量散度,單位:10-6 g·s-1·cm-2·hPa-1;灰色實線:500 m地形高度線)

表2 2017—2019年4—9月的KF、BMJ和G3方案60 h預報時效的850 hPa風速與探空站觀測值的平均絕對誤差
基于以上討論設計參數化方案敏感性試驗,以期提升對流可分辨集合預報系統在四川盆地東部的降水預報效果。保持成員m10的初值和測邊界不變,將G3方案更換為KF方案,對比m10在更換方案前(old-m10)、更換方案后(new-m10)的降水預報CSI評分(圖12),可見更換方案后對各量級降水的預報能力在0.05顯著性水平上顯著提高,大雨量級降水在60 h預報時效的評分增幅達20%。進一步計算本系統在m10更換方案后的概率匹配平均(new-PM),與m10 采用G3方案時的概率匹配平均(old-PM)進行對比(圖12),同樣可見調整方案后的預報評分有所增長,評分增幅在48 h之后更顯著。

圖12 新方案(虛線)和舊方案(實線)對2020年6—7月24 h累計降水不同預報時效(24~84 h)的(a)小雨、(b)中雨、(c)大雨、(d)暴雨量級的CSI評分(短豎線為2.5%~97.5%的bootstrap顯著性檢驗區間)
圖13為對流可分辨集合預報系統在m10更換方案前(old schemes)、更換方案后(new schemes)的60 h 降水預報Talagrand分布,其橫坐標表示12個區間,縱坐標為實況值落在各個區間的概率。更換方案前后的Talagrand分布都呈兩端高、中間低的“U型”分布,說明大部分實況值落在了集合成員預報最大(小)值之外的區間。更換方案之后的Talagrand分布更加平直,Outlier評分由0.278降至0.275,集合離散度由8.99上升至9.07,大雨量級降水概率預報的相對作用特征面積由0.719上升至0.723,說明概率預報技巧有所提高,更換方案之后的集合預報系統更可靠。

圖13 更換方案前后的系統對2020年6—7月24 h累計降水60 h預報時效的Talagrand分布
利用四川盆地東部的站點觀測數據和對流可分辨集合預報系統模式數據,評估了該系統在2017—2019年4—9月的降水預報效果,進一步探討不同物理過程參數化方案的降水預報性能。結果表明:
(1)概率匹配平均和集合平均相比于各個集合成員存在明顯的預報優勢。集合成員之間的預報評分差異在小雨和中雨量級隨時效逐漸增大,而在大雨和暴雨量級隨時效增大的特征不明顯。
(2)KF和BMJ積云參數化方案的降水預報效果相對較好,G3方案在48 h后的CSI評分偏低。三種方案預報的降水分布特征和觀測較為一致,但對降水范圍和量級的預報存在一定偏差,BMJ方案預報的降水整體偏多,G3方案預報的降水整體偏少,KF方案預報的降水更接近觀測。
(3)Thompson和Morrison微物理參數化方案對小雨量級降水的預報效果較好,WSM6方案對中雨量級降水的預報效果較好,三種方案對大雨和暴雨量級降水的預報效果相當。三種方案對渝中至渝東北的降水存在低估,在華鎣山、武陵山和大婁山預報了虛假的強雨帶,尤其WSM6方案過強地體現了山地地形的作用。
(4)MYJ和MYNN邊界層方案的CSI評分相對較高,YSU方案的預報評分在48 h之后偏低,但YSU方案多和G3方案搭配使用,其評分偏低主要受G3方案影響。三種方案對研究區域西部的降水有所高估,尤其MYJ方案預報的降水偏多,對東部的降水有所低估,尤其YSU方案預報的降水偏少。
(5)四川盆地東部的降水預報對積云參數化方案最為敏感。G3方案預報的850 hPa 風速和觀測的誤差較大,經向水汽通量相對KF和BMJ方案偏弱,因此其預報效果較差。將一個成員的G3方案調整為KF方案后,降水預報評分顯著提升,60 h預報時效的大雨量級降水評分增幅達20%,集合離散度亦有所增加,概率預報技巧得到提高。
本文通過24 h累計降水分析集合預報系統不同成員的預報效果,得到不同參數化方案的預報性能,繼而對系統的方案組合進行優化,后期還需結合降水日變化特征、空間檢驗開展精細化的檢驗評估,分析不同物理過程參數化方案的預報性能,改進或優化集合預報系統參數化方案,在保證集合預報系統有一定離散度的情況下各成員有相似預報性能。此外,本研究表明不同方案均在華鎣山、武陵山和大婁山預報虛假的強雨帶,說明模式在地形復雜地區存在系統性偏差,具體偏差原因值得進一步研究。