陳俊清,李 毅,王 斌,楊雪寧,劉峰貴
(1. 西北農林科技大學 水利與建筑工程學院,教育部旱區農業水土工程重點實驗室,陜西 楊凌 712100;2. 水利部黃河流域水治理與水安全重點實驗室(籌),河南 鄭州 450003; 3. 澳大利亞新南威爾士州初級產業部,澳大利亞 新南威爾士州 NSW 2650; 4. 青海師范大學 地理科學學院,青海 西寧 810016)
聯合國政府間氣候變化專門委員會(Intergovernmental Panel on Climate Change, IPCC)第六次報告指出,2001—2020年全球平均地表溫度較1850—1900年升高約0.99 ℃[1]。全球變暖背景下,干旱、暴雨和熱浪等極端事件呈增加態勢,不僅加劇了旱澇災害、造成農作物減產,而且嚴重危害了人體健康[2]。極端氣候事件是指天氣變量觀測值超過某一閾值時的小概率事件[3]。氣候變化檢測和指數專家組(Expert Team on Climate Change Detection and Indices, ETCCDI)定義了27個具有代表性的極端氣候指數[4],包括極端氣溫和極端降水兩大類指數,已被廣泛應用于全球或區域尺度極端氣候研究[5]。其中ETCCDI定義了16個極端氣溫指數(extreme temperature index, ETI),可從不同角度評估極端氣溫事件,例如強度指數有最高氣溫(TXx)和最低氣溫(TNn),相對閾值指數有暖晝天數(TX90p)和冷夜天數(TN10p),以及絕對閾值指數霜凍天數(FD0)等[6-7],而酷熱天數(TD30)作為表征極端氣溫事件的絕對閾值暖指數,在極端氣溫事件評估中具有很好的適用性[8]。
大量研究人員對極端氣溫指數進行分析預測,為緩解氣候變化可能造成的不利影響提供了參考。研究者們采用多種方法對ETI與其關鍵影響因子進行建模,并預報極端氣溫事件。如逐步多元線性回歸模型(stepwise multiple linear regression, SMLR)可較好地描述極端氣溫指數與多個影響因子之間的定量關系,如CHEN等[9]利用SMLR模型量化分析了湖北省植被對極端氣候指數的敏感性。隨著大數據時代的到來,各種機器學習模型被廣泛應用,其中隨機森林(random forest, RF)模型是BREIMAN[10]建立的一種組合式機器學習方法,具有準確性高、不易過擬合的優點,能有效處理大數據集并判定變量的重要性。LI等[11]利用機器學習方法對北京地區網格溫度進行了預報。ZHOU等[12]對比了多元線性回歸(multiple linear regression, MLR)、梯度提升決策樹、k-最近鄰法、隨機森林、極端梯度提升(extreme gradient boosting, XGB)和深度神經網絡(deep neural network, DNN)等6種機器學習方法對近地面氣溫的預報。
此外,極端氣溫事件與大氣環流變化的密切聯系為極端氣溫事件的預報提供了新的研究方向。大氣環流會促進高低緯度之間及海陸之間的水熱交換,是影響氣候的重要因素。大氣環流異常往往會導致極端氣溫事件的發生,因此,常用環流指數來定量表征大氣環流的變化,而大氣環流通常分為大氣類、海溫類和其他三類。目前,已有諸多學者開展了大量針對極端氣溫事件影響因素的研究,發現大氣環流對極端氣候事件的發生具有重要影響[13-14]。梁蘇潔等[15]分析并采用了北極濤動、北大西洋濤動、太平洋—北美型和平流層極渦4種大氣遙相關型指數構建了多元回歸統計方程對華北地區冬季極端低溫事件進行了預測。戴聲佩等[13]對華南地區極端氣溫事件進行大尺度環流影響分析,指出厄爾尼諾—南方濤動(El Nio-Southern Oscillation, ENSO)異常與華南地區極端氣溫事件關系密切,南海副高強度指數和西太平洋副高強度指數也對極端氣溫事件有明顯貢獻。
黃河發源于青藏高原,是我國第二大河,流經內蒙古高原、黃土高原和黃淮海平原,最終匯入太平洋。黃河流域位于32°N~42°N,96°E~119°E,面積約7.95×105km2,主要是干旱半干旱地區,其年平均降水量為123~1021 mm,年平均氣溫為-4~14 ℃[16]。全球變暖背景下,黃河流域極端氣溫事件頻發,苗書玲等[17]發現黃河流域極端氣溫指數在流域西北部有明顯的下降趨勢,東部則上升趨勢明顯。張克新等[18]也發現黃河流域極端氣溫事件和厄爾尼諾—南方濤動(ENSO)指數存在多尺度的顯著相關性。盡管目前國內對極端氣溫事件的時空變化及其成因分析已有相關研究,但研究大多采用主成分分析[19]、基于SPSS軟件的因子分析[13]等統計分析方法,對于RF等機器學習模型的應用還較少。此外,諸多學者在單個大氣環流因子如ENSO對極端氣溫事件的影響方面取得了成果[20],但極端氣溫事件的成因復雜,受到諸多因素的共同作用,綜合考慮多種大氣環流因子對黃河流域極端氣溫事件的預測研究還不夠深入。黃河流域是氣候變化的敏感區,長期以來,頻發的極端氣溫事件對該區域生態系統和人類生活造成嚴重影響。探究黃河流域極端氣溫事件的氣候驅動要素及其預測,能夠為適應氣候變化、流域生態環境保護和防震減災提供重要的科學依據。
本文在收集1961年1月—2022年10月環流指數數據和1961年1月1日—2020年12月31日黃河流域80個站點氣溫數據的基礎上,分析黃河流域極端氣溫事件的時空分布特征及其對環流的響應規律,運用SMLR和RF模型模擬極端氣溫指數,并利用環流指數對未來極端氣溫指數進行預測,以期揭示黃河流域極端氣候事件的變化規律及成因,為極端氣溫的預報提供科學依據。
黃河流域80個氣象站點1961年1月1日—2020年12月31日的逐日氣溫數據來源于中國氣象科學數據中心(http://data.cma.cn),經檢查該數據具有一致性和完整性,數據缺失率<1%,如圖1所示。

圖1 黃河流域氣象站點空間分布Fig.1 Spatial distribution of weather stations in the Yellow River Basin
研究選取1961年1月—2022年10月130個環流指數的逐月數據,該數據來源于國家氣候中心(http://cmdp.ncc-cma.net/cn/download.htm),為保證數據的連續性,將連續缺失3個月及以上的環流指數剔除后保留了100個環流指數。
1.2.1 極端氣溫指數的選取和計算
選用描述頻率和強度的6個極端氣溫指數,其中5個是ETCCDI定義的(http://etccdi.pacificclimate.org/list_27_indices.shtml),包括TXx、TX90p、TNn、TN10p和FD0。另一個選用的極端氣溫指數TD30具有生物學重要性且被廣泛應用于極端氣溫事件研究[8]。TXx、TX90p和TD30是極端氣溫暖指數,而TNn、TN10p和FD0屬于冷指數。6個ETI的詳細說明如表1所示。

表1 極端氣溫指數說明Table 1 Description of extreme temperature indexes
根據逐日氣象數據提取了各站點的逐月TXx、TX90p、TNn、TN10p、FD0和TD30。
1.2.2 環流指數的多重共線性分析
選留的100個環流指數之間可能有較高的相關性,因此在建模前需排除相互不獨立的環流指數。利用方差膨脹系數(variance inflation factor, VIF)對環流指數進行多重共線性診斷[21]。VIF的計算式為
(1)

重復多次共線性診斷,逐步剔除VIF>10的具有顯著共線性[22]的環流指數。經分析,最終保留了57個環流指數。
1.2.3 關鍵環流指數的篩選
單站點6個ETI對應的關鍵環流指數具有差異,但相鄰站點關鍵環流指數較相似,故對各站點進行關鍵環流指數的篩選,以便用于建模。用Pearson相關系數r表征每個ETI與各環流指數之間的相關程度[23]。初步分析兩者關系發現ETI和環流指數之間的相關性基本具有12個月的周期,因此,分別計算滯后0~12個月情況下、各ETI與經過多重共線性分析篩選的57個環流指數之間的r值。r的取值范圍是-1~1,r>0(<0)表示正(負)相關,|r|越大相關性越高。根據r的臨界值表[24],當顯著性水平P<0.01、樣本數為720時,r的臨界值為0.097,即具有99%顯著性水平的關鍵環流指數的篩選條件為r>0.097。
1.3.1 逐步多元線性回歸模型(SMLR)
由于ETI與各關鍵環流指數的相關系數r隨滯后時間(月份)變化,因此,取r最大(rmax)時的滯后時間對應的多個關鍵環流指數進行建模。TX90p、TN10p、FD0和TD30表征極端氣溫事件發生的頻率,單位為d、且只能為正值。SMLR模型采用原始數據得到的模擬值存在負值,因此將各站點TX90p、TN10p、FD0和TD30的序列進行對數轉換。以1961—2010年的數據作為率定集,2011—2020年的數據為驗證集,建立各對數轉換后的ETI序列和特定滯后時間下關鍵環流指數之間的SMLR模型[25],該模型表示為
y=a1x1,j+a2x2,j+aixi,j+…+anxn,j+b
(2)
式中:y為ETI,其中TXx和TNn采用原始數據,而TX90p、TN10p、FD0和TD30為對數轉換后的序列;xi,j為對應rmax的滯后時間為j個月的第i個環流指數;ai為偏回歸系數;b為截距。
1.3.2 隨機森林RF模型
隨機森林模型是通過Bootstrap重抽樣構建決策樹的組合分類器模型[10],具有良好的分類篩選與預測性能。利用與SMLR模型數量及滯后時間一致的環流指數,對各ETI采用RF建模,以1961—2010年的數據作為率定集,2011—2020年的數據為驗證集,并與SMLR模型的建模效果進行比較。
在RF模型訓練中需確定2個參數:決策樹數量(ntree)和每個樹節點上隨機變量的數量(mtry)。對于回歸問題,ntree一般取500;mtry設置為回歸模型所有預測變量數的1/3[26]。RF模型通過均方誤差增量(increase in mean squared error, IncMSE)評估變量的重要性,對每棵決策樹的輸入變量xi進行隨機擾動后,檢驗袋外數據(out of band, OOB)的均方誤差,IncMSE值越大表示變量越重要[27],計算公式為
(3)
式中:IncMSEi為第i個變量的IncMSE(%);MSEi1,OOB為未受到擾動的袋外數據的均方誤差;MSEi2,OOB為隨機擾動后袋外數據的均方誤差。
由于模型實際包含的環流指數數量及其重要性在黃河流域80個站點存在差異,因此,提出新的重要性評估指數RankYR(%),以表征各環流指數在整個黃河流域上對極端氣溫指數的影響程度,表達式為
(4)
式中:Ranki,YR為第i個環流指數的黃河流域總體重要性(%);SIii為站點ii模型實際包含的環流指數的數量;Ranki,ii為第i個環流指數在站點ii中的變量重要性名次;Impi,ii為第i個環流指數在站點ii的變量重要性IncMSE(%);SImax為黃河流域實際包含環流指數最多的站點的環流指數數量。
RankYR值越大,說明該環流指數對整個黃河流域ETI的影響越大,反之亦然。
用決定系數(R-square,R2)、林氏一致性相關系數[28](Lin’s concordance correlation coefficient, LCCC)、平均絕對誤差(mean absolute error, MAE)以及均方根誤差(root mean square error, RMSE)來評估SMLR和RF模型率定和驗證的效果。評價指標的計算式為
(5)
(6)
(7)
(8)

黃河流域1961—2020年6個ETI的年際變化曲線及年極端氣溫事件的多年平均情況如圖2所示。從時間變化來看,極端氣溫暖指數TXx,TX90p和TD30呈現出波動上升的趨勢,說明黃河流域極端高溫事件的強度和頻率均呈增加趨勢,對全球變暖呈正響應。極端氣溫冷指數FD0、TN10p呈下降趨勢,TNn則呈上升趨勢,表征黃河流域極端低溫事件的發生頻率在減小,強度也有所降低。
在空間分布上,由圖2可知,TXx、TX90p和TD30的值在黃河流域下游低海拔地區均較高;同時該區域的TNn較大,TN10p和FD0的值則較低,表明該地區極端高溫事件的強度和頻率均較大,而極端低溫事件的強度較弱且頻率較低,這可能是受到緯度和地形的影響。總的來說,黃河流域極端高溫事件強度和頻率的空間分布情況與極端低溫事件大致相反。
分析在滯后0~48個月的情況下,ETI與經過多重共線性分析的57個環流指數的Pearson相關系數r的變化,發現其具有明顯的周期性,周期為12個月。因此對滯后時間為0~12個月的情況進行具體分析。57個環流指數中大氣環流指數共35個,分別是北非副高面積指數(North African Subtropical High Area Index, NAHAI)、西太平洋副高強度指數(Western Pacific Subtropical High Intensity Index, WPSH)、東太平洋副高強度指數(Eastern Pacific Subtropical High Intensity Index, EPSH)、太平洋區極渦強度指數(Pacific Polar Vortex Intensity Index, PPVI)、北大西洋—歐洲區極渦強度指數(Atlantic-European Polar Vortex Intensity Index, AEPVI)、北半球極渦中心經向位置指數(Northern Hemisphere Polar Vortex Central Longitude Index, NVCL)、北半球極渦中心緯向位置指數(Northern Hemisphere Polar Vortex Central Latitude Index, NVCLI)、歐亞經向環流指數(Eurasian Meridional Circulation Index, EMC)、亞洲緯向環流指數(Asian Zonal Circulation Index, AZC)、亞洲經向環流指數(Asian Meridional Circulation Index, AMC)、東亞槽位置指數(East Asian Trough Position Index, EATP)、印緬槽強度指數(India-Burma Trough Intensity Index, IBTI)、北極濤動(Arctic Oscillation, AO)、南極濤動指數(Antarctic Oscillation, AAO)、北大西洋濤動(North Atlantic Oscillation, NAO)、北非—北大西洋—北美副高脊線位置指數(North African-North Atlantic-North American Subtropical High Ridge Position Index, NANRP)、東太平洋副高脊線位置指數(Eastern Pacific Subtropical High Ridge Position Index, EPRP)、南海副高脊線位置指數(South China Sea Subtropical High Ridge Position Index, SSRP)、西太平洋副高西伸脊點指數(Western Pacific Sub Tropical High Western Ridge Point Index, WHWRP)、亞洲區極渦面積指數(Asia Polar Vortex Area Index, APVA)、太平洋區極渦面積指數(Pacific Polar Vortex Area Index, PPVA)、北美區極渦面積指數(North American Polar Vortex Area Index, NAPVA)、大西洋歐洲區極渦面積指數(Atlantic-European Polar Vortex Area Index, AEPVA)、太平洋—北美遙相關型指數(Pacific—North American Pattern, PNA)、東大西洋遙相關型指數(East Atlantic Pattern, EA)、西太平洋遙相關型指數(West Pacific Pattern, WP)、東大西洋—西俄羅斯遙相關型指數(East Atlantic-West Russia Pattern, EAWR)、極地—歐亞遙相關型指數(Polar-Eurasia Pattern, POL)、斯堪的納維亞遙相關型指數(Scandinavia Pattern, SCA)、50 hPa緯向風指數(50 hPa zonal wind Index, X50ZW)、赤道中東太平洋200 hPa緯向風指數(Mid-Eastern Pacific 200 hPa Zonal Wind Index, MPZW)、850 hPa西太平洋信風指數(West Pacific 850 hPa Trade Wind Index, WPTW)、850 hPa中太平洋信風指數(Central Pacific 850 hPa Trade Wind Index, CPTW)、850 hPa東太平洋信風指數(East Pacific 850 hPa Trade Wind Index, EPTA)和北大西洋—歐洲環流型C型指數(Atlantic-European Circulation C Pattern Index, ACCP)。15個海溫指數分別為NINO 1+2區海表溫度距平指數(NINO 1+2 SSTA Index, NINO1+2)、NINO W區海表溫度距平指數(NINO W SSTA Index, NINOW)、NINO A區海表溫度距平指數(NINO A SSTA Index, NINOA)、西太平洋暖池面積指數(Western Pacific Warm Pool Area Index, WPWPA)、大西洋多年代際振蕩指數(Atlantic Multi-decadal Oscillation Index, AMO)、親潮區海溫指數(Oyashio Current SST Index, OC)、西風漂流區海溫指數(West Wind Drift Current SST Index, WWDC)、NINO B區海表溫度距平指數(NINO B SSTA Index, NINOB)、熱帶南大西洋海溫指數(Tropical Southern Atlantic SST Index, TSA)、西半球暖池指數(Western Hemisphere Warm Pool Index, WHWP)、印度洋暖池面積指數(Indian Ocean Warm Pool Area Index, IOWPA)、類ENSO指數(ENSO Modoki Index, EM)、東部型ENSO指數(Nino Eastern Pacific index, NE)、熱帶印度洋海溫偶極子指數(Tropic Indian Ocean Dipole Index, TIOD)和副熱帶南印度洋偶極子指數(South Indian Ocean Dipole Index, SIOD)。其他指數共7個,分別為西太平洋編號臺風數(Western North Pacific Typhoon Number, WNPTN)、登陸中國臺風數(Number of Landing Typhoon on China, NLTC)、太陽黑子指數(Total Sunspot Number Index, TSN)、南方濤動指數(Southern Oscillation Index, SOI)、大西洋經向模海溫指數(Atlantic Meridional Mode SST Index, AMM)、準兩年振蕩指數(Quasi-Biennial Oscillation Index, QBO)、大西洋海溫三極子指數(North Atlantic Triple index, NAT)。
圖3以靖遠站TXx為例,對比了在滯后0~12個月的情況下,TXx與經過多重共線性分析的57個環流指數的Pearson相關系數r的變化,其中圖3(a)、(b)區分了對TXx具有較大(|rmax|>0.097)和較小(|rmax|<0.097)影響的環流指數組。由圖3可知:TXx受到多種環流指數的綜合影響,不同環流指數rmax對應的滯后時間不同,大致都在0~12個月的范圍內。說明環流指數對TXx的影響存在滯后性,且該滯后效應存在明顯的周期性。通過這種方式,在建模過程中可直接剔除圖3(b)中的15個環流指數。其他站點的r值各有不同,不再贅述。
進一步對環流指數與TXx在不同滯后時間的Pearson相關關系進行顯著性檢驗,并選擇rmax對應的滯后時間,篩選出|r|>0.097且P<0.01的關鍵環流指數,如圖4所示。關鍵環流指數與TXx在不同滯后時間的|r|的峰值介于0.098~0.893之間,平均為0.441,說明大部分關鍵環流指數對TXx具有較為顯著的影響,rmax對應的滯后時間分別為5、6、11、12個月。其他站點的環流指數滯后時間各有不同,不再贅述。

圖4 靖遠站TXx與關鍵環流指數在不同滯后時間下的相關系數熱圖Fig.4 Heat map of correlations between TXx and key circulation indexes at Jingyuan station under different lag times
2.3.1 ETI的對數轉換及描述性統計特征
因站點較多,此處以靖遠站為例說明4個以d為單位且只能為正值的ETI的原始值及其自然對數轉換值的描述性統計特征,如表2所示。TX90p、TD30、TN10p和FD0原始值的偏度系數分別為1.87、1.75、2.25和0.47,峰度系數分別為2.51、1.91、4.09、-1.60,呈現高度正偏態分布且在峰度上偏離正態分布。對原始值進行對數轉換后,偏度系數分別為1.09、1.01、1.48、0.09,而峰度系數分別為-0.45、-0.65、0.51、-1.81,說明對數轉換值總體上更接近正態分布。其他站點的ETI對數轉換序列統計特征有各自的特點,此處不再贅述。

表2 靖遠站TX90p、TD30、TN10p和FD0的原始值及其自然對數轉換值的描述性統計Table 2 Descriptive statistics of original values and natural logarithmic values for TX90p, TD30, TN10p and FD0 at Jingyuan station
2.3.2 建立的SMLR模型參數特征
基于篩選的關鍵環流指數進行SMLR模型建模,并對黃河流域各站點的ETI進行了模擬,得到具體方程,以靖遠站為例展示了SMLR模型中對應關鍵環流指數的偏回歸系數以及ETI與環流指數之間的相關性為rmax時對應的滯后月數,如表3所示。TX90p和TD30與各環流指數的rmax對應的滯后時間完全相同。TXx和TNn及FD0和TN10p與環流指數的rmax對應的滯后時間也較為接近,與TX90p和TD30的rmax對應的滯后時間接近或間隔6個月。其他站SMLR模型的參數特征也已經獲得,不再贅述。

表3 靖遠站逐步多元線性回歸模型方程的偏回歸系數、截距及rmax對應的滯后時間Table 3 Partial regression coefficient, intercept and the lag time for obtaining the maximum value of r in SMLR model equation at Jingyuan station
2.3.3 基于RF的環流指數重要性排序
以靖遠站為例,基于RF模型獲得的環流指數的重要性IncMSE排序如圖5所示。環流指數對6個ETI的影響程度均不同,其中太平洋區極渦強度指數(PPVI)是影響TNn和FD0的最重要指數,印度洋暖池面積指數(IOWPA)則是影響TX90p和TD30的最重要指數,北大西洋—歐洲區極渦強度指數(AEPVI)和北非—北大西洋—北美副高脊線位置指數(NANRP)分別是影響TXx和TN10p的最重要指數。太平洋區極渦強度指數(PPVI)、北非—北大西洋—北美副高脊線位置指數(NANRP)、南海副高脊線位置指數(SSRP)、東太平洋副高脊線位置指數(EPRP)和北非副高面積指數(NAHAI)對ETI的重要性排序最靠前。其他站的重要性排序結果也已獲得(數據略)。

圖5 靖遠站影響極端氣溫指數的環流指數的重要性排序Fig.5 Rank of importance of circulation indexes influencing extreme temperature indexes at Jingyuan station
IncMSE僅體現環流指數在單站點的重要性,RankYR考慮了黃河流域全部80個站點上選取的關鍵環流指數對ETI的重要性。黃河流域RankYR>5%的環流指數如表4所示。PPVI是影響黃河流域TXx、TNn、TX90p和FD0的最重要的環流因子;NANRP對黃河流域TN10p和TD30的影響最大。

表4 影響黃河流域各極端氣溫指數的環流指數重要性RankYRTable 4 RankYR of circulation indexes affecting extreme temperature indexes in the Yellow River Basin %
2.3.4 模型性能評價
SMLR模型和RF模型模擬的黃河流域80個站點的ETI值的率定和驗證結果如圖6所示。由圖可知:①在率定期,SMLR和RF模型R2的中位數變化范圍是74.7%~95.4%和74.4%~95.9%;LCCC中位數的變化范圍是0.83~0.98和0.78~0.98。SMLR模型MAE中位數的變化范圍是1.6~1.8 ℃和1.3~2.3 d,而RF的是1.6~1.8 ℃和1.3~2.2 d。SMLR模型RMSE的中位數變化范圍是2.1~2.3 ℃和2.7~4.0 d,RF模型的是2.0~2.3 ℃和2.8~3.5 d。②在驗證期,SMLR和RF模型分別解釋了ETI變化的53.4%~94.6%和64.3%~95.4%;而LCCC中位數的變化范圍是0.71~0.97和0.69~0.97。SMLR模型的MAE中位數的變化范圍是1.7~1.8 ℃和1.5~2.9 d,而RF模型的是1.7~1.9 ℃和1.5~3 d。SMLR模型RMSE的中位數變化范圍是2.2~2.3 ℃和3.3~4.7 d,而RF模型的是2.1~2.3 ℃和2.8~4.4 d。2種模型對ETI的預測能力都比較好,其中RF模型模擬TNn的R2、LCCC、MAE和RMSE均優于SMLR模型。RF模型模擬TX90p、TD30和TN10p時僅LCCC稍差,其他情況下RF模型均優于SMLR模型。而RF模型模擬FD0的R2明顯優于SMLR模型,LCCC、MAE、RMSE則略微差于SMLR模型。SMLR模型僅模擬6個ETI中TXx的效果優于RF模型。③總的來說,RF模型的模擬效果優于SMLR模型。驗證期2個模型模擬ETI的R2,LCCC,MAE和RMSE的表現整體上略低于率定期,但未出現明顯的模擬性能下降,且RF模型模擬TN10p的MAE和RMSE在驗證期的表現略優于率定期。


圖6 逐步多元線性回歸和隨機森林模型在黃河流域80個站點模擬極端氣溫指數的率定和驗證結果Fig.6 Calibrated and validated results of each extreme temperature index simulated by the SMLR and RF models at 80 sites in the Yellow River Basin
由于RF模型模擬ETI的性能總體優于SMLR模型,且各環流指數對黃河流域極端氣溫指數的影響具有0~12個月的時滯特征,故基于RF模型利用2021年10月—2022年10月的環流指數數據預測了2022年11月黃河流域80個站點的ETI,其空間分布如圖7所示。由圖可知:2022年11月,極端高溫事件的強度(TXx)和發生頻率(TX90p和TD30)較高的站點主要集中在流域下游的低海拔地區和局部河谷地帶。極端低溫事件的頻率指數(TN10p、FD0)與極端高溫事件的頻率指數(TX90p、TD30)空間分布規律基本相反;TNn和TXx的空間分布特征基本相同,最低氣溫(TNn)越小,表征極端低溫事件的強度越大,即極端高溫事件與極端低溫事件的強度具有相反的空間分布規律。總體上,預測的2022年11月黃河流域各ETI的空間分布情況與多年平均情況相似。待新的環流指數更新后,可采用類似方法對黃河流域多站點的ETI進行實時動態預測,從而對流域未來極端氣溫事件進行預警。

圖7 基于隨機森林模型預測的2022年11月黃河流域極端氣溫指數Fig.7 Forecasted extreme temperature indexes in November 2022 based on the RF models established in the Yellow River Basin
極端氣溫事件受多種大氣環流因子的綜合影響。丁之勇等[14]發現我國北疆地區極端氣溫指數受AO的影響最大,其次是NAO,而ENSO對其影響較小。龔道溢等[29]認為NAO主要影響北美、西歐以及北非個別地區的氣溫,北太平洋濤動(north Pacific oscillation, NPO)主要影響北太平洋和北美個別地區的氣溫,南方濤動指數(SOI)則主要對太平洋熱帶地區氣溫產生影響。但過去研究多集中于單個或幾個環流指數對研究區域內極端氣溫事件的影響,而本研究篩選了對極端氣溫事件有顯著影響的多個環流指數,充分探究極端氣溫事件對多種大氣環流因子的綜合響應,本文從130個環流指數中,通過數據預處理、VIF多重共線性分析、考慮滯后性的Pearson相關分析及顯著性檢驗等方法,嚴格地篩選出6個ETI的關鍵環流指數,最終構建SMLR和RF模型并進行環流指數重要性排序,克服了大氣環流因子選取不客觀、不全面的局限性。
大氣環流對極端氣溫的影響具有滯后性。汪寧等[30]研究發現我國北部、東北部、南部地區的氣溫和降水對歐亞遙相關型的響應約有2~4 d的滯后時間。黃浩等[31]發現AO和ENSO對河東地區冬、夏兩季的極端氣溫指數有顯著影響,且呈現出0~1 a的時滯特征。馬乃孚等[32]提出北太平洋海溫與華中夏季氣溫存在較好的滯后相關關系,通過赤道東太平洋海溫異常預測華中地區夏季氣溫的可預報尺度為1~3個月。本文發現環流指數對黃河流域極端氣溫指數的影響具有0~12個月的時滯特征,且不同環流指數的最佳滯后時間也有差異,這與黃浩等[31]的結果部分一致。同時本研究以時滯特征為切入點計算了不同環流指數的最佳滯后時間,并通過最佳滯后時間序列數據建立模型預測了黃河流域ETI,考慮了環流指數對ETI影響的時滯性,從而提高了模擬的效率和精度。
黃河流域ETI影響因子的重要性在不同站點上具有差異。RF模型具有良好的模擬性能,已被應用于很多領域。本研究采用2種模型對黃河流域ETI進行實時預測,對比分析發現在相同輸入下,RF模型除對TXx的模擬效果稍弱外,對其他5個ETI的模擬效果均優于SMLR模型。由于RF模型能夠給出單個站點的變量重要性排序,且環流對ETI的影響具有區域差異[33],本文基于RF模型給出的變量重要性指數IncMSE,創新性地提出了影響整個黃河流域80個站點的各ETI的環流指數重要性排序方法RankYR,并進行了具體分析,從而擴展了重要性排序的應用領域,得出了對黃河流域極端氣溫事件提供準確可靠預報的新方法,為將來研究分析黃河流域氣候變化中極端氣溫變化可能造成的影響提供了參考。
本文基于關鍵環流指數的最佳滯后時間序列數據構建了6個極端氣溫指數的SMLR和RF模型,探究了極端氣溫事件對多種大氣環流因子的綜合響應,得出以下結論:
1)黃河流域1961—2020年的ETI中,TXx、TX90p、TD30和TNn呈波動上升的趨勢,而TN10p和FD0呈現下降趨勢;極端高溫事件的強度和發生頻率的空間分布特征與極端低溫事件基本相反。
2)以靖遠站TXx為例,極端氣溫事件受多種環流指數的綜合影響。環流指數對TXx的影響存在滯后性和明顯的周期性。關鍵環流指數對極端氣溫指標具有顯著影響,其rmax對應的滯后時間主要為5、6、11和12個月。同時,環流指數對ETI的影響程度存在差異,PPVI對TNn和FD0的影響最大,IOWPA對TX90p和TD30影響最大,AEPVI和NANRP對TXx和TN10p影響最大。對整個黃河流域來說,PPVI對TXx、TNn、TX90p和FD0影響最大,而NANRP對TN10p和TD30影響最大。
3)SMLR和RF模型對ETI的預測能力較好,驗證期R2分別為0.53~0.95和0.64~0.95。RF模型除對TXx的模擬效果稍差外,對其他5個ETI的模擬效果均優于SMLR模型,因此被選擇用于預測黃河流域多站點的實時ETI。預測的2022年11月,黃河流域ETI的空間分布特征與多年平均情況基本相似。極端高溫事件的強度(TXx)和發生頻率(TX90p和TD30)較高的站點主要集中在流域下游的低海拔地區和局部河谷地帶,極端低溫事件強度和發生頻率的空間分布規律與基本極端高溫事件相反。