蘇萬磊
(河北省秦皇島水文勘測研究中心,河北 秦皇島 066000)
降水是促進陸地生態系統中物質能量循環的重要驅動因素,對作物生產、水資源安全、人居健康具有重要意義。準確的空間降水資料是水文預報、水質管理、氣候變暖控制計劃的基礎。經典的降水空間插值方法如普通克里格、反距離加權和Anusplin 等已得到廣泛應用,但這種單一模型不能較好擬合全局或局部變量與降水量空間變異性之間的關系,聯合普通克里格與回歸分析的回歸克里格方法,有效解決了殘差自相關與空間非平穩性問題,并在折疊地形區取得較好插值精度。河北省涵蓋了濱海、荒漠、叢林、草原、山地、平原等復雜地貌地形,這導致從區域稀疏氣象站中獲得連續性降水分布信息存在一定挑戰[1-3]。本文以河北省為案例,探究回歸克里格方法在降水資料空間插值中的應用。
河北位于太行山東麓、燕山南側、南臨華北平原腹地,區域面積21.8 萬km2。該區位于我國第一、第二級階梯過渡帶,海拔變化明顯,介于-5 m~2833 m 之間;其地貌分異復雜,形成前海低地、沖積平原、黃土丘陵山地及草原沙漠等復雜地形(圖1)。域內屬溫帶季風性氣候,夏季高溫且暴雨集中,冬季寒冷而干燥,春秋短促溫涼,多年平均氣溫5℃~11℃,年降水量為318 mm~685 mm,其中60%~75%集中于6月~9月。該省地貌分異較大,適宜不同溫帶作為生長,但長期以來降水量受氣候循環模式、下墊面、地形等因素影響,而空間分異較大。

圖1 研究區氣象站點分布
為反映區域降水量現勢性特征,本研究從中國氣象數據共享網絡(http:// cdc.cma.gov.cn/)獲取了河北省2001 年~2020 年158 個氣象站點逐日觀測數據,采用累加法將其生成年降雨數據,然后將20 年平均降水量數據作為當前站點降水量真值。研究區站點分布較均衡,可全面揭示研究區降水量空間差異。所使用的地形數據(Digital Elevation Model,DEM)(圖1))Google earth engine 下載,其由美國航空總署利用雷達影像生成的SRTM 數據,空間分辨率達 90m。利用ArcGIS10.8 軟件,先對研究區DEM 數據進行填洼處理,再經cubic 方法重采樣至1km,進而區域降水量空間插值目標一致。同時利用處理好的DEM 數據經raster to point 轉換后,生成各柵格點中心經緯度坐標信息。本文基于回歸克里格方法區域降水量空間插值則通過ArcGIS 10.8 平臺的Geostastical Analyst 模塊完成。
除氣候系統模式等因素外,降水量細節分布規律還與海陸位置、地形等密切相關。鑒于此,選用海拔(alt)、經度(lon)和緯度(lai)這3 個協變量作為降水量空間插值的輔助因素[2-3]。回歸克里格是一種聯合克里格(Kriging)插值與回歸分析(Regression)的空間推理法;其中克里格方法基于統計學理論,納入空間位置對變量空間自相關性的影響;而回歸分析較好考慮了環境變量的局部效應。因此,應用回歸克里格模型進行降水量插值的具體步驟如下:①基于站點尺度構建降水量與協變量之間回歸關系模型,并分離趨勢特征;②利用回歸殘差進行克里格插值;③將前兩者結果加和,進而得到降水量插值最終結果?;诙嘣貧w模型擬合降水量關系:
式中:Y、β0分別為站點實際降水量與常數項;β1、β2、β3分別為變量x1、x2、x3的估計系數。
其最終預測值表示為:
式中:y(Pi)為空間位置Pi處的降水量值;βj,(Pi)為其回歸模型系數;xj,(Pi)為位置Pi處的第j 個自變量;ε(Pi)為回歸模型殘差;n 為協變量數,n=3。
研究140 個氣象站點在近20 年來的降水量觀測值統計特征見表1,其最大、最小降水量分別為675.87 mm(興隆縣)、357.50 mm(康??h),相差達318.38 mm。計算得到降水量平均值為498.45 mm,介于400 mm~600 mm 降水量區域,按照中國氣候區劃屬半濕潤半干旱區;其偏差達58.03 mm,變異系數為11.69%,表明區域空間上降水量分布存在一定地帶性分異。經單樣本Kolmogorov~Smirnov(KS)檢驗表明,其P 值為0.06,未通過5%水平信度檢驗,為避免數據噪聲,將原降水量數據進行log 對數變換,使其符合正態分布形式,以便進行后續插值分析。

表1 河北省氣象站點降水量資料統計特征(n=140)單位:mm
為進一步了解該地站點數據使用回歸克里格方法的可行性,使用地統計學Moran's I 方法進行空間檢驗。由表1 可知,其Moran's I 值達9.54,其標準化統計量為2.75>1.96,表明該地降水量呈現顯著正向空間自相關性,因此可對其進行空間插值。
基于站點尺度,克里格方法擬合了區域降水量空間分布趨勢(圖2)。圖中x、y 軸分別指示正東、南方向,z 軸為降水量豐度,線性趨勢線表明研究區降水量在經向上呈由南向北減少,在緯向上表現出自動向西減少特征。由此表明,研究區降水量分布符合經向、緯向地帶性規律,將其納入回歸克里格模型可補充降水量分布結構性特征。海拔梯度影響著水汽運移過程、地表下墊面性質,進而對降水分布起作用。本研究中(圖3)降水量與海拔之間呈負相關關系,其R2達0.23,且具有顯著性,說明地形是解釋區域降水量分布差異的有效因子。

圖2 研究區降水量空間趨勢特征

圖3 研究區降水量與DEM 之間相關性
基于2.2 部分的分析結果,以經度、緯度和坡度 3 個因子為局部變量進行回歸克里格插值。其地統計函數見圖4,可知隨著空間距離增加,半方差值由小增大,在約7 km 距離時趨于平穩,表明降水量在該空間范圍內分布具有相關性。進一步分析得到其塊金值為6.28%<25%,說明其中空間上具有平穩性。區域降水量回歸克里格插值的多元線性回歸方程為:y=-2486.65+39.46 lon-32.44 lai+0.029 alt, 其R2=0.61,P<0.01,表明該模型具有較高解釋能力,通過地理位置和地形等較好區分了降水量特征區域(高值、低值中心)。

圖4 研究區降水量回歸克里格插值半方差函數圖
基于前述分析,生成研究區1 km 空間分辨率的降水量空間分布圖。可見,研究區降水量分布差異顯著,其中高值區為冀東的唐山,主要由于該地受副極地低壓帶影響相對強烈。河北省降水量分布次中心位于西南部太行山東側,年降水量介于550 mm~600 mm 之間,最低區聚集于冀西北地區,僅為343.1 mm~450 mm,主要由于距海洋較遠且受高峻地形影響,因此易發生干旱等災害。該分布特征符合河北省實際。

圖5 研究區降水量空間插值結果
采用2010 年~2020 年河北范圍內143 個國家級氣象站點多年平均降水數據,運用回歸克里格方法探究了區域降水量空間分布特征。河北境內地形差異顯著,因此該文在考慮海陸位置影響基礎上加入了海拔信息。分析表明,地理經度、緯度和海拔因素對河北省降水量空間分布具有全局性影響,使用該3 個協變量建立降水量插值的回歸克里格模型具有較好應用性,該模型解釋了區域降水量51%的變異性,因此具有較高可信度。此外,該文在實施空間插值時僅考慮了降水量與協變量之間線性關系,忽略了非線性因素,同時對協變量引用較少。因此,后期可嘗試以機器學習為代表的非線性模型擬合降水量空間分布模式,并且加入地形曲率、土地利用、大氣含水量、距離海洋位置等信息,進而優化降水量空間插值精度。