吳曉燕,高敏華, ,李艷艷
(新疆大學 a. 資源與環境科學學院;b. 綠洲生態教育部重點實驗室,烏魯木齊 830046)
降水不僅是地球水循環系統中非常重要的一個環節[1-2],也是氣象環境的重要參數,是規避洪澇等自然災害等重要的預測指標[3]﹒但單一的氣象站點的直接觀測數據不足以支撐對該區域的整體判讀,通常以有限的氣象站點的直接觀測數據結合不同的數學方法,生成氣象站點之外的連續的降水空間分布信息,以此滿足對該區域的水文模型等研究的數據支撐﹒然而隨著研究日益深入,降水空間分布信息的精度不足阻礙了持續的深入探索[4]﹒為了提高降水數據空間信息的準確性,一般多以增加插值站點數量來減少誤差[5],但是由于資金、人員和地形等多種因素的限制,一些地區無法建立起足夠數量且分布足夠均勻的水文站點[6]﹒因此以最少的站點資料得出最高的精度結果,成為研究者們探索的動力[7-13]﹒
綜合前人研究,雖然對算法、參數等進行了縝密的優化與修正,但多數研究者均在大尺度的平坦地區進行研究,很少在中等尺度的復雜山區進行分析﹒而天山山區,作為中尺度復雜地形的山區,受地形條件、自然條件和站點數目等多種因素的限制,導致對山區降水結構的認識不夠完整,嚴重制約了對山區降水規律相關的各方面的研究﹒因此迫切需要適宜我國西部干旱區的大多數復雜山區且站點數據稀缺的插值算法﹒
鑒于此,本文基于地統計分析方法,以混合插值的克里金(Kriging)法、樣條函數法、反距離權重(inverse distance weighting,IDW)法、考慮DEM 高程的反距離權重法,以及考慮地形因子的協同克里金法5 種方法,以36 個插值站點對天山山區的多年平均、春季、夏季、秋季和冬季5 種降水數據進行空間插值,結合未進行插值的8 個降水驗證站點的實測降水數據,以相對誤差和均方根誤差為驗證條件,對比分析5 種類型的插值方法的精度﹒為西北干旱地區,資料稀缺且地形復雜的山區降水水文模型建立提供研究支持﹒
天山山脈位于我國西北干旱區,被譽為“中亞水塔”[14],是中國十大山系之一,呈東西走向,綿延中國境內1 700 km,占地57 萬多km2,占新疆全區面積約1/3﹒由于天山山體對大西洋和北冰洋氣流的阻隔抬升作用,使得山區降水量豐富,可達200~700 mm,形成西北荒漠區的“濕島”[15],據統計,新疆65%的河流源于天山山區,其徑流量占全疆總徑流量54%,為下游50 多個市、縣,100 多個兵團團場生產生活用水提供保障[16]﹒因此為了保障水資源的科學利用,保證流域綠洲經濟系統和生態系統持續運轉,需要開展流域山區空間降水插值研究﹒
研究區位于我國境內的東經73°~95°,北緯40°~45°之間;海拔高度最高為7 429 m,最低為510 m;其中天山全長1 700 km,寬250~350 km,呈東西方向展開;研究區站點在海拔高程帶的分布上極其不均勻,多數集中在出山口等平緩地勢上,其中,最高站點海拔為2 458 m(因缺少高于此海拔的觀測數據)﹒研究區及站點位置見圖1﹒

圖1 研究區及站點位置
降水數據為全國氣象站點的逐日氣象數據,選取天山山脈周邊最大范圍85 km 以內,具有完整時間序列(1958~2015 年),并剔除掉南北疆差異較大后的44 個氣象站點數據,其中,36 個為插值站點,8 個為驗證站點,并將氣象站點的逐日數據整理為多年平均的降水數據和4 個季節的降水數據﹒
DEM 數據是ASTER GDEMS 數據,是目前覆蓋最廣的高精度全球高程數據﹒此數據由NASA 的新一代對地觀測衛星Terra 的觀測結果制作完成﹒數據覆蓋范圍為北緯83°到南緯83°之間的所有陸地區域﹒
2.2.1 混合插值的克里金法
克里金(Kriging)插值法方法被稱為空間自協方差最佳插值法,它是通過對周圍的實際測量的值進行加權以求解出的未測量位置的預測值﹒本文以GIS 相關軟件中自帶克里金插值法為基礎,對各種參數計算﹒由于最終結果的回歸系數大小是預測值與實際值是否擬合的關鍵,其系數越大表明擬合程度越高,反之表明擬合越低,當半變異模型為高斯函數時,最終結果的回歸函數的系數最高,因此本文均以高斯函數進行克里金插值﹒
鑒于克里金插值空間自相關性較強,在插值過程中會改變參與插值站點的原實際數據,即站點原實際數據與站點預測數據存在偏差,而為了消除偏差,常采用混合插值的方法﹒1)將36 個插值站點進行克里金插值計算,得到插值預測圖﹒2)提取插值預測圖中36 個站點當前的預測值信息,并將插值站點的實際觀測值減去預測值,得到36 個站點的偏差值﹒3)將36 個站點的偏差值進行插值,得到偏差值插值預測圖﹒4)由2)可知,實際值-預測值=偏差值,上述為點的計算,通過插值的方法可以使點轉為面,由此可以推理出:實際值分布圖=插值預測圖+偏差值預測圖﹒使用柵格計算將插值預測圖與偏差值預測圖相加,得到相對符合實際的插值分布圖﹒
2.2.2 混合插值的樣條函數法
樣條函數(Spline Function)是指一類分段(片)光滑,且在各段交接位置同樣光滑的函數﹒它是以最小曲率面來充分去逼近各觀測點的數據,之后推算至整個研究區內,形成降水分布﹒鑒于樣條函數插值法計算后也會影響原數據,因此本文采用混合樣條函數插值法,具體操作過程與克里金插值法過程相同﹒
2.2.3 混合插值的反距離權重法
反距離權重法(Inverse Distance Weighting,IDW)是假設每個測量點之間都存在著一種局部的影響關系,而且這種影響關系會隨著距離的變動而變動﹒這種方法對預測位置近的測量點位的權重分配較大,而遠距離的測量點位的權重隨距離而減小,因此稱之為反距離權重插值法﹒
2.2.4 混合插值的考慮高程的反距離權重法
為了使反距離權重法具有高程信息,將36個站點實際值與高程值進行回歸分析,得到兩者之間的回歸關系式﹒以柵格計算對天山DEM 數據信息進行一元回歸關系代入,得到以DEM 信息為基礎的降水預測圖﹒提取降水預測圖中36個站點當前預測值信息,得到含高程信息的預測值﹒通過36 個站點的含高程信息預測值進行反距離權重法,得到考慮高程的反距離權重,再采用混合插值的方法消除偏差﹒
2.2.5 考慮地形因素的混合協同克里金插值法
使用GIS 相關軟件中的統計法,將36 個站點實際值設置為第1 變量,將天山DEM 信息設置為第2 變量,以此完成考慮地形因素的協同克里金計算,再采用混合計算方法,得到考慮地形因素的混合協同克里金插值結果﹒
圖2 為天山山區多年平均降水量的普通克里金插值法(A)、反距離權重插值法(B)、考慮高程的協同克里金(C)、考慮高程的反距離權重插值法(D)和樣條函數插值法(E)5 種方法的插值結果﹒

圖2 5 種方法多年平均插值結果
同樣用5 種插值法對天山山區的春、夏、秋、冬4 季的降水量進行插值,多年平均和季節的插值結果都表明各種插值方法對天山山區的降水分布描述整體表現較為一致,空間上表現為自西向東減少,隨海拔高度增加而增大,即形成了以天山西部伊犁河谷和天山中部為中心的降水高值區,以天山東部和南部的次高值區﹒
以相對誤差和均方根誤差大小作為插值結果是否合格的重要依據,相對誤差與均方根誤差越小表明預測值越符合實際,反之不符合實際﹒
3.2.1 相對誤差(relative error)
相對誤差是指絕對誤差與被測量物的真實值的比值乘以100%所得到的數值,即

式中,?為實際相對誤差;Δ 為絕對誤差;L 為真值﹒通過8 個未參與插值的驗證站點對最終預測圖的預測值信息進行提取,計算預測值與實際值之間的相對誤差﹒
3.2.2 均方根預測誤差(root-mean-square error) 均方根誤差又被稱作標準誤差,其條件為在有限次實驗中,i=1, 2, 3, …, n﹒均方根誤差為

式中:n 為測量次數;x 為測量值或預測值;xp表示均值﹒通過8 個未參與插值的驗證站點對最終預測圖的預測值信息進行提取,計算預測值與實際值之間的均方根誤差﹒
相對誤差和均方根誤差結算結果如表1 所示﹒

表1 相對誤差、均方根誤差檢驗
通過對天山山區的多年平均、春季、夏季、秋季和冬季的5 種降水類型的5 種插值方法對比分析發現:多年平均降水量的5 種插值法中考慮地形因素的協同克里金效果與實際最為相符;春季降水量的5 種插值中混合插值的考慮高程的反距離權重效果與實際最為相符;夏季降水量的5種插值中考慮地形因素的協同克里金效果與實際最為相符;秋季降水量的5 種插值中考慮高程的反距離權重效果與實際最為相符;冬季降水量的5 種插值中考慮地形因素的協同克里金效果與實際最為相符﹒混合插值的克里金插值法中,秋季效果最佳;混合插值的樣條函數中,驗證結果均為最差,不適宜此地區;考慮地形因素的協同克里金中,多年降水量、春季、夏季、秋季和冬季表現均為良好﹒
1)從研究結果中可看出,不同的插值方法會因季節變動和降水量大小等因素表現出不同的插值效果﹒總體而言,混合插值考慮高程的反距離權重和考慮地形因素的協同克里金這2 種插值方法效果最佳﹒
2)插值方法有待優化﹒插值方法自身有計算誤差,此外,不同的緯度、坡度、坡向和下墊面特征等因素都會影響降水空間分布的插值結果精度﹒若增加諸如海拔方面等的空間分布對精度的影響十分顯著,若氣象站點的分布足夠均勻,尤其是各個高程的站點數據足夠,并添加坡度、坡向等多變量進行插值,效果更優﹒