李治軍,王華凡,侯 岳,黃佳俊
(1.黑龍江大學 水利電力學院,黑龍江 哈爾濱 150080;2.黑龍江大學寒區地下水研究所,黑龍江 哈爾濱 150080)
降雨量數據是進行產匯流計算的重要基礎,是進行地區水文循環規律研究、水資源供需平衡分析和旱澇災害預警機制建設的重要支撐[1-2]。我國幅員遼闊,氣候條件復雜多樣,水文氣象觀測站點少且分布不均,存在許多縣區僅擁有一個水文氣象觀測站點的現象。
本文以無資料流域水文預報(PUB)計劃為切入點,探討適用于缺資料地區降雨量求算的空間插值方法,以位于黑龍江省同江縣等9個偏遠縣區的9個氣象觀測站點2000—2014年的降雨量數據為基礎,在考慮高程和樣本點間距離等影響因素的情況下,采用反距離權重法(IDW),薄板樣條函數插值法(Splines),全局多項式插值法(GPI),局部多項式插值法(LPI),普通克里金插值法(OK)和協同克里金插值法(CK),借助地理信息系統(GIS)的地理空間分析工具,對研究區進行年降雨量、各年7月降雨量及次降雨量的空間插值計算,經交叉驗證分析,優選出針對不同降雨量大小的精確度最高的空間插值方法,為缺資料地區降雨量空間插值提供理論指導,為產匯流計算研究提供降雨量數據獲取的方法參考。
空間插值是根據已有的一定數量的反映空間某種要素分布特征的樣本,對未知空間進行預測的一種算法。按照推求的空間范圍,可分為內插和外推。空間內插通過已知點數據推求同一區域未知點的數據,而空間外推則通過已知區域的數據推求同域外未知點的數據。按照插值結果實現的數學原理,可分為確定性插值法和地統計插值法(又稱克里金插值),確定性插值法以研究區內部相似程度或平滑度為基礎,由已知樣本點創建插值表面。地統計插值法在量化樣本點之間的空間自相關的基礎上,利用頻率分布、方差和均值等統計特性,進一步解釋說明了采樣點在預測區域的空間分布情況[3-5]。張莉莉等基于海南島18個觀測站點的氣象數據,應用GIS中的插值工具,通過交叉驗證,對比分析,得出混合插值法最優于海南島氣象要素空間插值的結論[6]。蔣育昊等考慮高程、坡向和距離等影響降雨量大小的因素,利用PRISM模型對北京西北山區的月降雨量進行插值分析,論證了在復雜地形條件下PRISM插值方法相對于其他方法,能夠更加準確地描述降雨的空間分布[7]。陳雅婷和劉奧博以中國1915個氣象站30年的平均降水量為數據基礎,利用經驗貝葉斯克里金法、泛克里金法和多項式法等插值方法進行全國范圍內的降雨量插值精度分析,經誤差分析驗證,結果表明,通過估計基礎半變異函數來表示數據誤差的經驗貝葉斯克里金法插值效果最好,輸出表面最為光滑[8]。降雨量空間插值方法眾多,不同方法得出的插值輸出表面效果差異較大,輸入數據聚類情況、樣本點數量和研究區地形地貌類別等因素都直接影響插值的精度。本文對上述各類插值方法的特點進行歸納,有助于進一步決策選取何種方法進行插值計算,見表1。

表1 常用插值方法特點歸納
反距離權重插值法(IDW)基于相近相似的地理學原理,利用樣本點被賦予的不同權重,進行插值計算。該法假定插值表面特性取決于局部變化,如采樣點均勻分布,不存在聚類現象,則插值效果最佳。
薄板樣條函數插值法(Splines)基于使經過所有樣本點的預測表面達到最小曲率的思想,進行插值點的數據預測。該法要求采樣點數據準確,預測表面在短距離內各點數據值不能相差太大。
全局多項式插值法(GPI)依據多項式擬合的一個插值表面,形成具有數值分布的采樣區,結合最小二乘法原理,利用采樣區地理坐標(x,y),推求降雨量z的數值,以此進行數據擬合并估計待測點值。該法計算簡便,結果精度較低。
局部多項式插值法(LPI )使用位于指定重疊領域的多個多項式進行插值表面擬合,對具有多種形狀的擬合表面,多個多項式的擬合效果會明顯優于單個多項式。
普通克里金插值法(Ordinary Kriging)基于變量的空間相關性,依賴于克里金法的將感興趣變量空間自相關作為距離的函數,利用樣本點的原始數據與變異函數的結構特點,對待插點進行無偏,最優化估計。該法要求觀測數據服從正態分布,參數較多,確定最佳參數形成最佳插值表面相對復雜。
協同克里金插值法(Co-Kriging)將區域化變量從單一屬性發展至兩個及以上的協同屬性,可在降雨預測模擬中納入風向和地形等影響因子,進一步認識降雨的潛在空間特征,提高降雨插值精度,引入高程影響因素的協同克里金插值法。
交叉驗證將樣本點分為訓練集和驗證集,使用訓練集做插值分析,利用驗證集測試插值效果,通過比較預測值與觀測值的誤差,進而評估插值結果和方法的優劣。本文采用交叉驗證方法中的平均誤差、均方根誤差和標準化均方根誤差綜合優選不同雨量條件下的插值方法。
本文的研究區位于黑龍江省東北部的三江平原,選取位于集賢縣、寶清縣、綏濱縣、同江市、富錦市、雙鴨山市、饒河縣、密山市和虎林市的9個氣象站點。
根據實測的氣象站點的降雨量數據,在整個考察年份內,9個氣象站點記錄的多年平均年降雨量值大多在500.0 mm左右,最大值位于虎林市,為610.8 mm,最小值位于富錦市,為488.3 mm。
為進一步考察各氣象站點記錄的降雨量年內分布情況,對考察年份內的月降雨量進行統計分析,結果表明,年內降雨多集中在7月和8月,其中7月份的多年平均月降雨量年內占比最大,9個氣象站點均超過20.00%,最大值為寶清縣的25.75%。
空間插值分析主要包括獲取原始數據、分析數據、選擇合適的預測模型和驗證插值結果的合理性,其中分析數據部分包括檢驗數據是否服從正態分布、全局趨勢性分析和各向異性分析等。本文運用ArcGIS軟件地理統計分析模塊對各氣象站點的年降雨量、各年7月降雨量及選取的場次降雨量數據進行相關性分析,利用QQ plot 分布圖檢驗數據的正態分布情況,驗證是否存在離群值,利用全局趨勢分析,對數據的趨勢效應進行分析。通過對各站點年、月和場次降雨量進行正態分布及趨勢分布檢驗。分析結果表明,除部分站點某年或某月降雨量值存在離群點,其他數據均具有良好的正態分布和趨勢分布效果。本文立意于缺資料地區降雨量插值計算研究,樣本數據較為稀缺,且各站點數據均為氣象臺站觀測所得,故在插值處理時不剔除離群點和引起趨勢變化較大的點,節選的樣本點不同雨量下的趨勢分布和正態分見圖1~圖3。

圖1 年降雨量

圖2 月降雨量

圖3 場次降雨量
通過ArcGIS軟件中的地理統計分析工具,運用上文提到的各種插值方法,對研究區的降雨數據進行插值分析,經交叉驗證,并對結果進行轉換分析,得到各種方法在不同雨量情況下的誤差情況,具體結果見表2。

表2 不同雨量情況下插值方法誤差結果 mm
由表2可知,在數值較大的年降雨量插值模擬中,OK法和CK法得出的插值誤差結果優于其他方法。為進一步優選出各雨量情況下最好的插值方法,對OK法和CK法的插值結果進行均方根誤差標準化的計算,進一步預測標準誤差的有效性,經計算,OK法的結果為0.95,CK法的結果為1.17,參照數值結果與1越近效果越好的判斷標準,可得出OK法最適合缺資料地區年降雨量的空間插值計算。在數值大小居中的各年7月降雨量插值模擬中,CK法得出的插值誤差結果優于其他插值方法,在樣本點數據較少并結合研究區高程數據的情況下,該法可充分考慮地形地貌對降雨量數據的影響,避免了插值時同一組樣本數據過于分散造成插值誤差較大的結果。在數值較小的場次降雨量插值模擬中,OK法得出的插值結果優于其他插值方法。本文采用考察期內各氣象站點每年夏季第一場連續三天的降雨數值為樣本,雨量值集中分布在50 mm以下,各氣象站點數值差較小,OK法在場次降雨量的插值計算中,相對于確定性插值方法,該法利用樣本點擬合的線性方程來推求未知點的降雨量數值時,加權值不僅考慮了觀測點與未知點的距離,同時考慮了位置和空間結構關系,擬合精度更高,插值誤差更小。
(1) 在充分考慮研究區地形地貌和樣本點數據空間自相關的情況下,普通克里金法和協同克里金法的插值結果明顯優于其他方法,誤差較小,插值結果圖更加平滑美觀。
(2) 在年降雨量插值模擬分析中,降雨量大小呈現由研究區東南向西北遞減的趨勢;在各年七月和場次降雨量插值模擬分析中,降雨量大小呈現由東北向西南遞減的趨勢。由此可見,同一研究區域在不同降雨量情況下的插值結果有很大區別,地形地貌及氣候條件對地區降雨量大小的影響較大。
(3) 因插值樣本點較少,反距離權重法得出的插值結果表面具有明顯的“牛眼”現象,觀測點數據對全局性的插值結果影響較大,多項式法和薄板樣條插值法得出的插值結果表面分層現象嚴重,平滑度較低,普通克里金法和協同克里金法得出的插值結果表面存在個別圖像存在較小范圍內的“牛眼”和分層現象,但全局平滑性整體優于確定性插值方法得出的插值表面。
(4) 本文因插值樣本點較少,故無法考慮不同樣本點情況下的各種插值方法的優劣,隨著降雨量空間插值分析的不斷深入,多尺度和多要素地對降雨量影響因子分析的愈加全面,缺資料地區降雨量空間插值計算結果將更加精確。