符 靜,易臻照,趙 莎
(1. 衡陽師范學院古村古鎮文化遺產數字化傳承協同創新中心,湖南 衡陽 421002;2. 衡陽師范學院城市與旅游學院,湖南 衡陽 421002)
受地理條件限制,難以建立數量龐大且均勻分布的氣象站點,從而為獲取大范圍降水空間分布信息,降水空間插值成為研究區域降水格局變化的重要手段[1-3]。氣象數據空間插值方法常見的有克里金法、反距離權重法、樣條函數法、趨勢面法以及局部多項式法等[4],基本原理是通過數學建模利用離散數據來模擬連續的空間信息。
然而不同的插值方法在區域適用性上存在較大差異,近年來,大量學者利用已有觀測資料,對各插值方法進行誤差分析以獲得區域最優插值方案。靳國棟等基于中國某煤礦礦區煤層數據,對比了距離加權反比插值法和普通克里金插值法,認為克里金法優于距離加權反比法[5]。李軍龍等采用OK、Spline、IDS進行空間插值,得出OK法對年均溫、年降雨量及年積溫的插值精度均最高[6]。Garcia等使用反距離加權(IDW)和多重二次諧波(MQB)方法進行插值實驗,結果證實MQB在所有條件下插值精度都優于IDW[7]。魯振宇[8]、仲嘉亮[9]、林金煌[10]、宋麗瓊[11]等分別以黃河源區、新疆地區、福建省、深圳市為例,對比幾種常規的插值方法,結果表明普通克里金法精度較高。Chen等為獲取中國地區日降水柵格數據,通過對比不同插值方法,得出基于季節半變異函數的普通克里金法插值效果最佳[12]。董曉華等以清江流域為研究區,插值結果表明協同克里格法要優于普通克里金法,而反距離加權法明顯不如兩種克里金法[13]。殷嘉霖等基于湖南省及其周邊50個氣象站點多年平均降水進行空間插值,得出局部多項式法插值精度最高[14]。何文英等以新安江流域為研究區,得出年尺度上殘差克里金法插值精度最高,而月尺度上則需要基于不同的數據條件或地理條件選擇最佳的插值方案[15]。王天華[16]、解恒燕[17]等以月尺度降雨量為基礎,插值實驗證實反距離權重法插值精度較高。
綜上,結合區域實際對比不同插值方法的模擬精度,篩選適合區域的插值方法,進而模擬降水空間分布信息,對于區域生態系統管理以及生態安全等有重要意義。本文采用反距離權重法(IDW)、普通克里金法(OK)、樣條函數法(Spline)以及趨勢面法(Trend)對湖南省1960-2015年年均降水進行空間插值實驗,進而對模擬結果進行交叉檢驗和站點驗證,探討了適合研究區降水的插值方法,并分析了區域降水空間分布特征。
選取1960-2015年湖南省87個氣象站點所記錄的逐月降水資料,來源于湖南省氣象局。在Excel 2013軟件中計算生成標準化數據,對少量缺測或無效數據進行線性插補,進而通過計算獲得各站點年尺度降水數據,并統計多年降水平均值,其中,南岳站降水量最大為2 023.4 mm,新晃站最少為1 164.3 mm。將站點數據導入ArcGIS 10.2中,利用坐標信息轉換為Shapefile數據,采用隨機交叉驗證抽樣方法,選取20%的站點數據作為驗證樣本,剩余80%作為插值樣本(圖1),考慮到數據對內插誤差的影響,在選取驗證樣本時會去掉誤差較大的站點。其他數據還包括湖南省行政區矢量數據、地形數據以及社會經濟數據等。
1.2.1 反距離權重法(IDW)
反距離權重法原理是基于地理學第一定律,依據相近相似原理,利用預測點和采樣點之間的距離進行加權,距離預測點越近,采樣點給出的權重也就越大。計算公式如下:
(1)
式中:Z表示降水量的預測值;Zi表示第i(i=1,2,3,…,n)個實測值;di為預測點到i點的距離;p為距離的冪,通常為2;n為參與插值的樣本數。
1.2.2 普通克里金法(OK)
普通克里金法又稱地統計法,是一種無偏估計的插值方法。其原理是利用已知樣本的加權平均值估計平面上的未知點值,使估計值等于實際值的數學期望值,且方差最小。計算公式如下:
(2)
式中:Z為降雨量的預測值;λ表示克里金法權重系數;Z(Xi)表示實測點Xi處的降雨量。
1.2.3 樣條函數法(Spline)
樣條函數法基本原理是采用多項式擬合樣本數據生成光滑插值曲線的一種插值方法。計算公式如下:
(3)
式中:Z為降雨量預測值;n為樣本數;λi為線性方程組求解系數;di為預測點到i點的距離;x,y分別表示平面直角坐標系的橫、縱坐標值;R(di)表示di為自變量的方程;T(x,y)表示x,y為自變量二元線性方程組。
1.2.4 趨勢面法(Trend)
趨勢面法是基于多項式回歸分析原理,得到一個適合地理要素空間分布的光滑層面,而后依據面方程計算預測點的屬性值。計算公式如下:
(4)
式中:Z(x,y)為降雨量預測值;n0表示多項式階數;ε表示隨機誤差;ak,j為觀測點值確定系數;x,y分別表示平面直角坐標系的橫、縱坐標值。
1.2.5 插值精度驗證
為檢驗研究區不同插值方法的預測精度,選取研究區20%的站點數據作為驗證樣本,剩余80%作為插值樣本,用來分析預測值與驗證點實測值之間的相關性,并驗證年平均降水量空間插值結果的準確度。結合區域實際,精度評價采用平均絕對誤差(MAE)和均方根誤差(RMSE)兩種常用的指標,二者計算公式如下:
(5)
(6)
式中:Zi表示驗證樣本點降雨量觀測值;n為驗證樣本數量;Z(X)為降雨量預測值。為了更好地檢驗預測點與觀測點之間的誤差,選擇將降雨量觀測值與預測值導入SPSS軟件或者Excel軟件進行誤差檢驗和分析。MAE和RMSE值越小,表明誤差越小,插值精度越高。
降水空間插值的不確定性主要來源于氣象站點數目、觀測數據時空尺度、插值方法差異以及插值運算等誤差特性。利用SPSS軟件,基于湖南省87個氣象站點降水數據繪制Q-Q正態分布圖(圖略),分析得出降水與海拔有很強的相關性。例如,南岳、安化、桂東三站的海拔及降水量均與周邊其他站點差別較大,導致其正態分布偏差較大,而其余站點都集中于一條直線,數據近似符合正態分布。因此,在進行降水空間插值交叉驗證時采用的樣本需要剔除南岳、安化和桂東等,以免異常值導致誤差偏大。此外,湖南省降水在時空尺度上分配不均,采用IDW、OK、Spline和Trend四種方法對該區域年均降水量進行空間插值,通過對比不同插值模型的均方根誤差和平均絕對誤差,從而獲取適合該區域降水的最優插值方案。
采用普通克里金法、反距離權重法、樣條函數法和趨勢面法進行插值實驗對比分析(表1)。其中,普通克里金法采用了5種半變異模型(球面函數、三角函數、指數函數、高斯函數、線性函數),其他參數設置為默認。反距離權重法,其搜索區域形狀、冪指數以及鄰近站點數的取值對插值結果有一定的影響,選取冪指數2、4、6、8和鄰近站點數12。樣條函數法選用REGULARIZED和TENSION兩種模式。趨勢面法取階為1和2。

表1 不同插值結果誤差分析Tab.1 Different interpolation methods validate the results of correlation test between measured and predicted values
交叉驗證結果表明,不同插值方法的實測結果與預測結果有顯著相關性。由表1可知,整體上,樣條函數法、趨勢面法、克里金插值法的均方根誤差最小值分別為2.52、4.53、4.36 ,平均絕對誤差最小值分別為49.22、60.74、60.12 mm,均大于反距離權重法的均方根誤差和平均絕對誤差的最小值,表明反距離權重誤差較小,插值精度較高。具體地,克里金法采用的插值模型不同,平均絕對誤差也不同,其中,誤差最小的是三角函數模型(MAE=60.12),最大的是球面函數模型(MAE=61.51),由低到高排列依次為三角函數、高斯函數、線性函數、指數函數、球面函數,同樣地,三角函數模型的均方根誤差也小于指數函數、高斯函數、線性函數和球面函數。樣條函數選取TENSION模型產生的誤差遠遠小于REGULARIZED模型。趨勢面插值隨著階數的增加誤差逐漸降低。反距離權重法的插值精度隨著冪值的增大有所提高,冪指數為4時誤差最小,之后隨著冪指數增大,誤差逐漸變大,誤差值排序為:IDW4 通過對比同一種插值方法的不同插值模型以及不同插值方法的交叉驗證結果,得出反距離權重法(IDW4)插值結果誤差最小,精度較高,基于TENSION模型的樣條函數法次之,基于三角函數模型的克里金法精度略差,階為2的趨勢面法插值精度最差。由此可見,樣條函數法、克里金法和趨勢面法并不是湖南省年均降水量理想的插值方法,而反距離權重法(IDW4)插值精度最高,是適合該區域的一種相對較好的插值方法。 為了直觀地比較普通克里金法、反距離權重法、樣條函數法和趨勢面法的降水插值結果,選取IDW4、基于三角函數模型的OK、基于TENSION模型的Spline和階為2的Trend,運用ArcGIS 10.2軟件的Spatial Analyst模塊對湖南省多年平均降水量進行插值實驗。 由圖2可知,4種插值方法一定程度上均能反映湖南省年均降水量的空間分布特征,總體大致呈自東南向西北逐漸減少趨勢,研究區東部和東南部降水較多,西部和西北部降水相對較少,梯度變化較為明顯,地域降水分布不均勻。而由于降水插值精度與插值方法的選擇、插值模型參數設置以及樣本的空間布局緊密相關,因此,不同插值方法空間插值結果存在明顯的差異性。具體來看,反距離權重法和樣條函數法的插值結果基本一致,插值面較為光滑,顯示出研究區東部、東南部及南部地區降水多,北部洞庭湖區、衡邵地區以及西部降水相對較少,同時受地形因素影響較大,形成了明顯的“牛眼”格局[圖2(a)和圖2(c)]。基于三角函數模型的OK插值相比較其他三種插值模型,插值面效果較為粗糙,可能與其參數設置默認有關,降水空間分布與反距離權重法及樣條函數法的插值結果類似,顯示研究區東部和南部降水相對較多,北部洞庭湖區、中部和西部部分地區降水偏少[圖2(b)]。趨勢面法顯示出區域降水空間分布較為單調,表現為明顯的自東南向西北遞減趨勢[圖2(d)]。 基于1960-2015年湖南省87個氣象站點資料,采用克里金法、反距離權重法、樣條函數法和趨勢面法對研究區年均降水量進行空間插值分析,主要結論如下: (1)湖南省降水空間插值具有不確定性,主要與氣象站點數量、觀測數據時空尺度、插值方法差異以及插值運算等誤差特性有關。 (2)湖南省降水空間插值誤差分析顯示冪值為4時的反距離權重法插值結果誤差最小,精度較高,基于TENSION模型的樣條函數法次之,基于三角函數模型的克里金法精度略差,階為2的趨勢面法插值精度最差,表明IDW4是適合該區域的一種相對較好的插值方法。 (3)基于三角函數模型的克里金法、IDW4、基于TENSION模型的樣條函數法和階為2的趨勢面法一定程度上均能反映湖南省年降水量空間分布特征,總體上大致呈自東南向西北逐漸減少趨勢,梯度變化較為明顯,地域降水分布不均勻。 (4)反距離權重法和樣條函數法的插值面較為光滑,受地形因素影響,形成了明顯的“牛眼”格局。基于三角函數模型的普通克里金法插值面較為粗糙。趨勢面法顯示區域降水空間分布較為單調,表現為明顯的自東南向西北遞減趨勢。 □2.3 降水空間分布對比分析
3 結 論