肖城龍
(重慶市勘測院,重慶 401121)
基于ArcGIS的空間數據插值方法的研究與實驗
肖城龍*
(重慶市勘測院,重慶 401121)
應用ArcGIS軟件,通過對反距離權重插值、克里金插值、樣條插值和自然鄰域插值進行實驗和評估,討論幾種插值方法的額特點、優劣,同時對其中的不足提出自己的改進思路,并提出未來空間插值需要考慮和提高的方面。
空間插值;反距離;樣條;自然領域;克里金
空間插值是一種通過已知點或分區數據,推求任意點或分區數據。即利用函數f(x)在某區間中若干點的函數值,制定適當的特定函數,在這些點上取已知值,在區間的其他點上用這特定函數的值作為函數f(x)的近似值。在已觀測點的區域內推算未知的數據的過程稱為內插;在已觀測點的區域外估算未觀測點的數據的過程稱為外推。
假定區間[a,b]上的實值函數f(x)在該區間上n+1個互不相同點x0,x1……xn處的值是f(x0),……f(xn),要求估算f(x)在[a,b]中某點x*的值。基本思路是,找到一個函數P(x),在x0,x1……xn的節點上與f(x)函數值相同(有時,甚至一階導數值也相同),用P(x*)的值作為函數f(x*)的近似。其通常的做法是:在事先選定的一個由簡單函數構成的有n+1個參數C0,C1,……Cn的函數類Φ(C0,C1,……Cn)中求出滿足條件P(xi)=f(xi)(i=0,1,……n)的函數P(x),并以P()作為f()的估值。此處f(x)稱為被插值函數,x0,x1,……xn稱為插值節點,Φ(C0,C1,……Cn)稱為插值函數類,上面等式稱為插值條件,Φ(C0,……Cn)中滿足上式的函數稱為插值函數,R(x)=f(x)-P(x)稱為插值余項。當估算點屬于包含x0,x1,……xn的最小閉區間時,相應的插值稱為內插,否則稱為外插。這兩種方法在GIS中的使用均十分普遍,一般來說,空間位置越靠近的點更有可能獲得與實際值相似的數據,而空間位置越遠的點則獲得與實際值相似的數據的可能性越小。
中誤差(root mean square error,RMSE),相對中誤差(relative root mean square error,R-RMSE),對數中誤差(log root mean square error,L-RMSE),平均誤差(mean error,ME),標準差(standard deviation,SD),精度比率(accuracy ratio,AR)。RMSE由于計算簡單、易于理解而成為使用較為廣泛的精度模型,如美國USGS的各種分辨率DEM及英國OS DEM精度都是以RMSE衡量。RMSE并不反映單個誤差的大小,而是從整體意義上描述了地形參數和其真值的離散程度,因此,RMSE的真正價值在于它提供真值可能存在的范圍。
誤差統計模型的建立需要合理的誤差頻率分布假設,RMSE假定誤差服從均值為零的正態分布,因此RMSE不能揭示誤差中的系統成分。RMSE可以反映利用樣本點數據的估計靈敏度和極值效應,標準差SD代替RMSE可以消除系統性誤差,AR則可以比較分析不同空間尺度、不同表面的空間數據參數精度。
本實驗運用ArcGIS軟件作為分析工具,版本為ArcGIS 9.3。ArcGIS是一款可提供地理數據顯示、制圖、管理、分析、創建和編輯的GIS桌面軟件。ArcView部分帶有數百種可進行空間分析和地理處理任務的工具,地理處理任務包括諸如圖層疊加、緩沖區分析和數據轉換等常規的GIS操作。ArcCatalog部分可以用來組織、管理和創建GIS數據。ArcView中的ArcToolbox工具箱中包含了實驗所需的反距離權重插值、克里金插值、樣條插值和自然鄰域插值工具。
數據來自國際科學數據服務平臺,通過提取部分DEM數據中的高程點作為原數據即已知數據。本實驗主要是對幾種插值算法做比較,故為方便處理,提高效率,對下載的DEM數據進行處理,得到如圖1的原始數據和如圖2高程點數據。

圖1 DEM數據 圖2 提取出的高程
先對插值結果圖和原始數據圖做如圖3~圖5比較:
圖3中從左至右依次為原始數據、反距離插值、克里金插值、規則樣條插值、張力樣條和自然鄰域插值。從整體上幾種插值均保持了原來數據的基本特征,數據比較集中在50 m~70 m段,有一定的科學性,其中克里金插值效果相對其他幾種較平滑。圖4是原數據柱狀拉伸統計圖,圖5從左至右依次為反距離插值、克里金插值、規則樣條、張力樣條和自然鄰域插值,因為拉伸模型都相同,所以具有可比性,從圖中也可以看出,克里金插值的數據起伏波動較大。反距離插值效果和樣條插值數值特征從整體上所得的數據特征基本一致,自然鄰域最接近原始數據的數值分布特征。

圖3 插值效果圖比較

圖4 原數據柱狀拉伸統計圖
以上是對插值結果數值統計的對比分析,下面引入檢測點,采用精度模型進行評價,表1是檢驗點高程值和插值后的高程值統計表。
帶入精度評價模型評價時,值得注意的是反距離權重插值等確定性插值只依賴于數學模型,其驗證標準只有中誤差,而統計類的有多種評價體系。一般來說中誤差最小,平均誤差接近于中誤差,標準差接近于0結果最好。我們用前面給出的幾種評估模型計算如表2所示:

插值檢驗數據統計 表1

續表1

插值精度比較 表2
從表中可以看出幾種插值的中誤差、相對中誤差和指數中誤差是張力樣條函數較小,規則樣條函數的平均誤差和精度比率最小;克里金插值的中誤差和平均誤差最大,說明克里金插值結果波動性很大;比較而言,對于該高程數據,樣條插值的效果會更好。
結合幾種插值算法的參考和本次實驗,對幾種插值的特點做以下描述:反距離加權法直觀并且效率高,在已知點分布均勻的情況下插值效果好,插值結果在用于插值數據的最大值和最小值之間,但缺點是易受極值的影響。克里金方法的關鍵在于權重系數的確定,該方法在插值過程中根據某種優化準則函數來動態地決定變量的數值,從而使內插函數處于最佳狀態。克里金方法考慮了觀測的點和被估計點的位置關系,并且也考慮各觀測點之間的相對位置關系,在點稀少時插值效果比反距離權重等方法要好。所以利用克里金方法進行空間數據插值往往取得理想的效果。克里金算法提供的半變異函數模型有高斯、線形、球形、阻尼正弦和指數模型等,在對氣象要素場插值時球形模擬比較好。樣條函數適用于逐漸變化的曲面,如溫度、高程、地下水位高度或污染濃度等。該方法優點是易操作,計算量不大,缺點是難以對誤差進行估計,采樣點稀少時效果不好。自然鄰域插值以Voronoi圖為幾何基礎,較好地反映數據的局部相關性,適用于實際資料有限、數據復雜的建模,但有效的插值范圍相對較小。當然對空間插值而言,沒有絕佳的插值方法,只有在針對某一數據采用多種插值方法比較下選擇出來的適用方法。
對于以上幾種插值的不同特點,我們另外提出多級空間插值。其思路是先將整體空間數據集按照相應規則劃分為若干局部區域;然后提取各局部區域的空間數據特征;再根據局部數據特征與算法匹配規則,選擇相適應的算法及參數對局部區域進行插值運算;如果繼續進行局部插值,則將各局部數據集合并為更大范圍的局部數據集,回到步驟2,如果選擇結束則利用整體插值方法對局部數據集的插值結果進行再次插值,得到插值后的復雜空間數據集。這其中,可以將不同的插值模型混合使用,已取得良好插值效果。
一個行之有效而科學快速的插值方法相比采集同等的數據節約了大量的人力物力,顯得更具現實意義。雖然目前空間數據無論從數據采集還是數據插值技術上都相對完備,但要滿足未來需求,還需做下面幾個方面的考慮:一是提高算法的魯棒性和全自動性:在應用GIS處理空間數據時,不同數據格式的訪問,如何指定數據魯棒性、指定插值方法以及如何以全自動方式選擇參數的問題,成為實際應用中迫切需要解決的問題之一。二是多源數據集成:不同來源的數據其分辨率、精度、分布等情況不同,需要用新的數據處理方法和集成方法來優化提取多源數據信息。三是多尺度建模和多維表達:新型多時空尺度模擬方法正在不斷發展中,多維數據技術的綜合集將促進多變元應用的發展。最后值得一提的是精度、實用性以及計算效率是空間插值技術的根本,這是在研究整個空間數據插值技術過程都必須考慮的因素。
[1] 胡鵬,黃杏元,華一新. 地理信息系統教程[M]. 武漢大學出版,2005(8);7~8,117~120.
[2] 湯國安,劉學軍,閭國年. 數字高程模型及地學分析的原理與方法[M]. 科學出版社,2005(8);17,188~189.
[3] 孟耀偉,梁衡,程菊明. 多級空間數據插值及其應用方法[J]. 許昌學院學報,2010(9).
[4] 王穎,祝民強,喬康寧. 航測數據處理中空間插值方法[J]. 測繪與空間地理信息,2011(2).
[5] Stephen J.Jeffrey,Using spatial interpolation to construct a comprehensive archive of Australian climate data[J]. Environment Modeling & Software,2001(16):309~330.
[6] Trevor C.Bailey,Interactive spatial data analysis[C]. University of Exter.
[7] 郭艷軍,潘懋,燕飛等. 自然鄰點插值方法在三維地質建模中的應用[J]. 解放軍理工大學學報,2009(12).
TheStudyandExperimentofSpatialDataInterpolationBasedonArcGIS
Xiao Chenglong
(Chongqing Survey Institute,Chongqing 401121,China)
Thispaper applicateseveralcommonly usedinterpolation methods(inverse distance weighted interpolation,kriginginterpolation,spline interpolation andnatural neighborinterpolation),interpolationexperiment based on ArcGIS. Assessmentoftheresultsto discussthecharacteristicsoftheamountofseveralinterpolation methods,the pros and cons,onthelack ofimprovementideas,and suggest wherespatial interpolationneed to be consideredand improved.
spatial interpolation;IDW;spline;natural neighbor;kriging
1672-8262(2017)06-71-04
P208.1
A
2017—03—09
肖城龍(1987—),男,助理工程師,主要從事測繪地理信息工作。