唐江浪 李剛






摘? 要:空間插值法是基于已獲取的空間數據對研究區域其他空白區信息數據進行預測,即是將離散點的測量數據轉換為連續的數據曲面的一個過程。文章闡述了四種常見的空間數據插值方法的數學含義,并基于MapGIS軟件應用這四種方法對示例數據進行插值分析,研究得出了這幾種方法的使用特點和影響因素,對該軟件用戶的空間數據插值處理具有一定的指導意義。
關鍵詞:空間數據插值;MapGIS;數據網格化;等值線
中圖分類號:P208;P632? ? ? 文獻標識碼:A 文章編號:2096-4706(2019)19-0020-04
Abstract:The spatial interpolation method is based on the acquired spatial data to predict other blank area information data in the study area,so it is a process of converting the measurement data of discrete points into a continuous data surface. The paper expounds the mathematical meanings of four common spatial data interpolation methods,and based on MapGIS software application,the four methods are used to interpolate the sample data. The characteristics and influencing factors of these methods are obtained. It has a certain guiding significance for the spatial data interpolation processing of the software users.
Keywords:spatial data interpolation;MapGIS;data gridding;contour
0? 引? 言
MapGIS軟件功能強大,作為空間數據應用分析專業軟件,在圖件繪制和空間數據處理上具有其獨到的優勢,可以制作具有出版精度的各種復雜的地學圖件。同時,它能對地形數據與各種專業地學數據進行一體化管理和空間分析查詢,從而為多源地學信息的綜合分析提供了一個理想的平臺[1]。
獲取地質、地球物理、地球化學等海洋地學空間數據具有難度大、成本高的特點。其作為生產研究數據,通常采用獲取離散點數據的形式,然后應用專業軟件選擇合理的方法對其插值進行離散數據網格化,流程如圖1所示。
離散數據網格化方法,是將散點數據按照一定的插值算法經過插值產生規則的Grid矩形網格數據。由于受到插值算法的影響,插值生成的規則網格節點無法與初始散點數據在位置上保持一致,用以取代原數據屬性值的網格節點無法保持原有的數據特征[2]。因此用Grid數據生成的等值線,通常會出現野值空值現象,即與實際情況相背離,使得整體數據精度下降,使后續對地質現象的判讀和分析產生偏差。為了解決由空間插值而產生的誤差問題,有必要對插值方法進行研究分析,以找到最適合各類型數據的插值方法,保證原始數據的完整和真實。
目前,國內對于數據插值的相關研究和應用較多,黃利艷[3]對于ArcGIS軟件的多種插值方法進行了降雨預測模型的研究;劉剛等[4]針對異構網格數據提出基于線性插值函數的數據插值方法;譚繼強等[5]以氣溫數據插值為例,分析評價了多種插值方法的精度和優缺點。這些研究專門對于MapGIS插值方法在地學實際生產過程中的分析評價則較少,而該軟件作為地調系統主流應用軟件,理應需要更深入更廣泛的研究分析。
1? 空間插值理論基礎
目前各主流空間數據軟件提供的插值方法很多,如Surfer軟件中提供多達十二種插值方法來構建網格數據模型,ArcGIS軟件在統計分析擴展模塊中也提供了多種插值方法,而國產軟件MapGIS提供了四種實用的插值方法。基于目標數據的研究內容,空間數據的插值方法也不盡相同,如基于距離的插值方法、基于數理統計的插值方法、基于數學對應關系的插值方法、基于幾何關系特征的插值方法等。由于各種插值方法均有自己的適應性特點,不同數據需要嘗試不同的插值方法。文章基于MapGIS選取稠密數據高斯距離加權網格化、稠密數據中值選取網格化、泛克里格法網格化和距離冪函數反比加權網格化這四種插值方法作為研究對象,最后輔以網絡下載的某一區域的水深點數據進行網格化,生成等值線進行驗證分析。
1.1? 高斯距離加權法
高斯距離加權法最主要的參數是已知點和插值點的距離,距離的大小與已知點的貢獻率成數量級的差異。因此,選擇合適的搜索半徑顯得尤為重要。設F0(i,j)為分析區內網格點的要素值,(i,j)為各點行列序號,F(k)為測點實測要素值(k為測點序號),則插值公式為:
1.2? 中值選取法
稠密數據中值選取法基于一個最基本的假設,即任一網格點的屬性值使用的都是距其最近的網格點的屬性值,基于統計算法求出任一點網格值與其相鄰網格值之間的誤差。
1.3? 泛克里格法
泛克里格插值是基于變異函數理論和結構分析為研究基礎,利用地質統計學通過對區域化變量進行無偏最優估計,進而獲取插值點數值的一種全局插值方法[8]。設研究區域為A,區域化變量(即欲研究的物理屬性變量)為{Z(x)∈A};x為空間位置(一維、二維或三維坐標);Z(x)為在采樣點xi(i=1,2,…,n)處的屬性值(或稱為區域化變量的一次實現)Z(xi)(i=1,2,…,n),則根據泛克里格插值原理,未采樣點x0處的屬性值Z(x0)的估計值是n個已知采樣點屬性值的加權和,即:
假設區域化變量Z(x)在整個研究區域內滿足二階平穩假設:
(1)Z(x)的數學期望存在且等于常數:E[Z(x)]=m(常數)。
(2)Z(x)的協方差Cov(xi,xj)存在且只與兩點之間的相對位置有關[9]。
1.4? 距離冪函數反比加權法
特定空間范圍內,連續附近的數據具有一定的聯系和相似性,離得越近,其相關性越大。反比加權法就是基于這一相近相似特性發展而來[10]。設空間待插點為M(xm,ym,zm),M點鄰域內有已知散亂點Ti(xi,yi,zi)(i=1,2,…,n)。利用距離冪函數加權反比法對M點的屬性值Zm進行插值。其插值原理是待插點的屬性值是待插點鄰域內已知散亂點屬性值的加權平均,權的大小和待插點及鄰域內散亂點之間的距離有關,是距離的k(0≤k≤2)(k一般取2)次方的倒數。即:
其中,di為待插點與其鄰域內第i個點之間的距離[11]。
2? 四種插值方法應用比較
插值方法的主要參數設置為網格間距即網格線數,不同數據精度不同插值方法各不相同。利用已知點數據,設置搜索半徑通過內插到半徑范圍內的離散點。另外,特定范圍內的搜索形狀也會影響網格化效果,不規則多邊形對網格化效果影響最大,多邊形邊沿處會出現白化空值或者重疊值現象,尤其需要研究者注意。
通過專業地形數據網站SRTM下載了某個區域的散點數據和網格數據,通過MapGIS數字地面模型子系統的離散數據網格化模塊,分別用上述四種插值方法對實驗數據進行網格化操作。
四種方法的離散網格化通過繪制平面等值線可以清晰地渲染出來。利用MapGIS等值線繪制模塊,設置中等程度的等值線光滑處理,既可以達到最小干擾成圖因素,又能達到最好成圖渲染效果。圖2為四種插值網格化方法下的等值線渲染效果。
通過四種網格化數據后生成的等值線對比,稠密數據高斯距離加權網格化和泛克里格網格化下生成的等值線基本形態相似,網格數據無明顯偏差。稠密數據中值選取網格化有少許位移,誤差由其函數曲線引起,誤差值R(x)=f(x)-C(x)不容易控制,在選取該方法時,應嘗試多次試驗,獲取最佳參數。冪函數反比加權網格化相比其他三種方法形變最大,由于加權系數為距離的函數,故加權系數在參數中要準確把握,該方法中,加權系數與采樣點距離成反比,因此充填的加權系數具有歸一化的特點。另外,該方法不需要對每一個采樣點求解方程,這種插值方法最有效率,適合大范圍高精度離散數據網格化。
將插值網格化數據生成的等值線和多波束數據生成的等值線進行疊加后的渲染效果如圖3所示,對比線為多波束數據生成的等值線。稠密數據高斯距離加權網格化和泛克里格網格化下的等值線吻合效果最好,等值線繪制合理,符合海底地形基本特征。其他兩種網格化方法有部分偏差和位移,需要在參數設置上做合理的嘗試,最終選取最優參數。
3? 結? 論
利用稠密高斯距離加權網格化、稠密中值選取網格化、泛克里格網格化和冪函數反比加權網格化這四種插值網格化方法生成的等值線,形態基本相似,部分區域有少許差異,其中高斯距離加權網格化和泛克里格網格化下的等值線最為接近。通過與研究區域的多波束數據生成的等值線進行疊加,發現高斯距離加權網格化和泛克里格網格化下的等值線與之最為吻合,符合研究區海底地形特征。在進行海底水深數據網格化時,選擇這兩種方法,設置合適的參數,會取得較好的網格化數據效果。同時,應盡可能收集目標區域的綜合地質知識,修正自動網格化的數據,以便提供更精確的基礎數據。最后,其他軟件也提供了很多網格化方法,需要進一步研究分析,以獲取最優數據網格化方案。
參考文獻:
[1] 360百科.mapgis [EB/OL].[2019-08-05].https://baike.so.com/doc/5398933-5636397.html.
[2] 蘇永紅.基于MapGIS的極值無偏地球化學等值線圖生成方法 [J].物探與化探,2016,40(5):1026-1029.
[3] 黃利燕.基于ArcGIS不同空間插值方法的降雨量預測效果對比 [J].北京測繪,2019,33(7):759-762.
[4] 劉剛,池騁,孫立鵬,等.基于線性插值函數的二維異構網格數據插值方法研究 [J].華北電力大學學報(自然科學版),2017,44(6):8-13.
[5] 譚繼強,丁明柱.空間數據插值方法的評價 [J].測繪與空間地理信息,2004,27(4):11-13.
[6] 楊昌軍,陳渭民,羅玲等.高斯權重法在溫度場插值中的應用研究 [J].南京氣象學院學報,2004,27(5):606-614.
[7] 劉蕾.Mapgis軟件網格化效果比較 [J].地質找礦論叢,2014,29(3):454-457.
[8] 王咸彬,吳成梁.散亂數據插值方法及其在背景速度建模中的應用 [J].石油物探,2017,56(1):126-140.
[9] 靳國棟,劉衍聰,牛文杰.距離加權反比插值法和克里金插值法的比較 [J].長春工業大學學報(自然科學版),2003,24(3):53-57.
[10] 張云傲,任俊儒,孫立新.沉降監測數據插值方法選取與精度分析 [J].測繪與空間地理信息,2018,41(6):214-217+221+224.
[11] 靳國棟,劉衍聰,牛文杰.距離加權反比插值法和克里金插值法的比較 [J].長春工業大學學報(自然科學版),2003,24(3):53-57.
作者簡介:唐江浪(1982-),男,漢族,湖南邵陽人,工程師,本科,研究方向:遙感地質解譯、地理信息系統。