(1.南京工業大學 測繪科學與技術學院,江蘇 南京 211816; 2.大連市勘察測繪研究院有限公司,遼寧 大連 116021)
徑向基函數插值(Radial Basis Functions, RBF)為典型的精確性插值算法,它要求插值表面經過所有已知采樣點,插值表面比較平滑,在DEM建模[1-3]、巖體變形[4]、水文預報[5]中獲得有效應用。選用合適的徑向基插值參數是保證DEM插值效果的前提,為此一些學者對其進行了深入研究。和嫻等對不同地形條件下徑向基核函數的適用性進行了探討[6]。對于光滑因子取值而言,相關文獻提出了數值近似表達法[2,7-8]、交叉驗證法[9]、遞歸算法[10]等,文獻[11]根據地貌類型、采樣密度和插值算法對規則格網精度影響的研究,認為多重二次曲面和多重對數徑向基函數應使用接近于零的光滑因子,反多重二次曲面、自然三次樣條曲面和薄板樣條曲面徑向基函數則應使用非常大的光滑因子。對于徑向基搜索方式,張錦明等采用ASTER GDEM數據源基于多重對數徑向基函數對搜索方向和搜索點數進行實驗分析,結果表明光滑因子為零時,采用四方向并適當增加搜索點數對提高插值精度更有效[12]。
不同地貌類型區適用不同類型核函數,那么不同類型核函數在搜索方式設置上是否存在差異值得研究。為此,本文在上述研究基礎上,擬對常用的5種徑向基核函數插值時搜索方向和搜索點數進行優選分析,以消除搜索方式參數設置的不確定性,從而為DEM徑向基插值參數選擇提供參考和指導。
本文選用平原、丘陵和山地3種不同地貌類型區,其地形特征描述參數如表1所示。從表1中可以看出,實驗所選取的3個樣區地表高程集中于平均數附近,平原和丘陵地區處于正偏度狀態,山地地區高程差值最大,處于負偏度狀態。實驗數據為1∶2 000地形圖矢量散點和等高線。
徑向基函數算法是一系列精確插值方法的組合,這種插值方法類似于將橡膠膜的徑向基表面穿過各個已知采樣點,并保證表面的總曲率最小[13]。徑向基核函數在插值過程中決定采樣點權重分配方案,對插值效果有著重要影響[14-15]。本文選用常用的5種核函數(見表2)進行實驗分析。式中,h為由點(x,y)到第i個數據點的距離;R2為用戶指定的平滑因子,平滑因子越大,山頂等高線則越平滑。5種核函數都是準確的插值器,都能適應本實驗中的離散采樣點數據。
表1 實驗樣區地形描述參數統計Tab.1 The description of study sites
表2 常用5種徑向基核函數Tab.2 The five frequently-used RBF kernel functions
2.2.1搜索點數實驗設計
搜索點數(Search Point)是指參與內插計算的采樣點個數。在對參與計算的采樣點進行選擇時,應考慮所選點是否具有代表性,同時也要避免選擇過多采樣點參與計算,從而造成插值速度變慢。內插過程中,無論是搜索半徑控制,還是搜索方向限制,究其本質都是為了控制參與計算采樣點個數的問題。所以,搜索點數選擇也是影響內插質量重要因素之一,最優搜索點數范圍也應隨地貌類型區的差異而改變。
為了探究徑向基插值中最優搜索點數,實驗中采用固定搜索方向和光滑因子,搜索點數設置包括兩個方面:一是單向改變上、下限值,即固定上限減小下限和固定下限增大上限;二是雙向改變上、下限值,即同時增大上、下限和同時減小上、下限。基于上述實驗方案研究搜索點數對插值效果的影響,探尋不同地形條件下搜索點數最優參數范圍。
2.2.2搜索方向實驗設計
搜索方向(Search Direction)是指在搜索采樣點時增加考慮方向因素。當采樣點呈不規則分布時,預測點周圍可能出現某個方向采樣點不足,而另一個方向采樣點過量的現象,從而對內插效果產生影響。因此,限制搜索方向可以盡可能地滿足各個方向對采樣點數量的要求。
DEM插值精度與搜索方向關系密不可分,傳統的空間插值很少考慮各個方向變化,通常在進行DEM 內插時,默認選擇四方向搜索。但是不同地形條件對搜索方向敏感度具有較大差異,并非所有地貌類型都適合四方向搜索。因此在進行空間內插時,需要考慮不同搜索方向對內插結果的影響。本次實驗分別從無方向、四方向、四方向45°旋轉、八方向等四個搜索方向進行內插計算,進而探討搜索方向對內插精度的影響,尋找適合不同地形條件的最佳搜索方式組合(見圖1)。
圖1 搜索方向實驗設計Fig.1 The search directions for the experiment
2.2.3精度評價方案
考慮到 DEM 中誤差(RMSE: root mean square error)是目前通用的DEM 質量評價標準,本文將RMSE作為評價DEM內插精度的主要指標。該方法可以從整體意義上描述地形參數與其真值的離散程度,中誤差越小,預測值越接近真實值,模擬效果越好。中誤差的計算公式為
(1)
式中,zk為假設預留樣本點的實際高程,ZK為內插DEM上對應預測點的高程值,n為布設檢驗點的個數。
(1) 根據插值需要,將每個實驗樣區原始等高線數據進行預處理得到離散采樣點,并將其分為訓練數據集和測試數據集兩部分,其中85%采樣點作為訓練數據集生成插值表面,預留15%采樣點作為測試數據集,用以評測插值精度。平原區、丘陵區和山地區訓練數據集點數分別為6 735,15 538,42 752,測試數據集點數分別為1 189,2 742,7 545。
(2) 根據實驗方案中搜索點數和搜索方向不同取值,使用訓練數據集應用上述5種徑向基核函數分別建立5 m分辨率的格網DEM;然后將預留樣本點作為檢查點,計算殘差值,并生成每個實驗樣區殘差中誤差值。
(3) 分析探討不同實驗樣區搜索點數和搜索方向對DEM徑向基插值精度的影響規律,在此基礎上確定搜索方式的最優取值區間。
在進行搜索點數分析實驗時,搜索方向采用常用默認的四方向搜索,同時不考慮光滑因子的影響,即將光滑因子值設定為0。
3.1.1單向改變搜索點數上下限值
一方面固定搜索點數上限值為15,不斷減小下限值,分別設置為3~15,7~15,10~15,13~15;另一方面固定搜索點數下限值為10,不斷增大上限值,分別設置為10~15,10~18,10~21,內插生成3種地形樣區5 m分辨率的DEM,其中誤差值變化如圖2所示。
(1)當降低搜索點數下限值時,同種徑向基核函數在同一地形樣區中得到的DEM高程中誤差值變化較小,但在不同地貌類型區中得到的DEM高程中誤差值則存在顯著差別。其中,5種徑向基核函數在平原樣區得到的高程中誤差值均小于其他地貌類型區,中誤差最大值都出現在山地樣區。針對地貌類型區而言,平原樣區中,5種徑向基核函數得到的DEM高程中誤差值大小順序為TPSF=NCSF (2)當增大搜索點數上限值時,同種徑向基核函數在同一地形樣區中生成的DEM高程中誤差值存在差異,但并沒有呈現單調遞增或單調遞減的趨勢。MQF在山地樣區中誤差值減小,而NCSF在平原樣區當上限值為21時中誤差值急劇上升,MLF在平原樣區中誤差值增加幅度顯著,IMQF在三種地形樣區中誤差值都出現不同幅度上升;相對地,TPSF對搜索上限值變化靈敏度較差。針對地貌類型區方面,平原樣區中, TPSF與MQF中誤差受搜索點數上限值影響較小,并且其值遠小于另外3種核函數;丘陵樣區中,TPSF和NCSF中誤差值較小并且基本保持不變,MQF中誤差值隨搜索點上限值增加降低明顯,插值精度與TPSF和NCSF近乎相同;山地樣區中,TPSF始終最小并且遠小于其它核函數。 3.1.2雙向改變搜索點數上下限值 將搜索點數上、下限值分別以15,10為基準,調節步數為2,得到6組搜索點數,即4~9,6~11,8~13,10~15,12~17,14~19,16~21。研究該系列搜索點數對不同地貌類型區DEM插值精度的影響,DEM高程中誤差值統計結果如圖3所示。 (1) 平原樣區中搜索點數雙向改變對MQF和NCSF插值效果影響不大,高程中誤差值均控制在0.3 m以下;當鄰域搜索點上限值達到21時,MLF和TPSF內插得到的高程中誤差值會驟增;IMQF在該樣區插值結果幾乎呈線性增加趨勢,隨著搜索點數上限值增加中誤差值不斷變大。 (2) 丘陵樣區中,MQF插值精度隨內插點數增多得到有效提高,TPSF、NCSF和MLF,無論搜索點數增加或減少,中誤差值變動幅度均較小,相比較而言,TPSF和NCSF插值效果更優。 (3) 山地樣區中,隨著搜索點數增加,MQF中誤差值總體上得到有效降低,是該樣區徑向基插值核函數的首選;NCSF和TPSF插值精度也得到一定程度的提高,MLF中誤差值基本保持穩定,而IMQF插值精度卻逐漸降低。 圖2 單向改變搜索點數對DEM插值精度的影響Fig.2 The impacts on DEM accuracy when either the maximum or minimum of search point number is changed 圖3 雙向改變搜索點數對DEM插值精度的影響Fig.3 The impacts on DEM accuracy when both the maximum and minimum of search point number are changed 圖4 搜索方向對DEM插值精度的影響,橫坐標為搜索方向Fig.4 The impacts on DEM accuracy when different search directions are applied 在進行搜索方向分析實驗時,搜索點數采用常用10~15個,同時不考慮光滑因子的影響,即將光滑因子值設定為0,采用無方向、四方向、四方向45°旋轉和八方向搜索進行徑向基函數插值,生成的DEM中誤差如圖4所示。 (1) 平原樣區中,搜索方向對插值結果影響較小,整體上DEM高程中誤差值小于其他樣區;當搜索方向改變時,MQF、TPSF、NCSF高程中誤差值相對穩定,均保持在0.3 m以下;對于MLF和IMQF而言,當進行無方向和四方向45°旋轉搜索時,二者具有相對較高的中誤差值,當使用四方向以及八方向搜索時,二者與另外三種核函數相比,插值精度仍然表現較差,但相對而言可以將插值效果控制在較為理想的范圍。 (2) 丘陵樣區中,TPSF和NCSF插值精度受搜索方向影響較小,二者高程中誤差值均在0.5 m以下并且近乎相同;IMQF中誤差值遠高于其他核函數,同時在不同搜索方向變化很小;MLF和MQF在無方向以及四方向45°旋轉搜索時插值精度表現優良,中誤差值在0.5 m左右,當使用四方向以及八方向搜索時,MLF中誤差值達到1.3 m和1.1 m,MQF中誤差值均在0.8 m左右。 (3) 山地樣區中,IMQF表現出較差的內插效果,其中誤差值在各個搜索方向均超過1.0 m,當使用無方向搜索時高達1.5 m;MQF較其他四種徑向基核函數的插值精度最優,在四方向45°旋轉搜索時高程中誤差值為0.5 m,較其它搜索方向降低幅度明顯; 而MLF、TPSF和NCSF插值精度受搜索方向影響并不顯著。 (1) 單向改變搜索點數下限值時,所有核函數內插生成的DEM高程中誤差值基本穩定;當增加搜索點數上限值時,只有MQF在3種地形樣區中插值精度得到不同程度的提高,其他核函數中誤差值保持不變甚至增大。 (2) 當同時增加搜索點數上下限時,不同核函數插值精度在3種地形樣區呈現出不同變化特點。 (3) 當改變搜索方向時,除TPSF和NCSF中誤差值變化較小外,另外3種核函數在不同樣區也具有各自的變化規律。 綜合而言,為獲取更好的插值效果,建議平原樣區使用NCSF或TPSF核函數,NCSF搜索點數上限值為18,TPSF搜索點數上限值為21;丘陵樣區同樣宜采用NCSF或TPSF核函數,二者搜索點數上限值控制在14~21之間;山地樣區適宜采用MQF或TPSF核函數插值,MQF采用四方向45°旋轉搜索,搜索點數上下限值設置為16~21,而TPSF采用常用的四方向搜索,搜索點數可為默認10~15個,單向改變搜索點數對插值精度影響較小。3.2 搜索方向對DEM插值精度的影響
4 結 論