李明飛 吳軍超 張一馳
1 陜西省土地工程建設集團有限責任公司,西安市光泰路7號,710075 2 華南師范大學地理科學學院,廣州市中山大道西55號,510631 3 廣東省智慧國土工程技術研究中心,廣州市中山大道西55號,510631
在高程測量中,GPS 獲取的高程數據為大地高,而我國所采用的高程系統為正常高[1],兩者存在差值,即高程異常。因此,如何獲取高精度的高程異常是區域似大地水準面擬合的關鍵。
LSSVM是一種常用的區域似大地水準面擬合方法,其以支持向量機為基礎改進而來,在高程轉換過程中能夠取得較好的效果[2]。但單一的LSSVM會存在模型誤差,精度有限,且會造成擬合殘差序列信息浪費?;诖?,本文以LSSVM為基礎,提出LSSVM-Shepard組合區域似大地水準面擬合方法,充分利用擬合的殘差序列信息,減少模型誤差影響,提高高程轉換精度。

假設(xi,yi)為一組高程異常數據集,其中,i=1,2,…,n,xi∈Rl,yi∈R。xi為數據集的平面坐標,yi為數據集的高程異常。則LSSVM優化問題為:
(1)
式中,ω為系數序列,e為誤差項,γ為正則化參數,φ(·)為映射函數,b為偏差量。根據拉格朗日定理可得:
L(ω,b,e,α)=J(ω,e)-
(2)
分別對ω、b、ei、αi求偏導數,并使偏導數等于0。整理得:
(3)
根據Mercer條件可知[6-7],存在映射函數φ和核函數K,使得K(xk,xl)=φ(xk)Tφ(xl)。線性方程組(3)整理可得:
(4)
通過解方程(4)可得αi和b,則LSSVM模型函數可表示為:
(5)
Shepard插值模型是針對大量離散點提出的局部逼近模型,是一種改進的加權平均法[8]。該模型應用于高程轉換的主要原理為:對于給定的數據集(xi,yi,ξi),i=1,2,…,n,(xi,yi)為平面位置坐標,ξi為對應的高程異常,則未知點高程異??赏ㄟ^下式進行求解:
(6)
式中,u為擬合度,u>1;ri為未知點到各已知點的距離;ρ(ri)為已知點關于未知點的距離權函數:
(7)
從式(7)可以看出,影響范圍內會形成兩個環帶。
根據物理大地測量學理論,高程異??煞譃?個分量[9],其公式為:
ξ=ξ長+ξ中+ξ短
(8)
式中,ξ長、ξ中、ξ短分別為長波、中波、短波分量。高程異常在中長波項部分趨勢變化平緩,而在短波項部分變化較大,容易受到地形等因素影響。
LSSVM將最小二乘思想引入到支持向量機,趨勢面變化相對平緩,同時保持支持向量機良好的非線性問題處理能力,可提高計算效率。與二次曲面擬合“移去-恢復”模型的中長波項相比,LSSVM能夠更好地處理中長波項中存在的非線性問題。Shepard插值模型可以充分利用周圍已知點信息,能夠有效處理局部變化信息。本文將兩個單一模型進行結合,采用LSSVM擬合高程異常的中長波項,利用Shepard插值模型擬合包含模型誤差的短波項,綜合兩個單一模型的優點,同時充分利用單一模型的擬合殘差信息。其主要步驟如下:
1)利用LSSVM對高程異常的中長波項進行擬合,確定模型系數,并計算包含LSSVM模型誤差和短波項的殘差序列。
2)利用Shepard插值模型對殘差序列進行訓練,使用交叉驗證方法確定模型系數。
3)利用組合模型計算區域內任意一點的高程異常值。
實例1 項目區位于黑龍江省某市,地勢較為平坦,屬于平原地區。項目區共有74個GPS C級網點,且均已進行二等水準聯測[ 10],測區面積為1 100 km2。點位分布見圖1。

圖1 平原地區GPS點位分布Fig.1 Distribution of GPS points in plain area
實例2 似大地水準面擬合項目區位于云南某地區,區域內地形起伏大,屬于高原山區地形。區域內共布設24個C級GPS 控制點,并已進行三等水準聯測[11],測區面積約為2 159 km2。點位分布見圖2。

圖2 高原山區GPS點位分布Fig.2 Distribution of GPS points in plateau mountainous area
LSSVM模型采用徑向基函數作為核函數,其公式為:K(x,xi)=exp(-‖x-xi‖2/2σ2)。該模型含有2個參數,分別為懲罰系數γ和核函數參數σ,模型參數以雙層方格網法進行尋優。同時為減少取樣隨機性所產生的訓練偏差,采用交叉驗證法進行參數精度評定,將原始數據分為n等份,通過n次循環,每次以其中一份作為測試數據,其余n-1份作為訓練數據,得到模型并對測試數據進行預測。統計測試結果,最終獲得n次統計結果的平均值,并以此作為參數的評價因子。Shepard插值模型參數為擬合度u和影響半徑R,為防止模型陷入局部最優,文中將u和R范圍分別設置為[1,50]和[0.1,20],搜索步長分別設置為1和0.02,同時通過循環操作使尋優過程遍歷每一個節點。
為增加實驗的可靠性,選取10、20、30、40、50個均勻分布的聯測點分別作為平原地區實驗擬合點,選取7、9、11、13、15個均勻分布的聯測點分別作為高原山區實驗擬合點,剩余點作為檢測點進行計算。為使高程異常數據集處于同一量級,在實驗前對兩組數據分別進行標準化處理。
實驗分別采用二次曲面法、LSSVM、Shepard插值模型、二次曲面-Shepard、LSSVM-Shepard模型等5種方法進行似大地水準面擬合,采用檢測點的外符合精度作為評定指標。實驗計算結果如表1(單位m)和表2(單位m)所示。
表1為平原地區各模型計算結果對比。當擬合點個數從10增加至50時,LSSVM-Shepard模型的外符合精度從0.035 m降至0.015 m,且數值均小于二次曲面、LSSVM、Shepard插值等3種單一模型,說明該組合模型的擬合效果優于這3種單一模型。二次曲面-Shepard模型隨著擬合點數增加,外符合精度從0.034 m降為0.013 m,且數值均小于二次曲面和Shepard插值模型,說明擬合效果優于這兩種單一模型。當擬合點個數一定時,二次曲面-Shepard和LSSVM-Shepard模型的外符合精度最大差值的絕對值為0.002 m,表明兩個組合模型的擬合效果基本一致。

表1 平原地區似大地水準面擬合結果統計
表2為高原山區各模型計算結果對比。當擬合點個數一定時,LSSVM-Shepard模型的外符合精度小于其他4種模型,說明該組合模型高程轉換效果最優。當擬合點個數由7增加至11時,二次曲面-Shepard模型的外符合精度分別為0.097 m、0.103 m、0.110 m,而Shepard插值模型的外符合精度分別為0.095 m、0.094 m、0.089 m,Shepard插值模型的擬合效果略優,說明二次曲面-Shepard模型在復雜的高原山區進行高程轉換時適用性受限。

表2 高原山區似大地水準面擬合結果統計
綜上所述,無論是在平原還是高原山區實驗區,LSSVM-Shepard模型的擬合效果均優于二次曲面、LSSVM、Shepard插值等3種單一模型。在平原實驗區,LSSVM-Shepard模型和二次曲面-Shepard模型均能取得較好的擬合效果,但在高原山區實驗區,二次曲面-Shepard模型適用性受限,而LSSVM-Shepard模型仍能取得較好的擬合效果。
本文提出LSSVM-Shepard組合區域似大地水準面擬合方法,并結合平原地區和高原山區兩個工程實例進行實驗,得到以下結論:
1)無論是在平原地區還是高原山區,LSSVM-Shepard模型的擬合效果均優于二次曲面法、LSSVM、Shepard插值等3種單一模型,是一種可行的似大地水準面擬合方法。
2)二次曲面-Shepard模型在平原實驗區進行高程轉換時,能夠取得較好的擬合效果,但在高原山區實驗中,轉換度低于Shepard插值模型,適用性受限。LSSVM-Shepard模型以LSSVM代替二次曲面模型,能夠有效處理轉換過程中的非線性問題,在兩個實驗中均能取得較好的高程轉換效果,具有較強的適用性。