黎峻宇,劉立龍,韋相任
(1.桂林理工大學(xué)廣西礦冶與環(huán)境科學(xué)實(shí)驗(yàn)中心,廣西 桂林 541004;2.桂林理工大學(xué)測(cè)繪地理信息學(xué)院,廣西 桂林 541004;3.廣西空間信息與測(cè)繪重點(diǎn)實(shí)驗(yàn)室,廣西 桂林 541004;4.廣東省有色金屬地質(zhì)局九三三隊(duì)勘測(cè)公司,廣東 肇慶 526060)
當(dāng)前,GPS 測(cè)量技術(shù)已經(jīng)在國(guó)家基礎(chǔ)性建設(shè)中得到廣泛應(yīng)用。在這些基礎(chǔ)設(shè)施中,鐵路、公路、石油與燃?xì)夤艿溃c排灌管道,電力設(shè)施中的輸電線路,能源開(kāi)發(fā)項(xiàng)目中的石油物探等等,往往集中在一些大面積的帶狀區(qū)域內(nèi)[1]。GPS 測(cè)量直接獲得的高程是相對(duì)于WGS-84 橢球面的大地高,實(shí)際生產(chǎn)過(guò)程中使用的卻是相對(duì)于似大地水準(zhǔn)面的正常高,如何直接利用GPS 大地高來(lái)獲得滿足工程需要的正常高,以便節(jié)省人力、物力和時(shí)間,一直是測(cè)量界關(guān)注和研究的一個(gè)重點(diǎn),對(duì)大面積帶狀區(qū)域高程擬合方法的研究對(duì)國(guó)家基礎(chǔ)性建設(shè)更是具有十分重要的現(xiàn)實(shí)意義。然而除了文獻(xiàn)[1]等少數(shù)文獻(xiàn)涉及帶狀高程擬合研究之外,鮮有人詳細(xì)探討涉及大面積帶狀區(qū)域的高程擬合方法。高程異常轉(zhuǎn)換方法主要有四類:幾何解析法、物理大地測(cè)量法、人工智能法和混合轉(zhuǎn)換法,其中BP 神經(jīng)網(wǎng)絡(luò)、二次曲面擬合等方法在高程擬合中得到比較廣泛的應(yīng)用[2]。最小二乘支持向量機(jī)具有結(jié)構(gòu)簡(jiǎn)單、全局最優(yōu),泛化能力較好的優(yōu)點(diǎn),能夠很好地解決小樣本、非線性、高維數(shù)、局部極小等問(wèn)題,同時(shí)還克服了神經(jīng)網(wǎng)絡(luò)等一般學(xué)習(xí)機(jī)器中存在過(guò)學(xué)習(xí)、局部?jī)?yōu)化和樣本數(shù)量要求多的弊端,基于以上原因文獻(xiàn)[3][4]等開(kāi)始將其應(yīng)用到高程擬合中。本文使用一個(gè)大面積帶狀的GPS 網(wǎng)數(shù)據(jù)為基礎(chǔ),經(jīng)最小二乘支持向量機(jī)、BP 神經(jīng)網(wǎng)絡(luò)、二次曲面擬合三種方法進(jìn)行高程擬合,就不同方法擬合結(jié)果進(jìn)行對(duì)比分析,獲得一些具有一定價(jià)值的理論結(jié)果。最后根據(jù)這些理論結(jié)果,為國(guó)家基礎(chǔ)性建設(shè)中大面積帶狀區(qū)域高程擬合提出一些實(shí)用性建議。
最小二乘支持向量機(jī)原理是將最小二乘引入支持向量機(jī)中,采用等式約束代替不等式約束作為損失函數(shù)。訓(xùn)練過(guò)程由二次規(guī)劃問(wèn)題求解轉(zhuǎn)化為線性方程組求解,同時(shí)使誤差平方項(xiàng)達(dá)到最小化的計(jì)算過(guò)程[3]。設(shè)給定一個(gè)有M 個(gè)訓(xùn)練樣本的集合(xi,yi),i=1,2…~M,其中訓(xùn)練m 維向量,xi∈Rm,輸出數(shù)據(jù)yi∈R。按照結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則,函數(shù)擬合問(wèn)題可轉(zhuǎn)為下列函數(shù)的約束優(yōu)化問(wèn)題:

約束條件為:

式中:W∈Rm為權(quán)矢量;g(xi)是將x 從輸入空間映射到特征空間的函數(shù);ξi為誤差項(xiàng);C 為正規(guī)化參數(shù),控制對(duì)超出誤差樣本的懲罰程度,b 為偏置量。
經(jīng)過(guò)簡(jiǎn)化后得到最小二乘支持向量機(jī)函數(shù)為:

為了解決高維計(jì)算問(wèn)題,引入一核函數(shù)K(xk,xj)來(lái)等效高維空間的內(nèi)積形式[g(xk)g(xi)],即:

目前常用的核函數(shù)主要有多項(xiàng)式核函數(shù)K(x,x)=(x* y+1)p、徑向基核函數(shù)(Radial Basis Function,RBF)K(x,x)=exp[-‖x-y‖2/(2σ2)]和Sigmoid核函數(shù)k(x,xi)=tanh[v(x* xi)+c]等形式。根據(jù)數(shù)值限制條件和參數(shù)較少以及優(yōu)秀的局部逼近特征,本文選擇RBF 作為支持向量機(jī)核函數(shù)。最小二乘支持向量機(jī)模型的確定最重要的是核函數(shù)參數(shù)σ 和正規(guī)化參數(shù)的選擇,廣泛采取的方法是試算法、交叉驗(yàn)證法、留一法[5]。我們輸入的訓(xùn)練樣本為三維向量,分別為高程點(diǎn)平面坐標(biāo)和高程異常;輸出向量只有一維,即高程異常;基于MATLAB 工具箱中最小二乘支持向量機(jī)自帶的尋優(yōu)函數(shù)進(jìn)行參數(shù)尋優(yōu)σ、C。
BP 神經(jīng)網(wǎng)絡(luò)是一個(gè)多層前向型神經(jīng)網(wǎng)絡(luò),其權(quán)值調(diào)整采用誤差反向傳播算法,該網(wǎng)絡(luò)由輸入層、隱含層和輸出層組成。設(shè)神經(jīng)網(wǎng)絡(luò)的輸入向量為X=(X1,…,Xn)T,期望輸出為d=(d1,…,dm)T,輸入層與隱含層的權(quán)為W,其維數(shù)為n×s,閥值為θ1,維數(shù)為s×1,隱含層與輸出層的權(quán)W',其維數(shù)為s×m,閥值為θ2,維數(shù)為m×1,其中n、s 和m 為別為輸入層、隱含層和輸出層的神經(jīng)元節(jié)點(diǎn)數(shù)[6~7]。神經(jīng)網(wǎng)絡(luò)的正向傳輸?shù)挠?jì)算過(guò)程如下:
隱含層的輸出計(jì)算公式為:

輸出層的輸出計(jì)算公式為:

上式中,f1(I1)、f2(I2)為隱含層與輸出層的傳遞函數(shù),f1(I1)通常為Sigmoid 函數(shù)。f2(I2)可以為Sigmoid 函數(shù)或Purelin 函數(shù),y2為最終的輸出值。
常用BP 神經(jīng)網(wǎng)絡(luò)通常采用誤差反向傳播法調(diào)整連接權(quán)。神經(jīng)網(wǎng)絡(luò)的目標(biāo)函數(shù)為:

式中p 表示第p 個(gè)樣本,k 表示第k 個(gè)節(jié)點(diǎn),dk表示期望輸出。
本文BP 神經(jīng)網(wǎng)絡(luò)在MATLAB 程序環(huán)境下建立,BP 神經(jīng)網(wǎng)絡(luò)構(gòu)造各項(xiàng)內(nèi)容如下:
(1)輸入層神經(jīng)元個(gè)數(shù)3 個(gè),分別為高程點(diǎn)平面坐標(biāo)和高程異常;
(2)輸出層神經(jīng)元個(gè)數(shù)1 個(gè),即高程異常;
(3)訓(xùn)練函數(shù)取:tansig、purelin、trainlm.
(4)設(shè)置訓(xùn)練參數(shù)net.tranParam.show=100,net.tranParam.epochs=1000,net.tranParam.lr=0.01,net.tranParam.goal=1e-3,其他參數(shù)使用MATLAB 神經(jīng)網(wǎng)絡(luò)工具箱默認(rèn)的取值。
二次曲面擬合公式為:

在(10)式中ξ 表示高程異常,(x,y)為已知點(diǎn)平面坐標(biāo),ε 是誤差。在式(11)中有6 個(gè)參數(shù),此時(shí)需要重合點(diǎn)不少于6 個(gè)。重合點(diǎn)個(gè)數(shù)多于6 個(gè),采用最小二乘原理進(jìn)行數(shù)學(xué)模擬,確定模型。
將式(11)寫(xiě)成矩陣形式:

對(duì)每個(gè)重合點(diǎn),都可以列以上方程,在∑ε2=min的條件下,解出ai,再通過(guò)式(11)求取未知點(diǎn)的ξ,從而解算得各點(diǎn)正常高。
本文采用某大型工程的D 級(jí)GPS 控制網(wǎng)點(diǎn)作為樣本數(shù)據(jù),該控制網(wǎng)共有點(diǎn)41 個(gè),控制面積約為1 387.342 km2,控制網(wǎng)呈帶狀分布(點(diǎn)位分布如圖1所示),水準(zhǔn)按照二等水準(zhǔn)測(cè)量要求施測(cè)。取33 個(gè)分布相對(duì)均勻的點(diǎn)作為樣本點(diǎn),8 個(gè)點(diǎn)作為擬合點(diǎn)。

圖1 點(diǎn)位分布圖
為了驗(yàn)證不同模型的內(nèi)符合精度,就擬合求取的樣本點(diǎn)高程異常值與實(shí)測(cè)高程異常值之差進(jìn)行統(tǒng)計(jì),分析模型的可塑性。驗(yàn)證內(nèi)符合精度的誤差最大值(max)、誤差最小值(min)、均方根誤差(RMS)、平均絕對(duì)誤差(MAE)見(jiàn)表1,不同方法在對(duì)應(yīng)點(diǎn)擬合誤差如圖2 所示。

內(nèi)符合精度對(duì)比 表1

圖2 樣本點(diǎn)誤差分布圖
由表1、圖2 知:支持向量機(jī)的誤差最大值最小值之差在3 種方法中最小,MAE 最小,RMS 也最小;支持向量機(jī)與其他兩種方法相比,進(jìn)行高程擬合可以很好地控制較大的誤差出現(xiàn),同時(shí)支持向量機(jī)擬合誤差變化范圍更小,支持向量機(jī)擬合誤差更好地控制在某一范圍內(nèi);最小二乘支持向量機(jī)誤差變化最小,內(nèi)符合精度最高,相對(duì)其他的擬合方法提高了約1 cm,模型具有很好的可塑性;
驗(yàn)證模型的內(nèi)符合精度只能達(dá)到分析模型可塑性的目的,為了充分說(shuō)明各模型在大面積區(qū)域的泛化能力,還需要對(duì)模型的外符合精度進(jìn)行驗(yàn)證。分析了各種方法在擬合點(diǎn)高程異常值與實(shí)測(cè)高程異常值之差,各種方法的max、min、RMS、MAE 如表2、圖3 所示。

外符合精度對(duì)比 表2

圖3 擬合點(diǎn)誤差分布圖
通過(guò)表2、圖3 可以清晰地看到,支持向量機(jī)的誤差最大值最小值之差在3 種方法中最小;3 種方法外符合精度比較接近,支持向量機(jī)MAE 比最小的BP 神經(jīng)網(wǎng)絡(luò)僅差1.9 mm,RMS 較最小的BP 神經(jīng)網(wǎng)絡(luò)也僅差1.3 mm;支持向量機(jī)與其他兩種方法相比,進(jìn)行高程擬合可以很好地控制較大的誤差出現(xiàn),最小二乘支持向量機(jī)誤差變化較小,RMS 等于0.023 6 m,外符合精度可達(dá)cm 級(jí)精度,模型具有較好的泛化能力;
綜上,對(duì)于本文所選實(shí)例區(qū)域,最小二乘支持向量機(jī)模型的內(nèi)外符合精度可以達(dá)到厘米級(jí)精度,內(nèi)符合精度為0.026 7 m,外符合精度為0.023 6 m,達(dá)到高程擬合的精度要求,可應(yīng)用于大面積帶狀區(qū)域高程擬合。最小二乘支持向量機(jī)擬合模型同時(shí)獲得較高的內(nèi)外符合精度,具備較好的可塑性和泛化能力。
本文以大面積帶狀區(qū)域GPS 控制網(wǎng)為實(shí)驗(yàn)區(qū)域,使用最小二乘支持向量機(jī)、BP 神經(jīng)網(wǎng)絡(luò)、二次曲面擬合三種方法實(shí)施高程擬合,進(jìn)行大面積帶狀區(qū)域高程擬合方法研究。通過(guò)探討得出:
(1)最小二乘支持向量機(jī)可應(yīng)用于大面積帶狀區(qū)域高程擬合,在本文大面積帶狀區(qū)域中擬合精度達(dá)到較理想的厘米級(jí),且三種擬合方法的泛化能力很接近,BP 神經(jīng)網(wǎng)絡(luò)最強(qiáng),最小二乘支持向量機(jī)次之。
(2)最小二乘支持向量機(jī)在大面積帶狀區(qū)域高程擬合中具有相當(dāng)?shù)膬?yōu)勢(shì),可同時(shí)獲得較高的內(nèi)外符合精度,該方法在可塑性優(yōu)勢(shì)明顯的同時(shí)也具有較強(qiáng)的泛化能力。
(3)同一區(qū)域,不同方法擬合精度不同,本文試驗(yàn)獲取數(shù)據(jù)具有局域性,不同的高程擬合方法在其他區(qū)域的適用性有待進(jìn)一步驗(yàn)證。
綜上所述,在大面積區(qū)域,進(jìn)行高程擬合,建議可采用最小二乘支持向量機(jī)模型。
[1]高西峰.GPS 水準(zhǔn)在帶狀區(qū)域似大地水準(zhǔn)面精化中的應(yīng)用研究[D].長(zhǎng)安,長(zhǎng)安大學(xué),2007.
[2]任超,吳偉,黃征凱等人.基于ACI 準(zhǔn)則的徑向基函數(shù)網(wǎng)絡(luò)在GPS 高程轉(zhuǎn)換中的應(yīng)用[J].測(cè)繪科學(xué),2013(2):77~79.
[3]黃磊,張書(shū)畢,王亮亮等人.粒子群最小二乘支持向量機(jī)在GPS 高程擬合中的應(yīng)用[J].測(cè)繪科學(xué),2010(5):190~192.
[4]姬張建,袁運(yùn)斌,盛傳貞.混沌粒子群支持向量機(jī)并考慮地形改正的GPS 高程擬合[J].大地測(cè)量與地球動(dòng)力學(xué),2010(2):95~98.
[5]吳吉賢,杜海燕,張耀文.LSSVM 回歸模型在局部區(qū)域GPS 高程擬合中的應(yīng)用[J].測(cè)繪科學(xué),2013(6):66~68.
[6]張德豐.MATLAB 神經(jīng)網(wǎng)絡(luò)應(yīng)用設(shè)計(jì)[M].北京:機(jī)械工業(yè)出版社,2011:137~139.
[7]王小輝,王琪潔,丁元蘭等人.基于二次曲面和BP 神經(jīng)網(wǎng)絡(luò)組合模型的GPS 高程異常擬合[J].大地測(cè)量與地球動(dòng)力學(xué),2012(6):103~106.
[8]張昊,王琪潔,朱建軍等人.樣本數(shù)據(jù)預(yù)處理對(duì)基于BP神經(jīng)網(wǎng)絡(luò)的高程轉(zhuǎn)換的影響[J].大地測(cè)量與地球動(dòng)力學(xué),2011(2):125~128.
[9]邱衛(wèi)寧.具有穩(wěn)健初值的選權(quán)迭代法[J].武漢大學(xué)學(xué)報(bào)·信息科學(xué)版,2003(4):452~454.
[10]張恒璟,程鵬飛.基于GPS 高程時(shí)間序列粗差的抗差探測(cè)與插補(bǔ)研究[J].大地測(cè)量與地球動(dòng)力學(xué),2011(4):71~75.