高 尚,金 犇,郭 凱
(長江水利委員會水文局長江下游水文水資源勘測局,南京 210011)
在長江沿線的基礎測繪和工程建設中,高程數據是必不可少的。傳統的高程測量方法,如幾何水準法,雖然準確,但在大范圍水準測量中成本高且效率低下[1]。隨著衛星導航定位技術的發展,GNSS(全球導航衛星系統)高程在工程測繪中得到廣泛應用。然而,由于衛星定位技術所采用的高程基準面是參考橢球面而非傳統水準基準的大地水準面,導致出現高程異常問題。為解決高程異常影響,研究者們提出了多種方法,包括曲線擬合模型、曲面擬合模型、神經網絡模型和地球重力場模型等。
其中,二次多項式方法作為曲面擬合模型在高程擬合中得到廣泛應用。該方法通過最小二乘準則構建擬合方程,并利用此方程外推高程異常值。粟劍[2]采用曲線擬合法將GNSS 大地高轉換為正常高,使擬合高程達到三等測量精度。唐詩華等[3]針對GPS 高程擬合方法的精度問題,根據測量實例比較了各種最小二乘法的擬合能力。研究表明:最小二乘估計在高程擬合中精度最高。張騰旭等[4]通過研究發現對于大面積高程異常值變化較大的地區,最小二乘配置法能夠取得較高的擬合精度。在高程擬合方面,張潘等[5]通過高程擬合與三等水準測量成果進行對比分析,驗證了模型在實際中應用的優越性。
近年來,隨著機器學習算法的不斷發展,如BP 神經網絡,采用機器學習來進行高程異常擬合也引起了許多學者的廣泛關注。曾凱等[6]利用神經網絡進行高程擬合應用。鄧才林等[7]采用BP 神經網絡對湖南省新化縣進行高程異常擬合。李林曉等[8]對改進的RBF 神經網絡組合模型中的關鍵參數進行優化選取,且應用于工程實踐中。
本文旨在探究二次多項式擬合和BP 神經網絡在高程擬合中的應用。通過評估內外符合精度,對比分析2 種方法的精度表現。該研究將提供一種新的解決方案和方法,為長江沿線大范圍帶狀區域的高程擬合問題提供支持,以提高測繪和工程建設的精確性。
高程異常的多項式擬合法就是建立一個以二維位置參數為自變量的多項式函數模型,其函數值即為高程異常,通過一定數量的已知點的高程異常值可計算出多項式的系數。對于公共點(同時具有大地高和正常高的點)上的高程異常與平面坐標之間假定有如下數學關系
式中:ξi為對應于平面坐標(xi,yi)的高程異常,a0、a1、a2、a3、a4、a5為所求的模型參數,εi是誤差,因此,需要6 個或6 個以上公共點,采用最小二乘原理進行數學模擬,確定模型。
將式(2)寫成矩陣形式
通過列以上的方程并解算,本文可以求出各個重合點的正常高。具體方法是,解出在Σε2=min 條件下的ai值,再通過公式(2)求解出未知點的ξ。
BP 神經網絡也可以稱為多層前饋型神經網絡,其最大特點是信號和錯誤的反向傳輸。初始權重是隨機設置的,然后根據反向傳播過程中訓練數據(訓練過程中的計算值)與輸出數據(訓練要達到的實際值)之間的差異進行修改。重復前進和后退過程,直到訓練數據和輸出數據之間的差異達到訓練精度為止,其具體網絡結構如圖1 所示[9]。

圖1 BP 神經網絡模型算法結構
BP 神經網絡由輸入層、隱含層和輸出層三部分組成。設神經網絡的輸入向量為X=(X1,…,Xn)T,期望輸出為d=(d1,…,dm)T,輸入層與隱含層的權值矩陣為V=(v1,v2,…,vk,…,vq)T,閥值為θ,隱含層和輸出層的權值矩陣為W=(w1,w2,…,wi,…,wm)T,神經網絡的正向傳輸的計算過程如下。
隱含層的輸出計算公式為
輸出層的輸出計算公式為
式中:f1(I1)、f2(I2)為隱含層與輸出層的傳遞函數,f1(I1)通常為Sigmoid 函數。f2(I2)可以為Sigmoid 函數或Purelin 函數,y2為最終的輸出值。
常用BP 神經網絡通常采用誤差反向傳播法調整連接權。神經網絡的目標函數為
式中:p 表示第p 個樣本,k 表示第k 個節點,dk表示期望輸出。
本文的BP 神經網絡簡述如下:使用MATLAB神經網絡工具箱建立,輸入層包含高程點平面坐標x 和y,輸出層為高程異常。訓練函數選用了tansig、purelin 和trainlm,訓練參數設置net.tranParam.show=100,net.tranParam.epochs=1000,net.tranParam.lr=0.01,net.tranParam.goal=le-3,并且其他參數采用MATLAB神經網絡工具箱默認值。
南京河段是長江中下游重點河段之一,上承馬鞍山河段,下接鎮揚河段。河段起始端和尚港是蘇皖兩省分界點,終端為泗源溝,主泓長100.3 km。本文采用長江下游安徽馬鞍山市小黃洲沿江至江蘇鎮江市世業洲頭的E 級GNSS 控制點作為樣本數據,該段區域控制點共有71 個,控制長度約為104 km,控制點呈帶狀分布在長江兩岸沿線(點位分布圖如圖2 所示),水準高程按照三等水準測量要求施測。本文取60 個分布相對均勻的點作為樣本點,11 個點作為待擬合點。

圖2 點位分布圖
為了分析不同模型的可塑性,可以使用已知點的GNSS 高程異常值與擬合的高程異常值進行比較,并定義擬合殘差,來驗證不同模型的精度。精度評定分為內符合精度和外符合精度。
2.2.1 內符合精度
根據參與擬合計算已知點的GNSS 高程異常值ξi與擬合的高程異常值進行比較,并用來定義擬合殘差,內符合精度μ1公式如下所示
2.2.2 外符合精度
根據參與擬合計算檢核點的GNSS 高程異常值ξi與擬合的高程異常值進行比較,并用ui=ξi-ζi′來定義擬合殘差,外符合精度公式如下所示
分別采用2 種方式對測區范圍內的60 個高程值進行擬合,驗證精度的誤差最大值(max)、誤差最小值(min)、均方根誤差(RMS)、平均絕對誤差(MAE)、中誤差見表1,2 種方法在對應點擬合殘差如圖3 所示,BP神經網絡擬合結果如圖4 所示。

表1 內符合精度對比

圖3 二次多項式與BP 神經網絡擬合殘差
從表1 與圖3 中可知,采用2 種擬合方式都有較好的擬合效果,計算結果非常接近,誤差趨勢也一致。
通過對2 種擬合方式的數據進行對比,可以看出,在該測區范圍內,通過二次多項式和BP 神經網絡2 種擬合方式計算得出的結果相差較小。針對11 個均勻分布的校核點進行外符合精度計算比較,得出以下結論:
首先,從表2 中可以看出,2 種擬合方式在最大值和最小值方面的絕對值誤差都在測量要求范圍之內。

表2 外符合精度對比
其次,通過比較RMS 和MAE,可以看出2 種擬合方式在整體預測精度上也相差較小。RMS 和MAE 都是衡量預測結果與真實值之間誤差的指標,數值越小代表預測的精度越高。根據表2 中的數據,二次多項式的RMS 為0.040 4,BP 神經網絡的RMS 為0.034 5,這說明使用BP 神經網絡進行擬合的結果相對更加精確。而在MAE 方面,二次多項式的數值為0.033 1,BP 神經網絡的數值為0.025 3,也表明了BP 神經網絡相對于二次多項式更能接近真實數據。
最后,本研究還可以觀察比較2 種擬合方式的中誤差。中誤差是用來衡量預測值的分散程度,數值越小說明預測結果的穩定性越好。根據表2 的數據,二次多項式的中誤差為0.042 3,BP 神經網絡的中誤差為0.036 2,可以看出2 種擬合方式在中誤差上也存在一定的差距,BP 神經網絡的結果更加穩定。
綜上所述,通過對2 種數據擬合方式進行比較,研究可以得出結論:無論是二次多項式還是BP 神經網絡,都能夠滿足測量要求內的誤差,并且2 種方式的預測結果相差較小。在整體預測精度上,BP 神經網絡相對于二次多項式表現更佳,其RMS 和MAE 的數值較小,能夠更準確地擬合真實數據。此外,BP 神經網絡還表現出更好的穩定性,其中誤差較小。因此,本研究可以認為BP 神經網絡是一種更適用于該測區范圍內數據對比的擬合方式。
本文以長江下游馬鞍山至鎮江多項式段布設的E級GNSS 控制網作為實驗區域,使用二次多項式曲面擬合、BP 神經網絡擬合2 種常用的方式進行高程擬合,對大范圍帶狀區域高程擬合方法進行研究。通過研究得出:
1)確定地球表面高程異常的大小不僅與地球內部的密度變化有關,也與地形起伏等多種因素有關。因此,對于給定區域內的高程異常點,采用一種數學函數進行擬合時,由于擬合模型的缺陷,必然存在誤差。在選擇擬合方程來描述高程異常分布時,只能選擇誤差相對較小的模型,這是比較合理的做法。
2)已知點的分布情況對擬合效果和選擇擬合模型具有關鍵影響。如果已知點覆蓋整個擬合區域,則擬合精度通常比較穩定。但是,如果待擬合的點位于已知點所涵蓋的區域之外,則擬合精度會降低。
3)2 種高程擬合方法相對比,BP 神經網絡擬合具有相對更好的擬合結果,但容易陷入局部最優解,應在實際應用當中,多次進行訓練,最后選擇更好的擬合結果。
綜上所述,在長江下游平原沿線區域,進行高程擬合時,可采用BP 神經網絡擬合法。