何廣煥, 唐詩華, 邢鵬威, 張 躍, 蒙金龍
(桂林理工大學 a.測繪地理信息學院; b.廣西空間信息與測繪重點實驗室, 廣西 桂林 541006)
全球導航衛星系統(GNSS)是與現代科學技術發展同步興起的先進導航、 定位技術[1]。現今GNSS技術已經成為快速收集地理數據的重要手段, 但其獲取的高程是以參考橢球面為基準的大地高, 而在實際測量工程項目中, 采集的高程數據是以似大地水準面為基準的正常高, 這兩種高程之間存在的差值, 即高程異常值[2]。為了使GNSS技術能代替傳統的水準測量技術, 構建高精度的轉換模型一直是測繪工作研究的重點。隨著人們對擬合模型構建方法的深入研究, 近年來越來越多的智能算法應用于區域GNSS高程擬合模型的建立[3-4]。孫佳龍等[5]提出通過地形熵聚類優化多面函數高程擬合模型, 將地形熵作為高程數據分類的方法, 再利用多面函數進行高程異常擬合, 取得了很好的擬合效果。蒲倫等[6]提出利用蟻群-遺傳算法優化多面函數構建高程擬合模型, 為常規多面函數選取合理的中心節點及光滑因子, 使其擬合模型達到更高的精度。高紅等[7]經過對比分析驗證了粒子群算法優化最小二乘支持向量機(least squares support vector machine, LSSVM)用于區域高程擬合模型構建的可行性。本文通過鯨魚算法(whale optimization algorithm, WOA)為LSSVM高程擬合模型尋找正則化參數c和核函數參數σ2, WOA算法具有全局搜索能力強、 參數少、 收斂速度快的特點, 能夠較好地解決原擬合模型中難以尋找最佳參數的問題, 進一步提高了區域GNSS高程擬合模型的預測精度。
Mirjalili等[8]在受到座頭鯨捕食行為的啟發后,于2016年提出了鯨魚算法。WOA還原了鯨魚的狩獵過程, 通過仿照鯨魚的捕獵方式去尋找獵物位置最優解, 此過程主要包括了3種行為: 包圍獵物、 螺旋氣泡捕食、 隨機搜索[9]。鯨魚算法參數少、 收斂速度快、 全局搜索能力強, 適用于多個領域[10]。假設鯨魚的種群規模為N, 所要求解問題的維度是d, 則第i只鯨魚在d維空間中的位置可表示為Xi=(x1i,x2i, …,xdi), 其中i=1, 2, 3,…,N。
鯨魚在正式捕食前, 需要預估獵物的位置, 而鯨魚所在的位置可看作待優化問題的解。當領頭鯨魚確定獵物的位置后, 通過信息傳遞, 其他鯨魚群也會向目標位置游動, 進而不斷更新自己的位置
D=|C·X*(t)-X(t)|;
(1)
X(t+1)=X*(t)-A·D。
(2)
式中:t表示當前種群代數;X*(t)表示t代鯨魚所確定獵物的最優位置向量;X(t)代表其他鯨魚種群的個體位置向量; “·”表示逐元素乘法運算;D表示領頭鯨魚與獵物之間的距離向量;X(t+1)為其他鯨魚向領頭鯨魚靠進而不斷更新的位置向量參數;C是控制參數;A是收斂因子。上式可以進一步表示為

(3)
式中:r為[0, 1]中的隨機數; 隨迭代次數的增加,a由2線性遞減到0;ti為當前迭代次數;Tmaxlter是最大迭代次數。
鯨魚捕食的另一種方法是先估算自身到待捕獵物之間的距離, 然后慢慢靠近獵物的位置, 當到達獵物位置后, 向其吐出螺旋狀氣泡從而實現捕食
D′=|X*(t)-X(t)|;
(4)
X(t+1)=D′·ebl·cos(2πl)+X*(t)。
(5)
式中:D′表示獵物到第i只鯨魚的距離向量參數;b代表螺旋狀常數, 一般定義為1;l為[-1, 1]的隨機數。
由于鯨魚在捕食的過程中, 包圍獵物和螺旋氣泡捕食兩種行為可同時進行, 因此它們所能發生的概率相同(均為0.5), 可得模型
(6)
式中:p是[0, 1]的隨機數。
鯨魚在搜索獵物的過程中, 除上述方式外, 還可以進行大范圍的隨機搜索, 根據獵物位置而隨時改變自身位置, 擴大自身的搜索范圍, 避免陷入局部最優的境況。此過程可表示為
D=|C·Xrand-X|;
(7)
X(t+1)=Xrand-A·D。
(8)
式中:Xrand是當前代數中其中一條鯨魚發現獵物的位置。
通過收斂因子A的絕對值來選擇更新位置的方式: 當|A|<1時, 進入包圍吐泡模式尋找局部最優位置參數; 當|A|≥1時, 鯨魚進入全局搜索, 避免陷入局部最優。鯨魚算法具體流程如圖1所示。

圖1 鯨魚算法流程
最小二乘支持向量機是在原有支持向量機的基礎上, 利用最小二乘法將原有支持向量機優化問題的非等式約束用等式約束替換, 使得支持向量機的泛化能力、 全局優化能力增強, 還提高了收斂速度和化簡了計算過程[11]。其原理及數學模型為: 給定訓練樣本集{(x1,y1), (x2,y2),…, (xn,yn)}, 則xn∈Rn表示n維的輸入樣本,yn∈R為一維輸出樣本, 通過映射函數φ(x)把輸入樣本空間的非線性擬合問題映射到高維特征空間的線性擬合問題, 并采用結構風險最小化原則來建立優化問題
(9)
約束條件為
s.t.yi=wT·φ(xi)+b。
(10)
式中:w為權重向量;c為正則化參數, 主要目的在于控制并減少過度擬合;ξ為懲罰變量, 其作用在于引入離群點;b為誤差;i=1, 2, …,n。利用Lagrange 乘子ai和KKT (Karush-Kuhn-Tucker)條件優化LSSVM, 可得函數模型
y(x)=ai[φ(xk)φ(xi)]+b。
(11)
先前的過程中, 為了利于對輸入樣本數據的分類, 將LSSVM函數模型轉化為高維特征函數, 增大了計算量。為解決這一問題, 需引入核函數K(x,xi), 優化后得到最終模型
(12)
常用的核函數有徑向基核函數、 線性核函數和多項式核函數, 本文采用徑向基核函數作為LSSVM的核函數
(13)
式中:σ2為核函數參數。
在實際測量工程中, 直接利用LSSVM來構建區域擬合模型, 最終模型的預測精度往往難以達到要求, 其主要原因在于核函數參數和正則化參數的取值會直接影響模型的預測結果, 不合理的參數設置將會降低模型預測結果的可靠性[12]。本文提出利用鯨魚算法來尋找LSSVM中的正則化參數c和核函數參數σ2, 代替常規LSSVM中的交叉驗證法, 提高參數尋優的全局性, 進而構建較高精度的區域擬合模型。具體過程為: ①讀取訓練樣本數據, 并對其進行歸一化處理; ②設定鯨魚種群參數, 主要有種群大小N、 起始位置(x,y)、 最大迭代次數Tmaxlter、 螺旋氣泡形狀參數b以及鯨魚種群位置的上下界; ③將高程擬合模型的殘差均方根誤差RSME作為每個鯨魚位置的適應度函數, 以適應度最優個體位置作為獵物位置X*; ④當迭代次數t≤Tmaxlter時, 會不斷更新參數a、A、c、l、p; ⑤|A|<1時, 用式(6)更新鯨魚最優位置; 當|A|≥1時, 用式(8)全局搜索更新鯨魚最優位置; ⑥每次迭代過程中根據適應度函數確定當前鯨魚位置, 并與之前鯨魚的位置進行對比分析, 選出一個最優位置并記錄保存, 如果達到最大迭代次數, 則跳出步驟⑥, 否則返回步驟③ 繼續執行; ⑦ 輸出鯨魚的最優位置X*, 循環結束后, 將鯨魚的最優位置作為LSSVM的核參數和正則化參數, 建立區域GNSS高程擬合模型并輸出檢測結果。
為驗證WOA-LSSVM算法在區域GNSS高程擬合中的穩定性及有效性, 本文分別選取兩個不同地形特征的研究區進行測試分析, 檢驗該組合算法在構建區域GNSS高程擬合模型中的有效可行性。
3.1.1 研究區概況 以杭州跨海大橋為例, 數據來源于文獻[13]中杭州跨海大橋實驗中的部分GNSS水準重合點, 跨海大橋全長約36 km, 寬度為33 m, 點位分布較廣, 主要分成南北兩個區域, 中間海中加密網點走向大致呈線形分布。均勻選取28個GNSS水準重合點, 用于組合算法構建擬合模型, 將剩余的12個重合點作為檢核點, 具體情況見圖2。將鯨魚的種群數量設置為30頭、 最大迭代次數為90、 螺旋狀常數設置為1, 為LSSVM選擇最合適的參數用于區域擬合模型的構建。

圖2 跨海大橋GNSS水準點位分布
3.1.2 擬合模型精度分析 為了驗證WOA-LSSVM組合法在GNSS高程擬合中的穩定性及有效性, 將其與常規LSSVM擬合法、 BP神經網絡擬合法進行對比分析, 分別統計了10次3種擬合方法建模的內外符合精度, 結果見表1。

表1 不同模型擬合精度統計
可知, 在10次實驗之后, 無論是內符合精度還是外符合精度結果, WOA-LSSVM擬合法建模的穩定性均要優于BP神經網絡和常規LSSVM擬合法, 且組合算法外符合精度均值為±12.2 mm, 常規LSSVM外符合精度均值為±17.5 mm, 相較于常規LSSVM, 擬合模型預測精度提高了30.3%, 進一步證明了WOA-LSSVM擬合法構建擬合模型的精確性。為了更加清晰直觀地展現檢核點預測結果的變化趨勢, 繪制了12個GNSS水準檢核點的高程異常柱狀圖3。

圖3 不同建模方法的高程異常預測值與真實值對比
可見, 不同擬合法構建擬合模型的預測值與真實值之間的近似差值, 其中第12個檢核點的預測結果與真實值的差值較大, 相較于其他幾個檢核點預測結果, 3種方法的預測結果與真實值相比均不太理想, 但WOA-LSSVM法構建的擬合模型預測結果更加接近于真實值, 也表明了改進擬合模型預測結果的精準性有所提高。縱觀整個柱狀圖的變化趨勢, 相較于常規LSSVM、 BP神經網絡擬合法, 組合算法的擬合結果也更為可靠。
3.2.1 研究區概況 以上實驗通過少量帶狀區域分布的GNSS水準數據來驗證了WOA-LSSVM構建區域擬合模型的有效性, 為進一步驗證組合算法在實際測量工程中的建模真實性, 在廣西東北部某市采集少量GNSS水準數據, 其覆蓋面積約為300 km2, 點位分布較為均勻, 考慮到測區地勢較為平緩, GNSS水準點間隔在2~2.5 km, 滿足三、 四等水準測量的要求。其中選取40個分布均勻的GNSS水準重合點作為擬合點, 剩余的20個點作為檢查點(圖4)。

圖4 研究區域點位分布
3.2.2 建模結果及分析 將WOA-LSSVM算法的種群數量、 最大迭代次數、 螺旋狀常數等參數設置為與3.1節相同, 分別利用3種擬合方法構建區域高程擬合模型后, 檢核點通過擬合模型預測其高程異常, 統計了與真實值間的殘差值, 并繪制了檢核點擬合殘差的變化折線圖5。

圖5 3種擬合方法檢核點殘差對比
通過擬合殘差的波動趨勢可以看出, WOA-LSSVM擬合模型預測檢核點的殘差波動范圍要小于BP神經網絡擬合法、 常規LSSVM擬合法, 效果最為理想。其中BP神經網絡擬合法的波動性最為明顯, 也表明BP神經網絡擬合法需要得到改進。為了更為直觀地了解不同擬合法預測的檢核點高程異常值, 對20個檢核點的高程異常預測值和殘差值進行分析, 結果見表2。

表2 不同擬合模型檢核點的預測結果
可知, WOA-LSSVM擬合法建模的擬合殘差變化區間為-20.9~14.5 mm, 常規LSSVM擬合模型的殘差變化區間為-30.6~23.1 mm, BP神經網絡擬合法為-34.2~22.2 mm。相較于其他兩種方法, 鯨魚優化擬合法的殘差變化區間最小, 結果最為穩定, 證明了WOA-LSSVM構建區域GNSS高程擬合模型的有效性。為了驗明組合算法建模的精準性, 計算了不同方法建模的內外符合精度, 如表3所示。

表3 不同模型的擬合精度統計
可知, 在研究區域內, 常規LSSVM建模的外符合精度為±15.4 mm, WOA-LSSVM法建模的外符合精度為±12.4 mm, 比常規LSSVM提高了19.5%, 這主要是因為鯨魚算法在優化參數的過程中, 極大程度地避免了過早收斂或局部最優的現象, 從而提高了區域GNSS擬合模型的預測精度。
考慮到最小二乘支持向量機法在構建區域GNSS高程擬合模型時參數選擇較為困難的問題, 本文將鯨魚優化算法引入到最小二乘支持向量機擬合法中。WOA在參數尋優的過程中具備更高的精度及穩定性, 針對帶狀區域或面狀區域均能夠為LSSVM選擇出最佳的核參數和正則化參數。采用改進后的LSSVM、 常規LSSVM及BP神經網絡建模進行對比分析, 得到不同地形特征的擬合模型, 實驗結果表明, 利用鯨魚算法優化后的最小二乘支持向量機建立的高程異常擬合模型預測精度明顯提高, 并且使得核函數參數和正則化參數的選擇更為合理, 證明了鯨魚優化算法建模的可行性和有效性, 為以后的測高工作提供一定的參考依據。