張 炎,周 飛,唐詩華,肖 燕,張 躍
(1.廣西空間信息與測繪重點實驗室,廣西 桂林 541006;2.桂林理工大學測繪地理信息學院,廣西 桂林 541006;3.廣西基礎地理信息中心,廣西 南寧 530023)
隨著現代測量技術的快速發展,全球定位系統(GPS)憑借其全能性、全天候、連續性和實時性得到了廣泛應用[1]。GPS測量可以同時測定目標位置的平面坐標和大地高程,并且平面定位精度可達到1~2 cm。但是大地高并不是實際工程中所用到的高程,需要將大地高轉化為正常高才能滿足工程需求[2],兩者之間存在一個高程異常值。因此,如何獲取高精度的高程異常值始終是測繪工作者面臨的問題。目前,采用少量GPS水準重合點來實現高程擬合越來越受到業界認可。常規的GPS高程擬合方法有二次曲面擬合、三次樣條擬合、多項式曲線擬合、多面函數法等,但前3種方法擬合精度往往難于滿足實際工程需求,多面函數法中心點的選取過于繁瑣[3- 4]。最小二乘支持向量機(least squares support vector machine,LSSVM)是一種新型機器學習方法,可以利用少量樣本數據快速精確地建立擬合模型,但參數的選擇較為復雜。
本文提出將果蠅優化算法(fruit fly optimization algorithm,FOA)引入最小二乘支持向量機(LSSVM),建立區域GPS擬合模型。利用FOA全局尋優能力強、過程簡練的特性,快速精準的為LSSVM選擇最佳參數,近一步提高利用少量GPS水準重合點建立區域高程擬合模型的精度。
最小二乘支持向量機(LSSVM)是由Suykens在原有支持向量機的基礎上提出的。支持向量機具有結構簡單、全局優化、泛化能力較好等優點,而LSSVM除具備這些優點之外還提高了收斂速度,化簡了計算過程[5- 6]。兩者區別主要在于用等式約束代替標準支持向量機中的不等式約束,并收集數據的誤差平方和損失函數作為訓練集的經驗損失[7]。其具體步驟如下:
針對給定的訓練集Α={(x1,y1),…,(xl,yl)}∈(Rn×Y)l,xi∈Rn,yi∈Y=R,i=1,2,…,l。其中,A為訓練樣本集;(xl,yl)為訓練樣本;R、Y為實數集。利用非線性映射將樣本輸入映射到高維特征空間,構造出高維特征空間的線性回歸函數,即
g(x,w)=wTφ(x)+b
(1)
式中,g為線性回歸函數;w為權值向量;φ(x)為非線性映射函數;b為閾值。根據結構風險最小化原理,將其轉化為以下優化問題,公式為
(2)
約束條件為
s.t.yi=wTφ(xi)+b+ξi
(3)
式中,c為正則化參數;ξ為誤差項。利用Lagrange函數和KKT(Karush-Kuhn-Tucker)優化條件可以求得LSSVM的函數模型,即
Z(x)=ai[φ(xk)φ(xi)]+b
(4)
式中,Z(x)為LSSVM的函數;ai為Lagrange乘子。
根據Hilbert-Schmidt原理,引入核函數K(xk,xj)=[φ(xk)φ(xi)],近而將高維空間的內積計算轉換為原空間中的函數的計算,解決了高維特征空間的計算問題,即
(5)
目前,核函數主要有多項式核函數、徑向基核函數和線性核函數。考慮到GPS高程擬合預測模型較為復雜,本文選用徑向基核函數作為LSSVM的核函數,可以達到比較好的預測效果,即
(6)
式中,σ為核函數參數。
從上面整個過程可以看出,利用最小二乘支持向量機(LSSVM)構建擬合模型只需要確定核函數參數σ和正則化參數c。相比原有支持向量機,計算過程簡潔許多。
果蠅優化算法(FOA)是由臺灣學者潘文超提出的一種基于果蠅覓食行為的群智能優化算法。相比于其他智能優化算法,FOA具備全局尋優能力強、運行時間少、參數少等優點,在各個領域得到廣泛應用。其基本原理是果蠅在嗅覺與視覺上的感知能力要優于其他生物,憑借靈敏的嗅覺器官,果蠅可以快速地搜索并分辨出空氣中存在的各種氣味,達到食物的周圍后,借助于優越的視覺定位出同伴與食物的所在地。果蠅優化算法流程見圖1。詳細操作步驟[8-9]:
(1)初始確定果蠅種群的規模、迭代次數,隨機給出每個果蠅個體根據嗅覺尋找食物的初始方向和距離。
(2)在剛開始仍然無法得知食物所在的準確位置,只能先獲取果蠅與原點的距離L,進一步計算味道濃度判定值S,利用味道濃度判定值S確定味道濃度判定函數值,最終獲取目前所在位置的食物味道濃度。
(3)確定味道濃度最大的位置,記錄保存下來,之后所有果蠅均朝此方向飛去。
(4)重復以上步驟,迭代多次,每次的迭代結果均與上一次迭代結果比較,保留食物味道濃度的最佳位置及方向,最終獲取食物的最佳位置。

圖1 果蠅優化算法流程
在實際的工程應用中,要想獲取最佳的GPS高程擬合模型去解決工程中的問題,現有的一些方法難以達到理想的要求。吳吉賢,杜海燕等[10]曾提出過利用LSSVM擬合方法進行區域GPS擬合模型的建立,但需要合理的方法來提取最佳參數。因此,本文提出利用FOA-LSSVM的組合方法來解決這個問題。利用FOA的廣泛快速的搜索能力,為LSSVM選取建模過程中的正則化參數c和核參數σ最優值,進一步提高LSSVM方法構建模型的擬合精度。FOA-LSSVM擬合方法的基本步驟是:
(1)輸入訓練樣本數據,并對其進行歸一化處理。
(2)設置初始果蠅的種群參數,主要有種群大小D、迭代最大限值Bmax、初始位置(x,y)、方向、搜尋距離L。
(3)計算味道濃度判定值S,并將其映射為LSSVM的參數,建立高程擬合模型及預測。
(4)以均方根誤差RSME為味道濃度函數,獲取種群內最優個體的位置及最佳味道濃度值記錄并保存。
(5)將種群位置、方向、搜尋距離、味道濃度值進行迭代尋優。
(6)輸出結果。
迭代次數存在最大限值,若迭代次數達到了最大限值或找到了符合要求的果蠅味道濃度函數值,則結束迭代,將最終結果輸出;否則,重復步驟(3)~(6),直到達到最大限度或獲取符合要求的最佳味道濃度函數值為止。

表2 3種模型擬合結果的殘差值
研究區域選擇在廣西東南小范圍區域,覆蓋面積約200 km2,以此來分析FAO-LSSVM擬合方法在區域GPS高程擬合中應用的精度。本文選取了30個GPS水準重合點數據進行擬合模型的建立,剩余的10個作為檢測樣本。步驟如下:
(1)將果蠅種群規模設置為20個,最大迭代次數為80次。
(2)隨機選取種群個體的初始位置、方向、搜尋距離。
(3)將徑向基函數(RBF)選定為FOA-LSSVM擬合方法的核函數。
為證明FOA-LSSVM擬合方法的有效性,將其結果與BP神經網絡、LSSVM擬合方法的擬合結果進行對比。表1為不同擬合方法的符合精度。從表1可知,BP神經網絡的內符合精度為0.013 7 m,標準LSSVM擬合方法的內符合精度為0.010 7 m,FOA-LSSVM擬合方法的內符合精度為0.007 9 m,比標準LSSVM擬合方法的內符合精度提高了26%,同時也可以看出其外符合精度也均優于其他2種方法。因此,利用FOA-LSSVM擬合方法構建區域GPS擬合模型具有一定的可行性,且模型的擬合精度較高。

表1 不同擬合方法的符合精度對比
為近一步檢驗FOA-LSSVM擬合方法的穩定性,選用10個檢測數據在該模型中獲取GPS高程異常值,從檢測數據的擬合結果中得到殘差值,并進行對比分析。3種模型擬合結果的殘差值見表2。3種擬合方法的殘差對比見圖2。
由表2和圖2可知,相比于BP神經網絡、LSSVM擬合方法擬合結果,FOA-LSSVM擬合方法擬合結果波動較小,尤其是相對于常規的LSSVM擬合方法而言,擬合精度更加穩定,總體的波動范圍也有所減小,充分證明了該組合方法的現實性及有效性,并且確保了在區域范圍內進行擬合模型建立的穩定性。

圖2 3種擬合方法的殘差對比
本文基于果蠅優化算法對最小二乘支持向量機擬合方法進行了參數優化,進一步解決了其在構建區域GPS高程擬合模型過程中難以獲取最佳參數的問題,并與BP神經網絡擬合方法、常規的LSSVM擬合方法進行了對比分析,得出以下結論:
(1)利用果蠅優化算法為最小二乘支持向量機擬合方法選擇參數時,由于果蠅優化算法本身具有全局尋優能力強、參數少、過程簡單、易實現的優點,使得經過其優化的最小二乘支持向量機擬合方法的擬合結果更佳,避免了常見的易陷入局部最優的缺陷,模型的整體擬合精度有了一定的提高。
(2)相比于BP神經網絡,在選擇了合適的函數、最佳參數的情況下,最小二乘支持向量機擬合方法針對非線性的少量樣本數據有更高精度的擬合效果,且FOA-LSSVM組合方法解決了BP神經網絡易陷入局部最優化的問題,也避免了其需要大量的樣本數據的麻煩,具有一定的現實性及有效性。
本文提出的果蠅優化算法結合最小二乘支持向量機擬合法構建的區域高程擬合模型的精度相比于常規LSSVM擬合法、BP神經網絡擬合法有一定的提高,為以后的擬合模型構建提供了思路,但試驗對比僅針對了小范圍區域,今后需要采集大范圍的研究區域數據進行進一步對比分析。