張紹成,殷 飛,胡俊亮,葉仲韜,胡友健
(1. 中國地質大學(武漢) 地理與信息工程學院,武漢 430074;2. 橋梁結構健康與安全國家重點實驗室, 武漢 430034;3. 中鐵大橋科學研究院有限公司,武漢 430034)
橋梁線形測量的主要工作是通過檢測橋梁在交通負載狀態下,橋梁主體在高程方向上的線形變化,獲悉橋梁的承載能力和健康狀態,是橋梁日常運營維護的重要工作。
傳統橋梁線形測量是基于水準儀、全站儀、傾角儀等對橋面點位的位移監測[1],但傳統測量手段測量效率低,易受橋面交通的干擾,在橋梁的運營維護階段對橋面交通影響非常大。基于全球衛星導航系統(global navigation satellite system,GNSS)的實時動態差分(real-time kinematic,RTK)技術,能實現厘米級精度的動態測量,在橋梁線形測量應用中能較好地提高橋梁線性測量的效率[2],而且GNSS 連續的高頻采樣測量結果,能夠有效探測潛在的病害區域。然而在實際進行大型橋面測量時,GNSS 動態測量信號容易受到橋面的橋塔、懸索、拉鎖等建筑的干擾,出現較大的多路徑干擾,導致相位信號失鎖,造成整周模糊度無法固定的情況。采用車載GNSS RTK,則能夠快速實現橋梁線形重復測量,快速獲得大量冗余數據,若能夠合理地利用冗余數據,則能有效地解決GNSS RTK 測量在橋面復雜觀測條件下的精度和可靠性問題。目前,研究橋梁測量數據融合和預測的方法有很多,如采用最小二乘法對傾角儀所得橋梁撓度進行融合[3];采用卡爾曼濾波(Kalman filter, KF)[4]法、灰色模型(grey model, GM)[5]法或神經網絡[6]法預測橋梁形變并建立立模標高,但這些方法均基于傳統橋梁撓度測量方法的觀測結果,不完全適用于GNSS RTK 這種連續多點的橋梁線測量方法。
支持向量機(support vector machine, SVM)是一種基于結構風險最小化理論的機器學習方法,而支持向量機回歸(support vector regression, SVR)是SVM 的重要分支,其良好的泛化能力,使其能夠應用到很多行業中[7]。本文使用了一種基于高斯徑向基(radial basis function, RBF)核函數支持向量機回歸的通用逼近函數方法,實現了高精度橋梁整體線形回歸的建模。
本文首先介紹支持向量機回歸的基本原理及相應的參數選擇原則,然后基于橋梁實測數據建立了支持向量機回歸模型,以某橋梁的往返共10 組實測數據驗證支持向量機回歸方法的有效性,最終實現測試橋梁的高精度線形測量。


為最小化結構風險函數R(ω),通過構造拉格朗日函數及對偶求解,可將回歸方程式寫為


任何滿足梅塞(Mercer)條件[8]的函數均可作為核函數,若采樣點所對應的核函數系數不為零,則該采樣點為支持向量,而最佳的支持向量的數據回歸等效于所有數據的回歸。
支持向量機回歸擬合表現主要取決于參數[9],主要包括懲罰系數C,不敏感損失函數參數ε、核函數及其參數。最優參數選擇主要基于經驗對比、范圍搜尋及交叉檢驗[10]進行參數尋優,本文基于觀測數據及其估計噪聲確定C與ε,根據橋梁的線形特點確定核函數,采用留出法(Hold-out)交叉驗證[11]確定核函數參數。
橋梁的變形特性需要一種能夠逼近任意線形同時能保證函數平滑特性的核函數。高斯徑向基函數可將原始的空間映射為無窮維空間,實現任意數據線性可分,其基本公式為

式中:e 為自然常數;γ為高斯核函數的幅寬參數。
通過調控該參數,擬合函數可有效地逼近任意線性,但不合適的γ參數會使得最終回歸結果出現過擬合或欠擬合[12]。為計算最優的γ值的范圍,確保回歸建模不出現過擬合和欠擬合,本文基于原始觀測值結果進行Hold-out 驗證,通過最小化預測風險(預測結果和觀測結果的殘差的均方根誤差)獲取γ參數,并利用于高精度基準點與SVR 預測的結果的均方根誤差作為最終的精度評估標準。
懲罰系數C主要用于權衡模型的復雜度(即高維平面的平整度)與采樣點落入ε范圍之外的容忍程度。根據馬特拉(Mattera)和海伊金(Haykin)理論[13],基于高斯徑向基核函數的SVR 理論最優的C應當由輸出值的范圍確定,其定義為

參數ε控制著線性不敏感區間的范圍,由損失函數可知,在ε不敏感區間內的采樣點均無損失。一般情況下ε值和采樣點的噪聲水平成一定比例關系,且和訓練樣本大小存在負相關性[9]。依據該原則,采用一種經驗有效的確定方法,即

式中,σ為采樣點的標準差。
RTK 橋梁線形測量是通過車載高精度GNSS接收機,對橋面同一路線進行多次重復觀測,然后采用數據融合的方法進行建模,從而獲得高精度的橋梁線形信息。本文以某長度約700 m 的公路橋單側輔橋為實驗測試區域,往返測量同一路線共10 次,獲取高頻RTK 測量結果共計8 051 個點位坐標,整周模糊度固定率約為78.3%。RTK 測量結果通過與高程異常改正后的36 個水準測量基準點對比,其結果如圖1 所示,圖1 中深色與淺灰色點位分別為10 次重復測量結果中的固定解與浮點解,三角點為高精度水準測量基準點。

圖1 RTK 測量橋梁線形觀測結果與水準測量基準點對比
Hold-out 驗證又稱為外部測試(external testing,ET),是目前最為可靠的、估計基于統計模型預測能力方法之一[11]。該方法的基本原理是從最初的樣本中,隨機選出部分數據作為訓練數據,剩余數據則作為交叉驗證數據,利用訓練數據所得的模型預測驗證數據,評估模型的泛化能力。實驗從觀測數據中選出10%(805 個)作為交叉驗證數據集,然后利用公式分別計算C和ε,其結果如表1 所示。

表1 GNSS-RTK 測量數據支持向量機回歸參數表
從表1 可以看出,在Hold-out 模式下,回歸參數C和ε與全數據回歸差異不大。利用所有數據SVR 回歸計算并使用自身數據預測驗證,以及使用90%數據回歸計算并使用Hold-out 驗證方法驗證,在不同RBF 核函數γ參數下得到的均方根誤差變化如圖2 所示。

圖2 回歸計算和預測結果的均方根誤差
從圖2 中可以看出,γ取值在1×10-5~1×10-3之間時,隨著γ值的增大,二者的均方值誤差將大幅度地減少,表明SVR 所得結果為欠擬合;當γ取值在1×10-1~1×101之間時,隨著γ值的增大,自預測的均方根誤差逐步減少,而Hold-out 驗證的均方根誤差卻逐漸增大,表明SVR 所得結果為過擬合。
為說明Hold-out 驗證所尋的最優參數的效果,圖3 統計出了利用所有數據SVR 回歸計算并使用外部已有基準點預測的均方根誤差隨γ的變化。

圖3 Hold-out 驗證的均方根誤差
基于最小化基準點預測風險和Hold-out 驗證預測風險得出的最優γ取值分別約為 1×10-1.7和1×10-1.6。與圖2 的結果對比可知,基準點預測和Hold-out 驗證結果在均方根誤差變化具有一致性,說明最小化Hold-out 驗證的預測風險所得的γ參數有效避免過擬合和欠擬合的問題。
因此在本文的應用中,取Hold-out 驗證所得的γ參數1×10-1.6,在95%的可靠性條件下,估算出的原始觀測數據的固定解精度約為2.9 cm,含浮點解的總體觀測精度則超過100 cm,而基于整體觀測數據(含浮點解)的回歸建模得到結果如圖4 所示,橋梁線形統計精度達到1.3 cm。

圖4 SVR 最終建模結果及其殘差分布
此外考慮到Hold-out 交叉驗證尋找γ參數計算耗時隨著數據量的增加而急劇增加,為提高計算效率,進一步測試重復測量的次數對于最優γ參數的取值影響。使用不同組數的實測數據的運算結果如圖5 所示。

圖5 不同參與運算觀測組數的Hold-out均方根誤差驗證
從圖5 可以看出,不同數據模式下均顯示,γ的最優取值范圍值為 1×1 0-2~1×1 0-1,并且數據量越小對過擬合越敏感,更易找出最優γ值。
同時,本文基于矩陣實驗室(matrix laboratory,MATLAB)軟件,測算參與重復測量的次數與運算時間對比如圖6 所示。

圖6 參與運算觀測組數的計算耗時對比
從圖6 可以看出,由10 組數據總耗時5 585 s降低至一組數據總耗時41 s,γ參數尋優速度提高約136 倍,因此,基于少量數據即可選取最優回歸建模γ參數。
同時,基于不同觀測組數量的建立的橋梁線形回歸模型的統計精度對比結果如圖7 所示。

圖7 參與運算觀測組數的回歸建模精度
從圖7 可以看出,隨著參與運算觀測組數的增多,回歸模型精度也在逐步升高。基準點對比均方根誤差由單組的5.33 cm 提升至10 組的0.65 cm,當觀測組數超過5 組時,精度提升幅度逐步趨緩。由此可見,對于橋梁的線形測量建模,通過首期多次測量數據建模分析,選取適當的重復觀測數據量,即可作為后續測量監測外業任務的參考,在保證測量精度的前提下節約測量工作量。
本文將基于高斯徑向基核函數的支持向量機回歸應用于橋梁RTK 線形測量建模。針對支持向量機選擇參數困難問題,采用原始數據和先驗噪聲水平確定的懲罰系數和線性不敏感系數,同時使用Hold-out 交叉驗證確定核函數參數。基于橋面實測數據結果回歸檢驗及水準基準點數據對比表明以上參數的有效性,并利用單組數據尋找核函數參數大幅度減少參數尋優時間,最后基于多次重復動態車載測量數據實現了1.3 cm 精度的橋梁線形建模,在實際橋梁線形測量中具有較高的應用價值。