盧獻健,晏紅波,梁月吉
基于集合經驗模態分解和支持向量機的大壩變形預測方法
盧獻健1,2,晏紅波1,2,梁月吉1
(1.桂林理工大學測繪地理信息學院,廣西桂林 541004;2.廣西空間信息與測繪重點實驗室,廣西桂林541004)
受水位、溫度等諸多因素共同影響,大壩變形具有隨機性和非線性特征,提出了一種基于集合經驗模態分解(EEMD)和支持向量機(SVM)的大壩變形預測算法。算法先對大壩位移序列進行集合經驗模態分解,有效分離出隱含在時序中的非線性高頻波動成分和低頻趨勢成分;其次根據各分量特點構造不同的SVM進行預測,最后疊加各分量預測值得到預測結果。與BP神經網絡模型及傳統支持向量機的對比結果表明,所提預測算法具有較強的自適應預測能力,預測精度較高。
大壩變形預測;集合經驗模態分解;支持向量機;精度評定
大壩變形往往受水位、溫度、自身物理變化等諸多因素共同影響,難以建立較為準確的形變量與影響因素之間的復雜非線性關系模型,因此傳統時間序列法和回歸分析等方法在變形預測中的應用受到了限制。經驗模態分解(Empirical Mode Decomposition,EMD)是一種有效的處理非線性和非平穩信號的自適應分解方法[1]。它不需要確定任何基函數,依據信號本身的時間尺度直接對信號進行平穩化處理,“篩選”出原信號的波動項和趨勢項[2]。目前,EMD算法已在眾多領域得到了有效的驗證和應用。戴吾蛟[3]將EMD方法應用于GPS多路徑效應的探測中并取得較好的效果。羅飛雪等[4]通過實驗證明了利用EMD將變形序列分解成不同特征尺度的平穩窄帶信號的可行性。張豪[5]將EMD方法成功應用于大壩變形預測。然而,在信號分解過程中,EMD方法根據信號的極值點采用三次樣條插值函數擬合以獲得的上、下包絡線存在邊界效應等問題,這使分解得到的各個分量的精度受到了影響,不利于分析隱含在信號中的信號變化特征[6]。集合經驗模態分解(Ensemble Empirical Mode Decomposition,EEMD)[6-7]對經驗模態分解的尺度混合問題進行了優化,使經驗模態分解的邊界效應問題得到了有效解決。
另一方面,各種人工智能算法得到快速發展,其中支持向量機(Support Vector Machine,SVM)[8]在非線性、高維模式識別中具有獨特優勢而得到了廣泛應用[9-11]。張衛國等[12-13]將支持向量機應用于變形預測中,解決了多因素影響下的復雜變形預測問題,取得了較好的預測效果。
基于上述研究,本文采用集合經驗模態分解與支持向量機相結合的思路,對大壩變形進行分析研究。在利用EEMD對大壩序列進行分解的基礎上,利用SVM對各個分量進行預測,最后疊加得到大壩變形的預測結果。
1.1集合經驗模態分解基本原理
設Y(t)為大壩變形序列,EMD分解首先搜索原始信號Y(t)的極大值、極小值來構造信號的上、下包絡線Vmax(t)和Vmin(t),將原始信號與包絡線均值進行比較

并判斷D(t)是否滿足構成本征模態分量(Intrinsic Mode Function,IMF)的兩個條件。滿足則作為第1 個IMF,否則作為新的Y(t)繼續進行分解。按上述方法從高頻到低頻的順序依次對信號進行分解,直到分解的余量Bn(t)是一個單調函數時結束,最終原信號可以表示為

式中,Li(t)為第 i次分解得到的本征模態分量;Bn(t)為經n次分解后的剩余分量。
由于變形序列的端點不一定處于極大值或極小值,因此所計算的上、下包絡線在兩端有可能偏離實際值,最終引起IMF模式混淆問題,影響EMD分解質量。
集合經驗模態分解是EMD方法的改進,其利用高斯白噪聲具有均勻分布、均值為0的統計特性,通過多次向原信號加入不同的隨機白噪聲來改變信號的極值點特性,把多次分解得到了IMF求取平均來有效解決EMD的邊界效應問題[7]。EEMD分解步驟為:①向大壩監測信號序列Y(t)加入隨機白噪聲nm(t)得到Ym(t),其中,nm(t)要服從(0,(αε)2)的正態分布,α為噪聲的強度參數,ε為信號的標準差。②使用EMD對Ym(t)進行分解,得到若干個本征模態分量Li(t)和一個剩余分量Bn(t)。③重復執行①、②共m次,其中每一次加入的白噪聲序列的幅值不同。④對總計為m次EMD分解得到的每一個IMF計算均值,作為EEMD方法得到的大壩原始序列最終分量IMF。
EEMD分解結果的質量主要受EMD分解的重復次數與加入噪聲的強度兩因素的綜合影響,但通過多次分解以及求和取平均后可以使得IMF的模式混淆問題得到有效改善。
1.2網格算法優化支持向量機
對已知訓練集M={(x1,y1),…,(xk,yk)},x∈R,y∈R,k為樣本總數,SVM通過映射z=φ(x)把低維不可分的樣本作非線性變換為線性可分的高維特征空間E,并在空間E中建立學習機對樣本的非線性特征進行線性分析或回歸。其應用核函數的展開定理有效避免非線性變換中產生的“維數災難”問題。設u,v分別為原空間D中的兩個向量,根據泛函數有關理論,定義一個滿足Mercer條件的對稱函數k(u,v),則不難得到k(u,v)=φ(u)φ(v)。這樣,通過在高維空間計算內積,不考慮高維空間的維數,就可以實現非線性向高維線性的轉變,建立支持向量機回歸模型[9]

式中,αi、βi均為 Lagrange因子;Δ為常數項;k(xxi)為核函數。
實際應用中,SVM的性能取決于所選用的核函數。而多項式核函數、徑向基核函數(RBF),和sigmoid核函數是SVM常采用的3種核函數。本文以徑向基核函數為SVM的核函數,其關鍵是確定核函數k(xxi)中最優的懲罰參數C和核參數g,參數C、g的選擇是否合理直接對SVM的預測精度產生影響。本文利用網格搜索法進行參數尋優[15],通過設定參數C、g的取值范圍并格網化,利用交叉驗證方法計算網格內各組合參數的訓練均方根誤差,并取最小均方根誤差對應的C和g作為參數尋優結果。
1.3EEMD-SVM預測模型流程
基于EEMD-SVM的大壩預測模型,將大壩在各個時間點的變形值作為一時間序列{X(t),t=1,2,…,m},對序列X(t)進行集合經驗模態分解得到n個本征模態函數IMF和1個殘差項B,即
X(t)=B+IMF1+IMF2+…+IMF(n)(5)對各個IMF和B使用網格搜索尋找最優的徑向基核函數參數C、g,并建立各自的SVM預測模型進行預測,通過預測得到各分量的預測值YIMF1,YIMF2,…,YIMF(n)和YB,最后將各分量預測值疊加得到大壩變形預測結果Y為

綜上所述,建立EEMD-SVM大壩變形預測模型的方法與流程見圖1所示。

圖1 模型預測流程

為綜合評定預測結果的精度,本文采用均方根誤差和平均絕對值誤差作為模型預測結果精度的評定指標,即式中,MSE為均方根誤差;MAE為平均絕對誤差;Yt為大壩實際變形值;Y^t為大壩預測值;n為大壩觀測期數;t為大壩觀測第t期。
為了分析驗證本文模型的有效性及精度,以某鋼筋混凝土重力壩[16]為例,選擇其具有代表性的第30號壩段共91期的壩頂水平位移進行數據分析,其水平位移變形如圖2所示。由圖2可知,該大壩的水平位移變形隨機性變化較強,呈非線性變化趨勢。

圖2 大壩變形水平位移序列
利用本文的EEMF-SVM預測模型對以上變形序列進行預測。首先,采用EEMD對大壩變形序列進行分解,其結果中各分量如圖3所示。

圖3 EEMD分解結果
圖3表明,EEMD將大壩序列分解為5個IMF 和1個余量B,5個IMF分量的頻率逐級降低,表示了不同因素影響下的波動特征,余量B屬于低頻成分,代表了原變形序列中隨時間變化的趨勢。其中,分量IMF1~IMF3的信號周期性波動的特點較明顯,而這個波動的周期并不穩定,具有非均勻變化的特性。這種非均勻變化反映了大壩水位、溫度及壩體結構變化等內外部因素共同作用的非線性。可見,經EEMD分解后各IMF分量更加明顯的反映了隱含在時序中的物理特征,各分量變化曲線比原變形序列曲線(圖2)光滑和平穩,有利于變形分析與預報。
分解后,IMF和B分量序列的數據個數均為91個,選取第1~71個樣本作為訓練樣本,其余樣本作為測試樣本。分別使用支持向量機對分解得到的各分量進行訓練和預測,其中核函數均選用徑向基核函數,利用網格搜索法對懲罰參數C和核參數g進行尋優,各分量的模型參數尋優結果見表1。

表1 各個分量SVM預測模型參數
為了進行比較,同時利用BP神經網絡模型和傳統支持向量機(SVM)模型進行預測。3種方法的變形預測結果對比見表2,圖4直觀地反映了各模型預測結果和大壩實際變形的對比。

表2 不同方法的預測結果比較 mm

圖4 各模型的預測值和大壩實際變形值對比
由表2可見:BP神經網絡和傳統支持向量機的預測結果相近,部分預測值和實際值相差比較大,預測結果的最大殘差分別為3.742、2.933 mm。而本文算法的預測值和殘差均優于其他預測模型,殘差最小值為0.067 mm,最大值僅為0.825 mm。從圖4可進一步看出,在大壩變形浮動大的第74~84期,BP神經網絡和傳統的支持向量機在預測中都出現了不同程度的偏差,而本文算法的預測結果則比較穩定,也更接近于大壩實際值;在大壩變形較平穩的第85~91期,各模型預測結果較好地與實際值相符合。
為評定模型預測精度,根據3種方法的預測結果計算了各自的均方根誤差和平均絕對誤差兩項精度指標,其結果如表3所示。可知,本文EEMDSVM模型的預測精度優于傳統SVM模型和BP神經網絡模型,具有較好的全局預測精度。

表3 各預測模型精度對比 mm
本文將EEMD和SVM相結合并應用于大壩變形預測。算例的分析結果表明,EEMD能夠將復雜、非線性的大壩變形序列分解為不同特征尺度的平穩信號,有效分離出大壩變形序列中不同頻率的波動和趨勢成分;利用SVM對這些“單純”的平穩信號分別建立SVM預測模型,則更有利于支持向量機性能的充分發揮,最終提高預測結果的精度。與傳統SVM模型和BP神經網絡模型的比較結果表明本文EEMD-SVM模型更有優勢,對大壩、邊坡監測等工程領域具有一定的參考意義。
[1]HUANG N E,SHEN Z,LONG S R,et al.The empirical mode decomposition and the Hilbert spectrum for nonlinear and non-stationary time series analysis[J].Proceedings of the Royal Society of London A,1998,454(1971):903-995.
[2]張恒璟,程鵬飛.基于經驗模態分解的CORS站高程時間序列分析[J].大地測量與地球動力學,2012(3):129-134.
[3]戴吾蛟,丁曉利,朱建軍,等.基于經驗模態分解的濾波去噪法及其在GPS多路徑效應中的應用[J].測繪學報,2006,35(4):321-327.
[4]羅飛雪,戴吾蛟.小波分解與EMD在變形檢測應用中的比較[J].大地測量與地球動力學,2010,30(3):137-141.
[5]張豪,許四法.基于經驗模態分解和遺傳支持向量機的多尺度大壩變形預測[J].巖石力學與工程學報,2011(S2):3681-3688.
[6]毛玉龍,范虹.經驗模式分解回顧與展望[J].計算機工程與科學,2014,36(1):155-162.
[7]WU Z,HUANG N E.Ensemble empirical mode decomposition:a noise-assisted data analysis method[J].Advances in Adaptive Data Analysis,2009,1(1):1-41.
[8]MONFARED M,RASTEGAR H,KOJABADI H M.A new strategy for wind speed forecasting using artificial intelligent methods[J].Renewable Energy,2009,34(5):845-848.
[9] CORTES C,VAPNIK V.Support vector networks[J].Machine Learning,1995,20(3):273-297.
[10]張衛國,鐘平安,張玉蘭,等.季節性支持向量機中長期徑流預報模型[J].水力發電,2014,40(4):17-21.
[11]姜振翔,徐鎮凱,彭圣軍,等.基于貝葉斯支持向量機的潰壩生命損失風險評價方法[J].水力發電,2014,40(4):31-34.
[12]章永來,史海波,周曉鋒,等.基干統計學習理論的支持向量機預測模型[J].統計與決策,2014(5):72-74.
[13]肖浩波,谷艷昌.混凝土壩安全監控最小二乘支持向量機模型[J].長江科學院院報,2013,30(5):34-37.
[14]王新洲,范千,許承權,等.基于小波變換和支持向量機的大壩變形預測[J].武漢大學學報:信息科學版,2008,3(5):469-471.
[15]LIU Xianglou,JIA Dongxu,LI Hui.Research on Kernel Parameter Optimization of Support Vector Machine in Speaker Recognition[J]. Science Technology and Engineering,2010,10(7):1669-1673.
[16]姜成科.基于遺傳算法的神經網絡在大壩變形預報中的應用[D].大連:大連理工大學,2009.
(責任編輯王琪)
Dam Deformation Prediction Method Based on Ensemble Empirical Mode Decomposition and Support Vector Machine
LU Xianjian1,2,YAN Hongbo1,2,LIANG Yueji1
(1.College of Geomatics and Geoinformation,Guilin University of Technology,Guilin 541004,Guangxi,China;2.Guangxi Key Laboratory of Spatial Information and Geomatics,Guilin 541004,Guangxi,China)
Affected by water level,temperature and other factors,the deformation of dam is random and nonlinear.A new algorithm based on Ensemble Empirical Mode Decomposition(EEMD)and Support Vector Machine(SVM)for dam deformation prediction is presented herein.First,the deformation sequence is decomposed by EEMD in order to effectively separate the nonlinear trend of high frequency component volatility and low frequency component.Then,the SVM is applied to build a prediction model for each component.Finally,the predicted values of each component are superimposed.The calculation result is analyzed and compared with the results of BP neural network and traditional SVM.The comparison shows that the new algorithm has stronger ability of adaptive fitting prediction and the prediction accuracy is higher.
dam deformation prediction;empirical mode decomposition;support vector machine;precision evaluation
TV698.11
A
0559-9342(2016)02-0038-04
2015-05-12
國家自然科學基金資助項目(41161072);廣西空間信息與測繪重點實驗室基金項目(13-051-14-09、13-051-14-15)
盧獻?。?982—),男(壯族),廣西南寧人,講師,碩士,主要從事GNSS應用、精密工程測量;晏紅波(通訊作者).