杜傳陽 鄭東健
(1.河海大學 水文水資源與水利工程科學國家重點實驗室,南京 210098;2.河海大學 水利水電學院,南京
210098)
大壩的安全運行關乎人民生命財產安全,其變形情況能夠比較直接客觀地反映出大壩運行狀況,因此,建立有效的安全監測模型并及時分析和處理實測資料,發現異常及時處理,對大壩健康穩定運行至關重要[1-2].目前,根據研究進展及現狀,常用的有支持向量機(Support Vector Machines,SVM)、統計模型、時間序列模型、神經網絡等模型,這些模型各有利弊[3].其中SVM模型在大壩安全監測中應用廣泛,適用于處理一些高維數、非線性的問題,且有良好的泛化能力[4],懲罰因子c和核參數σ的選擇對模型性能有較大影響.本文在SVM理論的基礎上對模型加以改進,并對各改進方法進行比較.利用粒子群算法(Particle Swarm Optimization,PSO)對SVM 模型的參數進行尋優,以提高預測效果.同時考慮到PSO算法容易陷入局部最優,引入速度因子和位置因子對標準PSO算法進行改進,一旦發現粒子存在陷入局部最優的趨勢,則立即對粒子的位置進行初始化,稱改進算法為自適應位置PSO(Adaptive Position PSO,APPSO)算法[5];同時,馬爾科夫鏈模型具有適用于數據波動較大的特點,可以用來克服由于實測數據波動較大影響擬合和預報精度的缺點,以提高殘差分析的準確度[6].通過實測數據對各種改進方法進行對比驗證,結果顯示改進方法均能夠明顯提高預測的精度.
支持向量機SVM能夠有效解決復雜的非線性問題,以統計學理論為理論基礎.其基本思想是利用內內積函數將非線性變量映射到一個高維特征空間,以結構風險化最小為原則構造最優決策函數,然后在高維空間內線性回歸[7].
設一組訓練樣本:(x1,y1),(x2,y2),…,(xi,yi)∈(Rn×R),對輸入樣本做如下處理,利用非線性映射φ(x)從原低維空間映射到更高維的特征空間,并構造最優線性擬合函數f(x)=[ω,φ(x)]+b,其中[,]表示內積.以結構風險最小化為原則尋找ω,b,綜合考慮模型復雜程度以及泛化能力,尋優過程等價于

式中,ω為權向量,ξ為松弛變量,ξ≥0;C為懲罰參數,C>0,表示在模型復雜和經驗風險取一折中,b為一常數,l訓練為樣本數.
建立Lagrange函數以實現上述優化問題:

式中,αi為Lagrange乘子.
根據 KKT(Karush-Kuhn-Tucker)條件可得

定義核函數k(x,xi)滿足 Mercer條件,消去ξi和ω后,得到線性方程組:

式中:e=[1,1,…,1]T;I為單位矩陣;α=[α1,α2,…,αl]T;Qij=K(xi,xj);i,j=1,2,…,l.
關于核函數,滿足Mercer條件即可為核函數,其中徑向基核函數(RBF)最為常用:

最終可以得到回歸模型:

馬爾科夫過程[8]是一種具有無后效性的隨機過程,馬爾科夫鏈[8]則指的是狀態和時間參數均離散的馬爾科夫過程.在大壩安全監測數據中,各個測點位移的數值是與時間有關的狀態函數,且時間、狀態均為離散,可認為是典型的馬爾科夫隨機過程.
將實測數據按照馬爾科夫鏈的基本原理分成若干狀態,分別用E1,E2,E3,…,En表示,按時序依次取t1,t2,t3,…,tn為轉移時間,指數列由Ei經k步轉為Ej的概率,即


設E1的初始向量V(0),經過k步轉移得到的向量V(k)可由下式求得:

本文根據轉移概率在各個狀態區間內所占的比重對預測結果進行加權修正,詳細過程如下:首先利用APPSO-SVM模型(或SVM模型)求出擬合值和預測值,實測值減去擬合值得殘差序列,根據其取值范圍劃分概率區間,可以通過每個狀態向下一時刻的轉移概率算出轉移概率,進而得到轉移概率矩陣[9].預測過程中,選取預測值前面最近的幾個(本文取4個)已知所屬狀態的測值,然后對通過已知狀態測值轉移到要預測值需要的時步進行統計,并算得相應的Ei(i=1,2,…)步轉移概率矩陣,從相應的轉移矩陣中找到相應的轉移概率,然后統計處于各個狀態 的概率,根據計算的概率在不同狀態區間內的所占比重按式(11)加權修正:

標準粒子群算法[10]中的粒子通過對自身以及對群體的認識不斷對自身的位置進行更新,進而在全局范圍內搜索最優解.由于粒子群算法容易陷入局部最優點,對標準粒子群算法進行改進:
1)對慣性因子ω采用線型遞減策略[11]:

式中,maxω、minω為最大、最小權重值;i為當前迭代次數;j為最大迭代次數.ω的取值范圍常取[0.3-0.9].
2)對學習因子c1、c2采用線性學習的方法,c1先大后小,c2先小后大[12]:

式中,c1s、c2s為c1、c2的迭代初始值;c1e、c2e為c1、c2的迭代終值;i為當前迭代次數;j為最大迭代次數,c1表示變化范圍[2.5,1],c2表示變化范圍[1.5,2.75].
3)由公式(1)易看出,在進行迭代時,其自身的歷史最優值Pi會隨著粒子i的位置接近全局最優值Pg而不斷接近Pg,從而(1)式后兩項近似為0,若粒子的速度也近似為0,由(2)式能夠看出粒子的位置不能得到更新,如果此時的“全局最優點”恰為局部最優點,則粒子就會陷入局部最優.因此,引入速度因子υ和位置因子γ(υ,γ≥0),dij=‖Xij-Pgj‖2,表示第i個粒子的第j維的當前位置與全局最優位置的距離.粒子迭代過程中,進行位置和速度更新前進行判斷,一旦發現粒子的位置dij<γ,且飛行速度Vij<υ,就可判定粒子出現停滯,立即對粒子的位置進行初始化,防止陷入局部最優.本文利用該改進的PSO算法尋優參數σ和C,達到對SVM模型改進的目的,其中一個粒子代表一個SVM模型.
綜合前述各理論,大壩變形預警模型流程圖如圖1,其中適應度的計算在交叉驗證(cross validation,CV)意義下的準確率為個體適應度[13].分別按下述流程圖求得各改進方法預測值①、②、③、④,然后進行比較分析.

圖1 流程圖
以某水電站實測數據為例,每隔一周選取一組數據,選取2010年7月1日~2012年12月13日實測數據共130組作為訓練樣本,選取2012年12月20日~2013年2月21日共10組實測值用以預測.

訓練樣本標準化,設Xmin、Xmax為各組樣本數據的最值,標準化后變量:

種群初始化[15]:粒子個數取20個、迭代次數取100,慣性因子ω范圍為[0.9,0.3],學習因子c1、c2變化范圍分別為[2.5,1]、[1.5,2.75],懲罰因子C與核參數σ范圍各為[0.1,100]、[0.01,10].γ=0.1和υ=0.001為核參數σ的位置因子、速度因子,γ=5和υ=0.05為懲罰因子C的位置因子、速度因子.
通過均方差FMSE(式(17))的比較,能更加直觀地看出改進方法優越性,SVM模型的擬合均方差為1.907mm,APPSO-SVM 模型的擬合均方差為1.023 mm,SVM-MC模型的擬合均方差為0.968mm,APPSO-SVM-MC模型的擬合均方差為0.578mm.

式中,n為樣本數;yi為監測實值為模型計算值.
下面詳細介紹APPSO-SVM-MC預測值④計算過程:首先可求得APPSO-SVM模型預測值②以及模型擬合值,將實測值與APPSO-SVM模型擬合值相減可得殘差序列,最小值與最大值分別為-1.68 mm、1.86mm,分為4個區間,見表1.利用馬爾科夫鏈進行殘差分析,得到轉移概率矩陣,見式(18).預測過程中,模型的殘差取值若超出所定義區間范圍,如果殘差大于1.86mm,則歸屬于狀態Ⅳ,如果殘差小于-1.67mm,則歸屬于狀態Ⅰ.

表1 概率狀態劃分


下面預測2012年12月20日位移,以驗證其可行性.取預測日期前面4組APPSO-SVM擬合值,進行馬爾科夫修正,2012年12月20日所屬各狀態的概率統計值見表2.

表2 20121220位移所屬狀態
由APPSO-SVM模型得到20121220的預測值為78.82mm,由公式(11)可計算出經過殘差修正后的預測值為79.04mm.

其余日期預測結果依次類推,各改進模型預測結果以及參差值分別見表3和表4.

表3 不同改進模型預測值對比

表4 不同改進模型殘差對比
SVM-MC模型預測值③的求算方法類似于上述過程,僅需將APPSO-SVM擬合值改為SVM擬合值,其余過程相同.
將不同改進模型的預測值與部分擬合圖同基本SVM模型的擬合值與預測值更直觀的進行比較,如圖2~3所示.由擬合圖可以明顯看出APPSO-SVMMC模型的擬合精度高于基本的SVM模型;由殘差比較與模型預測曲線圖可以看出:APPSO-SVM-MC模型的精度最高,APPSO-SVM與SVM-MC模型精度次之,但明顯高于基本SVM模型精度,基本SVM模型精度最低.

圖2 不同模型擬合曲線圖

圖3 不同模型預測值曲線圖
本文以SVM理論為基礎,對其改進方法進行比較研究,充分利用粒子群算法快速全局尋優的特點,同時為克服粒子群尋優過程易陷入局部最優點的不足,引入了位置因子和速度因子;利用馬爾科夫鏈模型適用于描述隨機波動數據的優點來提高殘差辨識的精確性.由實驗結果可知本文所提出的改進方法均能有效提高模型的預測精度,將改進PSO算法與馬爾科夫鏈綜合對SVM模型進行改進可以大大提高預測精度,而APPSO-SVM模型與SVM-MC模型的預測精度也有較大提高,實際工程中應根據精度需要進行適當選擇.綜上所述,本文研究的變形預警模型擁有一定的應用價值,可在大壩安全監測領域推廣應用.
[1] 田 斌,徐衛超,何薪基,等.前饋人工神經網絡法在大壩安全監控中的應用[J].水力發電,2003,29(7):60-63.
[2] 吳中如.水工建筑物安全監控理論及其應用[M].北京:高等教育出版社,2003.
[3] 于 鵬,顧沖時.大壩安全監測的組合預測模型[J].人民黃河,2006,28(1):67-68,72.
[4] 蘇懷智,溫志萍,吳中如,等.基于SVM理論的大壩安全預警模型研究[J].應用基礎與工程科學學報,2009,17(1):40-48.
[5] 紀雪玲,李 明,李 瑋,等.一種克服局部最優的收縮因子PSO算法[J].計算機工程,2011,37(20):213-215.
[6] 張 楠,馬福恒,張 帥,等.大壩實測性態的灰色馬爾科夫鏈預測方法研究[J].水電能源科學,2012,30(8):70-73.
[7] 張學工.關于統計學習理論與支持向量機[J].自動化學報,2000,26(1):32-42.
[8] 董 勝,劉德輔.年極值水位的灰色馬爾科夫預報模型[J].水利學報,1999(1):60-64.
[9] 張 鑫,任永泰,王福林,等.基于改進灰色馬爾科夫模型的年降水量預測[J].數學的實踐與認識,2011,41(11):51-57.
[10]姜諳男,梁 冰.基于PSO-SVM的大壩滲流監測時間序列非線性預報模型[J].水利學報,2006,37(3):331-335.
[11]劉華鎣,林玉娥,齊名軍,等.求解約束優化問題的改進粒子群算法[J].大慶石油學院學報,2005,29(4):73-75.
[12]Asanga R,Saman K H,Harry C W.Self-organizing Hierarchical Particle Swarm Optimizer with Time-varying Acceleration Coefficients[J].IEEE Transactions on Evolutionary Computation,2004,8(3):240-255.
[13]Oh,Hee-Seok Kim,Donghoh Lee,Youngjo et al.Crossvalidated Wavelet Shrinkage[J].Computational Statistics,2009,24(3):497-512.
[14]方衛華.基于峰值識別理論的大壩安全監控模型[J].水電能源科學,2008,26(5):78-79,149.
[15]楊 維,李歧強.粒子群優化算法綜述[J].中國工程科學,2004,6(5):87-94.