唐 琪 包騰飛 杜傳陽 滕雯雯
(1. 河海大學 水文水資源與水利工程科學國家重點實驗室,南京 210098; 2. 河海大學 水資源高效利用與工程安全國家工程研究中心,南京 210098; 3. 河海大學 水利水電學院, 南京 210098; 4. 威海市水利局,山東威?!?64200)
?
逐步RVM-Markov模型在大壩變形預測中的應用
唐琪1,2,3包騰飛1,2,3杜傳陽1,2,3滕雯雯4
(1. 河海大學 水文水資源與水利工程科學國家重點實驗室,南京210098; 2. 河海大學 水資源高效利用與工程安全國家工程研究中心,南京210098; 3. 河海大學 水利水電學院, 南京210098; 4. 威海市水利局,山東威海264200)
摘要:相關向量機(RVM)模型具有結構稀疏化、核函數選擇范圍廣等特點,應用到大壩變形預測中比支持向量機(SVM)模型更具優勢.同時考慮到殘差對預測精度的影響,引入Markov鏈用于預測數據修正,從而得到一種高精度的逐步RVM-Markov組合模型.在實際應用中,RVM模型的泛化能力與SVM相當,向量數量卻遠小于SVM模型,計算過程得到簡化,Mrakov鏈對殘差進行修正后又提高了預測精度.將上述組合模型用于大壩變形實例分析,獲得了較好的回歸預測效果.
關鍵詞:大壩變形監測模型;相關向量機;Markov鏈
大壩變形位移是大壩安全監控的重要方面,根據大壩變形實測資料進行分析預測,對了解大壩運行狀況,監控大壩和壩基安全起到重要作用[1].變形測值受水壓、溫度和時效等因素的影響,會存在一定的趨勢變形及周期波動.近些年來,支持向量機(Support Vector Machine,SVM)模型以其在小樣本非線性數據回歸預測上良好的適用性而在大壩變形監測領域得到廣泛研究,但該模型仍存在懲罰系數易選擇不當、支持向量個數隨樣本的增大成線性增長等問題.而Micheal E.Tipping[2]在2001年提出的相關向量機(Relevance Vector Machine,RVM)模型不僅具有與SVM相當的適用范圍與泛化能力,而且以其結構稀疏化、核函數不需滿足Mercer條件等優點很好地彌補了SVM模型的不足.另外考慮到變形測值波動較大會引起殘差規律的變化,降低預測精度,本文利用Markov鏈模型具有適應大波動數據的優點,將RVM與Markov鏈模型相結合,并采用逐步更新樣本數據的方法,得出一種高精度的變形預測模型,并應用到工程實例中進行驗證.
1相關向量機
1.1相關向量機基本原理
相關向量機(Relevance Vector Machine,RVM)與SVM類似,但RVM是在貝葉斯理論框架下進行學習,在先驗參數的結構下基于主動相關決策理論(Automatic Relevance Determination,ARD)來移除不相關的點[3],從而獲得稀疏化的模型.
其中,ω=(ω0,ω1,…,ωN)T為權值向量;K(x,xj)為核函數,εi為附加噪聲.
相關向量機假定ti服從均值為y(xi)的高斯分布,即p(ti|x)~N(ti|y(xi),σ2).

其中t=(t1,…,tn)T,ω=(ω1,…,ωn)T,Φ∈RN×(N+1),Φ=[φ(x1),φ(x2),…,φ(xN)]T,φ(xi)=[1,K(xi,x1),…,K(xi,xN)]T.
RVM對樣本集的訓練目的是得到權值向量的后驗分布.先定義ω滿足ARD高斯先驗分布
其中α=(α0,α1,…,αN)T為超參數,每一個αi都相互獨立且只與其對應的權值ωi相關[4].
利用公式(2)(3),根據貝葉斯公式可得權重ω的后驗分布為
從而
其中,Σ為后驗協方差矩陣,μ為后驗均值向量,B=σ-2I.
對權值進行積分,即
由此可得,p(t|α,σ2)~N(0,C),其中協方差
通過最大化邊緣似然p(t|α,σ2)來進行稀疏貝葉斯學習,為了計算方便,可以轉化成對數形式:
對公式(10)關于α求導可以得到迭代公式
其中μi是μ的第i個元素,∑ii是矩陣∑的第i個對角元素,γj=1-αj∑jj.
根據公式(6)、(7)、(11)、(12)可以迭代計算出邊緣分布最大化的α和σ,并且出現很多αi趨向于∞的情況,代入公式(11)可得μi趨向于0,則可以將其對應的基向量刪除,令對應的ωi=0,從而得到稀疏化的RVM模型.
1.2RVM相較于SVM的優點分析
1)RVM的核函數不需滿足梅西(Mercer)定理(關于梅西定理,本文不作詳細討論),其選擇范圍要比SVM更廣.這一選擇條件的放寬,進一步提高了RVM的適用性.
2)針對現實情況常常出現樣本重疊的問題,SVM利用懲罰系數來進行處理.但SVM不能對此系數做自動評估,需要手動設置,懲罰系數設置不當,將會引起過擬合的問題而導致結果不理想.由于RVM的參數可以自動賦值,則避免了這一問題.
3)對于同樣的樣本數據,RVM訓練過程中“相關向量”的比重要遠遠小于SVM“支持向量”的比重.SVM中“支持向量”的個數隨著其訓練樣本的增大而線性增加,遇到較大的訓練樣本時,會影響其最終的測試速度,而RVM的“相關向量”個數增長速度相對于“支持向量”則要慢了很多.這一特性,使得RVM在某些對實時性要求較高的情況之下,能表現得更為理想.
2Markov鏈修正模型
2.1馬爾科夫過程基本原理
馬爾科夫過程(Markov Process)是一個無后效性的隨機過程,具體是指當ti時刻所處狀態為已知時,大于ti時刻所處狀態的概率特性只與過程在ti時刻所處狀態有關,而與過程在ti時刻以前的狀態無關[5].而馬爾科夫鏈(Markov Chain)就是指具有馬爾科夫性質的狀態和時間均離散的隨機過程.在大壩安全監測中,各個測點的垂直位移、水平位移、應力、滲流等物理量數據均是與時間相關的狀態函數,并且狀態和時間均離散,是典型的馬爾科夫隨機過程.



設V(0)為初始狀態E1的初始向量,則經過k步轉移后,向量V(k)可通過下式求得:
2.2馬爾科夫鏈修正殘差
利用馬爾科夫鏈對RVM模型預測結果進行修正,首先求出擬合值與實測值的殘差序列,根據殘差序列劃分概率區間,通過各個狀態向下一個時段的轉移的頻率可以計算出轉移概率,進而構造出轉移概率矩陣[6],本文采用1步轉移矩陣,即k=1.
在用RVM模型進行預測時,根據式(16)進行殘差修正:

3逐步RVM-Markov大壩變形預測模型實現步驟
混凝土壩的變形位移主要考慮水壓、溫度和時效的影響[7],因此可以采用如下統計模型:
其中,δH、δT、δθ分別為水壓分量、溫度分量和時效分量,H、H0表示監測日和始測日的上游水頭,t為監測日到始測日的累計天數,t0為系列監測資料中的第一天到始測日的累計天數,θ=t/100,θ0=t0/100.該統計模型共包括與水壓、溫度、時效相關的10個輸入向量,輸出向量為大壩變形位移.
另外,還需按下式對監測數據進行標準化處理,使處理后的數據保持在[0.1,0.9],以提高學習速度:
其中xmax和xmin是每組監測數據的最大值和最小值.
本文將馬爾科夫鏈與RVM模型相結合,并進一步改進,采用逐步更新的方法,以期提高長期預測的精度.首先根據N期實測數據建立模型并進行預測,得到第N+1期預測值,然后去除第一期數據并加入第N+1期預測數據,再得到第N+2期預測值,依次類推,即總是取最近的N期數據重新建立模型對下一期數據進行預測.
綜上,逐步RVM-Markov預測模型的算法流程圖如圖1所示.

圖1 逐步RVM-Markov模型回歸預測流程圖
4工程實例
某水電站位于我國安徽省涇縣,水庫總庫容24.76億m3,年發電量3.16億kW·h.其壩型為重力拱壩,最大壩高76.3m,壩頂高程126.3m.取該壩8號壩段壩體垂線2009年2月1日至2013年2月13日期間的監測資料進行分析,由于相鄰兩天數據相近不具有代表性,因此每7d取一組數據,共得到210組徑向位移監測數據為樣本,前200組用于擬合,后10組用于預測.
首先將2009年2月1日至2012年12月5日這200組數據進行標準化處理,然后代入RVM模型訓練,核函數選擇高斯徑向基(RadialBasisFunction,RBF)核函數,核參數 取0.7,得到一系列擬合值.將位移實測值與擬合值相減得到殘差,其中上限為1.04mm,下限為-0.86mm,據此將殘差序列分為4個區間,見表1.

表1 概率區間劃分
在預測過程中,如果模型的殘差超出區間邊界值,則大于1.04 mm時歸于狀態IV,小于-0.86 mm時歸于狀態I.將殘差代入馬爾科夫鏈分析,求得1步轉移概率矩陣如下:
將以上各計算結果代入公式(16)進行殘差修正即可得到RVM-Markov模型擬合值,其擬合效果見圖2.然后用逐步更新學習樣本的方法預測2012年12月12日至2013年2月13日的10組數據,逐步RVM-Markov模型的預測結果見表2.

圖2 RVM-Markov模型擬合曲線圖

預測日期實測值RVM預測值一次殘差殘差修正值逐步RVM-Markov預測值二次殘差20121212-1.62-1.36-0.26-1.16-1.42-0.2020121219-1.83-1.49-0.34-1.38-1.71-0.1220121226-2.79-2.02-0.77-1.77-2.54-0.2520130102-3.39-2.14-1.25-1.41-2.66-0.7320130109-3.54-2.95-0.59-3.10-3.680.1420130116-4.41-3.53-0.88-3.22-4.10-0.3120130123-5.02-4.35-0.67-4.72-5.380.3620130130-5.6-5.39-0.21-5.58-5.800.2020130206-6.62-6.04-0.58-5.59-6.17-0.4520130213-6.51-6.730.22-7.24-7.020.51
為了便于直觀地表現出逐步RVM-Markov模型的優越性,又采用SVM、RVM模型進行回歸預測,將3種模型的預測效果進行對比見圖3.利用各自的均方差來反映不同模型的回歸預測精度,同時記錄支持向量與回歸向量的個數來比較SVM與RVM模型的復雜程度,對比效果見表3.

圖3 3種模型預測曲線圖

圖4 3種模型預測殘差曲線圖

模型SVMRVM逐步RVM-Markov預測時段均方差/mm0.87300.65700.2933向量個數1313228
由圖2可以看出逐步RVM-Markov模型的擬合精度較高,同時從圖3、4也可以看到逐步RVM-Markov模型預測效果較好,其殘差相較于其他兩種模型更接近于0,表3的均方差數據也反映出該模型的預測精度要優于其他兩種模型.另外根據表3中支持向量與相關向量的個數對比可以得知,SVM模型的支持向量多達131個,而兩種RVM模型的相關向量分別為32個和28個,說明RVM模型結構經過稀疏化之后計算的復雜度相較于SVM模型已經大大降低.
5結論
為了彌補SVM模型懲罰系數易選擇不當、計算結構復雜等缺陷,將基于貝葉斯框架的RVM模型應用于大壩變形預測,并對殘差進行Markov鏈修正,而且采用逐步更新訓練樣本的方式以提高預測精度,共同構成了逐步RVM-Markov組合模型.經過工程
實例驗證,RVM模型在大壩變形回歸預測的應用中擬合精度較高,且經過超參數α的篩選,其結構比SVM更加簡化,降低了計算的復雜程度;將Markov鏈應用于殘差修正,有效地提高了預測精度;逐步RVM-Markov組合模型具有相對簡單的運算結構與良好的預測精度,在大壩變形監測領域具有良好的應用價值.
參考文獻:
[1]顧沖時,吳中如.大壩與壩基安全監控理論和方法及其應用[M].南京:河海大學出版社,2006.
[2]Tipping M E. Spare Bayesian Learning and the Relevance Vector Machine[J]. Journal of Machine Learning Research,2001(1):211-244.
[3]王晶.稀疏貝葉斯學習理論及應用研究[D].西安:西安電子科技大學,2012.
[4]嵇小輔,張孟堯,王博,等.基于相關向量機的賴氨酸反應過程參數軟測量[J].華僑大學學報:自然科學版,2013,34(1):22-25.
[5]牛東曉,關哲,任峰.等.基于馬爾科夫過程的電力企業市場競爭預測[J].華北電力大學學報,2004(01):66-68.
[6]張鑫,任永泰,王福林,等.基于改進灰色馬爾科夫模型的年降水量預測[J].數學的實踐與認識,2011,41(11):51-57.
[7]方衛華.基于峰值識別理論的大壩安全監控模型[J].水電能源科學,2008,26(5):78-79,149.
[責任編輯王康平]
Application of Progressively RVM-Markov Model to Prediction of Dam Deformations
Tang Qi1,2,3Bao Tengfei1,2,3Du Chuanyang1,2,3Teng Wenwen4
(1. State Key Laboratory of Hydrology-Water Resources & Hydraulic Engineering, Hohai Univ., Nanjing 210098, China; 2. National Engineering Research Center of Water Resources Efficient Utilization and Engineering Safety, Hohai Univ., Nanjing 210098, China; 3. College of Water Conservancy & Hydropower Engineering, Hohai Univ., Nanjing 210098, China; 4. Weihai Municipal Water Conservancy Bureau, Weihai 264200, China)
AbstractThe relevance vector machine(RVM) model has some features including the rarefaction of its construction and the broad range of its kernel function. Thus, using the RVM model to predict the dam deformations has more advantages than using SVM. When we consider that the residual will influence the precision of prediction, the introduction of Markov chain, which can help us correct the predicting data, will enable us to get a highly precise progressively RVM-Markov model. When the RVM is utilized practically, it can have the generalization ability equal with that of the SVM; but it needs much less vectors than the SVM does. Consequently, the process of calculating is simplified; and the Markov chain increases the precision of prediction. Finally. if we use the combined model mentioned above to predict the dam deformations, we will get better results of regression prediction.
Keywordspredicting model for dam deformation;relevance vector machine(RVM);Markov chain
基金項目:國家自然科學基金青年項目(51209078)
收稿日期:2015-06-19
中圖分類號:TV698.1
文獻標識碼:A
文章編號:1672-948X(2015)06-0047-05
DOI:10.13393/j.cnki.issn.1672-948X.2015.06.010
通信作者:唐琪(1991-),女,碩士研究生,研究方向為水工結構安全監控.E-mail:xqyt77@163.com