田紫圓,何佳楠,吳震宇,周 弭,孫 燕
(1.四川大學 水利水電學院 水力學與山區(qū)河流開發(fā)保護國家重點實驗室,四川 成都 610065;2. 國網(wǎng)四川甘孜州電力有限責任公司康定市供電分公司,四川 康定 626000)
大壩安全監(jiān)測是保證水庫安全運行,掌握大壩性態(tài),及時診斷工程運行現(xiàn)狀的必要手段[1]。重力壩是水庫大壩常用壩型之一。變形監(jiān)測是監(jiān)控重力壩長期運行安全的重要手段,而構(gòu)建重力壩變形監(jiān)測模型,對于重力壩變形[2]規(guī)律分析和結(jié)構(gòu)異常性態(tài)[3]的診斷以及評估重力壩安全風險[4- 5]具有重要意義。
在重力壩變形監(jiān)測模型中,基于機器學習算法的監(jiān)測模型愈加受到關注和應用。極限學習機(ELM)是一種具有單層隱藏節(jié)點的前饋神經(jīng)網(wǎng)絡,連接輸入的權(quán)值隨機分配。與使用反向傳播算法訓練的網(wǎng)絡相比,該模型具有良好的泛化性能和學習速度,能夠簡單有效地用于混凝土壩結(jié)構(gòu)行為預測監(jiān)測模型的建立。胡德秀[6]以土石壩監(jiān)測測點的水平位移作為輸出值,以上下游水位、壩區(qū)氣溫、對數(shù)時效因子作為輸入值,構(gòu)建基于穩(wěn)健估計極值學習機(M-ELM)的變形監(jiān)測模型,具有較高的擬合和預測精度;戴波[7]以重力壩測點水平位移為例,結(jié)合混沌理論和極限學習機建立變形監(jiān)測統(tǒng)計模型,其預測效果優(yōu)于傳統(tǒng)的重力壩統(tǒng)計模型;Kang[8]采用ELM算法對豐滿重力壩的壩頂水平位移進行監(jiān)測模型的構(gòu)建,并且與BP神經(jīng)網(wǎng)絡模型、MLR模型和SR模型相比,ELM模型對該工程的位移具有更好的預測性能且訓練速度較快。基于VC維理論和結(jié)構(gòu)風險最小化準則而建立的支持向量機SVM[9- 10],可以用于非線性數(shù)據(jù)的回歸預測,被廣泛應用于重力壩變形監(jiān)測模型研究中。姜振翔[11]將小波分解和支持向量機結(jié)合,建立監(jiān)測模型用于重力壩引張線監(jiān)測點位移的預測,具有較強的預測精度;宋志宇[12]以豐滿混凝土重力壩為例,將環(huán)境量作為輸入變量,壩頂水平位移作為輸出變量,采用最小二乘支持向量機(LSSVM)建立重力壩的變形監(jiān)控模型,比傳統(tǒng)支持向量機(SVM)預測精度更高。近年神經(jīng)網(wǎng)絡算法在重力壩變形監(jiān)測模型的研究中應用也較為廣泛。Wang[13]提出了一種基于混合多種群遺傳算法的神經(jīng)網(wǎng)絡算法,利用該混合模型對重力壩的位移進行了分析預測,其算法在全局搜索、收斂速度和預測精度方面均優(yōu)于普通BP神經(jīng)網(wǎng)絡和統(tǒng)計回歸模型。另外,有不少學者在其它領域內(nèi)采用遺傳算法(GA)和模擬退火(SA)算法共同優(yōu)化BP神經(jīng)網(wǎng)絡,與傳統(tǒng)BP神經(jīng)網(wǎng)絡相比,其優(yōu)勢在于能夠提高收斂速度和預測精度,避免神經(jīng)網(wǎng)絡容易陷入局部極小值的缺陷[14- 15]。
本文擬結(jié)合EMD分解,采用極限學習機(ELM)、基于網(wǎng)格搜索和K-fold交叉驗證的支持向量機、基于模擬退火遺傳算法優(yōu)化的BP神經(jīng)網(wǎng)絡(GASA-BP)三種機器學習方法對EMD分解重構(gòu)的周期項進行訓練和預測,并采用評價指標均方根誤差RMSE和平均絕對誤差MAE對其訓練集擬合和預測集的預測效果進行對比分析。
極限學習機(ELM)是Huang[16]等提出的一種高性能單隱層前饋神經(jīng)網(wǎng)絡,基本步驟如下:
(1)輸入訓練集{Xi,Yi|xi∈Rd,yi∈Rm,i=1,2,…,N},隱藏層激活函數(shù)G(·)形式和隱藏層神經(jīng)元數(shù)量L。
(2)對訓練集數(shù)據(jù)實例xi(i=1,2,…,N)和數(shù)據(jù)實例對應的標記yi(i=1,2,…,N)分部進行[0,1]最值歸一化。
(3)計算生成的隱藏層節(jié)點參數(shù)wi(i=1,2,…,L)和bi(i=1,2,…,L)。
(4)計算隱藏層輸出層連接權(quán)重β*=H+T。
(5)構(gòu)建ELM網(wǎng)絡,得到訓練集對應的ELM的輸出值fL(xi)(i=1,2,…,N),并進行標記反歸一化,即可得到訓練集標記對應的預測值。
(6)輸入預測集的數(shù)據(jù)實例{Xi|xi,i=N+1,N+2,…,N+p},p為預測集數(shù)據(jù)的組數(shù)。對預測集的數(shù)據(jù)實例同樣進行與(2)中結(jié)構(gòu)一致的歸一化。通過構(gòu)建的ELM網(wǎng)絡,得到預測集對應的ELM的輸出值fL(xi)(i=N+1,N+2,…,N+p),并進行反歸一化,即可得到預測集的標記預測值。
本文采用基于網(wǎng)格搜索和K-fold交叉驗證的SVM回歸模型[17- 18],其優(yōu)點在于可以對參數(shù)組合(C,g)同時進行尋優(yōu),有效避免了局部最優(yōu)的問題,提高計算的整體效率。其中,組合(C,g)中的C為非負懲罰因子,g為核函數(shù)參數(shù)。
基于網(wǎng)格搜索和K-fold交叉驗證的(C,g)參數(shù)優(yōu)化步驟如下:
(1)設定網(wǎng)格劃分區(qū)間。令a=[-4,4],b=[-4,4],步長取為0.1。取SVM模型參數(shù)的網(wǎng)格劃分節(jié)點為C=2a,g=2b。
(2)將訓練數(shù)據(jù)等分為K個子集。K取為3,確保訓練集中的訓練樣本數(shù)量大于測試樣本數(shù)量。
(3)對于設定網(wǎng)格中的每組(C,g),任取一個等分的子集作為測試集,其余K-1個子集作為訓練集進行SVM的模型構(gòu)建,將得到的訓練模型對取出的測試集進行預測,統(tǒng)計測試結(jié)果的均方誤差MSE:
(1)



本文采用遺傳算法(GA)和模擬退火(SA)算法共同優(yōu)化BP神經(jīng)網(wǎng)絡,GA的抽樣過程可以優(yōu)化算法[19],SA算法可以有效控制算法的收斂性[20],有效增強BP神經(jīng)網(wǎng)絡的搜索能力和運行效率[21]。
基于模擬退火遺傳算法優(yōu)化的BP神經(jīng)網(wǎng)絡權(quán)值算法的主要步驟如下:
(1)進行實數(shù)編碼。采用3層前饋神經(jīng)網(wǎng)絡,編碼長度n與輸入節(jié)點數(shù)a,輸出節(jié)點數(shù)b,隱含層節(jié)點數(shù)c相關,其計算公式為:
n=(a+1)c+(c+1)b
(2)
(2)設置相關參數(shù)。給定模擬退火的初始溫度t0,退火速率λ,迭代次數(shù)k=0。同時,設定隱含層節(jié)點數(shù)、最大進化代數(shù)(迭代次數(shù))、種群規(guī)模、染色體選擇方法交叉概率Pc、交叉方法、變異概率Pm、變異方法等。
(3)生成初始群體。節(jié)點的連接權(quán)重范圍設定為[xmin,xmax],基因取范圍中的隨機數(shù)。
(4)對群體中個體進行評價。輸入學習樣本可以計算出學習誤差E:
(3)
式中,N—訓練樣本集的組數(shù),yi—神經(jīng)網(wǎng)絡第i個輸入樣本的輸出,yi—響應的期望輸出。個體的適應度為:
(4)
(5)執(zhí)行遺傳操作。具體如下:
①選擇操作。個體Xi被選中進入下一代的概率為:
(5)
式中,G—種群規(guī)模,fi—個體Xi的適應度。

(6)
(7)
式中,e—比例因子,為(0,1)范圍內(nèi)以均勻分布產(chǎn)生的一個隨機參數(shù)。
③變異操作。個體Xi中的每一個基因位以變異概率Pm的概率發(fā)生變異,相當于有Pm的幾率使區(qū)間[xmin,xmax]中均勻分布產(chǎn)生的隨機數(shù)代替原有基因位。
(6)引入最優(yōu)的保留策略。
(7)引入模擬退火操作。
①利用模擬退火狀態(tài)產(chǎn)生新基因值g′(k),具體為:
g′(k)=g(k)+β
(8)
式中,β∈(-1,1),為一個隨機擾動的參數(shù)。
②計算g′(k)的目標函數(shù)值和g(k)的目標函數(shù)值之差ΔC。
③計算接受概率Pr,公式為
Pr=min[1,exp(-ΔC/tk)]
(9)
式中,tk—迭代k次后的模擬退火溫度。
④若Pr>random[0,1],則取g(k)=g′(k),否則,g(k)保持不變。
⑤引入最優(yōu)保留策略。
⑥采用模擬退火函數(shù)tk+1=λtk進行退火,其中,λ為退火速率,λ∈(0,1)。
(8)判斷終止條件。滿足遺傳算法操作的終止條件轉(zhuǎn)(9),不滿足轉(zhuǎn)(4)。
(9)解碼賦值,進行預測。將搜索的最優(yōu)個體解碼,賦值給神經(jīng)網(wǎng)絡節(jié)點連接權(quán)重和節(jié)點閾值,進行預測。
本文以某重力壩9#壩段真空激光LA9測點順河向位移為例,訓練集和預測集輸入變量分別采用2015年5月1日—2017年5月1日和2017年5月2日—2017年8月1日水壓分量的模型因子H、H2、H3、H4和溫度分量的模型因子PC1、PC2,訓練集輸出變量采用真空激光LA9測點順河向位移經(jīng)EMD分解后重構(gòu)的周期項,預測集采用周期項作為實際值,用于檢驗機器學習的預測效果。分析和評價指標使用均方根誤差RMSE和平均絕對誤差MAE。其中:
(10)
式中,H(t)—t時刻作用在重力壩上的上游水位;Hmin—重力壩上游的極限死水位;Hmax—重力壩監(jiān)測時期最高上游庫水位。
(1)極限學習機(ELM)模擬結(jié)果
經(jīng)試驗,變量進行最值化歸一的區(qū)間設置為[0,1],極限學習機ELM的激活函數(shù)設置為Sigmoid函數(shù),隱藏層神經(jīng)元節(jié)點數(shù)量L設置為10,可以獲得較好的訓練和預測效果。訓練產(chǎn)生的輸入層神經(jīng)元與隱含層神經(jīng)元間的連接權(quán)重、隱藏層神經(jīng)元的閾值和隱藏層與輸出層的連接權(quán)重見表1,ELM算法訓練集擬合與預測集預測效果如圖1—3所示。

表1 隱藏層節(jié)點輸出參數(shù)及輸出權(quán)重

圖1 EMD重構(gòu)周期順河向位移ELM擬合

圖2 EMD重構(gòu)周期順河向位移ELM預測

圖3 基于EMD與ELM的LA9順河向位移監(jiān)測模型

圖5 EMD重構(gòu)周期順河向位移SVM預測

圖6 基于EMD與優(yōu)化SVM的LA9順河向位移監(jiān)測模型
(2)基于網(wǎng)格搜索和交叉驗證的支持向量機模擬結(jié)果
采用基于網(wǎng)格搜索和交叉驗證的支持向量機對LA9順河向EMD分解的周期項位移進行訓練時,變量進行最值化歸一的區(qū)間設置為[0,1],采用徑向基函數(shù)作為支持向量機的核函數(shù)。引入網(wǎng)格搜索和交叉驗證優(yōu)化時,取SVM模型參數(shù)的網(wǎng)格劃分節(jié)點為C=2a,g=2b,網(wǎng)格劃分區(qū)間設定a=[-4,4],b=[-4,4],步長取為0.1。訓練數(shù)據(jù)等分子集數(shù)設置為3。

圖4 EMD重構(gòu)周期順河向位移SVM擬合
(3)基于模擬退火遺傳算法優(yōu)化的BP神經(jīng)網(wǎng)絡模擬結(jié)果
采用基于模擬退火遺傳算法優(yōu)化的BP神經(jīng)網(wǎng)絡對LA9順河向EMD分解的周期項位移進行訓練時,變量進行最值化歸一的區(qū)間設置為[0,1]。給定模擬退火的初始溫度為1000,退火速率取0.8。隱含層節(jié)點數(shù)設置為10,最大進化代數(shù)為1000,種群規(guī)模為30。染色體選擇方法交叉概率為0.7,變異概率為0.1。網(wǎng)絡節(jié)點的連接權(quán)重取值范圍設定為[-3,3]。訓練時的適應度曲線如圖7所示。最終基于模擬退火遺傳算法優(yōu)化的BP神經(jīng)網(wǎng)絡的訓練集擬合與預測集預測效果如圖8—10所示。

圖8 EMD重構(gòu)的周期順河向位移GASA-BP擬合

圖7 適應度曲線
(4)分析對比
圖11—12為基于EMD的真空激光LA9順河向位移通過機器學習訓練和預測的結(jié)果,其擬合與預測評價指標見表2。

表2 基于EMD的真空激光LA9順河向位移擬合預測指標

圖9 EMD重構(gòu)的周期順河向位移GASA-BP預測

圖10 基于EMD與GASA-BP的LA9順河向位移監(jiān)測模型

圖11 基于EMD的LA9順河向位移機器學習訓練擬合

圖12 基于EMD的LA9順河向位移機器學習預測
由訓練集的擬合效果可得,ELM、優(yōu)化SVM、GASA-BP三種機器學習方法的均方根誤差RMSE和平均絕對誤差MAE均小于最小二乘法,優(yōu)化SVM和GASA-BP方法在順河向位移的擬合精度上相比最小二乘法提升較大,說明采用機器學習相比最小二乘法的線性擬合可以有效提高訓練集的擬合精度。其中,優(yōu)化SVM模型擬合精度最高,相比最小二乘法線性擬合精度提升了45.4%。
在預測效果方面,采用ELM和GASA-BP兩種機器學習的預測評價指標RMSE、MAE均小于最小二乘法,說明ELM和GASA-BP方法相比最小二乘法的線性擬合,可以提升監(jiān)測模型的預測效果。優(yōu)化SVM的機器學習方法在預測方面,其評價指標RMSE(0.481mm)、MAE(0.375mm)略大于最小二乘法的評價指標RMSE(0.406mm)、MAE(0.334mm),說明其預測精度比最小二乘法略低。分析其原因,SVM回歸模型在訓練時采用基于網(wǎng)格搜索和K-fold交叉驗證的尋優(yōu)方法,大幅提高了訓練集的擬合精度而出現(xiàn)了過擬合的現(xiàn)象,使得預測集在預測精度方面不如最小二乘法的線性擬合。
本文以某重力壩9#壩段真空激光LA9測點順河向位移為例,驗證了ELM、SVM、GASA-BP三種機器學習方法針對EMD分解重構(gòu)的周期項可以有效提升重力壩變形監(jiān)測模型的訓練和預測精度。
通過不同方法的對比分析可知,ELM和GASA-BP方法均可提升模型的訓練及預測精度。優(yōu)化SVM方法在訓練集擬合精度最高,但由于出現(xiàn)過擬合現(xiàn)象使得其預測集精度略低于最小二乘法。因此選擇合理的算法對模型構(gòu)建至關重要,綜合比較得知,GASA-BP方法為最優(yōu)。