張建中,顧沖時,袁冬陽,王巖博
(1.河海大學水災害防御全國重點實驗室,江蘇 南京 210098; 2.河海大學水利水電學院,江蘇 南京 210098)
我國已修建水庫大壩近10萬座,其不僅發揮了防洪、發電、供水、航運等綜合效益,而且對調控水資源時空分布、助力能源結構低碳轉型、促進國民經濟發展等具有重大意義。在運行期間,水庫大壩長期服役安全存在很多風險隱患,再加上一些工程設計和歷史遺留等問題,很多工程都面臨著安全隱患,一旦失事,將會對下游人民的生命財產安全和水生態安全造成巨大的威脅[1-2]。安全監測是保證混凝土壩長效服役安全的重要手段[3-5]。變形作為最能直觀反映混凝土壩在外部荷載和內部荷載耦合作用下運行性態的監測效應量,是安全監測的重點[6-7]。使用混凝土壩變形監測數據進行合理的變形行為分析及預測,對保障混凝土壩長效服役安全、實時診斷大壩健康態勢與預測未來運行行為具有重要意義[3,8]。
混凝土壩變形監測數據是一種非線性、非穩態特征的時間序列,使用信號分解理論可將其分離成不同頻率信號序列[9-11]。為提高預測精度,通過引入“分解-重構”的思想,將監測數據進行高低頻分解,分解成不同頻率的子序列,然后分別進行預測、重構[12-13]。朱寶強等[14]依據時間序列原理將混凝土壩位移序列分解為趨勢項與隨機項,并用改進的支持向量機(support vector machine,SVM)進行預測;陳俊風等[15]使用小波分解把原始序列分解成多個子序列,用優化的BP神經網絡分別對這些子序列進行預測;徐肖遙等[16]使用經驗模態分解(empirical mode decomposition,EMD)將變形數據分解成多尺度變形分量,結合改進的極限學習機(extreme learning machine,ELM)對變形分量進行預測;馬佳佳等[17]運用集合經驗模態分解(ensemble empirical mode decomposition,EEMD)將原始數據分解為不同頻率分量,然后分別使用長短期記憶神經網絡(long short term memory neural network,LSTM)和多元線性回歸對高頻和低頻分量進行預測;王飛等[18]采用局部均值分解將變形數據分解成趨勢項和隨機項,結合相關向量機和整合移動平均自回歸模型進行組合預測;張健飛等[19]使用變分模態分解(variational mode decomposition,VMD)將變形時間序列數據分解成一系列模態分量,采用卷積神經網絡對各模態分量建模并預測。
相比于單一方法(如BP[20]、ELM[16]、SVM[21]等)的變形預測模型,以上“分解-重構”變形預測模型具有更好的性能,但其分解及預測方法對模型預測性能有著很大的影響[19-22]。就位移序列分解方法而言,小波分析分解徹底,但自適應能力不強,分解尺度選取困難,很難獲得最優解[23-24];經驗模態分解自適應性強,時頻分辨率高,但存在模態混疊等問題[25];EEMD雖能抑制模態混疊現象,但分解個數隨機不可控,需要多次迭代求均值[26];局部均值分解可緩解端點效應,但在模態混疊方面仍需改進[27];相比EMD和EEMD等分解方法,VMD擁有更好的魯棒性,可通過信號的自適應分解,有效緩解EMD模態混疊和解決EEMD分解層數不可控等問題[21,28]。
就模型預測而言,BP神經網絡具有出色的非線性特質,但收斂速度慢[20];ELM收斂速度快、泛化能力強,但模型穩定性不夠理想[16];SVM擁有很好的學習能力,但模型計算速度比較慢,魯棒性還需提高[21];整合移動平均自回歸模型在時間序列上有很強的有效性,但只能預測具有線性關系的數據[18]。而混凝土壩在運行過程中產生的變形監測數據是一種時間序列,循環神經網絡(recurrent neural network,RNN)是一種擅長處理各種與時間序列有關的深度學習算法[29-30]。LSTM和門控循環單元(gate recurrent unit,GRU)在RNN基礎上進行改進,是兩種特殊的循環神經網絡,能有效解決RNN存在的梯度消失等問題,且相比LSTM,GRU具有更少的參數,其訓練效率更高[31-34]。
考慮到“分解-重構”預測模型相比單一模型具有更好的預測性能,本文提出了一種基于優化VMD與GRU的混凝土壩變形預測模型,針對VMD分解參數需人為設置,參數過大或過小都會影響分解效果,GRU超參數的設置直接影響其訓練速度、使用效果及魯棒性等問題[35-36],引入一種具有結構簡單、參數少、求解精度高及收斂速度快等優點的群智能優化算法(grey wolf optimization,GWO)對VMD及GRU的參數進行優化選取,并與GRU、BP神經網絡、ELM及VMD-GRU等預測模型進行對比,驗證該模型的可靠性與有效性。
VMD是一種非迭代、自適應且準正交的信號分解方法。該方法本質上是一種基于希爾伯特變換和混合頻率變分問題的自適應維納濾波器,可以通過循環迭代的方式,搜尋求得變分問題的最優解,基于交替方向乘子法,確定每個本征模態函數(intrinsic mode function,IMF)的中心頻率和帶寬,由此實現各分量從低頻到高頻的有效分離,從而得到信號頻域的特征信息。懲罰因子α和分解模態數K是變分模態分解過程中約束帶寬的重要參數,決定各模態的能量變化,其取值對最終分解效果的準確性以及后續信號處理有著至關重要的影響,目前VMD參數一般采用人為設置,對數據分解的高效性與精確性有很大的影響,且很難達到最佳分解效果。本文采用GWO對VMD的兩個參數α和K進行優化取值。
排列熵可以反映出信號的復雜程度,計算排列熵可以確定位移序列分解后的復雜程度,故將排列熵作為優化VMD參數的適應度函數,排列熵越小表示VMD分解后序列越有規律,越大表示VMD分解后序列越混亂[37],故以排列熵取得最小值作為尋優目標,對參數進行優化取值。采用GWO優化VMD的步驟如下:
步驟1獲取大壩原始變形監測數據。
步驟2算法參數設置。如狼群規模N、最大迭代次數tmax、參數α及K的上下限。
步驟3初始化灰狼位置向量。
步驟4計算個體適應度值。適應度函數HP的表達式如下:
(1)
式中:Pj指重構后矩陣序列出現的頻率;k為j的取值上限。
步驟5將當前最優個體參數分別保存至θ、β和δ狼的位置向量中。灰狼與獵物之間的距離及第t+1代灰狼的位置向量分別如下:
Dω=|C×Xpt-Xt|
(2)
Xt+1=Xpt-A×Dω
(3)
式中:Dω為灰狼與獵物之間的距離;Xpt為第t代獵物的位置向量;Xt、Xt+1分別表示第t和第t+1代灰狼的位置向量;A、C為系數向量。
步驟6更新尋優控制因子、A和C及候選狼ω的位置向量。A、C及ω狼的位置向量表達式分別如下:
A=2a×r1-a
(4)
C=2r2
(5)
Xt+1=(X1+X2+X3)/3
(6)
式中:a為控制因子;r1、r2是模在[0,1]間的隨機向量。
步驟7迭代終止條件判別。如果t 步驟8輸出模型最優參數(α,K),將其代入VMD算法分解原始數據,得到優化后的IMF分量。 GRU是一種特殊類型的RNN,相比標準的RNN,GRU更完整地描述了監測效應量序列的長短期時序相關性。GRU主要由重置門和更新門組成,重置門決定信息被遺忘的程度,更新門決定上一隱藏狀態傳遞給當前隱藏層多少信息。經過VMD分解后,各個分量的變化規律相比原始數據序列更加平穩,使用1層GRU網絡神經元即可滿足訓練要求。隱含層隱含神經元個數n與初始學習率r是GRU網絡預測過程中的重要參數,對模型構建及其預測精度有著至關重要的影響,目前GRU參數一般采用人為設置,隨機性很大,很難達到最佳預測效果。本文采用GWO對GRU的n、r參數進行優化取值,以提高預測精度。 GWO優化GRU算法步驟與GWO優化VMD算法步驟基本一致,不同之處在于GWO優化GRU時采用均方誤差(EMSE)作為適應度函數,以EMSE最小值作為尋優目標,即 (7) 式中:m為訓練樣本容量;yi為實測變形;y′i為訓練得到的變形。 根據上述方法原理,優化VMD與GRU模型(以下簡稱“本文模型”)的主要實現過程如下:①利用GWO優化求解VMD的重要參數α及K,使用優化的VMD把原始數據分解為一組最優IMF分量;②利用GWO優化求解GRU的重要參數n及r,使用優化的GRU模型對每個IMF分量進行時序預測;③將各IMF預測結果疊加,得到位移序列預測結果。模型預測流程如圖1所示。 圖1 本文模型預測流程 某特高拱壩正常蓄水位1240m,總庫容150億m3,壩頂高程1245m,頂寬12m,壩體共由43個壩段組成。為掌握大壩工作性態,采用垂線法監測壩體水平位移,垂線測點具體布置情況如圖2所示。為分析本文模型的有效性與合理性,取A09-PL-01、A22-IP-01和A29-IP-01共3個測點2010年7月1日至2020年2月10日的變形監測數據作為分析對象,具體監測數據如圖3所示。 圖2 垂線測點布置 圖3 實測位移變形監測數據 為避免VMD參數隨意取值影響分解效果,首先利用GWO迭代優化α和K兩個參數,GWO狼群數量與最大迭代次數分別10和50,α及K的取值區間分別為[100,10000]與[2,10]。測點A09-PL-01的尋優結果為α=6071、K=8,測點分解結果如圖4所示。 圖4 A09-PL-01測點GWO優化VMD序列分解 測點的模態分量按從低頻到高頻的順序進行排序,測點的IMF1分量是表示大壩變形趨勢整體呈上升狀態的趨勢項;測點的IMF2~IMF5分量是周期性強、平穩強度高的周期項;測點的其余分量是周期性弱、平穩性低的隨機項。 將2010年7月1日至2018年9月6日監測數據作為訓練集,2018年9月7日至2020年2月17日監測數據作為測試集,以測試集的預測性能來驗證模型的效果。 為避免GRU參數隨意取值影響預測效果,使用GWO對GRU參數n及r進行參數尋優,以更好地捕獲每個IMF的趨勢進行準確預測,GWO狼群數量與最大迭代次數分別取10和50,參數n、r的取值區間分別為[2,20]與[0.001,0.02]。各個分量參數[n,r]的尋優結果分別為[7,0.017]、[13,0.016]、[20,0.011]、[8,0.010]、[17,0.009]、[11,0.011]、[6,0.020]、[14,0.011]。將優化參數代入GWO優化GRU進行預測,各分量的預測結果如圖5所示。 圖5 A09-PL-01測點各IMF分量GWO優化GRU預測結果 從圖5可以看出,各分量的實測值和預測值的最大誤差不超過0.1mm,預測誤差很小。將測點所包含的各IMF分量預測結果疊加,得到測點變形預測結果。同時,為驗證本文模型的有效性,同時采用GRU、BP神經網絡、ELM及VMD-GRU模型等預測方法進行預測,預測結果對比如圖6所示。 圖6 A09-PL-01測點各模型預測結果對比 為進一步驗證本文模型的普適性,對A22-IP-01和A29-IP-01兩個測點進行建模預測,結果如圖7所示。為評估本文模型的預測精度,綜合采用決定系數(R2)、平均絕對誤差(MAE)、均方根誤差(RMSE)和平均絕對百分比誤差(MAPE)作為各測點預測模型預測統計指標,計算結果如表1所示。 表1 各預測模型性能評價指標 圖7 兩個測點各模型預測結果對比 由圖6與圖7可以看出,對于A09-PL-01、A22-IP-01和A29-IP-01這3個測點,5種預測模型預測值與真實值的變化趨勢基本一致,但相比BP神經網絡、ELM、GRU以及VMD-GRU模型的預測結果,本文模型的預測值更加接近實測變形值,預測值和實測值基本吻合,模型具有更高的精度。由表1可知,本文模型的MAE、RMSE與MAPE均明顯小于BP神經網絡、ELM、GRU與VMD-GRU模型。這3個測點本文模型的R2分別為0.9996、0.9996和0.9995,顯著接近于1,且明顯高于其他4個模型,進一步說明了本文模型預測性能的優良性。由此可以得出,本文模型比GRU、BP神經網絡、ELM以及VMD-GRU模型的預測精度更高,有效驗證了該模型的普適性與穩健性。 采用GWO分別優化VMD及GRU的重要參數,避免人工賦值的不確定性,解決了模型參數選擇困難的問題,提高了數據挖掘及非線性處理能力。 基于“分解-重構”的思想,將監測數據進行高低頻分解,分解成不同頻率的子序列,并結合深度學習網絡對其預測再重構,相比單一手段建立的預測模型,預測性能更好;本文模型相比未進行參數尋優的VMD-GRU模型預測精度更高,實例進一步驗證了本文模型的有效性、泛化性及準確性。1.2 GWO優化GRU
1.3 優化VMD與GRU模型預測流程

2 工程實例驗證


2.1 實測序列分解

2.2 建模預測


2.3 模型對比及精度分析


3 結 語