宋 洋,楊 杰,宋錦燾,程 琳
(1. 西安理工大學 省部共建西北旱區生態水利國家重點實驗室,陜西 西安 710048;2. 西安理工大學 水利水電學院,陜西 西安 710048)
混凝土壩憑借其在設計、施工、運行管理等方面的獨特優勢,已成為中國壩工建設中的主要壩型之一。然而,隨著水利水電事業的快速發展,水庫大壩的安全問題也越來越突出。高壩大庫開發建設所面臨的地形、地質、水文等工程條件越來越復雜,大壩在運行過程中受到各種動態、靜態和特殊的循環荷載,使水庫大壩建設與運行安全存在更大的不確定性。變形作為反映混凝土壩安全狀態的綜合變量,可以作為評判結構性能的重要指標。因此,對壩體變形值進行預測可以更好地了解壩體變形規律、預測壩體變形趨勢,對混凝土壩的安全穩定運行具有重要意義[1-2]。
在實際工程中,由于大壩運行過程存在不確定性,變形數據序列具有明顯的非線性、非平穩特征,且序列中不可避免地存在一定噪聲。非線性、非平穩數據主要由多種不同尺度的信息組成,對隱藏信息進行挖掘并降低噪聲,對變形數據的準確預測有重要意義[3]。目前常見的信號處理方法有小波變換法[4]、經驗模態分解(empirical mode decomposition,EMD)[5]和集合經驗模態分解(ensemble empirical mode decomposition,EEMD)[6]。對于小波變換法,當數據中存在白噪聲時,去噪效果不理想。在EMD 分解中容易出現模態混疊現象,導致預測效果不佳[7]。EEMD 分解通過加入白噪聲改善了模態混疊現象,但仍存在重構信號噪聲殘留的問題。Colominas 等[8]經過進一步完善,提出了基于自適應噪聲的完全集合經驗模態分解(complete ensemble empirical mode decomposition with adaptive noise,CEEMDAN),該方法通過對每階殘余量添加自適應白噪聲,得到若干頻率不同的IMF 分量,且重構誤差幾乎為0,對非線性時間序列的分解效果更好[9-11]。排列熵(permutation entropy,PE)是一種檢測時間序列隨機性和突變性的方法,由于計算簡單、抗噪能力強、輸出結果直觀等優點被廣泛用于非線性時間序列的處理[12]。通過計算各序列的PE 值判斷其復雜度,并對復雜度相近的序列進行合并,可以在挖掘原始序列隱藏信息的同時降低計算規模。因此,本文基于CEEMDAN-PE 對原始變形序列進行處理。
近年來,隨著大壩安全監控、人工智能等理論的迅速發展,已有眾多數學模型應用到了大壩的變形預測分析中,常見的模型有BP 神經網絡[13]、RBF 神經網絡[14]、支持向量機[15],但每種模型都有一定的局限性。BP 神經網絡收斂速度慢且容易陷入局部最優;RBF 神經網絡在面對大樣本數據時,網絡結構過于復雜。支持向量機對參數和核函數的選擇太敏感。同時,往往是由于多種因素的共同影響造成數據序列的非線性、非平穩性,各因素之間又存在復雜的時間關聯性。傳統神經網絡由于同一層的神經元不會相互傳遞,忽略了時間相關性的影響。在深度學習模型中,循環神經網絡(recurrent neural networks,RNN)通過對隱含層進行改進,使內部單元既有前饋連接又有反饋連接,增加了模型的記憶功能,在時間序列數據預測中有更好的適應性。但RNN 只具有短期記憶能力,對于長時間序列的預測精度不足。長短時記憶神經網絡(long short-term memory,LSTM)對RNN 的隱含層進行了改進,通過加入門結構實現了對歷史信息的存儲,加強了模型對長時間序列的記憶能力,能夠更好地學習時間序列的內部復雜規律,有效避免了RNN 存在的梯度消失和梯度爆炸問題[16-17]。因此,LSTM 模型適用于混凝土壩變形預測。
綜上,本文提出了基于CEEMDAN-PE-LSTM 的混凝土壩變形預測模型,利用CEEMDAN 將原始變形數據分解為頻率不同的多個固有模態函數(Intrinsic mode function,IMF),基于PE 對各個IMF 分量的復雜度進行判斷,對相近序列合并重組為若干組新的序列,達到降噪目的的同時降低了預測模型的計算量。最后,利用LSTM 對重組序列進行預測,并進行疊加得到最終預測結果。
EEMD 是一種噪聲信號數據處理方法,主要通過在原始信號中加入高斯白噪聲進行多次EMD 分解,而白噪聲頻譜具有均勻分布特性,可以有效改善EMD 分解存在的模態混疊現象。
CEEMDAN 是在EEMD 的基礎上發展的,其分解原理可以有效解決EEMD 產生重構誤差的問題。在CEEMDAN 算法中,xn(t)表示原始變形時間序列,ωn(t)為不同幅值ε 的高斯白噪聲,表示對原始信號進行EMD 分解得到的第j 個IMF 分量。CEEMDAN 算法實現步驟如下:
CEEMDAN 與EEMD 獲取第一個IMF 分量的方法相同,均通過對信號x(t)+εωn(t)進行EMD 分解得到,如下式所示:

(1)k=1 時,計算唯一的殘余信號,如下式所示:

(2)將高斯白噪聲ε1E1(ωi(t))加入殘余信號r1(t),i=1, 2, ···, n,進行EMD 分解,直到獲得第1 個IMF 分量,可得2 階IMF 分量:

(3)同理,對于k=2, ···, K,由以上步驟可以依次計算出第k 個殘余信號及第k+1 個IMF 分量:

(4)當殘余信號的極值點不超過2 個時,殘余信號便不能繼續分解時,CEEMDAN 算法終止,共得到K 個固有模態函數,最終的殘余量:

此時,原始變形時間序列可以表示為:

排列熵(PE)是一種時間序列復雜性衡量方法,可以快速檢測信號的隨機性與突變性,適用于混凝土壩變形監測數據的復雜度分析。算法的基本原理如下:
首先對給定的時間序列{X(i), i=1, 2, ···, n}進行相空間重構,得到的相空間矩陣為:

式中:m 為嵌入維數,τ 為延遲時間,j=1, 2, ···, k。
對于重構矩陣的每一行向量,均可得到一組符號序列:

式中:j1, j2, ···, jm表示重構向量各個分量所在的列序號。g=1, 2, ···, l,且有l≤m!。
根據Shannon 熵的形式,將變形時間序列x(t)的PE 定義為:

式中:0 ≤Hp(m)≤ln(m!),當Pg=1/m!時,Hp(m)達到最大值ln(m!)。
HP值的大小代表時間序列的隨機性,值越大說明時間序列的隨機性越強;反之,隨機性越弱,規律性越好。PE 值的計算與嵌入維數 m和延遲時間τ 有關。
循環神經網絡(RNN)是一種內部包含反饋結構的神經網絡,反饋結構意味著每個時刻的輸入不僅和當前輸入、網絡權值有關,而且也和上一時刻的隱藏層的狀態數據有關。RNN 的記憶能力能有效運用在時間序列的預測問題上。然而實際應用中,RNN 存在梯度消失和梯度爆炸問題,最終導致模型訓練中斷。為此,Hochreiter 等[18]在1997 年通過改進RNN 循環神經網絡提出了長短時記憶神經網絡(LSTM)。LSTM 神經網絡包含復雜的動力學結構,在循環神經網絡基礎上,將隱藏層的神經元換成了隱藏狀態和3 個門結構(輸入門、遺忘門、輸出門),控制各個記憶存儲單元的狀態,并實現了控制信息在隱藏狀態上的更新[19]。LSTM 神經網絡的內部單元結構如圖1 所示。
LSTM 神經網絡計算公式如下:

圖1 LSTM 的內部單元結構Fig. 1 LSTM internal unit structure diagram

式中:it、ft、ct、ot分別表示輸入門、遺忘門、更新后的細胞狀態及輸出門;xt為輸入信息; ht為獲取的輸出信息;W 為權重系數;bi、bf、bc和bo為偏置量;下標t 表示累計天數。
輸入門用來控制單元的更新;遺忘門控制歷史信息的保存;輸出門控制計算后的信息輸出。LSTM通過門結構使之前的輸入信息能夠繼續向后傳播而不消失,從而具有較好的長短時記憶能力,在預測中又有較好的擬合效果,能很好地進行變形時間序列的預測分析。
混凝土壩變形受溫度、水位等多種因素影響,監測數據是典型的非線性、非平穩信號。本文通過構建基于CEEMDAN-PE-LSTM 的變形預測模型,實現對混凝土壩變形擬合預測分析。具體步驟如下:
(2)變形數據序列的分解重組:首先,利用CEEMDAN 對變形數據序列進行分解,得到各階IMF分量及RES 分量;然后,利用排列熵算法計算每個分量的PE 值,以復雜度相似性為依據進行數據重組。
(3)重構數據預處理:由于不同環境影響因子量綱不同,為提高模型的預測精度,對重構數據進行歸一化處理。
(4)變形數據預測:對處理好的數據分別建立LSTM 模型進行變形值預測。對得到的變形值進行反歸一化處理,將每一項預測值進行累加,得到最終預測結果。
某水電站是福建省牟陽河上實施梯級開發的引水式電站,主要擋水建筑物為碾壓混凝土重力壩,壩基高程為562.0 m,壩頂高程634.4 m,最大壩高為72.4 m,壩頂長度為206 m。壩體共分為9 個壩段,其中1~4 和7~9 為非溢流壩段,5~6 為溢流壩段。該工程混凝土壩的變形監測項目主要為水平位移和垂直位移等。壩頂的水平位移監測采用引張線方法,引張線的固定端位于壩體右側01+107.25,導向端位于壩體左側0+93.50 處,總長度為200.75 m,引張線自動化監測系統觀測頻率為每天1 次,觀測點布置如圖2 所示。

圖2 引張線觀測點布置(單位:m)Fig. 2 Layout of the tension wire measuring points (unit: m)
本文選取壩頂引張線EX4 測點水平位移實測數據為因變量樣本,對2016 年8 月5 日至2017 年10 月10 日的共431 組監測數據進行分析,EX4 測點水平位移序列過程線如圖3 所示,其中2016 年8 月5 日至2017 年9 月20 日共421 組數據作為訓練樣本,2017 年9 月21 日至2017 年10 月10 日共20 組數據作為測試樣本。由圖3 可知,EX4 測點的水平位移具有明顯的非線性、非平穩特征,該測點數據完整可靠,以此為基礎進行基于CEEMDAN-PE-LSTM 的混凝土壩變形預測研究。

圖3 EX4 測點水平位移實測序列過程線Fig. 3 Process line of measured sequence of horizontal displacement of EX4 measuring point
研究表明,大壩的位移變形受多種因素影響,主要由3 個影響分量組成,分別是水壓分量δH(t)、溫度分量δT(t)和時效分量δθ(t)。大壩的位移可表示為:
模糊綜合評價是多重目標決策的一種情形,主要用于模糊環境,通過對事物影響因素進行模糊關系方程勻速,針對一定的目的對事物做出綜合評價. 模糊綜合評判的過程包括綜合考慮各種屬性,建立被評判對象的因素集;建立評判集;進行單因素評判;為不同因素賦權值,根據權值和單因素評判結果得出綜合評判結果[9].

首先對變形時間序列進行CEEMDAN 分解,分解結果如圖4 所示。原始變形時間序列被分解為7 個不同尺度的IMF 分量,頻率由高到低,對應的IMF 圖像越來越平滑。
變形時間序列CEEMDAN 分解的百分比誤差如圖5 所示。可以看出變形時間序列分解誤差非常小,量級約為10?6,說明序列完全分解,驗證了方法的有效性。
為了減小預測模型的計算規模,對分解的各IMF 分量進行PE 值計算與分析,進而使數據重構。在PE 計算中,延遲時間τ 對于排列熵的影響較小,故取τ 為1。根據試驗,選取嵌入維數m 為3。當m=3、τ=1 時,各IMF 分量的PE 值計算結果如圖6 所示,各分量的PE 值分別為2.581、2.439、1.723、1.367、1.329、1.234、0.608。

圖4 基于CEEMDAN 的變形序列分解結果Fig. 4 Decomposition result of deformation sequence based on CEEMDAN

圖5 CEEMDAN 分解的相對誤差Fig. 5 Relative error of CEEMDAN decomposition

圖6 各IMF 分量的排列熵值Fig. 6 Permutation entropy values of each IMF component
由圖6 可以看出各IMF 分量的PE 值隨著IMF頻率的降低逐漸減小,與圖4 所示規律相同,說明由高頻分量到低頻分量的隨機性程度逐漸降低。通過比較熵值間的相似性與接近程度對各IMF 分量進行重組,對PE 值相差0.2 以內的分量進行合并。其中,IMF1與IMF2分量的隨機性最強且PE 值相差為0.142,因此將IMF1與IMF2合并;IMF3分量的PE 值與其他分量相差較大,因此IMF3獨立分組;IMF4、IMF5與IMF6分量相鄰且PE 值較為接近,因此將三者合并;IMF7分量的PE 值與其他項相差較大,故將其單獨列為一組。綜上所述,各IMF 分量合并方案見表1,重組序列如圖7 所示。

表1 各IMF 分量合并方案Tab. 1 IMF components merger scheme

圖7 經過CEEMDAN-PE 處理的變形重組序列Fig. 7 Deformed recombination sequence processed by CEEMDAN-PE
3.4.1 模型參數選擇 在完成數據重構后,對4 組新的數據序列分別建立LSTM 預測模型,建立模型需要確定5 個超參數:輸入變量數、時間步、隱含層的層數、隱含層神經元數以及輸出變量數。在LSTM 神經網絡中,隱含層和神經元的數量對模型訓練和預測精度影響較大。若數量較少,會因訓練過少使預測效果變差;若數量過多,則會導致模型出現過擬合現象。經過多次試驗,本文設置2 層隱含層,第1 層神經元個數為64,第2 層神經元個數為32;時間步長為8;輸入變量數為9;輸出變量數為1。另外,設置模型的迭代次數為300,batch-size 為16,使用Adam 函數優化LSTM 神經網絡的內部參數。
為驗證本文提出的預測模型性能,分別采用偏最小二乘回歸(partial least squares regression,PLSR)模型、支持向量回歸(support vactor regression,SVR)模型、LSTM 模型對變形數據序列進行試驗驗證。其中對于SVR 模型,懲罰參數用于調整模型復雜性和經驗風險,核函數參數影響樣本在高維線性空間的分布,從而影響SVR 的性能。使用粒子群參數優化算法對SVR 模型進行參數優化,得到最優懲罰參數為64.6、核函數參數為0.02。LSTM 模型參數與本文提出的模型參數相同。
3.4.2 預測模型的評價指標 為了比較不同模型的預測效果,采用平均絕對誤差(mean absolute error,MAE)、均方根誤差(root mean square error,RMSE)和平均絕對百分比誤差(mean absolute percentage error,MAPE)作為評價指標來分析模型的預測精度。
各模型的預測結果與實際變形數據序列如圖8所示,預測性能評價指標見表2。
通過對比圖中各預測值與實測值曲線,可見PLSR與SVR 模型的預測結果都不理想,尤其是PLSR 模型在前幾個測試點的預測誤差較大;相比于PLSR與SVR 模型,單一的LSTM 模型對測試集的后半段預測值與實際值接近,但對前半段數據的預測效果不夠好;基于CEEMDAN-PE-LSTM 模型的預測結果較好,雖然在部分拐點的預測值與實際值有所差別,但預測誤差較小,總體結果與變形序列實際值基本一致,能反映EX4 測點水平位移的變化,較其他3 種模型的預測效果更好。
由表2 可知,采用LSTM 神經網絡進行預測時,3 項評價指標均明顯降低,反映了LSTM 模型能更好地對非線性、非平穩波動時間序列進行預測;與PLSR、SVR、LSTM 模型相比,CEEMDAN-PE-LSTM 模型的平均絕對誤差、平均絕對百分比誤差、均方根誤差分別為0.037 mm、2.220%、0.046 mm,均遠低于其他模型。就平均絕對百分比誤差而言,本文提出的CEEMDAN-PE-LSTM 模型與其他3 種模型相比,分別降低了91.82%、75.55%和87.33%,說明其預測精度最高,誤差最小;與單一的LSTM 模型相比,平均絕對誤差、平均絕對百分比誤差、均方根誤差分別降低了76.43%、75.55%和74.73%,說明經過CEEMDAN-PE 處理的模型預測精度明顯提高,能有效挖掘非線性數據中的隱藏信息,針對不同信息實現更準確地預測,進一步驗證了該預測模型的性能較好。

圖8 各模型預測結果Fig. 8 Prediction results of each model

表2 各預測模型性能指標對比Tab. 2 Comparisons of prediction performance indexes for each prediction model
混凝土壩變形時間序列具有典型的非線性、非平穩波動性特征,且數據包含一定的噪聲,容易導致模型預測精度不高。鑒于變形時間序列預測的復雜性,提出了CEEMDAN-PE-LSTM 模型,并通過對某混凝土壩的實測水平位移數據進行試驗研究得到如下結論:
(1)通過CEEMDAN 算法對變形時間序列進行多尺度分解,得到頻率不同的多個IMF,有利于掌握變形時間序列的變化規律。基于PE 算法對各IMF 分量進行重組,獲得復雜度差異明顯的一組新的序列,達到挖掘隱藏信息目的的同時減小了組合預測方法的計算規模。與單一的LSTM 模型相比,經過CEEMDANPE 數據分解與重組的模型,能更準確地描述混凝土壩水平位移的變化趨勢。
(2)與常規模型相比,本文提出的CEEMDAN-PE-LSTM 模型有更好的預測效果,各項評價指標均優于其他模型,能夠充分發揮LSTM 神經網絡在非線性時間序列預測方面的優勢,為混凝土壩變形預測提供了一種新方法。