李柏佚, 王桂林, 2, 袁 軍
(1. 重慶大學 土木工程學院, 重慶 400045;2. 庫區環境地質災害防治國家地方聯合工程研究中心,重慶 400045;3.重慶市地質礦產勘查開發集團有限公司,重慶 401121)
深基坑施工階段伴隨著變形,及時掌握其變形情況對保障深基坑的安全有著重要的意義。為此,學者們提出了很多方法對深基坑變形進行預測。目前,常用的預測方法有回歸分析、灰色理論、時間序列和人工神經網絡等。但是由于基坑變形序列具有較強的非平穩性及復雜的非線性特征,難以建立有效的影響因子與變形量之間的復雜關系模型。針對上述問題,有學者就采用經驗模態分解(empirical mode decomposition, EMD)先將非平穩的信號轉化為平穩信號,再建立預測模型來提高預測精度。羅飛雪等[1]證明 EMD 能夠將邊坡變形位移序列分解成具有不同尺度特征的平穩信號。吳杰等[2]將EMD算法用于大橋動態監測去噪,面對隧道爆破振動信號,邵東輝[3]采用互補集合經驗模態分解法去噪,結果都證明了EMD模型具有較好的非線性映射能力、學習能力和自適應能力,能有效地提高變形預測精度,其預測精度明顯優于BP神經網絡(back propagation neural network)模型,較粒子群優化算法PSO(particle swarm optimization)-BP神經網絡模型也有所提高。
然而,大多數的變形分析過程考慮的是變形點時間特性及觀測數據序列本身的關聯性,分析過程相互獨立,對關聯監測點之間的相互作用研究較少。但是,變形觀測所獲取的數據是由多個觀測點在多個周期內的數據集,且監測點間彼此關聯、相互影響。謝世成等[4]利用滑坡工程整體監測點變形數據建立了空間多點預測模型。對于規模較大的基坑,由于開挖施工步驟的不同,并且存在監測點空間距離間隔遠,基坑各側邊坡的監測數據關聯性并不大,利用整體監測點數據建立模型,可能因非關聯數據導致降低預測精度。周昀琦等[5]在基坑監測中建立了臨近點的變形相關性預測模型,充分挖掘變形數據中隱含的內部規律。本文以重慶某深基坑為例,對單點、多點關聯、多點不關聯情況下的變形預測進行對比研究,并提出基于關聯監測點數據的非線性變形預測模型。
EMD算法根據信號的局部時變特征進行自適應的時頻分解,它能將信號中不同特征尺度的數據逐步分解,并得到若干個固態函數(intrinsic mode function, IMF)分量。其中每個IMF必須同時滿足兩個條件[6-7]:①在整個數據段內,極值點的個數和過零點的個數必須相等或相差最多不超過一個;②在任意時刻,由局部極大值點形成的上包絡線和由局部極小值點形成的下包絡線的平均值為零,即上、下包絡線相對于時間軸局部對稱。采用EMD方法通過下面的步驟對任何信號x(t)進行分解:
步驟1確定信號所有的局部極值點,然后用三次樣條線將所有的局部極大值點連接形成上包絡線。
步驟2再用三次樣條線將所有的局部極小值點連接形成下包絡線,上下包絡線應包絡所有的數據點。
步驟3上、下包絡線的平均值記為m1求出
x(t)-m1=h1
(1)
如果h1為一個IMF,那么h1為x(t)的第1個IMF分量。
步驟4如果h1不滿足IMF的條件,將h1作為原始數據,重復步驟1~步驟3得到上、下包絡線的平均值m11,再判斷h11=h1-m11是否滿足IMF的條件,如不滿足,則重循環k次,得到h1(k)=h1(k-1)-m1k,使h1(k)滿足IMF的條件。記c1=h1(k)則c1為信號x(t)第1個滿足IMF 條件的分量。
步驟5將c1從x(t)中分離,得到
r1=x(t)-c1
(2)
將r1作為原始數據且重復步驟1~步驟4,得到x(t)第2個滿足IMF條件的分量c2,重復循環n次,得到信號x(t)第n個滿足IMF條件的分量。當rn成為一個單調函數不能再從中提取滿足IMF條件的分量時,循環結束。于是得到
(3)
PSO為一種智能優化算法[8],能夠優化BP神經網絡內部結構,提高收斂速度,有效防止陷入局部極值,較快搜索全局最優解。粒子通過動態搜索跟蹤個體極值和全局極值,從而實時更新粒子速度和位置,公式為
(4)
(5)
式中,w為慣性因子[9]
(6)
PSO優化3層BPNN的權值和閾值。神經網絡的輸入層、隱含層、輸出層神經元數分別設為I,H,O。記wHI為輸入層與隱含層的連接權值,wHO為隱含層與輸出層的連接權值,隱含層閾值θH,輸出層閾值θO。粒子群中粒子的位置為BPNN中當前迭代的權值和閾值,尋找最優位置即為優化網絡過程,其基本步驟如下[10-12]:
步驟1確定模型的維數D,粒子群種群規模、慣性權重和學習因子的初值,模型目標精度ε。
D=I×H+H+H×O+O
(7)
步驟2初始化粒子的位置和速度(獲取隨機解),計算每個粒子的適應度值,得到個體最優Pi和全局最優Pg。
步驟3用粒子群算法式(4)、式(5)、式(6)更新粒子的速度和位置,再計算新粒子的適應度值并繼續更新Pi,Pg。
步驟4以目標精度和最大迭代次數作為終止條件判斷是否終止迭代。滿足條件之一則完成計算,否則返回步驟3重復計算。
基坑邊坡存在豎向位移變化的多個監測點{bi|i=1,2,…,n},將多個監測點在不同時間點的變形值作為一時間序列{xi(t)|i=1,2,…,n;t=1,2,…,m},其中:i為監測點的序號;t為監測數據所采集的時刻,對序列xi(t)進行EMD分解得到n×q個固有模態分量IMF和n個殘余分量R,其中q為單個監測點的監測數據序列進行EMD分解所得到的IMF分量個數,即
(8)
基于EMD-PSO-BPNN的關聯監測點數據非線性變形預測流程,如圖1所示。將q個IMF分量集合和一個殘量集合分別代入PSO-BP模型中,得到各個分量集合的預測值YIMF1,YIMF2,…,YIMFq和YR,最后求各個分量預測值之和得到基坑邊坡豎向位移變化的預測結果Y,即
Y=YIMF1+YIMF2+…+YIMFq+YR
(9)

圖1 關聯監測點數據非線性變形預測流程
為綜合評定模型的精度,采用均方根誤差(root mean square error, RMSE)和平均絕對誤差(mean absolute error, MAE)作為模型評價指標。平均絕對誤差Em可表示為
(10)
均方根誤差Erm可表示為
(11)

2.1.1 工程背景
重慶某深基坑所在區域位于重慶向斜西翼,場地地層主要是素填土、粉質黏土、砂質泥巖和砂巖,其中巖層傾向100°~120°,巖層傾角5°~10°,基坑最深43 m。
2.1.2 數據分析
取深基坑E面3個沉降監測點(BM09,BM10,BM11)和A面2個沉降監測點(BM16,BM17)的200期數據作為研究對象,如圖2所示。由圖2可知,從單個監測點看,由于周邊條件復雜、擾動因素多、歷時較長,監測數據都呈現變形幅度較大,呈現明顯的非線性和非平穩性。但從數據整體判查,BM09,BM10,BM11的數據變化存在關聯性,BM16,BM17的數據變化存在關聯性。這是因為前3個測點同屬E面,后2個測點同屬A面監測點,顯然前3個測點與后2個測點之間的數據關聯性就不明顯。

圖2 A面、E面監測點原始數據變化圖
從E面的3個監測點整體來看:1~80期3個監測點的數據呈現出從平穩逐步過度到輕微回彈;81~90期內呈現出一個跳躍的變化;91~160期,除了105~115期內呈現出一個跳躍的變化,監測點整體呈現出從平穩逐步過度到輕微沉降;161~200期,除了165~180期內有幾個跳躍變化,整體呈現出回彈趨勢。從A面的2個監測點整體來看:1~110期,數據處于平穩的狀態,且局部無明顯波動;111~150期,數據有明顯下降,且伴隨著明顯的波動;151~200期,數據的波動較明顯。顯然,如果對該基坑邊坡的沉降時間序列直接建立模型進行處理,很難得到令人滿意的結果。因此,先對非平穩時間序列進行平穩化處理。本文采EMD分別對這5個監測點數據進行預處理,分解結果如圖3~圖7所示。由圖3~圖7可知,EMD可以降低邊坡變形序列的非平穩性,各分量變化曲線比原曲線更光滑和平穩,有利于變形分析與預測。

圖3 BM09的EMD分解結果

圖4 BM10的EMD分解結果

圖5 BM11的EMD分解結果

圖6 BM16的EMD分解結果

圖7 BM17的EMD分解結果
2.1.3 測試樣本數據選擇
關于BP算法中訓練樣本與測試樣本的數據量并沒一個固定的比值。如劉吉超等[13]在使用BPNN對車速進行預測時,測試樣本占總體數據的比例為30%。郭彩杏等[14]在BP算法優化研究過程中,采用的比例為10%。本文選取10%作為測試樣本。
基坑監測點的數據具有隨機性,可以針對10%的測試樣本代入式(12)[15]。
(12)
式中,當時滯k=10時,rk取得最大值0.29,故選取后10期的監測數據作為測試樣本。
以BM10為例,分別使用PSO-BPNN模型對分解得到的各分量進行訓練和預測。為驗證本文算法的可行性和有效性,建立3種方案進行對比分析:①BPNN模型;②PSO-BPNN模型;③EMD-PSO-BPNN模型。為了減少建模誤差,所有樣本數據都歸一化到[-1,1],經模型預測后再還原到原始區間。3種模型仿真結果如圖8所示。3種方法的仿真效果較真實數據而言都沒有出現較頻繁的波動情況。通過整理得到單個監測點191~200期的3種模型的預測數據,如表1所示。由表1可知,較BPNN模型和PSO-BPNN模型,EMD-PSO-BPNN的個別預測值偏差大,但從預測總體上看,最大偏差出現在第200期,為0.709 3 mm,最小偏差出現在第197期,為0.012 3 mm;PSO-BPNN精度次之,最大偏差出現在第200期,為0.899 4 mm,最小偏差出現在第191期,為0.090 6 mm; BPNN模型精度最差,最大偏差出現在第200期,為1.230 1 mm,最小偏差出現在第191期,為0.096 2 mm。隨著期數的增加,BPNN模型預測誤差波動相對較大,PSO-BPNN次之,EMD-PSO-BPNN模型誤差波動較小,且依然能保持良好的預測精度。

圖8 基于單個監測點1~200期數據的不同模型預測結果

表1 基于單個監測點數據的不同模型的預測結果比較
相比基于單個監測點數據的預測方法而言,關聯監測點預測模型加入了BM09和BM11監測點數據。同樣,為驗證本算法的可行性和有效性,建立上述一樣的3個不同預測模型進行對比分析,關聯點的3種模型預測結果如圖9所示。整理后10期預測數據如表2所示,單個監測點與關聯監測點預測效果對比,如表3所示。單測點預測時,EMD-PSO-BPNN模型相對PSO-BPNN模型和BPNN模型來說,數據更穩定,其中EMD-PSO-BPNN模型殘差絕對值的最大值為0.709 3 mm,最小值為0.012 3 mm;PSO-BPNN模型殘差絕對值的最大值為0.899 4 mm,最小值為0.090 6 mm;BPNN模型殘差絕對值的最大值為1.230 1 mm,最小值為0.096 2 mm。而當采用關聯點作為數據源進行預測時,相對于單個監測點預測時,除BPNN模型中殘差的最小絕對值增大了0.017 6 mm外,殘差的絕對值都得到了相應的減小,EMD-PSO-BPNN模型殘差絕對值的最大值減小了0.056 2 mm,最小值減小了0.012 2 mm;PSO-BPNN模型殘差絕對值的最大值減小了0.067 2 mm,最小值減小了0.061 7 mm;BPNN模型殘差絕對值的最大值減小了0.457 1 mm。另外,采用均方根誤差和平均絕對誤差這2項指標分別對單個監測點和關聯監測點進行評定。由表3可知,就單點或關聯點而言,EMD-PSO-BPNN模型的均方根誤差和平均絕對誤差都比PSO-BPNN和BPNN模型的更小;就同種預測模型,關聯點相對單點而言均方根誤差和平均絕對誤差都更小。顯然,基于關聯監測點的EMD-PSO-BPNN網絡模型具有較高的預測精度,可信度較高。

表2 基于關聯監測點數據的不同模型的預測結果比較

圖9 基于關聯監測點1~200期數據的不同模型預測結果

表3 單點與關聯點的3種模型精度評價
表3中,呈現了單點與關聯點的3種模型精度評價。不論是單點還是關聯點EMD-PSO-BPNN模型都是最優的,所以本小節只采EMD-PSO-BPNN模型來對非關聯監測點數據進行預測并進行預測結果精度分析。
本模型中選擇了與BM10監測點不在同一個基坑側面的監測點BM16和BM17,從監測數據來看,這兩個監測點的數據明顯與BM10測點不同,關聯性遠不如BM09和BM11監測點。后10期數據統計的殘差、均方根誤差、平均絕對誤差如表4所示。圖10為基于關聯點和非關聯監測點數據的預測結果。可見,基于非關聯點的監測數據對變形預測有干擾。圖11為BM10監測點19~200期數據的不同模型預測結果。

表4 關聯點與非關聯點的EMD-PSO-BPNN模型精度評價

圖10 關聯點與非關聯點1~200期的EMD-PSO-BPNN模型預測結果

圖11 BM10監測點191~200期數據的不同模型預測結果
本文通過研究基于單個監測點數據和關聯監測點數據的EMD-PSO-BPNN模型,PSO-BPNN模型,BPNN模型的預測結果,并對比其結果,并對比了基于整體監測點中非關聯多點數據的預測結果,得到如下結論:
(1)相比于BPNN模型,EMD-PSO-BPNN模型使得原始監測數據曲線更光滑和平穩,使得變形分析與預測更加有利,并且還克服了參數初始化隨機性及容易陷入局部極值的缺點。
(2)隨著周期數的增加,BPNN網絡模型預測誤差波動最大,PSO-BPNN模型次之,EMD-PSO-BPNN模型最小。
(3)同種模型下,考慮關聯監測點的預測結果比沒有考慮的結果更為精確。