李建新,肖 鋼,唐 鈴
(1.東莞市地理信息與規劃編制研究中心,廣東 東莞 523000;2.贛州市國土空間調查規劃研究中心,江西 贛州 341000)
邊坡是自然或人工開挖形成的,也是工程建設中最常見的工程形式,而邊坡失穩造成的滑坡時有發生,造成嚴重的經濟損失與人員傷亡[1]。實際上,滑坡災害的發生并不是一蹴而就,而是邊坡變形達到一定程度的結果。如果及時建立了基于邊坡變形監測數據的高精度預測模型,準確識別邊坡變形趨勢,一定程度上可以避免災害的發生。因此,建立高精度的邊坡變形預測模型是必要的,具有重要的社會價值和經濟價值。
邊坡變形過程復雜,不僅受到地質條件的控制,還受到其他因素的影響,包括地下水、降雨量和人工活動等,難以通過傳統方法建立高精度的邊坡變形預測模型[2]。隨著近些年來機器學習的不斷發展,BP神經網絡、支持向量機(SVM)和極限學習機等方法廣泛應用于邊坡變形預測[3-8]。SVM是Vapnik基于統計學習理論提出的一種機器學習方法[9],對于非線性、小樣本等問題具有較好的預測精度。研究表明SVM模型應用于邊坡或滑坡其他領域同樣具有較高的精度,具有很好的適應性[10-11]。
邊坡變形監測過程中受到多種因素的干擾,導致監測數據中存在噪聲,進而影響預測精度。近些年來基于集成經驗模態分解(EEMD)的去噪方法逐漸應用在各個領域,結果表明EEMD能夠作為一種有效的去噪方法[12-13]。EEMD 方法的最大優點在于其能夠以自適應方式提取信號的各個分量和變化趨勢。同時,相較于經驗模態分解方法,EEMD 方法顯著減少了模態混疊現象,并且也克服了小波變換容易造成許多虛假諧波。簡而言之,EEMD 方法是一種高效的信號處理方法,能夠更加準確地提取出信號中的各種信息。因此通過EEMD方法去除邊坡變形數據中的噪聲,使得SVM模型能夠更精確的識別邊坡的變形趨勢,提高邊坡變形的預測精度。
本文提出一種由EEMD去噪和SVM組合而成的預測模型,以提高邊坡變形預測的精度。模型首先通過集成經驗模態分解(EEMD)算法將邊坡變形時間序列進行分解,基于相關系數的計算去除噪聲后重構邊坡變形時間序列,然后將重構后的邊坡變形時間序列作為SVM模型的輸入,從而建立EEMD-SVM模型,既而預測邊坡變形值。
經驗模態分解(EMD)是一種能夠將非平穩和非線性時間序列自適應的分解為IMFs分量的方法,而不需像小波分解、傅里葉變換等方法那樣需要提供先驗知識。但是傳統EMD方法存在模態混疊的問題,為了克服這個問題,Wu等[14]在EMD的基礎上加入噪聲輔助,稱為集成經驗模態分解(EEMD)。EEMD先將白噪聲添加到原始數據信號中,為時頻空間提供一個統一的參考框架,再對添加了白噪聲的數據進行EMD分解,重復足夠數量的實驗,最后將多次分解得到的同頻率的IMF分量求平均作為最終的IMF分量。由于添加的白噪聲零均值的特性,經過整體平均計算后能夠消除白噪聲對最終IMFs分量的影響。
EEMD算法具體計算步驟如下。
1)假設原始時間序列數據為x(t),將白噪聲nj(t)添加到原始時間序列當中:
xj(t)=x(t)+nj(t)j=1,2,…,M
(1)
式中:
xj(t)——第j次實驗已經添加白噪聲的數據;
M——最大實驗次數。
2)在第j次實驗中,通過EMD將添加了白噪聲的數據xj(t)分解為若干個IMF:
(2)
式中:
ci,j(t)——第j次實驗分解出的第i個IMF分量;
rj(t)——第j次實驗分解得到的殘差分量;
N——每次實驗分解得到的IMF數量。
3)重復步驟(1)和(2),直至達到最大實驗次數,最終分解結果通過式(3)和(4)作整體平均所得:
(3)
(4)

SVM通過引入核函數將輸入數據映射到高維特征空間,從而將非線性問題轉化為線性問題,并且通過核函數避免了高維特征空間中的點積運算。SVM的目標函數為:
y=w·φ(x)+b
(5)
式中:
x——SVM的輸入,可以是多維數據;
y——SVM的輸出;
w——權重向量;
b——偏置常數;
φ(x)——非線性映射函數。

(6)
式中:
ε——訓練時回歸函數允許誤差;
C——懲罰系數,C值越大對訓練誤差大于ε的樣本的懲罰越大。
二次優化問題通常建立拉格朗日方程,對方程求參數偏導,且根據KKT條件偏導數為0,代回原方程可得對偶優化問題,通過SMO算法或者其他二次規劃算法可得支持向量回歸機預測模型:
(7)
式中:

n——樣本個數;
K(xi,x)——核函數,常用核函數為徑向基核函數。
采用核函數進行預測時,核參數和懲罰參數對算法的表現起著非常重要的作用,核參數的值太小(0.1~1)或懲罰參數的C值太大會對訓練集造成過學習現象,核參數的值太大(100~100 000)或c值太小(0.1~10)則會對訓練集造成欠學習現象。本文通過粒子群尋優算法對核參數和懲罰參數進行尋優。
本文引用3個統計量來評估模型的預測精度,分別為平均絕對誤差(MAE)、平均絕對百分比誤差(MAPE)和均方根誤差(RMSE),定義如下:
(8)
(9)
(10)
式中:

n——測試集樣本數目。
本文首先通過EEMD算法去除邊坡監測數據中的噪聲,將去噪之后的變形數據作為SVM模型的輸入,建立EEMD-SVM模型。在EEMD去噪過程中,EEMD分解會產生若干分量和殘差序列,計算各個分量與原始數據的相關系數,將相關系數較小的分量當作噪聲直接去除,重構剩余分量生成無噪聲的邊坡變形數據。對于EEMD-SVM模型,核函數采用徑向基核函數,為了提高模型的訓練速度,將去噪后的邊坡變形數據歸一化到[0,1]區間:
(11)
式中:
xi——去噪后的邊坡變形值;
xmax——去噪后的邊坡變形最大值;
xmin——去噪后的邊坡變形最小值;

圖1給出了構建邊坡變形預測模型的流程,詳細步驟如下:

圖1 EEMD-SVM模型流程示意
1)將邊坡變形時間序列劃分為訓練樣本集和測試樣本集,對訓練樣本集進行EEMD分解,得到若干分量和殘差序列。根據Wu等[12]的推薦,加入噪聲的標準差應為原始數據標準的0.2倍,最大實驗次數為100。
2)分別計算各分量和殘差序列與邊坡變形時間序列的相關系數。
3)將相關系數小于0.2的分量作為噪聲直接去除,重構剩余分量得到無噪聲邊坡變形時間序列。
4)將通過去噪后重構的邊坡變形時間序列作為SVM模型的輸入,并對SVM模型進行訓練,并且預測未來邊坡變形值。
5)根據測試樣本集的邊坡變形實測值,通過式(8)~(10)評價EEMD-SVM模型的預測精度。
溪洛渡水電站是金沙江下游河段梯級開發規劃的第3個梯級,是一座以發電為主,兼有防洪、攔沙和改善下游航運等綜合利用效益的特大型水利水電樞紐工程。工程樞紐位于四川省雷波縣和云南省永善縣接壤的金沙江溪洛渡峽谷。水庫正常蓄水位為600 m,死水位為540 m,汛期限制水位為560 m,總庫容為126.7億m3,調節庫容為64.6億m3。水庫在蓄水過程及運行過程中,由于庫水位的動態變化使庫岸邊坡地質結構遭受強烈改造,從而可能導致滑坡災害,帶來嚴重后果。
為了保障水電站的正常運行,建立了溪洛渡水電站水庫安全監測系統,系統通過GNSS技術監測了水庫長達199 km的庫岸邊坡。本文以花坪子邊坡的TP02-HPZ監測點為例,收集到2018年1月1日至2018年4月30日的邊坡變形數據,總共120期數據,前110期為訓練樣本,后10期為測試樣本。
將訓練樣本通過EEMD算法進行分解,加入的噪聲標準差為原始邊坡序列的0.2倍,最大實驗次數設置為100,圖2給出了訓練樣本的EEMD分解結果。其中,第1行至第5行分別為分解后的分量IMF1~IMF5,反映了從高頻到低頻不同時間尺度的邊坡變形波動特征,并且相對于原始的時間數據序列變化較為平穩,第7行為剩余分量。表1也給出了各分量與原始數據的Pearson相關系數,由表1可知,IMF1、IMF2和 IMF3分量與原始數據相關系數均低于0.2,并且不具有顯著性,說明這3個分量的變化趨勢與原始數據存在較大差異,可以將其當作噪聲直接剔除。而IMF4、IMF5和Residual分量與原始數據都存在顯著相關性,其中IMF5和Residual分量相關系數均在0.7以上,說明原始邊坡變形趨勢主要是由這3個分量組成的。圖3給出了剩下的IMF4、IMF5和Residual分量重構得到的去噪后的邊坡變形時間序列,可以看出去噪后的邊坡變形時間序列更加平滑,能夠更加準確的描述邊坡的真實變形趨勢,為SVM模型準確識別邊坡變形趨勢奠定了基礎。

圖2 訓練樣本EEMD分解結果示意

表1 各分量與原始數據的Pearson相關系數

圖3 去噪后的邊坡變形時間序列示意
為了證明EEMD-SVM模型的有效性,引入SVM、BP神經網絡(BP)和EEMD-BP模型作為對比。其中SVM和BP模型將原始邊坡變形時間序列作為輸入,而EEMD-SVM和EEMD-BP模型均采用去噪后的邊坡變形時間序列作為輸入。圖4給出了4種模型的預測結果,為了更加直觀詳細了解每個時刻的預測誤差情況,表2給出了4種模型的預測值。由表2可以看出,EEMD-SVM模型預測結果更加接近真實值,相較于其他3種模型,預測誤差主要集中在0.2以下。

圖4 模型預測結果示意

表2 模型預測值
表3給出了4種模型的預測精度。預測精度選用平均絕對誤差(MAE)、平均絕對百分比誤差(MAPE)和均方根誤差(RMSE)這3種評價指標對預測精度進行分析。由表3可以看出,SVM和EEMD-SVM模型的預測精度分別優于BP和EEMD-BP模型,說明SVM模型相較于BP模型更適合邊坡變形預測。而EEMD-SVM和EEMD-BP模型的預測精度分別優于SVM和BP模型,表明EEMD去噪算法可以消除邊坡變形數據的噪聲,提取出更準確的邊坡變形值。其中EEMD-SVM模型的3個精度評價指標均是最小的,相較于傳統SVM模型,MAE、MAPE和RMSE由0.371、0.694和0.414分別降到了0.263、0.491和0.347,MAE降低了29.1%,模型預測精度有著明顯提升。

表3 模型預測精度
1)邊坡的變形預測對于及時掌握邊坡的變形趨勢是至關重要的,本文通過將支持向量機與集成經驗模態分解方法結合,建立了可用于邊坡變形預測的EEMD-SVM模型。工程實例表明,EEMD-SVM模型具有較高的預測精度,可以為類似工程提供一種邊坡變形預測的參考方法。
2)在邊坡變形數據采集過程中,誤差是不可避免的,EEMD算法能夠將邊坡變形時間序列進行分解,消除無關分量,得到的去噪邊坡變形時間序列更加平穩,變化趨勢更加清晰,能夠有效應用于邊坡變形預測。
3)傳統的神經網絡模型在小樣本預測時能力有限,而支持向量機模型預測精度更高,模型運行也更簡單。