高彩云,高 寧
(1.河南城建學院 測繪與城市空間信息學院,河南 平頂山 467036;2.東華理工大學 江西省數字國土重點實驗室,江西 南昌 330013)
中國是世界上滑坡災害最為嚴重的國家之一,據中國地質環境信息網發布的中國地質災害通報顯示:2006至2015年10年間全國共發生地質災害260 353起,其中滑坡發生的比例居于地質災害首位,占地質災害總數的73.79%,這10年期間由滑坡造成的傷亡、失蹤人數共計11 281人,直接經濟損失435.05億元,不僅如此,滑坡所帶來的次生災害也是難以估計的。因此,采取必要的手段對其監測,進而科學、有效地對滑坡災害進行預測預報,具有重大的經濟價值及社會意義[1-2]。
滑坡從孕育到成災受到地形地貌、地質結構、降水、工程爆破以及其他人類活動等多種因素影響[3],可以看作一個具有開放、復雜和耗散等特點的非線性動力學系統,其位移變形特點既具有確定性,也具有隨機性,為此,眾多學者以智能算法為主要研究手段開展了滑坡的位移預測研究,如經典智能算法中的BP(Back Propagation)、RBF(Radial Basis Function)神經網絡以及SVM(Support Vector Machine)等得到了廣泛應用,然而,從實際應用情況來看,上述算法存有如下缺點[4-10]
1)BP算法基于梯度下降訓練網絡,在訓練過程中易陷入局部極小,網絡收斂速度慢,且最優網絡拓撲結構難以確定;
2)RBF算法在網絡訓練過程中需以“聚類算法迭代”為基礎選取基函數中心,當建模樣本數量較大時,訓練耗時較大,也易陷入局部極小;
3)SVM雖然具有小樣本、全局優化能力等優點,但待優化關鍵參數眾多,如懲罰函數、核函數等。
ELM作為一種新型的前饋神經網絡學習算法,其網絡訓練時只需設置隱含層節點數,計算過程中,網絡權值及隱含層的偏置一旦被隨機確定,則網絡訓練過程中不需要調整,并能產生唯一的最優解,具有網絡參數少、且易于選擇、學習速度快、網絡泛化性能強等優點,逐漸引起眾多學者的重視,如周超,殷坤龍等利用小波分析對滑坡位移序列進行分解,進而利用ELM算法對其分解量進行預測,并將其應用于三峽庫區八字門滑坡位移預測[11];李驊錦,許強等基于ELM算法對長江三峽庫區白水河滑坡的趨勢項和周期項進行了建模預測[12];仲維清等采用粒子群算法對ELM的輸入權值及隱含層閾值進行了優化選取[13],上述文獻對極限學習機進行了研究并取得了一些成果[14-17],但對最佳隱含層神經元個數和激勵函數等參數優化的深入研究較少,為此,文中提出了一種基于改進的ELM算法,并將其應用于不同類型的滑坡位移預測中,并對其適用性進行討論。
滑坡體從開始孕育變形到最終形成破壞,都歷經較長的時空變化。隨著內、外界影響因素(地形地貌、地質結構、降雨等)的變化,其可以演變為一完整的連續破壞過程,也可能在某時間段趨于穩定,直至停止,也可以是周期性時滑時移,對其進行位移模式及狀態辨識是根據有限的初期變形監測值來對將來可能的位移趨勢和最終位移值進行預測,以便根據其演化趨勢采取適當措施,將滑坡位移控制在一定水平,從而確保滑坡體穩定。
典型滑坡變形時序分可以分為4類[2,4],如圖1所示。

圖1 滑坡變形位移曲線分類Fig.1 Classification of landslide deformation displacement curve
圖1中,第(1)類、第(2)類為典型的簡單滑坡位移曲線,也是(3)、(4)2類復雜曲線的基本組成部分。對于第(1)類滑坡體,前期趨勢性特點明顯,變形過程中,位移增量逐漸減小,位移加速度由負向零轉變,后期位移速度趨于恒定,可視為滑坡勻速變形,變化起伏小,規律性強,易于外推預測;對于第(2)類滑坡體,變形過程中,位移速率從恒定到逐漸增大,位移加速度由零向正轉變,且有逐漸增大趨勢,若趨勢變化急劇,外推預測較為困難;第(3)、(4)2類滑坡體融合了前2類的變形特點,非線性特征明顯,演化規律復雜,相對于第(1)類、第(2)類而言,更難以準確預測。
ELM是一種新型的單隱含層前饋神經網絡學習算法,網絡由輸入層、隱含層和輸出層組成。設m,L,n分別為輸入層、隱含層和輸出層的節點數,假定存在N個不同的樣本 (xi,ti),其中xi=[xi1,xi2,…,xim]T∈Rn,ti=[ti1,ti2,…,tim]T∈Rm;xi為網絡輸入;ti為網絡的期望輸出,則ELM訓練模型可表示為[18-23]
式中yi表示ELM期望輸出;βi為隱含層第i個神經元與輸出層神經元間的連接權值;wi表示輸入層神經元與隱含層第i個神經元的連接權;bi為隱含層神經元的閾值;g(x)為激勵函數。假定訓練樣本數量N與隱含層神經元節點數量L相等,則對于任意給定的wj,bi,ELM都可以零誤差逼近訓練樣本,即

顧及(1)式,則上式可改寫為
將其以矩陣的形式表達
H·β=T
(4)
式中H為隱含層輸出矩陣;T為網絡輸出矩陣。ELM的網絡訓練目標可以歸結為如下式的優化問題
Minimize:‖H·β-y‖and‖β‖
(5)

式中H+為隱含層輸出矩陣H的Moore-Penrose廣義逆。
由ELM學習機理可知,相對于經典智能算法而言,具有如下特點[2,12-13]
1)ELM無需迭代計算,當隨機產生輸入層與隱含層間的連接權值wi和隱含層神經元的閾值bi后,網絡在學習過程中無需調整,只需要設置的網絡參數為L(隱含層神經元個數);
2)ELM所求解的參數僅為βi(網絡輸出權重),且βi的求解基于最小二乘法,其解具有唯一性和全局最優性,在理論上可以提高網絡的泛化能力;
3)ELM在理論上可以獲取最小的訓練誤差。
由3.1節可知,利用ELM構建滑坡位移預測模型時,所需考慮的網絡參數僅僅為隱含層神經元個數L,因為L的個數將直接影響參數wi,bi,βi,H的確定,目前,對于L取值的確定問題,并無確定性的方法,多數采用“試算法”,具有一定的盲目性;顧及(1)式,當ELM的所有參數確定后,激勵函數g(x)的構造形式將對滑坡位移預測效果帶來一定的影響,而g(x)通常可選取Sigmiod,Sine,Hardlim 3種類型,如下所示。
Sigmiod型
g(x)=1/(1+e-x)
(7)
Sine型
g(x)=sinx
(8)
Hardlim型

為了確定ELM隱含層神經元個數L,同時對g(x)進行優選,作者提出了一種二維區間搜索算法[2]:利用MATLAB自帶均方誤差性能函數在二維區間(L,g(x))內對參數最優解進行搜索,達到參數優化的目的。
基于ELM的滑坡位移預測步驟如下
1)ELM輸入、輸出的確定。輸入量為已知滑坡位移值,輸出為位移預測值(注:為了體現位移數據時效性對預測的影響,文中建模時,采用了數據滾動建模法[2]);
2)根據滑坡位移監測數據樣本量,劃分訓練樣本(用于ELM網絡訓練)和檢驗樣本(評估ELM的泛化能力);
3)將訓練樣本和檢驗樣本變換到[0.1,0.9]之間,以提高ELM的訓練速度;
、4)ELM滑坡預測模型的構建,采用二維區間搜索算法確定L和g(x);
5)利用訓練樣本對ELM進行訓練,進而利用檢驗樣本進行滑坡位移值預測;
6)將ELM網絡輸出值進行逆變換,恢復到原始量綱,并進行預測效果評估。
為了驗證ELM應用于不同類型滑坡位移預測的有效性,文中選取4組滑坡位移數據
1)鏈子崖滑坡GA監測點11期位移數據[5],前9期作為訓練樣本,后2期為檢驗樣本;
2)臥龍寺滑坡5#監測點52期位移數據[3],前48期作為訓練樣本,后4期為檢驗樣本;
3)古樹屋滑坡3#監測點33期位移數據[6],前28期作為訓練樣本,后5期為檢驗樣本;
4)新灘滑坡B3監測點89期位移數據[25],前80期作為訓練樣本,后9期為檢驗樣本;
4組滑坡位移時序經辨識后分別屬于圖1中的(1)、(2)、(3)、(4)類特征時序曲線。
以鏈子崖GA監測點位移數據為例進行ELM隱含層神經元個數L和激勵函數g(x)的優選實驗:采用2期數據滾動建模,在3種激勵函數及不同隱含層神經元下,以訓練樣本均方根誤差最小為目標函數,采用二值區間搜索算法,獲取兩參數的最優值,訓練過程中測試誤差相對于隱含層節點個數的變化曲線如圖2所示。

圖2 3種激勵函數下隱含層神經元節點數對預測性能影響Fig.2 Effect of the number of hidden node on the ELM performance under different activation function
從圖2可知,不同激勵函數和隱含層神經元個數對于ELM預測影響較大,在鏈子崖GA點建模過程中,在相同神經元下,Sigmoid函數效果優于Sine和Hardlim函數,在同樣的激勵函數下,隨著隱含層神經元個數由0~1 000的不斷增加,預測精度逐步提高,直至趨于平穩。最終獲取最優神經元數量為6,激勵函數為Sigmoid.
5.3.1 鏈子崖滑坡體GA點驗證實驗
改進ELM網絡拓撲結構為:輸入節點為2(輸入節點數量即為滾動建模數據維數),輸出節點為1(后一期預測值),隱含層神經元數量6,激勵函數Sigmoid(選取過程如5.2節)。
未改進ELM網絡拓撲結構為:輸入節點為2,輸出節點為1,隱含層神經元數量4,激勵函數Sigmoid.
2種算法對檢驗樣本預測結果見表1.
5.3.2 臥龍寺滑坡5#點驗證實驗
改進ELM網絡拓撲結構為:輸入節點為20,輸出節點為1,隱含層神經元數量68,激勵函數 Sigmoid(選取過程同5.2節)。
未改進ELM網絡拓撲結構為:輸入節點為2,輸出節點為1,隱含層神經元數量25,激勵函數Sigmoid.
2種算法對檢驗樣本預測結果見表2.
5.3.3 古樹屋滑坡3#點驗證實驗
改進ELM網絡拓撲結構為:輸入節點為3,輸出節點為1,隱含層神經元數量7,激勵函數 Sigmoid(選取過程同5.2節)。
未改進ELM網絡拓撲結構為:輸入節點為3,輸出節點為1,隱含層神經元數量4,激勵函數Sigmoid.
2種算法對檢驗樣本預測結果見表3.

表1 不同算法對鏈子崖GA點位移預測結果(單位:mm)Table 1 Results of different algorithms for point GAof Lianziya landside

表2 不同算法對臥龍寺5#點位移預測結果(單位:mm)Table 2 Results of different algorithms for point 5# of Wolongsi landside

表3 不同算法對古樹屋3#點位移預測結果(單位:mm)Table 3 Results of different algorithms for point 3# of Gushuwu landside
5.3.4 新灘滑坡B3點驗證實驗
改進ELM網絡拓撲結構為:輸入節點為20,輸出節點為1,隱含層神經元數量7,激勵函數 Sigmoid(選取過程同5.2節)。
未改進ELM網絡拓撲結構為:輸入節點為20,輸出節點為1,隱含層神經元數量25,激勵函數Sigmoid.
2種算法對檢驗樣本預測結果見表4.

表4 不同算法對新灘B3點位移預測結果(單位:mm)Table 4 Results of different algorithms for point B3 of Xintan landside
由表1至表4,同時結合作者建模過程(由于篇幅限制,文中未給出各滑坡體建模樣本的擬合結果),從如下角度討論ELM的預測效果。
5.4.1 整體逼近效果方面
1)鏈子崖滑坡GA監測點變形位移曲線在形式上屬于減速-勻速型(圖1(1)),前期趨勢性特點明顯,后期位移變化起伏小,規律性強,易于進行外推預測,故無論是利用改進的ELM神經網絡,還是未改進的ELM,進行外推預測時,均效果良好(見表1);
2)臥龍寺滑坡5#監測點變形位移曲線在形式上屬于勻速-增速型(圖1(2)),雖然前期趨勢性特點明顯,但后期位移變化出現了突變,故外推預測時,利用未改進的ELM預測時,整體殘差偏大;而采用改進的ELM預測時,整體殘差較小;
3)古樹屋滑坡3#監測點和新灘滑坡B3監測點的變形位移曲線分別屬于減速-勻速-增速型、復合型(圖1(3)和(4)),經歷了減速、勻速、增速等多種形式的變化,數據波動起伏較大,且存在多個拐點或突變點,故利用未改進的ELM進行預測時,出現了部分曲線段吻合效果好、部分曲線段離散程度大的狀況;而采用改進的ELM預測時,較未改進的ELM更為接近原始監測值。
5.4.2 預測效果方面
由表1至表4的統計結果,可知
1)改進的ELM神經網絡用于4種類型的滑坡變形位移預測時,其預測精度明顯優于未改進的ELM;
2)對于滑坡變形拐點或突變點預測而言,改進的ELM有一定程度的改善;
3)改進的ELM的外推預測能力較好。
1)基于改進的ELM滑坡位移預測模型,通過二值區間搜索算法確定最佳隱含層神經元個數L和激勵函數g(x),可獲得較高的預測精度,預測最小相對誤差為0.017%,最大為3.712%;
2)由4類滑坡實例驗證,改進的ELM能獲取更高的預測精度。