賈哲 郭慶軍 郝倩雯



摘要:為提高深基坑變形預測精度,在基坑地表沉降預測中引入反饋型Elman神經網絡模型,利用Elman神經網絡算法實現基坑沉降位移時間序列的滾動預測。以西安地鐵5號線某車站基坑工程為例,基于組合預測思想,結合神經網絡和馬爾科夫鏈兩種預測方法,建立了馬爾科夫鏈優化的神經網絡基坑地表沉降預測模型,借助馬爾科夫鏈模型對其隨機擾動誤差進行修正,并與前饋型BP神經網絡滾動預測模型對比。研究結果表明:Elman神經網絡預測模型在修正前、后的預測效果均優于BP神經網絡模型。設計開發出的基于MATLAB的圖形用戶界面(GUI)預測系統實現了模型預測過程便捷化,使預測過程能夠以圖形結果動態展現,具有較強實用價值。
關?鍵?詞:基坑變形預測; 神經網絡; 馬爾科夫鏈; 圖形用戶界面
中圖法分類號: TV551.4?文獻標志碼: ADOI:10.16232/j.cnki.1001-4179.2019.01.036
伴隨我國城市化進程的加快,地鐵、地下商業街等地下工程開始大量興建,深基坑工程隨之增多。由于城市地下作業環境的復雜性、施工工藝的特殊性以及城市建筑密集度的增大,施工風險越來越大[1]。基坑沉降是地下工程建設中必然存在的現象,為消除基坑沉降所帶來的風險隱患,有必要對施工期間地表沉降進行實時監測。為進一步確保基坑施工的安全性,可利用施工前期基坑沉降監測數據對后續沉降變形特征進行分析,預先發現險情以便及時防控。
深基坑變形的傳統計算方法有理論公式法和經驗系數法,傳統計算方法的結果是根據土力學、彈塑性力學等相關理論得到的近似解,與實際現場監測結果相比誤差較大,且計算方法對人員理論知識水平要求較高,不適用于現場施工人員實時預測。自20世紀70年代計算機技術開始廣泛應用于工程領域,在基坑工程領域逐漸興起數值模擬和人工智能等預測方法[2]。有限元、離散元等數值模擬方法雖能夠較好反映深基坑施工變形規律,但存在建模技巧性大,計算結果依賴于本構模型、地質參數等信息的選取,模擬穩定性不高等缺點。以神經網絡為代表的人工智能技術通過模擬動物大腦神經網絡行為進行信息處理,具有較強的自適應力和自學習力,對于基坑沉降變形等高度復雜的非線性問題具有良好的計算能力。
目前巖土工程中多采用BP等前饋神經網絡,并衍生出多種基于BP神經網絡的綜合模型。鄭穎人指出在進行基坑沉降預測時[3],不能一味采用前饋型神經網絡,可合理應用反饋神經網絡。因此本文將Elman反饋神經網絡引入基坑沉降預測,對比BP神經網絡與Elman神經網絡預測效果,為人工神經網絡在基坑變形預測中的應用提供新方法。Elman神經網絡已廣泛應用于能源、環境等領域,例如王一珺利用實測風速功率數據[4],建立基于Elman神經網絡的短期風功率預測模型,并利用遺傳算法對網絡參數進行優化;魏楨為預測風電場噪聲[5],構建風電場噪聲Elman神經網絡預測模型,并繪制風電場噪聲等值線地圖。
由于建筑施工周期長,變形量呈逐漸增長的趨勢,數據整體方差較大,實測數據將不可避免地存在隨機擾動誤差,單一神經網絡模型的預測精度會有一定誤差[6]。馬爾科夫算法具有不受過去狀態影響的特點,對復雜因素影響下的時間序列預測具有優化作用,為解決基坑沉降變形擾動性強的問題,結合馬爾科夫鏈對神經網絡預測模型進行優化。由于神經網絡與馬爾科夫鏈組合預測模型是基于MATLAB程序實現,需要操作人員掌握一定的計算機和神經網絡相關知識,不利于在施工現場直接運用。因此,本文在建立組合預測模型基礎上,編寫圖形用戶界面(Graphical User Interfaces)程序,實現現場預測可視化和操作簡單化的要求。
1?神經網絡與馬爾科夫鏈預測原理
1.1?神經網絡
BP神經網絡是應用最為廣泛的神經網絡模型之一,其基本思想是梯度下降法,按照訓練誤差反向傳播。BP神經網絡模型通過訓練、學習,在輸入值一定的情況下,得到最接近期望輸出值的結果。
Elman網絡主體結構層仍與BP等前饋神經網絡保持一致,但在輸入、隱含、輸出3個結構層之外增加承接層組成反饋連接。承接層作用在于接收隱含層單元上一時刻的輸出量,并與當前時刻網絡輸入一同作為隱含層輸入,隱含層與承接層的節點數為一一對應關系。由于增加承接層所帶來的反饋與記憶功能,Elman神經網絡對歷史數據的敏感性以及動態信息的處理能力均有所提升,實現動態建模的目標。Elman網絡結構圖及狀態空間表達式如圖1所示[7-8]。
表達式中w為不同層間的連接權值;g[w3x(k)]為輸出單元一個y的傳遞函數;f{w1xc(k)+w2[u(k-1)]}為隱含層單元x(k)的傳遞函數,xc為反饋狀態向量。Elman神經網絡權值修正采用BP算法,以誤差平方和作為學習指標,即E(w)=nk=1[yk(w)-y′k(w)]2,其中y′k(w)為原始輸入數據。
1.2?馬爾科夫鏈
馬爾科夫預測研究利用數學概率建立隨機模型,研究變量的初始概率和狀態轉移矩陣,從而確定變量狀態下一期的變化規律[9]。馬爾科夫鏈(簡稱MC)是指狀態和時間均離散的馬爾科夫過程,變量未來取值只與該變量當前的取值有關而與歷史取值無關,因而具有無后效性。
馬爾科夫鏈的函數描述如下:設隨機過程{X(n),n∈t},其中時間集合記為T={0,1,2,…},狀態空間集合記為E={E0,E1,E2,…},對于任意時刻n,n∈T以及任意狀態Ei,有:P{X(n+1)=En|X(n)=En},{X(n),n∈t}為馬爾科夫鏈[10]。
2?深基坑變形預測模型建立及應用
2.1?神經網絡預測模型
根據預測理論可知,預測誤差的大小與預測時步成正比關系,對于僅以時間序列為單位的沉降變化值應采用滾動預測保持預測時步的合理化,因此兩種神經網絡模型均采取滾動預測方式。滾動預測表述為:利用單一時序數據{Yt}進行預測,提取s個時序對第s+1個時序進行預測;當要預測第s+2個時序數據時,使用第s+1的時序數據代替最前面的1個時序進行預測[11]。
BP和Elman同為神經網絡模型,所以在數據選取、訓練和網絡訓練、參數設定等部分的代碼有許多相似之處,均需要設置學習速率、動量系數、訓練次數和誤差精度4類參數。但在網絡建立方面二者有所不同,BP神經網絡調用newff函數,而Elman神經網絡調用newelm函數。預測模型具體操作流程如圖2所示。
2.2?馬爾科夫鏈優化的神經網絡預測模型
根據馬爾科夫鏈理論,首先將預測值的相對誤差按照大小等分為m個狀態,則數據按照所對應區間置入P=[P1,P2,…,Pm]空間內,若某一相對誤差s處于Pi狀態,其經過n步轉移至Pj的概率為
C?(m)?ij?= S?ij?(n)Si(1)
S?ij?(n)為處于Pi狀態所有數據經過n步轉移至Pj狀態的的個數;Si表示所有數據中狀態為Pi的數據個數,由于最終時序狀態的發展無法確定,因此Si的統計數需要將最后n個數據去除。第n步時序狀態轉移概率矩陣C(n)為
C(n)=C?(n)?11?C?(n)?12?…C?(n)?1mC?(n)?21?C?(n)?22?…C?(n)?2m…?C?(n)?m1?C?(n)?m2?…C?(n)?mm?(2)
神經網絡預測值可通過狀態轉移概率矩陣進行優化,首先確定優化數據范圍,選取預測時步最近的r個相對誤差值;其次根據狀態轉移矩陣分別得出r個誤差值到預測數據的時步狀態概率,對所得r個概率進行求和,最大概率值所處的狀態即為預測時步相對誤差所處的狀態。
3?工程應用
西安地鐵5號線榮家寨車站位于金花南路與黃渠頭路十字路口,沿黃渠頭路東北走向布置。車站采用島式站臺,全長150 m,地下3層,主體為雙柱三跨箱型結構,共設4個出入口。車站采用明挖法施工,主體基坑開挖深度為24.40~25.25 m,采用鉆孔灌注樁加內支撐的圍護結構型式,共4道支撐,第一道為鋼筋混凝土支撐,其余3道為鋼支撐。為保障車站施工時基坑及周邊建筑的安全,驗證支護結構可靠性,依據《城市軌道交通工程測量規范》對施工全過程實施嚴密的信息化監測。
本文以榮家寨車站深基坑地表沉降監測為例,建立神經網絡預測模型進行沉降預測。訓練樣本數據選取榮家寨地鐵車站深基坑2個沉降測點的實測數據,命名為?Q1,Q2?,監測時間段為2016年11月至2017年2月,監測時間間隔為2 d,共收集51組數據。仿真預測按照數據量(30,50)分為中期、長期預測,輸出值為第31,51時步預測值。神經網絡訓練數據量分別為24和34,采用滾動預測方法,?其中s=5;最大訓練次數為2 000次,訓練收斂誤差為0.000 1,隱含層數均為11。仿真預測產生7個時步的數據,預測結果如表1所示。
通過表1可知,兩種模型預測趨勢與監測值基本一致,說明二者均具有持續性和長期記憶性,Elman神經網絡預測性能相對高于BP神經網絡模型。?Q2?監測點沉降量變化較為穩定,Elman模型在?Q2?監測點預測相對誤差遠小于BP神經網絡。對比長期預測結果,Elman模型預測誤差普遍小于BP模型,因此說明Elman神經網絡對于小幅變化數據和大數據的預測較BP神經網絡具有優越性。
由于基坑變形因素復雜,滾動預測中前后期數據變形規律存在差異,基坑沉降變形規律使得在利用前期數據預測后期數據時,預測系統存在滯后性,因此預測結果基本小于實測值。
分別以BP和Elman神經網絡的前6個時步預測值與監測值的相對誤差作為馬爾科夫鏈優化模型的樣本數據,修正第7個預測值的數據偏差。以Q1點長期預測值為例,將相對誤差按大小劃分為4個狀態區間,E1=[-9.44,-8.28),E2=[-8.28,-7.12),E3=[-7.12,-5.95),E4=[-5.95,-4.79]。按照所確定的誤差區間對前6個預測值誤差進行區間標注。由馬爾科夫鏈原理計算出3步狀態轉移矩陣:
000.50.5?0.50.500?0100?00100010?0.500.50?0100?01000100?0010?1000?0100
選取第51時步之前的3個時步數據進行誤差修正。由表2可得,第51時步的相對誤差在E3區間概率最大,則修正值為F(x)=(1-δ)x=11.23mm,其中x為單一神經網絡預測值,δ為相對誤差狀態區間的中間值。其它修正值如表3所示。
根據表3可見,馬爾科夫鏈對BP和Elman兩種神經網絡預測模型的修正效果顯著,平均絕對誤差基本控制在5%以內。對比BP-MC和Elman-MC模型,由于在單一神經網絡模型中,Elman模型預測效果普遍優于BP模型,因此經過馬爾科夫鏈修正的Elman模型預測精度相對較高,絕對誤差均小于2%。基于上述思考,在地鐵施工過程中地表沉降預測可選用馬爾科夫鏈修正的Elman神經網絡模型進行計算。
4?Elman-馬爾科夫鏈模型的GUI界面開發
MATLAB軟件雖然提供常見的基本函數,用戶可通過輸入命令調用函數,但缺少人機交互式的直觀界面,因此有必要設計圖形用戶界面(簡稱GUI)。GUI的發展應用為非專業用戶的使用提供便利,用戶在不懂得計算機語言的情況下也可以通過窗口、菜單、按鍵等方式進行操作[12]。本文以Elman-MC預測模型為例,進行GUI界面的開發。
4.1?Matlab GUI預測系統的模塊組成
在MATLAB中可使用GUIDE命令完成GUI圖形界面布局和編程工作。在空白頁面建立表格、按鍵、文本框等控件,并在控件中利用Callback編程實現相應的具體功能[13]。基坑沉降預測系統主要由3個GUI板面組成,開始界面、神經網絡預測和馬爾科夫鏈優化界面。
4.2?Elman-馬爾科夫鏈GUI模塊設計
根據Elman-MC預測模型的代碼,分別設計Elman和馬爾科夫鏈的GUI模塊,設計流程如圖3所示。
Elman神經網絡GUI界面的設計主要分為4部分。
(1) 通過構造數據矩陣生成分量向量實現滾動預測。
(2) 利用premmx函數對原始數據進行歸一化處理[14]。選用newelm函數構建Elman神經網絡框架,其中隱含層節點通過訓練時序?s?確定,尋找神經元個數在?s~2 s?范圍內相對誤差最小的神經元個數值。
(3) 采用trainlm訓練函數,通過避免直接計算赫賽矩陣減少訓練中的計算量[15]。
(4) Elman神經網絡的仿真預測使用sim函數:Y=sim(net,P(:,end-6:end)),輸出前6個數據預測相對誤差。
馬爾科夫鏈GUI界面的設計依據其功能分為以下3部分。
(1) 導入Elman神經網絡相對誤差和預測值至對應的馬爾科夫鏈數據文本框中,并計算得出相對誤差的自相關系數。
(2) 將訓練誤差由小到大劃分為四個區間,產生狀態空間I。確定每個樣本誤差所處狀態,并根據所選擇的不同滯后步數計算對應的轉移概率矩陣。
(3) 計算同一狀態的各預測概率加權和,其最大值所對應的狀態即為預測誤差所處預測狀態[16]。取誤差狀態區間的中間值對Elman神經網絡預測值進行修正。
為驗證Elman-MC預測模型GUI界面的運行可靠性,以?Q3監測點數據為樣本進行預測,中期數據預測過程如圖4,5所示。Q3?點第31時步監測值為?6.04mm,Elman神經網絡模型的預測值為5.66 mm,經過馬爾科夫鏈修正預測值精確為6.08 mm,預測達到預期效果,說明Elman-馬爾科夫鏈的GUI界面系統性能穩定。此外,Elman-MC預測模型具有不依賴于具體工程的特征,因此能夠在不同工程中應用,具有良好的可移植性。
5?結 論
(1) 分別采用BP和Elman神經網絡預測基坑周圍地表沉降變形規律,建立了滾動預測模型。鑒于神經網絡預測存在的缺陷性,利用馬爾科夫鏈無后效性特點對兩種神經網絡模型優化,提高網絡收斂速度和預測精度,有效避免了預測誤差隨預測跨度的增大而增大的問題。對比單一神經網絡模型可知,Elman模型預測精度優于BP模型,經過馬爾科夫鏈優化的Elman預測模型同樣優于BP模型。
(2) 基于人工神經網絡和馬爾科夫鏈的預測模型需要操作人員具備一定專業知識,以Elman-馬爾科夫鏈預測模型為例,應用Matlab GUI設計開發預測系統,實現了預測過程的可視化,使預測模型的應用更具操作性、實用性和較為廣泛的施工現場應用前景。
(3) 由于基坑地表沉降變形過程受多種復雜因素影響、神經網絡預測系統穩定性和預測周期跨度有待提高,應在建模過程中考慮更多影響因素、開發更加合適的算法代碼,提高預測模型的穩定性和周期跨度。
參考文獻:
[1]夏志強,周傳波,平雯,等.地鐵隧道盾構法施工地表沉降特征及預測研究[J].城市軌道交通研究,2014,17(10):98-102,106.
[2]李文棟.我國基坑工程的發展現狀[J].建筑工程技術與設計,2015(8):45-46.
[3]高瑋,鄭穎人.地下工程變形預測的集成智能方法[J].土木工程學報,2004(4):87-92.
[4]王一珺,賈嶸.基于Elman和實測風速功率數據的短期風功率預測[J].高壓電器,2017,53(9):125-129.
[5]魏楨,鄧院昌,楊正浩.基于Elman神經網絡的風電場噪聲預測模型[J].水電能源科學,2015,33(5):203-206.
[6]萬臣,李建峰,趙勇,等.基于新維BP神經網絡-馬爾科夫鏈模型的大壩沉降預測[J].長江科學院院報,2015,32(10):23-27,32.
[7]孫學聰. 深基坑變形監測及變形預測研究[D].西安:長安大學,2015:12-15.
[8]楊小輝.基于Elman神經網絡的復合土釘墻安全預測研究[D].邯鄲:河北工程大學,2013:32-33.
[9]張英豪,劉曉青,寧昕揚.灰色—馬爾科夫模型在南俄5水電站大壩變形預測中的應用研究[J].水利水電技術,2018,49(2):139-143.
[10]朱軍桃,熊東旭,李亞威.基于卡爾曼濾波的灰色馬爾科夫組合模型在基坑變形監測中的應用[J].桂林理工大學學報,2017,37(4):653-657.
[11]曹凈,丁文云,趙黨書,等.基于PSO-LSSVM模型的基坑變形時間序列預測[J].控制工程,2015,22(3):475-480.
[12]曲方,張龍,李迎業,等.基于BP神經網絡的煤與瓦斯突出預測系統開發[J].中國安全科學學報,2012,22(1):11-16.
[13]余勝威,吳婷,羅建橋.MATLAB GUI設計入門與實踐[M].北京:清華大學出版社,2016.
[14]王中凱,梁秀娟,肖長來,等.Elman神經網絡在平原區降水入滲補給預測中的應用[J].節水灌溉,2013(7):42-44,52.
[15]莫曼,鄢翠,方志杰.基于BP神經網絡的軟地基沉降分析[J].廣西大學學報:自然科學版,2015,40(1):202-207.
[16]李義華,杜康,周潔.基于改進灰色馬爾科夫模型的木材需求量預測[J].中南林業科技大學學報,2017,37(12):133-138.
引用本文:賈?哲,郭慶軍,郝倩雯.基于Elman-馬爾科夫模型的深基坑變形預測[J].人民長江,2019,50(1):202-206.
Deformation prediction of deep foundation pitbased on Elman-Markov model
JIA Zhe, GUO Qingjun, HAO Qianwen
(School of Civil and Architecture Engineering, Xi′an Technological University, Xi′an 710021, China)
Abstract:In order to improve the accuracy of deep foundation pit deformation prediction, a feedback Elman neural network model was introduced into the foundation pit surface settlement prediction. The rolling prediction of foundation pit settlement displacement time series can be realized by using Elman neural network algorithm. Taking the foundation pit engineering of a station of Xi'an Metro Line 5 as the example, based on the idea of combined forecasting, combining the two forecasting methods of Elman neural network and Markov chain, the prediction model of ground subsidence of foundation pit was established. The random disturbance error was corrected by Markov chain model. The effect of Elman neural network prediction model before and after the modification were both better than the BP neural network prediction model. Graphical User Interface (GUI) prediction system based on MATLAB was designed and developed, making the model prediction process easy and convenient and the prediction process can be displayed dynamically by graphical results.
Key words:?foundation pit deformation prediction; neural network; Markov chain; graphical user interface