鄧 多,陳建康,裴 亮,周 弭,孫 燕
( 1.四川大學水利水電學院,四川 成都 610065;2.國網(wǎng)四川甘孜州電力有限責任公司康定市供電分公司,四川 甘孜 626000)
復雜地質條件下,重力壩的深層抗滑穩(wěn)定是工程穩(wěn)定分析關注的一個焦點[1]。重力壩地基中的各種錯動帶和裂隙可能會組成雙滑面或多滑面的滑移通道,這些深層滑移通道就成了控制重力壩抗滑穩(wěn)定的關鍵性因素。抗滑穩(wěn)定安全系數(shù)是評估重力壩抗滑穩(wěn)定的一個應用較為廣泛的指標。對于深層抗滑穩(wěn)定安全系數(shù)和多種因素有關,包括壩前水深以及滑移通道上的各種材料參數(shù)等。安全系數(shù)和影響因素之間呈現(xiàn)一種復雜的非線性映射關系,難以用函數(shù)顯式表達。而人工神經(jīng)網(wǎng)絡模擬人腦神經(jīng)組織的處理過程,具有自組織、自學習特性,將知識存儲與連接權值中,可以實現(xiàn)各種非線性映射[2]。
人工神經(jīng)網(wǎng)絡在水文預報[3- 5]和邊坡的穩(wěn)定性研究方面[6- 7]應用較多,這些研究多是基于BP等淺層神經(jīng)網(wǎng)絡進行的。傳統(tǒng)的BP神經(jīng)網(wǎng)絡存在著一些缺陷[8]。一是當網(wǎng)絡層數(shù)過深,而訓練網(wǎng)絡時權值初始化的很小,那么模型會很快的陷入局部最優(yōu)解;二是網(wǎng)絡需要大量的帶標簽數(shù)據(jù),即有監(jiān)督的學習來進行訓練,無法很好地解決小樣本問題。Geoffrey Hinton在2006年提出的一種深度置信網(wǎng)絡(Deep Belief Network, DBN)[9]則很好地克服了這些問題。
深度置信網(wǎng)絡作為深度學習的算法之一,在文字檢測、人臉與表情識別,遙感圖像識別等諸多領域取得了進展和應用[10]。深度學習可以通過多層網(wǎng)絡模型來學習數(shù)據(jù)的多層抽象特征,極大地提升了語音識別、視覺對象識別、對象檢測等領域的技術水準[11]。與此同時,深度置信網(wǎng)絡在變量預測方面也展現(xiàn)出了優(yōu)勢,代杰杰等[12]提出變壓器油中溶解氣體濃度預測模型,該模型將多種氣體組分與環(huán)境量一同輸入深度置信網(wǎng)絡模型,預測結果比單一氣體含量預測模型更精確,姚騰輝[13]提出一種基于深度置信網(wǎng)絡的建筑用水流量預測方法,預測結果優(yōu)于BP網(wǎng)絡。劉春柳等[14]使用了帶有高斯分布的CRBM模型并針對特征冗余問題提出基于拉普拉斯函數(shù)的連續(xù)DBN模型,取得了比傳統(tǒng)DBN更為精確的預測結果。
目前深度置信網(wǎng)絡在應用重力壩穩(wěn)定方面的應用還較少。鑒于傳統(tǒng)BP神經(jīng)網(wǎng)絡易陷入局部最優(yōu)解以及擬合度不高的缺點,本文提出一種基于深度置信網(wǎng)絡的重力壩深層安全系數(shù)預測方法。該方法先通過三維有限元模型計算,得到不同壩前水深和材料參數(shù)作用下的應力分布,通過應力代數(shù)和比值法計算得到一系列安全系數(shù)。用DBN深度置信網(wǎng)絡來構建壩前水深、材料參數(shù)等影響因素和安全系數(shù)之間的映射關系,構建重力壩深層抗滑穩(wěn)定安全系數(shù)預測模型,并對模型的隱藏層數(shù)和隱藏節(jié)點數(shù)進行優(yōu)化分析。同時用傳統(tǒng)的BP神經(jīng)網(wǎng)絡構建模型來對比兩種網(wǎng)絡的預測效果。
深度信念網(wǎng)絡是由若干個受限波爾茲曼機(Restricted Boltzmann Machine,RBM)和一個分類器組成的前饋神經(jīng)網(wǎng)絡。輸入數(shù)據(jù)會首先經(jīng)過RBM訓練,第一層RBM的輸出作為第二層的輸入,這樣層層傳遞堆疊。每一層采用貪婪算法單獨訓練以達到每層最優(yōu)。最后通過分類器模型進行一次有監(jiān)督學習,一般采用BP網(wǎng)絡,完成對各層參數(shù)的微調。整個DBN即訓練完成。
單個RBM的組成只有可見層和隱藏層兩層神經(jīng)元,圖1為RBM網(wǎng)絡結構示意圖,可見層神經(jīng)元用vi表示,bi為該可見層神經(jīng)元的偏移量,隱藏層神經(jīng)元用hj表示,ci為該隱藏層神經(jīng)元的偏移量。可見層與隱藏層之間的神經(jīng)元全連接,第i個可見元vi和第j個隱元hj之間的連接權重用wj,i表示,層內部的神經(jīng)元相互不連接。RBM是基于能量函數(shù)的模型,其能量函數(shù)如式(1)所示。對于給定的可見層和隱藏層單元向量(v,h),聯(lián)合概率分布P(v,h;θ)如式(2)所示。RBM的訓練通過對比散度(Contrastivedivergence, CD)算法來更新權重等參數(shù)。

圖1 RBM結構
(1)
(2)

由于層內部的神經(jīng)元不相互連接,因此第i個可見元vi和第j個隱元hj的激活概率分別為:
(3)
(4)

基于DBN的重力壩深層抗滑安全系數(shù)預測分析及基本流程如圖2所示。首先參照工程實例建立重力壩有限元模型,獲取各種材料參數(shù)及統(tǒng)計特征。根據(jù)材料參數(shù)及統(tǒng)計特征設計正交試驗。將正交試驗組帶入模型提取所需應力,按照公式計算安全系數(shù)。接下來將數(shù)據(jù)歸一化,并分為訓練集和測試集。將訓練集數(shù)據(jù)輸入不同隱藏層和隱藏層節(jié)點數(shù)的DBN網(wǎng)絡模型,DBN網(wǎng)絡模型的結構如圖3所示。將測試集的數(shù)據(jù)帶入訓練好的網(wǎng)絡,獲得安全系數(shù)預測值。根據(jù)模型評價指標篩選出最優(yōu)隱藏層結構的DBN網(wǎng)絡。本文還構建了BP神經(jīng)用以對比模型的預測效果。

圖2 基于DBN的重力壩深層抗滑穩(wěn)定安全系數(shù)預測流程

圖3 DBN預測模型結構
本文基于DBN的預測模型需要用到材料的彈性模量、凝聚力和摩擦系數(shù)等數(shù)據(jù)由于單位不同,數(shù)值間存在數(shù)量級的差別。為了數(shù)值計算中“大數(shù)吃小數(shù)”情況的發(fā)生,以及為了使數(shù)據(jù)滿足神經(jīng)網(wǎng)絡中節(jié)點轉移函數(shù)的要求,需要將數(shù)據(jù)進行歸一化處理。數(shù)據(jù)歸一化的方法主要有最大最小法和平均數(shù)方差法[15]。這里采用較為常用的最大最小法。采用式(5)對預測模型的輸入變量進行歸一化,將彈性模量、凝聚力、摩擦系數(shù)與壩前水深等歸一化到[0,1]之間。每種數(shù)據(jù)對應一個維度,每個維度的數(shù)據(jù)需要單獨歸一化。另外,這些數(shù)據(jù)的標簽(本模型中即為安全系數(shù))也需要采用式(5)歸一化。同時DBN預測模型直接輸出的也是歸一化之后的值,需要采用式(6)進行反歸一化。數(shù)據(jù)歸一化之后,還需將數(shù)據(jù)劃分為訓練集和測試集。
(5)
(6)

為了評估不同結構神經(jīng)網(wǎng)絡預測模型的質量,本文采用神經(jīng)網(wǎng)絡中較為常用的均方誤差MSE(mean squared error)和決定系數(shù)R2(coefficient of determination)來量化預測模型的表現(xiàn)。MSE是指參數(shù)估計值與參數(shù)真值之差平方的期望值,MSE可以評價數(shù)據(jù)的變化程度,MSE的范圍為(0,+∞),MSE的值越小,說明預測模型描述實驗數(shù)據(jù)具有更好的精確度。
(7)
R2也是一種常用的來評判模型擬合精度的衡量指標,反映了該模型擬合程度,R2的范圍為(-∞,1),R2越接近1,表明模型越精確,當R2小于0時,表明模型效果很差。
(8)

某混凝土重力壩9號壩段如圖4所示。該壩段高148m,壩基包含多條裂隙和錯動帶。這些裂隙和錯動帶組成了一條具有4個滑裂面的危險滑移通道。4個滑裂面從左到右依次為錯動帶f×9- 1、f×10- 5、f×10- 4和第④組裂隙,其材料參數(shù)見表1。

圖4 重力壩剖面圖

表1 壩體及壩基材料基本參數(shù)建議值
本次工程算例分析根據(jù)以上工程情況建立的有限元模型如圖5所示。地基的建模范圍為:從建基面向下延伸取兩倍壩高,從壩踵和壩址分別向上游和下游延伸2倍壩高,橫河向寬度取9號壩段的實際壩段寬度20m。模型單元均采用Solid45單元類型,結點總數(shù)12201,單元總數(shù)13445。

圖5 有限元模型
模型計算中主要考慮壩體、地基以及構成壩體深層滑移通道的兩種錯動帶和一種裂隙的彈性模量E、凝聚力c′、摩擦系數(shù)f′及壩前水深共15個隨機變量。這些隨機變量的分布及統(tǒng)計特征見表2。

表2 隨機變量統(tǒng)計特征
將上述隨機變量分別按照一倍標準差和兩倍標準差進行波動,得到126組正交試驗數(shù)據(jù)。根據(jù)這些壩前水深和材料參數(shù)的正交試驗數(shù)據(jù)輸入有限元模型,并施加相應荷載:作用在壩體上下游表面靜水壓力,作用在壩基面上的揚壓力(揚壓力在帷幕灌漿處按強度系數(shù)α=0.25折減計算)、重力、初始地應力。加載上述荷載運行后得到有限元模型的應力分布。提取深層滑移通道上的單元應力,按公式(9)計算得到每一組正交試驗數(shù)據(jù)對應的安全系數(shù)K。
(9)

本次DBN網(wǎng)絡模型的編程計算在MATLAB(R2014A)平臺上進行。將上文得到的126組數(shù)據(jù)中的100組作為訓練集,剩下26組作為測試集。各種材料參數(shù)和壩前水深作為DBN網(wǎng)絡的輸入,因此DBN網(wǎng)絡的輸入層節(jié)點數(shù)為15。將安全系數(shù)K的值減去1作為預計的輸出,輸出層節(jié)點數(shù)為1。DBN網(wǎng)絡的隱藏層數(shù)和隱藏節(jié)點數(shù)對網(wǎng)絡的預測精度影響很大,為了達到最優(yōu)預測結果,下文將通過多次訓練不同層數(shù)和節(jié)點數(shù)的網(wǎng)絡,以選取預測效果最好的隱藏層網(wǎng)絡結構。另外網(wǎng)絡的傳遞函數(shù)采用Sigmoid函數(shù),學習率為1,迭代次數(shù)經(jīng)測試設置為120。
首先,設置隱藏層層數(shù)為1,設置節(jié)點為1,2,…,19,20,來測試的DBN網(wǎng)絡模型擬合效果。圖6為單隱藏層DBN網(wǎng)絡節(jié)點數(shù)為1到20時的MSE變化情況,其中當單隱藏層節(jié)點數(shù)為13時MSE最小,為0.01583。節(jié)點數(shù)為1時網(wǎng)絡的MSE遠大于其余各種情況的MSE,故未在圖中畫出。

圖6 單隱藏層DBN網(wǎng)絡誤差
然后設置隱藏層為2,第一和第二隱藏層節(jié)點數(shù)以2為步長,從2增加到20。每層有10種不同的節(jié)點數(shù),兩層組合得到100種節(jié)點組合的網(wǎng)絡擬合情況,如圖7所示。表3為100種節(jié)點組合中MSE最小的10種節(jié)點組合的具體數(shù)據(jù),從表中看出雙隱藏層最優(yōu)節(jié)點組合為第一層20,第二層2,MSE為0.01392。相比于單隱藏層最優(yōu)網(wǎng)絡的MSE有所降低,表明網(wǎng)絡的擬合效果提高了。

圖7 雙隱藏層DBN網(wǎng)絡誤差

表3 雙隱藏層部分節(jié)點組合擬合效果
接下來探究隱藏層數(shù)為3的情況,由于三隱藏層如果也按各層節(jié)點自由組合的方式會產(chǎn)生過多的組合。這里我們僅選取雙隱藏層中最小的10種節(jié)點組合進行下一步篩選。對于每一個雙隱藏層最優(yōu)節(jié)點組合,讓第三隱藏層的節(jié)點數(shù)以2為步長,從2增加到20,這樣也產(chǎn)生了100種網(wǎng)絡節(jié)點的組合,擬合效果如圖8所示。從圖中可以看出,三隱藏層的MSE普遍較大。這里從每個雙隱藏層節(jié)點的10種組合中取出MSE最小的一組,數(shù)據(jù)見表4。對比表2表3可以看出,三隱藏層的誤差明顯增大,說明增加的第三隱藏層已不能使網(wǎng)絡擬合效果進一步提高,增加的層反而使累積誤差增大。
綜合以上數(shù)據(jù),確定該DBN網(wǎng)絡模型隱藏層最優(yōu)結構為雙隱藏層,節(jié)點數(shù)為[20- 2]。如果加上輸入層和輸出層,則完整的最優(yōu)DBN網(wǎng)絡模型結構為[15- 202- 1]。

圖8 三隱藏層DBN網(wǎng)絡誤差

表4 三隱藏層部分節(jié)點組合擬合效果
對于BP神經(jīng)網(wǎng)絡也采用相同的思路來進行探尋最優(yōu)的網(wǎng)絡結構。不過由于BP神經(jīng)網(wǎng)絡各神經(jīng)元的參數(shù)是隨機生成的,其網(wǎng)絡訓練很容易陷入局部解,每次訓練的網(wǎng)絡性能有一定的差異性,故將每種結構的BP神經(jīng)網(wǎng)絡訓練100次,將100次網(wǎng)絡評價的均值作為該結構網(wǎng)絡評價的代表值,最終確定最優(yōu)的BP神經(jīng)網(wǎng)絡網(wǎng)絡結構為[15- 2- 1]。
在保證將最優(yōu)隱藏層結構的DBN模型和BP模型所預測的結果進行對比,真實值和二者的預測值繪制如圖9,二者預測誤差如圖10所示。DBN模型在多數(shù)點上的預測誤差都小于BP模型。二者的全局擬合評價見表5,DBN網(wǎng)絡的均方誤差為0.01392,小于BP網(wǎng)絡的均方誤差0.02190,前者相對于后者減小了36.42%。且DBN網(wǎng)絡的決定系數(shù)也大于BP網(wǎng)絡,表明DBN網(wǎng)絡的綜合擬合效果優(yōu)于BP網(wǎng)絡。

圖9 DBN網(wǎng)絡和BP網(wǎng)絡預測結果對比

圖10 DBN網(wǎng)絡和BP網(wǎng)絡預測誤差對比

表5 最優(yōu)BDN和BP模型結構與評價
本文將深度學習中的DBN深度置信網(wǎng)絡引入重力壩深層抗滑穩(wěn)定安全系數(shù)預測,以具體重力壩壩段為例,驗證了DBN網(wǎng)絡在安全系數(shù)預測方面的可行性和實用性。DBN網(wǎng)絡由于其多層RBM堆疊而帶來的高效特征提取能力,使得其在預測擬合度上取得了優(yōu)勢。
通過對不同網(wǎng)絡層數(shù)和節(jié)點層數(shù)的DBN網(wǎng)絡模型的優(yōu)化分析過程可知,當DBN網(wǎng)絡深度增加時,多層RBM堆疊提升了網(wǎng)絡的特征提取能力,網(wǎng)絡的預測精度相應提高。但網(wǎng)絡深度過大時,又會使訓練時間和復雜程度增加,誤差也會逐層增加。因此應合理選擇網(wǎng)絡深度以在精度提升和誤差增加之間取得最優(yōu)。