張楊楊,隋天雨,裴 俊,崔敏睿,李奕臻
(1.中國礦業(yè)大學,江蘇 徐州221116;2.中國石油大學(北京)克拉瑪依校區(qū),新疆 克拉瑪依834000)
實現(xiàn)人工智能(Artificial Intelligence,AI)是人類長期以來共同追求的目標[1]。特別是21世紀以來,人工智能領域持續(xù)升溫[2]。作為AI的一個重要分支,人工神經(jīng)網(wǎng)絡(Artificial Neural Network,ANN)是基于模仿生物大腦的結構和功能而構成的一種信息處理系統(tǒng),可以代替人腦有效地處理一些復雜問題,從而推動AI的發(fā)展。ANN是由大量處理單元即神經(jīng)元互連而成的網(wǎng)絡,也常簡稱為神經(jīng)網(wǎng)絡或類神經(jīng)網(wǎng)絡[3]。
本文首先介紹了反向傳播(Back Propagation,BP)與徑向基函數(shù)(Radial Basis Function,RBF)兩種發(fā)展較成熟、應用較廣的ANN模型理論;其次介紹了與機器學習、深度學習有關的卷積神經(jīng)網(wǎng)絡(Convolutional Neural Networks,CNN)相關的ANN模型理論;再次介紹了ANN在巖土工程領域的應用,包括預測與監(jiān)控等;最后給出對ANN的總結與展望。
BP神經(jīng)網(wǎng)絡是最傳統(tǒng)的神經(jīng)網(wǎng)絡,也是目前應用最廣泛的神經(jīng)網(wǎng)絡。其模型的拓撲結構包括輸入層、隱含層和輸出層。相鄰層之間各神經(jīng)元全連接,而同一層各神經(jīng)元之間無連接[4]。圖1為BP神經(jīng)網(wǎng)絡模型的拓撲結構示意圖。

圖1 BP神經(jīng)網(wǎng)絡模型的拓撲結構示意圖
該神經(jīng)網(wǎng)絡的原理是先通過激活函數(shù),結合閾值修正的線性加權和將各層連接起來;再根據(jù)所給的訓練樣本輸入向量和輸出向量,不斷學習并調整神經(jīng)元之間的連接權值與閾值,使網(wǎng)絡不斷逼近樣本輸入向量和輸出向量之間的映射關系。其訓練過程實質上是信息正向傳播與根據(jù)誤差逆向修正權值和閾值的過程。
網(wǎng)絡的設計過程無非是數(shù)據(jù)的輸入與輸出及反饋修正參數(shù)。輸入的數(shù)據(jù)常為對系統(tǒng)模型關鍵影響的自變量,在輸入前通常要進行標準化處理和歸一化處理。
各層之間數(shù)據(jù)輸入與輸出的過程以第i個神經(jīng)元為例,說明數(shù)據(jù)輸入與輸出的具體步驟。設x1,x2,…,xi為神經(jīng)元的輸入,ω1,ω2,…,ωi為對應連接權值,θi為閾值,y=f(x)為激活函數(shù)(常采用sigmod()函數(shù))。則該神經(jīng)元的輸出表達式為

根據(jù)BP神經(jīng)網(wǎng)絡原理,數(shù)據(jù)從輸入層傳遞到隱含層再傳遞到輸出層,這時就可以得到神經(jīng)網(wǎng)絡的訓練輸出為y'=(y1',y2',…,yi'),y'是權值的函數(shù)。假設真實的輸出是y=(y1,y2,…,yi),則可得到訓練誤差ε,通常用最小二乘法進行表示,其表達式為

可知ε也是權值的函數(shù)。接著采用梯度下降法,常借助編程,多次迭代使誤差ε最小。在實際操作中,可設置誤差小于一定值時終止遞歸,也可以設定迭代次數(shù)。這樣,BP神經(jīng)網(wǎng)絡的設計就完成了。但是面對一些復雜的問題,BP神經(jīng)網(wǎng)絡收斂速度慢,需要的訓練時間可能非常長,還有可能會陷入局部極小值,這時通常要對原模型進行修正,RBF神經(jīng)網(wǎng)絡就是解決方法之一。
嚴格來說,RBF神經(jīng)網(wǎng)絡是BP神經(jīng)網(wǎng)絡的一種特例,同樣包括輸入層、隱含層、輸出層。但從輸入層到隱含層的變換采用了RBF,是非線性的;從隱含層到輸出層則采用線性加權和,是線性的。RBF是一種局部非線性逼近的神經(jīng)網(wǎng)絡[5]。
RBF是一個取值僅僅依賴于離原點距離的實值函數(shù),標準距離一般使用歐氏距離(也叫做歐式RBF),通常采用高斯核函數(shù),其表達式為

式中:xc為核函數(shù)中心;σ為函數(shù)的寬度參數(shù),控制了函數(shù)的徑向作用范圍。RBF神經(jīng)網(wǎng)絡最大的特點是用RBF作為隱單元的“基”構成隱含層空間,這樣就可以將輸入向量直接映射到隱含層空間,而不需要通過權值的連接。RBF的作用就是采用核函數(shù)的思想,將低維數(shù)據(jù)轉化為線性可分的高維數(shù)據(jù)。通過這種變換,神經(jīng)網(wǎng)絡僅有隱含層、輸出層間的權值,且可通過線性方程組直接求解,這樣可大大加快學習速度,進一步避免局部極小值問題。
1)結構上,BP神經(jīng)網(wǎng)絡可以有多個隱含層,而RBF網(wǎng)絡只有一個隱含層。
2)理論上,已經(jīng)證明RBF神經(jīng)網(wǎng)絡是連續(xù)函數(shù)的最佳逼近,而BP神經(jīng)網(wǎng)絡不是[6]。
3)實際運算上,RBF神經(jīng)網(wǎng)絡的訓練速度比BP神經(jīng)網(wǎng)絡快,原因如下:一是因為隱含層只有一層;二是因為局部逼近可以簡化計算量。當輸入數(shù)據(jù)時,只有該輸入局部的神經(jīng)元會有響應,故其他權值通常可近似為0,大大簡化計算。
CNN是一類包含卷積計算且具有深度結構的神經(jīng)網(wǎng)絡,是最重要的流行深度學習算法之一[7]。CNN同普通ANN一樣,要經(jīng)過數(shù)據(jù)正向輸入、判斷、輸出以及逆向參數(shù)調節(jié)進行訓練。但是CNN特有的結構,包括隱含層的卷積層、池化層以及全連接層,使其具備了局部感知、權值共享的特性,從而極大地減少了參數(shù)數(shù)量,進一步可以高效率地進行高維數(shù)據(jù)運算,廣泛應用與各行業(yè)的圖像識別領域。圖2為卷積神經(jīng)網(wǎng)絡模型的拓撲結構示意圖。

圖2 卷積神經(jīng)網(wǎng)絡模型的拓撲結構示意圖
其中,隱含層的卷積層、池化層是保證卷積神經(jīng)網(wǎng)絡特征功能實現(xiàn)的核心結構。CNN隱含層的前半部分的由卷積層與池化層交替組成;后半部分則采用全連接層。輸出層的前半部分通常也采用全連接層,對于圖像分類問題,輸出層使用邏輯函數(shù)或歸一化指數(shù)函數(shù)即softmax()。卷積及池化作用理論較為復雜,下節(jié)具體展開;全連接層主要作用則是將上一層提取到的特征結合在一起,再進行分類。
卷積層的作用是提取輸入數(shù)據(jù)的特征,通過不同卷積層的不同卷積核,可以提取原數(shù)據(jù)不同方面的特征。要理解卷積運算并非易事,可以先將卷積運算視為圖像處理中的濾波器運算。卷積運算作用是提取或捕捉原輸入數(shù)據(jù)的特征。
假設輸入數(shù)據(jù)為一個m×n的矩陣X,卷積核為一個i×j的W(i≤m,j≤n)。則運算的過程為:卷積核W中的每一個權值ω分別和輸入矩陣X中所對應的x相乘后再求和,計算公式為

卷積運算的全部過程由很多上面的運算組成:卷積核以一定的間隔滑動,并對所覆蓋的區(qū)域進行運算,得到輸出y,直到遍歷矩陣X。
某一卷積運算為例,輸入矩陣X=,卷積核],輸入矩陣]。其卷積核W的9個元素與輸入矩陣X的16個元素中的9個元素進行卷積運算,滑動4次則運算完成,輸出一個二維矩陣。
池化層的作用是在卷積層的基礎上,進一步提取特征。運算方法較為簡單,分為兩類最大池化層和平均池化層,前者以矩陣的最大值為特征值,后者以平均值為特征值。
巖土工程領域作為基建支柱型行業(yè),在如今AI飛速發(fā)展的時代迫切需要進行產(chǎn)業(yè)升級。神經(jīng)網(wǎng)絡技術應用到巖土工程領域是中國AI前進的重要一環(huán)。目前神經(jīng)網(wǎng)絡應用已在巖土工程領域逐步開展,主要應用于巖性識別、地質預警、基坑工程沉降變形預測(采用BP,RBF)、隧道識別檢測(采用CNN)等。本文重點介紹基坑和隧道的應用。
基坑的研究在巖土工程領域極為重要。通常要保證施工周期內基坑的圍護結構變形與周圍地表沉降在安全范圍內。施工時,一般要對圍護結構進行位移監(jiān)測,對周圍地表進行沉降監(jiān)測。但只依靠監(jiān)測工作是遠遠不夠的,這只屬于事中控制,如果等到監(jiān)測值達到控制值時再尋求解決變形值過大的辦法就已經(jīng)太晚了[8],這就要求事先進行預測。
影響基坑變形的因素非常復雜,難以使用傳統(tǒng)的力學方法對施工周期內的變形進行準確預測,神經(jīng)網(wǎng)絡的發(fā)展一定程度上解決了這個問題。早在1993年,Abedi H等[9]在將BP網(wǎng)絡應用于軟土基坑支護結構位移的預測上并起到了很好的作用。1999年,同濟大學的馮紫良等[10]也成功地利用BP神經(jīng)網(wǎng)絡完成了基坑施工中的預測工作,開啟了神經(jīng)網(wǎng)絡在基坑預測應用的先例,并解決了大量難題。2009年,王寧等采用RBF神經(jīng)網(wǎng)絡進行預測,也取得了不錯的結果。
目前,基坑預測神經(jīng)網(wǎng)絡結構的輸入常取基坑開挖深度、土體的內摩擦角、土體粘聚力、土體重度、地下水位等,根據(jù)實際情況選取隱含層神經(jīng)元數(shù)目;輸出通常采用圍護結構位移和地表沉降量。同時,有些學者為了驗證神經(jīng)網(wǎng)絡的訓練精度,常采用有限元模擬檢驗。
目前我國已成為修建隧道最多的國家,隨之而來的也包括一系列的超欠挖、塌方等難題。傳統(tǒng)的檢測方法費時費力,故在深度學習興起之后,CNN模型迅速應用于隧道掘進機(Tunnel Boring Machine,TBM)與鉆爆法等隧道施工中,常用于地層識別和隧道檢測。
在TBM隧道施工中,地層識別的方法有觀察掌子面、巖渣識別等。一方面,采用CNN對掌子面進行觀察評價具有耗時短、反饋及時的優(yōu)點;另一方面,可建立對巖渣自動識別的CNN模型,借助其強大的圖像識別功能來獲取前方的地層地質特性,進一步判斷前方地質有無塌方、斷層等風險。
在鉆爆法隧道施工中,巖體本身的裂隙及爆破的參數(shù)對隧道安全性有很大影響。劉春等[11]研究表明,通過建立CNN模型可更加科學、高效地提取巖土裂隙形態(tài)參數(shù),為隧道巖體裂隙的定量分析和評價提供了可靠依據(jù)。張萬志[12]通過炮孔圖像采集、改進CNN、現(xiàn)場監(jiān)測等方法,實現(xiàn)了爆破參數(shù)的智能優(yōu)化,并進行了工程應用,取得了較好的效果。
本文介紹了BP,RBF,CNN一系列ANN技術,并著重闡述了相關網(wǎng)絡的基本理論及其在基坑、隧道中的應用。在未來發(fā)展中,可以根據(jù)實際工程問題,采用各種優(yōu)化算法繼續(xù)改進ANN模型,或者通過ABAQUS等有限元軟件建模檢驗ANN模型的精確性。希望ANN技術能夠進一步發(fā)展,在巖土工程領域得到更廣泛的應用,推動中國AI的前進。