狄圣杰,李曉敏,魏 檣
(1.河海大學巖土力學與堤壩工程教育部重點實驗室,江蘇 南京 210098;2.鄭州科技學院土木與建筑工程系,河南 鄭州 450000;3.中國水電顧問集團昆明勘測設計研究院,云南 昆明 650051)
巖土體具有復雜的結構和機理,破壞過程是漸變性的,是變形積累到一定程度表現出宏觀滑移的一個非線性復雜過程,如邊坡滑動蠕動或擋土墻后楔形巖土體的開裂滑動,巖土體物理力學特征和地質環境因素對其都有影響,這些影響因素有的是確定的,有的是隨機的,它們對不同類型邊坡穩定性的影響權重也是不同的,之間又有復雜的非線性關系[1-2]。運用現代智能方法如人工神經網絡已成為預測邊坡穩定性的一種較有效的手段,其特點是智能性、綜合性、集成性和非線性。
常用的BPNN(誤差反向傳播神經網絡)及其改進方法無法自動調整結構組成,性能優良的BPNN需要優化網絡結構,優化權值、閾值等參數,選擇合理的計算方法和學習參數。這些都用到了相關的優化算法,例如用遺傳或粒子群算法對未知參數尋優,必要時還要擴展網絡結構以減小系統誤差,同時收斂速度較慢,這會限制它在實際中的應用和推廣。廣義回歸神經網絡(GRNN)結構設計簡單,收斂速度快,所需訓練樣本少,對被建模對象的先驗知識要求不多,具有全局逼近性和最佳逼近性質,魯棒性及非線性處理能力強,能根據樣本數據反映其中隱含的映射關系,且不存在局部最小問題,目前已在工程中得到了應用[3-4]。
GRNN唯一需要調整的參數是光滑因子,它的選擇對于網絡性能優劣有較大影響,光滑因子越小,擬合程度越好,但過小會導致過擬合。文獻[5-7]選取了光滑因子試算范圍內的最小值,因為最小值不等于最優值,故直接應用某范圍內的最小值是不準確的,會導致網絡泛化能力差。筆者應用遍歷樣本的交叉驗證方法,可以合理地選擇光滑因子值,改善網絡泛化能力,提高預測精度。
GRNN是一種建立在非參數估計基礎上的非線性回歸的徑向基神經網絡,不需要事先確定方程形式,而以概率密度函數代替固有的方程形式,直接計算出因變量對自變量的回歸值。其優勢在于不需要重復訓練,網絡建成的同時訓練即完成,網絡的訓練過程實際上就是確定光滑因子的過程,并且在網絡數據稀少時效果也較好,能夠收斂于樣本量聚類較多的優化回歸面。網絡輸入層只傳遞輸入向量到徑向基層,隱含層中神經元個數由所描述的問題而定,通常傳遞函數采用高斯函數radbas:
式中:aj為經過高斯函數傳遞后的網絡輸出;nprod為規范化點積權函數,是線性輸出層的權值函數;‖dist‖為歐氏距離函數,即該層權值函數;bj為第j個隱含層與光滑因子有關的閾值;σj為光滑因子(spread),它決定第 j個隱含層位置處基函數的形狀,σj越大基函數越平滑。
GRNN的每次訓練都會自動檢查輸出誤差,所產生的最大誤差對應的輸入向量會作為權值產生一個新的隱含層神經元,然后,新網絡會循環檢查誤差直至神經元數量達到最大或達到一定精度為止。
初始化即訓練樣本的學習過程,學習樣本確定了,則相應的網絡結構和各神經元之間的連接權值也隨之自動確定,網絡訓練過程實際上是確定光滑因子的過程。較BPNN而言,GRNN的人為調節參數僅為1個,網絡學習全部依賴于數據樣本,這就決定了網絡得以最大限度地避免人為主觀假定對計算結果的影響。同時GRNN解決了BPNN訓練時間長且確定隱含層數目難的問題,能穩定地描述系統的特征。
一般情況下,訓練能力差時網絡的預測能力也差,并且在一定程度上隨著訓練能力的提高預測能力也會提高,但這種趨勢有一個極限,達到此極限后,隨著訓練能力的提高,預測能力反而下降,即出現所謂過適性,也稱為過擬合,此時網絡學習了過多的樣本細節而不能反映樣本內在的規律。泛化能力差會造成不適性,過適性和不適性的網絡都屬于不成熟網絡,仿真效果較差[8]。
創建輸入輸出樣本和廣義回歸神經網絡,輸入樣本在[-1,1]區間內均勻地取21個點,21個數據點坐標如圖1所示。當光滑因子取較小值0.02時,用步長0.01來檢驗擬合效果,觀察所選光滑因子是否能夠體現出所給樣本內在的規律性。從圖1(a)中可以看出,網絡記住了訓練樣本細節,甚至個別噪聲,曲線較陡,在原始樣本點處形成平臺,附近的數值向其值靠攏。當光滑因子取較大值0.2時,從圖1(b)可以看出,網絡進行函數逼近時擬合效果較差,出現了不適性??傮w來說,光滑因子值越小,擬合越好,曲線越不光滑,但光滑因子太小時不能學習到真正的規律性,這樣就對測試樣本或仿真樣本不敏感,即表現出過適性,以此網絡來推廣仿真勢必會造成較大的誤差。

圖1 訓練樣本的過適性與不適性
采用LOO交叉驗證方法評估模型的預測能力,即在一定范圍內以某一步長遞增變化,在學習樣本中以1個樣本作為估計樣本,剩余的樣本采用構造的GRNN對估計樣本仿真,對所有樣本都遍歷1次,得到預測值與樣本值之間的誤差序列,以序列均方誤差值作為網絡的評價指標,將最小誤差對應的光滑因子作為最終所選值。光滑因子的確定過程符合整體偏差最小原則[9-11]。

式中:E為預測值與樣本期望值的方差;Xi為第i個樣本對應的輸入值;Yi′(Xi)為第 i個樣本的預測值;Yi為樣本期望值;n為樣本個數。
訓練樣本中選擇某列數組作為估計樣本,用剩余的樣本構造學習樣本,依次對所有樣本遍歷1次,具體表達如式(3)、式(4)所示:

式中:a,b分別為訓練樣本和期望樣本;P為輸入樣本;T為輸出樣本;k為輸入或輸出數組的列數,可以控制光滑因子的精度。
應用上面所示的樣本可以求得光滑因子迭代值,其中用訓練樣本a代替輸入樣本P,用期望樣本b代替輸出樣本T,即依次取出j列作為測試樣本,剩余所有列作為訓練樣本,仿真后與理論值或實測值比較。
在確定平滑因子的過程中,初始值選取太小,式(4)可能出現除數為零的情況,文獻[3]給出了初始值的計算公式:

式中:σmin為光滑因子選取區間的初始值;Dmin為學習樣本中各輸入樣本之間Euclid距離的最小值;ε為計算機能夠表達的最小正數。
以步長為0.01檢驗網絡的擬合情況,選用誤差最小時對應的光滑因子(此時光滑因子為0.058),網絡仿真與訓練樣本如圖2所示,擬合效果較好。對于一般問題,按照上述方法確定的平滑參數即可滿足要求,也可建立優化問題模型,并應用傳統和新型優化方法解決該問題。

圖2 GRNN的逼真函數
為了得到比較好的預測效果,一般在網絡訓練前應對原始數據作預處理,包括剔除離散性較大的值,對數量級差別較大的數據作歸一化或標準化處理,對輸出向量作反處理變換至原單位(如不存在相對于其他輸入樣本特別大或特別小的樣本矢量可不進行歸一化)。歸一化時對輸入輸出向量正則化處理,使其落入[-1,1]區間,或歸一到其單位方差和零均值,計算完畢后需要對結果數據還原。簡單歸一化和反歸一化方法處理見式(6)、式(7):


式中:Mi為原始輸入值;M′i為歸一化后的網絡輸入值;N p i為在[0,1]區間的預測值;Ni為預測值的還原值;Vmin和Vmax分別為樣本最小值和最大值。
算例 對82個實際工程邊坡的極限平衡分析統計資料和邊坡對應狀態(表1)分析可以發現,由于分析信息的模糊性、不確定性,即使計算安全系數大于1.6,也有部分邊坡最終發生失穩破壞。訓練樣本為密度 ρ、黏聚力c、摩擦角 φ、殘余摩擦角 ψ及坡高Η,目標樣本為安全系數和穩定狀態。邊坡穩定狀態為0代表破壞,1代表穩定,利用GRNN具備的聚類分類原理可以初步評判邊坡穩定狀態。

表1 82個實際工程邊坡的統計資料與邊坡穩定狀態
樣本1~79作為訓練樣本,樣本80~82作為測試樣本。對樣本歸一化處理后GRNN迭代搜索出的平滑因子值為0.143,安全系數預測結果為1.2000,1.5195,1.2000;BPNN的預測結果為1.2063,1.5304,1.1584,模型的預測結果如表2所示。從表2可以看出,即使存在安全系數大于1.6而產生破壞的干擾樣本(表1中樣本45),但總體預測情況仍然是良好的,GRNN預測的安全系數誤差很小,最大為0.03%,而BPNN預測的安全系數最大誤差不超過3.5%。另外GRNN在計算過程中的快捷更顯示了其優越性。

?
a.討論了GRNN網絡中光滑因子的影響,光滑因子選取不當會造成網絡的泛化能力差。根據光滑因子的初值,提出使用LOO交叉驗證方法將得到的序列均方誤差值作為網絡的評價指標,最小誤差對應的光滑因子即為所選值,并驗證了該方法的合理性。
b.搜集了82個圓弧滑動邊坡穩定性樣本,由于分析信息的模糊性、不確定性,即使計算安全系數大于1.6也有部分邊坡最終發生失穩破壞。結合本文提出的光滑因子選取方法,應用GRNN模型進行預測分析,吻合效果較好,反演精度較高,網絡操作簡捷,易為工程人員接受,可在工程實際中應用。
c.由于GRNN具有較強的函數擬合和逼近能力,其對樣本依賴性強的特點使得選取具有代表性的訓練樣本數據非常重要,如果預測誤差過大可能是數據的問題,關于如何減小訓練樣本數據中的誤差或噪聲對預測精度的影響需做進一步研究。
[1]狄圣杰,徐衛亞.黏性土求主動土壓力的庫爾曼法及應用[J].巖土工程學報,2010,32(6):970-974.
[2]張玉,張方方.變水位多工況下大型渠道土質邊坡的穩定分析[J].水利水電科技進展,2010,30(1):56-60.
[3]TOMANDL D,SCHOBER A.A modified general regression neural network with new efficient training algorithms as a robust‘black box' tool for data analysis[J].Neural Networks,2001,14(4):1023-1034.
[4]周昊,鄭立剛,樊建人,等.廣義回歸神經網絡在煤灰熔點預測中的應用[J].浙江大學學報:工學版,2004,38(11):1470-1482.
[5]蘭海濤,李謙,韓春雨.基于廣義回歸神經網絡的邊坡穩定性評價[J].巖土力學,2009,30(11):3460-3463.
[6]周建萍,閆澍旺.廣義回歸神經網絡預測加筋土支擋結構高度[J].巖土力學,2002,23(4):486-490.
[7]馮志鵬,宋希庚,薛冬新,等.基于廣義回歸神經網絡的時間序列預測研究[J].振動、測試與診斷,2003,23(2):105-144.
[8]DI Sheng-jie,XU Wei-ya,WEI Qing.The selection of spread and the application in engineering of GRNN[C]//Proceedings of 2nd International Conference on Information Science and Engineering.Hangzhou:IEEE,2010:5508-5511.
[9]BROOMHEAD D S,LOWE D.Multivarialble functional interpolation and adaptive networks[J].Complex System,1988,2:321-355.
[10]SPECHT D F.A general regression neural network[J].IEEE Transactions on Neural Network,1991,2:568-576.
[11]DING D X,ZHANG Z J.Artificial neural network based inverse design method for circular sliding slopes[J].J Cent South Univ Technol,2004,11(1):89-92.