朱 禹, 鄭 蘭, 徐根祺
(1.安徽省水利水電勘測設計研究總院有限公司,安徽 合肥 230088;2.安徽水利水電職業技術學院,安徽 合肥 231603;3.西安交通工程學院電氣工程學院,陜西 西安 710300)
隨著我國經濟的迅速發展,水利工程建設也步入了快速發展期,長江流域的水利工程建設與沿線人民的生活息息相關。從長江下游調水,向淮河中游地區跨流域補水,解決沿淮淮北地區及輸水沿線工業和城鄉生活供水不足,補充農業灌溉用水,部分輸水渠段結合航運建設,形成長江與淮河兩大流域之間第二條便捷的水運通道,將改變淮河中上游地區與巢湖、皖江及長江中上游地區間的水運物資繞道京杭運河運輸的狀況[1],對于完善全國內河高等級航道布局,優化區域綜合交通運輸體系,促進長江經濟帶和中原經濟區發展具有重要意義[2]。
水利工程建設過程中無法避免地要對山體的開挖,坡體穩定性直接影響著工程建設質量。目前,對于邊坡穩定性的研究方法較多,有學者利用模糊理論對坡面沖刷穩定性進行分析[3],有研究者以水電邊坡為樣本,基于邊坡破壞機制對邊坡穩定性進行研究[4],也有研究人員基于灰色聚類空間對邊坡穩定性進行預測,均取得了一定的成果,但預測精度還有待提高[5]。
本文以引江濟淮工程白山節制樞紐工程為例,結合主成分分析法對邊坡穩定性影響因子進行提取,再利用提取后的影響因子通過RBF神經網絡對邊坡穩定系數進行預測,以解決由于初始影響因子之間所具有的相關性而導致的共線性問題。
白山節制樞紐位于引江濟淮工程菜子湖線、小合分線和白石天河入巢湖段的交匯處,承擔向小合分線輸水300 m3/s,以及溝通菜子湖線航道與巢湖航運的功能,其主要任務是輸水與航運。
白山樞紐船閘引航道堤防處于圩區內部,靠近白石天河入巢湖口,為新建堤防,堤防填筑高度6~8 m。場區地貌屬于沿湖平原圩區,地形較平坦,有較厚的淤泥質重粉質壤土層(厚2.60~13.30 m)。各土層物理力學指標建議值見表1。

表1 白山節制樞紐各土層指標建議值表
主成分分析是將原有的具有某些相關性的變量,通過線性變換重新生成一組互不相關的變量,用生成的新變量代替原變量的一種統計學方法[6,7]。其數學模型如式(1)所示:

(1)
式中:a1i,a2i,…,api(i=1,2,…,m)分別是屬于X協方差矩陣的特征值的特征向量,ZX1,ZX2,…,ZXp是對原變量標準化處理后的值。
利用SPSS消除原變量量綱各異和數據數量級不同所造成的影響[8,9],再根據式(2)對相關性矩陣進行判定:
(2)
式中:ZX為標準化處理后的矩陣。
之后還需對主成分的個數進行選定,可通過總方差解釋表中的累計貢獻率進行確定,即累計貢獻率≥85%因子的作為主成分被選定。用因子成分矩陣中的元素除以各元素對應的特征值再取二分之一次冪即可求出主成分中各指標的系數,主成分Fi根據式(3)求得:
(3)
式中:total是由總方差解釋表所確定的提取載荷因子平方和表下面各主成分累計值。
根據Fi,即可求得綜合成分評價公式,如式(4)所示:

(4)

徑向基函數神經網絡[10]分類在前饋神經網絡中,針對數據挖掘、函數逼近和模式分類等領域有著廣泛的應用。其網絡結構可分為輸入層、隱含層和輸出層三大部分。
其中輸入層神經元個數取決于輸入向量的維數,隱含層神經元節點數由實際情況決定,而節點數目是對網絡結構的復雜性影響最大的,輸入變量經輸入層到達隱含層,由隱含層節點進行非線性處理后連接至輸出層,在輸出層內對信息再進行線性疊加,輸出層的神經元數量由輸出向量的維數決定。
由此可以得出,RBF神經網絡即“線性-非線性-線性”運算的一種模型,其結構如圖1所示。

圖1 RBF神經網絡
假設RBF的隱含層節點數為k,輸入表示如下:
x=[x1,x2,…,xn]′
(5)
輸出表示為:

(6)
式中:ωi=[ω1,ω2,…,ωn]′表示隱含層和輸出層的權重,φi(x)表示輸入層和隱含層之間的關系,通過Gauss函數來反映:
(7)
式中:ci=[c1,c2,…,cn,]′表示各隱含層節點i的中心,σi表示隱含層節點徑向基函數的寬度,||·||為Euclid范數。
文中所用數據均來自前文所述實際工程案例。通過查閱文獻和實踐經驗,選取出6個原始影響因子,分別為:內摩擦角、坡度、土體重度、坡高、黏聚力、孔隙水壓力比。各影響因子之間存在一定的相關性,相關系數矩陣見表2。

表2 相關系數矩陣
由表2可知,土體重度和坡度、坡高的相關性較大,黏聚力和坡高的相關性較大,內摩擦角和孔隙水壓比的相關性較大。如果直接采用這些影響因子對邊坡安全系數進行計算,結果會產生共線性從而影響到預測效果。
對各影響因子的公因子方差比進行計算,結果見表3。

表3 公因子方差比
從表3可以看出,土體重度和坡高分別有0.096和0.077的信息未被提取,而黏聚力、內摩擦角、坡度和孔隙水壓比的絕大部分信息都已被提取。
對各影響因子進行主成分分析,相應的特征值和貢獻率見表4。

表4 主成分特征值和貢獻率
表4結果表明,前4個主成分的累計貢獻率已達95.277%,滿足主成分選取原則。同時,后兩個主成分的特征值很小,所以,選取前4個主成分代替初始6個影響因子信息。
以文中實際工程為例,分別選取80組和20組數據作為訓練樣本集和測試樣本集對模型進行訓練和驗證,表5中列出了部分樣本數據。

表5 樣本數據
為了展示利用PCA降維對于預測效果的影響,將PCA-RBF和單一RBF的預測結果進行對比,如圖2所示。

圖2 預測結果
從圖2可以看出,使用PCA對主成分進行提取后的邊坡穩定系數預測值比單獨使用RBF神經網絡的預測值更接近傳統計算值,預測效果更好。
為了進一步分析模型的預測性能,繪制出PCA-RBF和RBF的誤差曲線,如圖3所示。

圖3 誤差比較
由圖3可見,RBF的預測結果中最大誤差為0.2898,而PCA-RBF的預測結果中最大誤差為0.1973。同時,RBF的預測結果中誤差絕對值小于0.15的有9個,占總測試樣本數的45%,PCA-RBF的預測結果中誤差絕對值小于0.15的有16個,占總測試樣本數的80%,明顯高于RBF的預測效果。
(1)本文結合主成分分析PCA方法和RBF神經網絡建立了可用于水利工程邊坡穩定性分析的PCA-RBF模型,通過預測準確度和誤差值對模型預測效果進行了對比分析,結果說明了該模型具有較好的預測效果,可以用于水利工程邊坡穩定性分析。
(2)本文主要針對水利工程的邊坡數據進行研究,由于數據的局限性,后續還需通過其他類型邊坡數據對模型進行進一步驗證,以提高模型的適用性和泛化能力。