李 金
(鐵道第三勘察設計院集團有限公司,天津 300142)
隧道圍巖具有以下特點:1)由于隧道巖體經歷不同期次的構造作用以及淺、表生作用,巖體中存在大量軟弱結構面,從而使巖體具有各向異性、非均質性[3]。2)隧道巖體通常賦存于地應力、地下水等復雜地質環境中,不同地應力環境中巖體的力學響應不同,而地下水滲流場和巖體應力場二者耦合共同決定了巖體的復雜空間應力狀態。3)隧道圍巖在施工中要經歷開挖、爆破、卸荷、回填等工程處理,這些擾動使得圍巖的力學性質表現出更加復雜的時間和空間形態。
綜上所述,隧道圍巖本質上是一個非線性非平衡開放系統,表現為結構的無序、不穩定、不平衡以及時空的不可逆和非對稱,從而使隧道圍巖的工程地質性質及其力學行為具有不確定性,面臨“參數給不準”和“模型給不準”兩大瓶頸問題,而這是傳統的基于經驗的圍巖分級方法暫時無法解決的[4]。
面對隧道圍巖的高度復雜性和非線性特點,使得隧道圍巖穩定性評價的確定性理論在準確性和可靠性方面受到一定限制。而作為智能科學領域的支持向量機具有對高度非線性和復雜性系統無限逼近能力的優點,使得支持向量機可以成為隧道圍巖分級的強有力工具。
支持向量機網絡(Support Vector Mochine)的數學理論基礎是統計學習理論的VC維理論和結構風險最小原理,主要理論內容是1995年由Vpnik提出的[3]。其基本思想就是通過事先選擇好的某一個非線性變換,將輸入向量映射到高維特征空間中,在特征空間中構造一個最優分類超平面,使不同類別之間的隔離邊緣最大化,而這個分類超平面由支持向量決定。支持向量機網絡模型的最大優點是在有限樣本的情況下仍能得出精確的預測結果(見圖1)。

圖1 支持向量機分類模型示意圖
BP神經網絡和RBF神經網絡的理論基礎都是傳統統計學,只有在訓練樣本數據足夠多甚至趨近于無窮大時,經驗風險才有可能趨近于期望風險,但實際上訓練樣本數據都是有限的,有時甚至是不足的,所以BP神經網絡和RBF神經網絡經常出現過學習現象,模型的泛化能力不高。基于傳統統計學理論的學習機器,如BP神經網絡和RBF神經網絡,模型的泛化能力與樣本數目和研究系統的復雜性有關,而且始終存在學習精度和泛化能力之間的矛盾。
建立基于支持向量機網絡的隧道圍巖分級模型,首要一步是建立起圍巖分級指標體系并予以向量化。本文主要從隧道圍巖的巖塊強度、巖體結構、巖體完整性、巖體受地質構造影響程度、巖體結構面發育情況、控制性結構面與隧道軸線的關系以及地下水狀態等方面建立分級指標體系。
由于這些數據大部分都是定性的描述,為了建立定量模型的需要同時也要符合工程地質分析的習慣,需要對分級指標數據作定量化處理。具體操作方法是采用“1”和“0”的組合向量來分別表示某一工程地質屬性的有無,如極硬巖可用(0,0,0,0,1)表示,硬巖可用(0,0,0,1,0)表示,較軟巖(0,0,1,0,0)表示,軟巖(0,1,0,0,0)表示,極軟巖(1,0,0,0,0)表示,其他分類指標的定量化以此類推。
依據以上建立的圍巖分級指標體系,在充分調研文獻資料和隧道施工設計資料的基礎上,收集整理了93組具有代表性的隧道圍巖分級數據作為基于人工神經網絡的圍巖分級模型的樣本數據,向量化后為93組44維數據。
由于定性數據的測量誤差較大,所以選定83組數據作為訓練樣本建立分類模型,最后用10組數據作為預測樣本用來評價分級模型的分級準確性。
最后需要指出的是,《英文漢詁》是中國第一本完全橫排的書,也是最早使用西方標點符號的漢語制作,大大方便了學習者的閱讀。因此,全書視野之廣闊、內容之豐富、解釋之詳盡、語言之平和,讓讀者深切感受到此書解釋的不再是單純、枯燥的語法,而是語法與人類經驗的融合,深入貫徹了“答海內學者之憤悱”這一指導思想。
1)核函數類型的選擇。
支持向量機網絡的核函數類型一般有線性核函數、多項式核函數、徑向基核函數和Sigmoid核函數。研究表明核函數的選擇對支持向量機網絡的性能影響不大。但是選擇合適的核函數可以減小分類模型的計算量。綜合考慮核函數的核參數數目、特征空間的非線性變換以及維數災難,最終選取高斯徑向基核函數。

2)核參數的選擇。
高斯徑向基核函數的核參數主要有中心向量和寬度系數,支持向量機網絡模型要求解的支持向量就是中心向量,由算法自定選定;而寬度系數σ2表征神經元的感知閾,影響改變樣本特征空間的復雜程度,過大過小都不合適而且與懲罰因子C共同決定分類模型的結構風險,本文通過網格搜索尋找最優寬度系數和懲罰因子。
3)懲罰因子C的選擇。
懲罰因子C用來控制錯分樣本的懲罰程度,在錯分樣本的比例和模型算法復雜性二者之間尋求折中,其值大小最終影響分類預測模型的復雜程度。同樣,懲罰因子C的選擇也存在一個優化問題,過大過小皆不合適,而且與寬度系數σ2共同決定分類模型的結構風險,需要對二者同時協調優化,詳細過程見圖2。

圖2 支持向量機分類模型網格搜索參數對流程圖
4)數據的處理。
數據的處理包括對輸入數據的處理即前處理和輸出數據的處理即后處理。由于多分類支持向量機本是基于二分類支持向量機發展而成,所以本文支持向量機網絡模型的樣本數據采用1~5五個數字分別代表五個圍巖級別,而且不做歸一化處理。
基于以上所述,本文采用網格搜索法先粗搜后細搜,對寬度系數和合懲罰因子同時協調優化,最終選擇寬度系數和合懲罰因子的最優組合值作為分類模型的參數(見圖3),采用訓練樣本數據的分類正確率和預測樣本的分類正確率分別表征網絡模型的經驗誤差和泛化能力。

圖3 支持向量機搜索最佳參數示意圖
通過一系列優化設計,最終確定:支持向量機網絡的核函數采用高斯徑向基核函數,寬度系數取0.015 625,懲罰因子取181.019 3;樣本數據一共93個,訓練數據83個,仿真預測數據10個。最終預測結果見表1和圖4。

表1 支持向量機分級模型預測結果

圖4 支持向量機神經網絡分級模型預測結果與期望結果對比
通過上面的圍巖分級結果分析可知,支持向量機模型分級模型對10個預測樣本的分級正確率為90%,唯一一個誤判的是樣本89,將Ⅳ級誤判為Ⅲ級,但是誤差不超過一級;表明支持向量機模型基本能完全正確的進行圍巖分級。
支持向量機模型對圍巖分級結果能夠進行很好的預測,正確率達到90%,預測精度也基本滿意,收斂速度明顯變快。如何進一步對定量實測的工程地質指標進行建立分級模型是本文的不足,是以后需要進一步深入的工作。其次是擴散系數和懲罰系數需要通過不斷試算確定最優值,雖然采用了粗細網格結合的搜索方法,但是仍然增加了建模時間,如何改進參數的尋優方法也是接下來需要解決的問題。
[1] 馮夏庭.智能巖石力學導論[M].北京:科學出版社,2000.
[2] 杜時貴,周慶良.公路隧道圍巖定量分類系統研究設想和建議[J].西安公路交通大學學報,1996,16(4):32-37.
[3] 沈中其,關寶樹.鐵路隧道圍巖分級方法[M].成都:西南交通大學出版社,2000.
[4] Vapnik V.Statistical Learning Theory[M].Wiley,New Yorw,NY,1998.
[5] T Joachims.Making Large scale SVM Learning practical Proeeeding of advanced Kernel Methods Support Vector Learning[M].Cambridge,MA:MIT Press,1998.