王海波 黃林沖 林越翔 馬建軍



摘要:節理巖體力學性能研判不明會對地下工程建設安全造成極大隱患,規范中對含節理巖體的力學性能判斷多以粗略的定性分級為主,未給出明確的力學性能量化表征方法;而傳統回歸分析方法難以綜合考量節理形貌多維度特性,巖體力學性能預判精度低。為探尋含節理巖體力學性質智慧量化預測方法,從含單節理巖體入手,廣泛調研并收集了130組含單節理巖體單軸抗壓強度(UCS),并采用節理傾角θ、節理貫通率k量化節理形貌特征,以彈性模量E及抗壓強度σ表征巖石強度,開展基于機器學習的含單節理巖體力學性質智慧預測方法研究。為充分論證機器學習算法在巖體性能預測方面的適用性,引入神經網絡、隨機森林、支持向量機等多種機器學習算法,并采用分布統計、灰色關聯分析等手段遴選關鍵控制指標,進一步結合k折交叉驗證法訓練映射網絡,在此基礎上比較了多種機器學習算法及傳統回歸分析模型的預測性能。研究結果表明:① 統計分析與灰色關聯度分析可高效篩選指標組合;② k折交叉驗證和多指標評價能有效減少機器學習模型的偶然誤差;③ 整體上特征數量與預測效果成正比,其中支持向量機、隨機森林分別為全參量預測和局部參量預測的最佳表現模型;④ 機器學習模型比經驗、半經驗得出的傳統多元非線性回歸模型預測效果更佳,充分展現了其在巖石力學性能智慧判別與預測中的巨大潛力。
關鍵詞:節理巖體; 單軸抗壓強度; 統計分析; 灰色關聯分析; k折交叉驗證; 機器學習
中圖法分類號: U456.2
文獻標志碼: A
DOI:10.16232/j.cnki.1001-4179.2024.S1.040
0引 言
地下空間工程中常遇到由不規則節理、裂隙等結構組成的不連續介質體,即節理巖體。節理巖體中蘊含的節理結構是導致巖體穩定性下降的重要原因,嚴重影響隧道工程安全性,因此含不規則節理巖體強度一直是地下工程安全穩定性研究的重要課題[1-2]。宋英龍等[3]的試驗研究表明,節理特性是節理巖體力學性能的重要影響因素,因此準確量化節理特征對節理巖體宏觀力學性能的影響,對相關工程設計與建造至關重要。
受限于自然環境和巖體體積,節理巖石力學特性的相關實驗難以通過原位試驗完成,因此,目前現有的現場研究主要選擇與天然巖體屬性相似的類巖材料作為替代。例如陳超等[4]以云南紅砂巖為研究對象,通過水泥、砂、硅灰以及樹脂等制作了含不同節理傾角和貫通率的節理巖石試樣,將類巖材料誤差控制在10%以內,分析了節理傾角和貫通率對其單軸抗壓強度(UCS)的影響;張波等[5]利用山東大學自主研發的新型類巖石相似材料-改性橡膠粉-水泥砂漿來模擬含交叉裂隙的巖石,通過多次單軸壓縮實驗明晰了裂隙角度變化對節理巖石的影響機制;劉浩[6]以砂巖為對象,結合正交試驗實現了類巖材料的最佳配比,并針對節理傾角等特征開展單軸、三軸試驗研究。此外,也有部分研究通過鉆取天然巖石和裂紋切割制成含節理巖體試樣,開展力學測試。例如,Liu等[7]用巴西劈裂法構建含不同形貌節理的巖體試樣,分析其在單軸壓縮下的力學特性;Jin[8]等以天然柱狀玄武巖石為研究對象,對含有不同節理特征的巖石進行壓縮試驗,得出了節理對柱狀玄武巖的影響機制。
綜上,現有研究普遍認為節理幾何形貌、空間位置對巖體力學性能影響顯著,而巖石巖性則決定著巖體力學強度的根本基準。這兩類特征共同影響并決定著含節理巖體的綜合力學強度。為實現含節理巖體綜合力學強度的量化評判,學者們采用回歸分析等方法建立了一系列的力學預測模型。例如,楊科[9-10]等人用煤頂板巖石進行單軸壓縮實驗,分別建立線性函數、對數函數、多次函數等6種回歸模型研究單軸抗壓強度與彈性模量之間的關系。這類基于經驗、半經驗得出傳統多元回歸分析的力學強度預判,在預測精度及適用性方面依然存在顯著局限。相比之下,基于機器學習的巖體力學強度預測,憑借其強大的信息捕捉能力和計算能力,能夠準確描述高維變量之間的非線性關系,且具有極強的可移植性與普適性,近年來在巖土力學性能分析領域獲得了廣泛的關注與應用,并表現出了較好的性能[11]。
為突破傳統手段對含節理巖石力學性能判斷的局限,本文以單節理巖體為研究對象,從節理形貌與巖石物性入手,廣泛調研并收集了130組包含節理傾角θ、節理貫通率k、完整巖樣密度ρ、彈性模量E、抗壓強度σ等多個參量的樣本數據,開展基于機器學習的含單節理巖體力學性質智慧預測方法研究。為系統比較不同機器學習算法應用于含節理巖體力學性能預測的效果,本文引入了BP神經網絡、隨機森林、支持向量機等多種機器學習算法,并基于統計學與灰色關聯分析量化遴選,構建輸入參量組合,進而開展預測性能測試,以期為隧道及地下空間工程建設過程中的巖體性能量化及智慧估計提供技術參考與支撐。
1算法介紹
1.1BP神經網絡
BP神經網絡是典型的反饋神經網絡,具有誤差反向傳播和動態權重更新的特點[12]。它基于生物神經系統的結構構建,包括輸入層、隱藏層和輸出層。輸入信號經過不同的權重和閾值組合映射到下一層,并形成新的輸入信號。通過激活函數處理后,輸出結果單向傳輸到下一層,直到獲得最終輸出。
誤差反向傳播算法用于更新權重和閾值,利用梯度下降法計算每層誤差相對于權重和閾值的梯度向量,并沿著梯度向量的反方向進行調整[13-14],直到輸出結果達到預設精度或迭代次數。
1.2隨機森林
隨機森林算法是一種集成學習方法,旨在通過集體決策提高弱學習器的預測準確性[15]。它由回歸樹和隨機集合組成。回歸樹包括根節點、中間節點和葉節點,將輸入樣本根據特征進行分類,最終輸出對應的結果。
此算法的核心問題是選擇最佳特征分割點和輸出值,可使用二進制方法來多次確定。隨機森林通過特征和樣本的隨機化過程,保證了樹之間的部分相似性,從而減少欠擬合和過擬合,并提高集體決策的可靠性。
1.3支持向量機回歸
支持向量機回歸(SVR)是一種有監督的學習算法,通過優化結構和減小風險來提高模型的泛化能力,實現經驗風險和置信范圍的最小化[16]。與傳統線性回歸相比,SVR的計算方式有所不同。它在回歸線周圍設定閾值,形成一個區域,如圖1所示。通過將區域內樣本點誤差定義為0,并計算區域外的損失,將回歸問題轉化為最優化函數問題[17]。具體的簡化和求解過程不再贅述,最優化目標函數如公式(1)所示:
minw,b=12‖W‖2+Cni=1lεfxi,yis.t.0≤yiwTxi+b≤1(1)
式中:w為超平面的n維法向量,決定超平面的方向;b為偏置項,代表超平面到坐標原點的距離;C為懲罰變量,l為損失函數。為了更容易得出回歸方程,通過引入核函數,將低維樣本空間映射到高維特征空間用以更快速地尋找超平面[18],如圖1所示。
對于樣本容量為n的問題,計算維度往往是n2,n3或者更高,顯然,在面對小樣本范圍和不簡單的數據時,支持向量機回歸模型往往可以兼顧計算精度和計算效率。
2樣本數據
2.1數據源
本文使用的數據集來源于已發表的各類學術論文,以核心期刊論文和學位論文為主。根據目前各類已有的實驗研究數據情況[19-21],諸多因素都對含單節理巖石的單軸抗壓強度有顯著影響,且面對不同的對象影響程度有所差異。數據庫中所有輸入及輸出參數的直方圖以及變量之間的散點如圖2所示。為了有效驗證和分析各變量對UCS的影響程度,本文收集的數據集主要囊括巖石節理特征(JRC、傾角、貫通率等)和完整巖石特性(密度、泊松比、彈性模量等)兩部分。經過篩選和整理后,最終選取了一個關鍵輸出指標,即單軸抗壓強度(UCS);5個關鍵輸入參數,分別為節理傾角θ、節理貫通率k、完整巖樣的密度ρ、彈性模量E、抗壓強度σ,一共130組數據。由圖2可知:巖石節理特征相互獨立,且與巖石巖性關系極不顯著,而表征巖性的各指標之間相關性顯著。故據此可將節理特征可視為獨立變量,并遴選巖性參數指標,研究在不同特征輸入參數組合下,對巖體力學性能的預測效果。
2.2灰色關聯分析
灰色關聯分析(grey relation analysis)在工程領域被廣泛用于評估因素之間的同步變化程度[22-23]。為消除不同量級對模型的影響,提高計算效率,首先對全特征的樣本數據進行標準化處理,將其轉化為無量綱的數據,標準化公式如下:
xnorm=x′-xminxmax-xmin(2)
式中:xnorm為標準化計算結果,x′為特征序列中任意值,xmax和xmin分別為特征序列里的最大值和最小值。基于上述標準化數據構建關聯矩陣,然后計算各個因素與參考項之間的關聯度,計算公式如下:
G(xr(j),xi(j))=miniminjxr(j)-xi(j)+δmaximaxjxr(j)-xi(j)xr(j)-xi(j)+δmaximaxjxr(j)-xi(j)(3)
式中:G(xr(j),xi(j))代表第i個特征和參考特征序列中第j個數據之間的灰色相關系數,δ為取值范圍(0,1)之間的調節系數。任意兩個特征序列之間的灰色相關系數計算公式如下:
G(xr,xi)=1nnj=1G(xr(j),xi(j))(4)
計算結果如圖3所示。
結合數據分布規律直方圖和灰色關聯分析熱圖3結果可見,隨機變量之間的可作定量描述,由于節理特征在實驗中的賦值完全取決于研究人員,主觀性較強,因此在節理特征部分可能存在規律性較強的協同變化,這在圖3中也有體現,例如節理傾角和節理貫通率的相關系數偏大、節理的貫通率和彈性模量的關聯性偏小等。因此,在此條件下的節理特征之間、節理特征和巖樣特征之間的關聯數據參考程度不強,所以在考慮特征分組依據時,應重點關注單變量特征與因變量結果之間的關聯程度,同時,為研究不同參量以及不同參量數量對自變量的影響,對組內自變量與因變量的灰色關聯系數取平均值,結果見表1。
根據表1,本文分別遴選了平均值較大的4種不同的特征參數組合,即:θ-k-ρ-E-σ、θ-k-ρ-E、θ-k-ρ-σ、θ-k-ρ,開展基于機器學習的巖體力學性能強度預測實驗。
3實驗模型
3.1k折交叉驗證
本文使用的數據集來源于多個不同研究實驗,為減小實驗誤差,提高機器學習模型的的性能和泛化能力,通過k折交叉驗證方法[24](本次實驗取k=5),將原始數據集隨機分成5個大小相等的子交叉驗證集,其中4個子交叉驗證集用于模型訓練,剩下的1個子交叉驗證集用于模型測試。將上述過程重復5次,最終會得到5個獨立的模型性能評估結果。k折交叉驗證可以更準確地評估機器學習模型在未知數據上的表現,實現對模型性能的可信度評估。
3.2模型框架
圖4展示了本文建立節理巖石的單軸抗壓強度(UCS)的預測模型構建流程圖。主要分為4個階段:數據預處理、k折交叉驗證、訓練和測試以及結果分析評價過程。
數據預處理工作包括收集因變量UCS及主要影響因素的數據集,建立輸入和輸出參數數據庫,開展灰色關聯分析,初步確立各變量的相關程度,并且以此為根據對特征進行劃分得到多個特征集。第二階段通過k折交叉驗證方法將上述每一個特征集等量劃分成80%的訓練集和20%的測試集進行交叉驗證,訓練和測試階段用到了多個預測模型,將上述劃分后的訓練集和測試集編號并作為輸入,最后輸出每個模型的結果進行比較,進一步評價各模型的適用范圍。
4實驗結果分析
輸入變量的選擇對模型的性能至關重要,根據灰色關聯程度分析,獨立的特征變量對節理巖石單軸抗壓強度影響程度各不相同,結合節理特征對于節理巖體單軸抗壓強度影響的研究方向,因此本次實驗分別選擇全特征組和局部特征組合。
4.1評價指標
本文選用均方根誤差(RMSE)、平均絕對誤差(MAE)和平均絕對百分比誤差(MAPE)3個常用指標來評估機器學習模型的性能[25]。3個指標各有優劣,可用來對同一個樣本做對比評價。RMSE和MAE直接反映了預測誤差,且對異常值敏感,尤其是RMSE的平方項對于離群點給予了更多的懲罰。
即使少量異常值也可能導致RMSE值偏大,相比之下,MAPE是一個與樣本尺度無關的指標,百分比誤差消除了數據單位影響,MAPE的不足之處在于絕對值項使得其對正誤差懲罰更小,同時輸出值y趨近于0時,MAPE趨于無窮大。綜上所述,評價指標各有優劣,RMSE、MAE和MAPE的組合可以有效地評估模型性能,3個指標的表達式如下:
RMSE=ni=1y-yi2n(5)
MAE=1nni=1y-yi(6)
MAPE=1nni=1y-yiy(7)
4.2模型評價
主要的超參數設置如表2所列,本次實驗選用了3種復雜程度和超參數數量接近,并且選擇具有代表性的機器學習模型進行試驗。
圖5~7展示了算法模型-特征組-交叉驗證的共計60次測試結果。從圖中折線的變化趨勢可知,不同交叉驗證集的結果之間存在明顯的差異,例如基于第二驗證集的實驗誤差均存在偏大現象,對比單次隨機抽樣方法,k折交叉驗證方法能夠更為全面地展示數據集的特點,同時極大程度規避了單次試驗誘發的偶然誤差影響,提高了對預測精度評判的客觀性。
圖5和圖6除了在具體數值上存在差異以外,二者整體的變化規律趨于一致,結合公式(5)和公式(6)的函數性質,不難解釋二者變化相似的特點。值得注意的是,部分數據點表現在這兩幅圖中相反,如第4次交叉驗證實驗中,SVR模型測試的θ,k,ρ特征組和BP神經網絡模型測試的θ,k,ρ,E特征組等,再次暴露了單一模型和單次實驗存在的局限性,極容易產生錯誤甚至完全相反的評價結果。
因此,需要對實驗結果進行多維度的評價分析,通過綜合多參數評價結果判定模型預測性能,結果如表3所列。
對于任意模型,誤差之和越小,模型預測準確率越高。由表中數據可知,通過支持向量回歸模型測試的全特征樣本實現了最小平均誤差,BP神經網絡模型測試的θ,k,ρ,E特征組預測效果最差。特征組包含特征參數越多,輸入參數與輸出參數之間的映射關系重構越充分,預測效果越好。四變量參數組合中,θ,k,ρ,σ特征組的預測效果最優。
對于機器學習模型來說,雖然隨機森林模型未達到最佳的預測性能,但是對每組特征樣本的測試,其結果都表現出較為穩定的誤差控制,模型平均誤差最小。尤其是在輸入參數較少的情況下,隨機森林模型的誤差穩定,表現出了優異的泛化能力。此外,隨機森林模型的預測結果最接近于灰色關聯分析結果。因此,隨機森林模型可以認為是本次測試實驗的最佳模型。
4.3與經驗、半經驗模型比較
文獻[24-25]利用SPSS軟件結合多種類型函數和實驗數據,嘗試構建節理巖石強度的經驗模型。結果表明經驗、半經驗模型在預測精度方面存在一定的局限性。為了進一步驗證機器學習模型的性能,隨機選擇一個測試樣本,對于相同的訓練集,利用SPSS軟件擬合多元非線性函數,表達式如下:
y=0.029x1-20.788x2+5.449x3+0.055x4+
0.535x5+0.05x1-1.48+2.1x247.829+
1.66e-9.926(x3+x4)x5-1.358
(8)
將上述公式測試結果與機器學習模型擬合結果進行比較,結果如圖8所示。
由圖8可知,機器學習模型之間的預測表現各不相同,但是其結果均優于傳統的多元非線性模型,可見機器學習模型具備獨特的自動提取變量特性和強大的建模能力,而傳統分析模型僅針對類似問題可給出良好的解決方案,在處理映射關系更復雜的樣本時,準確性會明顯下降。
5結 論
本文以地下空間建設過程中常見節理巖體為對象,對其抗壓特性的研究現狀進行了系統調研,整理收集了包含節理特征和巖樣特征的現場實驗數據,并且對這些數據進行了分布統計分析和灰色關聯分析的預處理工作,對特征進行了劃分。然后結合支持向量回歸、隨機森林和BP神經網絡3種機器學習模型對劃分的特征組樣本分析和預測,并且與經驗、半經驗模型進行比較。主要結論有:
(1) 聯合統計分析與灰色關聯度分析可高效量化指標組合,有效篩選得到具有代表性的關鍵控制指標組合。
(2) k折交叉驗證有效提高了模型泛化能力,避免了樣本特性導致的實驗誤差,多誤差綜合評價從多個維度科學地減小機器學習模型預測的偶然誤差,確保對模型性能得出準確、客觀評價。
(3) 整體上,輸入參量越多,含節理巖體性能預測效果越好;在采用全參量預測時,支持向量機算法得到的預測結果誤差最小,而在采用局部參量進行預測時,隨機森林算法的泛化能力最強,預測精度最為穩定,反觀支持向量機算法及人工神經網絡算法誤差均出現了明顯的增長。
(4) 相較于經驗、半經驗推導出的簡單多元非線性回歸模型,機器學習模型通過不斷學習和更新,在適應性、泛化能力、預測能力、可解釋性方面均體現了更好的效果,充分展現了機器學習算法在巖石力學性能智慧判別與預測的巨大潛力。
參考文獻:
[1]楊明明.高應力下不同節理傾角的隧道穩定性影響研究[J].武漢交通職業學院學報,2022,24(4):130-135.
[2]趙金銳.層狀節理對深埋隧洞巖爆的影響[D].西安:西安理工大學,2022.
[3]宋英龍,夏才初,唐志成,等.不同接觸狀態下粗糙節理剪切強度性質的顆粒流數值模擬和試驗驗證[J].巖石力學與工程學報,2013,32(10):2028-2035.
[4]陳超,王偉,許高杰,等.考慮不同節理傾角和貫通率的類巖材料單軸壓縮試驗[J].河海大學學報(自然科學版),2022,50(5):124-130,146.
[5]張波,李術才,楊學英,等.含交叉裂隙節理巖體單軸壓縮破壞機制研究[J].巖土力學,2014,35(7):1863-1870.
[6]劉浩.類砂巖材料單節理巖體卸荷力學特性研究[D].北京:北京交通大學,2020.
[7]LIU X G,ZHU W C,ZHANG P H,et al.Failure in rock with intersecting rough joints under uniaxial compression[J].International Journal of Rock Mechanics and Mining Sciences,2021,146:104832.
[8]JIN C,LI S,LIU J.Anisotropic mechanical behaviors of columnar jointed basalt under compression[J].Bulletin of Engineering Geology and the Environment,2018,77(1):317-330.
[9]楊科,袁亮,祁連光,等.淮南礦區11-2煤頂板巖石單軸抗壓強度預測模型構建[J].巖石力學與工程學報,2013,32(10):1991-1998.
[10]ALADEJARE A E.Evaluation of empirical estimation of uniaxial compressive strength of rock using mea-surements from index and physical tests[J].Journal of Rock Mechanics and Geotechnical Engineering,2020,12(2):256-268.
[11]李磊,陳向東,丁星,等.基于圖像處理與機器學習的巖土濕度檢測系統[J].傳感器與微系統,2020,39(6):83-85,88.
[12]WANG Z H,CHEN Q Q,WANG Z Y,et al.The investigation into the failure criteria of concrete based on the BP neural network[J].Engineering Fracture Mechanics,2022,275:108835.
[13]任建平,宋仁國,陳小明,等.基于BP神經網絡梯度下降算法的7003鋁合金熱處理工藝優化[J].宇航材料工藝,2009,39(4):6-9,57.
[14]CHENG Z L,ZHOU W H,GARG A.Genetic programming model for estimating soil suction in shallow soil layers in the vicinity of a tree[J].Engineering Geoology,2020,268:105506.
[15]GAL Y,GHAHRAMANI Z.Dropout as a Bayesian approximation:representing model uncertainty in deep learning[C]∥International Conference on Machine Learning,2016.
[16]DANIEL V C,JAVIER A,MERCEDES L.Comparing two SVM models through different metrics based on the confusion matrix[J].Computers & Operations Research,2023,152:0305-0548.
[17]LUIS C P,MARTN C,ALFONSO R D,et al.A novel formulation of orthogonal polynomial kernel functions for SVM classifiers:The Gegenbauer family[J].Pattern Recognition,2018,84:211-215.
[18]王旭.不同傾斜角度及貫通度節理類巖石力學和蠕變特性研究[D].淮南:安徽理工大學,2021.
[19]汪中林.單軸壓縮下單裂隙類巖石力學特性和破壞規律研究[D].荊州:長江大學,2018.
[20]田威,余宸,王肖輝,等.3D打印裂隙巖體動態力學性能及能量耗散規律初探[J].巖石力學與工程學報,2022,41(3):446-456.
[21]麥加里.實用軟件度量[M].北京:機械工業出版社,2003.
[22]張濤,平西建.基于差分直方圖實現LSB信息偽裝的可靠檢測[J].軟件學報,2004,15(1):151-159.
[23]萬俊杰,任麗佳,單鴻濤,等.基于灰色關聯分析與ISSA-LSSVM的配電網可靠性預測[J].控制工程,2023,30(5):856-864.
[24]STONE M.Cross-validatory choice and assessment of statistical predictions[J].Journal of the Royal Statistical Society,Series B(Methodological),1974,36(2):119-132.
[25]HYNDMAN R J,KOEHLE A B.Another look at measures of forecast accuracy[J].International Journal of Forecasting,2006,22(4):679-688.
(編輯:鄭 毅)