







摘要:邊坡穩定性智能預測是邊坡治理和邊坡結構設計的重要基礎。邊坡穩定性評估具有復雜性和非線性,各種智能預測模型通常具有更好的性能,為研究邊坡穩定性問題提供了新的方向。構建了基于正弦余弦算法(SCA)優化梯度提升樹(GBDT)的邊坡穩定性預測混合模型。收集436個邊坡案例來建立數據庫,包含6個參數(邊坡高度H、邊坡角β、容重γ、內聚力C、內摩擦角φ、孔隙水壓系數ru)和邊坡狀態數據。80 %數據劃分為訓練集,20 %數據為測試集進行測試。通過結合五重交叉驗證和正弦余弦算法來調整模型的超參數。根據準確率、精確率、召回率、F1分數、AUC來評估所提出方法的性能。同時,研究對比了5個經典分類機器學習模型,以評估模型預測邊坡穩定性的性能和適用性。結果表明:SCA能顯著提高GBDT模型的性能,SCA-GBDT模型的準確率、精確率、召回率、F1分數、AUC分別為0.886 0,0.877,0.915,0.896和0.955。通過SHAP算法對模型特征重要性分析,發現內摩擦角對預測結果的影響最顯著。SCA-GBDT模型為預測邊坡穩定性提供了一種可靠的方法,可以應用于邊坡工程實踐。
關鍵詞:邊坡穩定性;預測模型;機器學習;正弦余弦算法;梯度提升樹;內摩擦角
[中圖分類號:TD167 文章編號:1001-1277(2025)03-0059-07 文獻標志碼:A doi:10.11792/hj20250311 ]
引言
邊坡失穩是一個全球性的工程地質問題,是除地震和火山外自然界三大地質問題之一[1]。許多巖土工程,如露天采礦、道路交通、水利水電等活動改變了地表結構,形成了大量邊坡[2]。這些邊坡在開挖擾動、爆破振動、孔隙水壓和地震活動的動載荷作用下,極易發生滑坡失穩等地質災害,對生命財產安全造成巨大威脅。因此,為了降低邊坡失穩風險,科學準確地評估邊坡穩定性對工程設計和災害防治具有重要意義[3]。由于邊坡系統的復雜性,其受多種參數的影響,表現出顯著的非線性和不確定性,邊坡穩定性分析方法一直是巖土工程中的研究熱點和難點。
現有邊坡穩定性分析方法通常分兩類,傳統模型和機器學習(ML)模型。傳統邊坡穩定性預測方法包括現場監測技術、理論分析方法、數值模擬方法[4]等。目前,許多邊坡變形監測技術,包括位移傳感器[5]、振動測量[6]、激光掃描[7]等已被應用于邊坡變形的現場監測,以提供預警信號。這些技術具有相對較高的預測精度,可以實時獲取邊坡變形數據,從而為邊坡穩定性評估和預警決策提供重要依據,但安裝過程復雜,成本極高。理論分析方法是從力學角度提出的。許多理論分析方法已被用于邊坡穩定性分析[8],如極限平衡法(LEM)、強度折減法(SRM)等。雖然理論分析方法簡單,但由于公式和假設的簡化,不適用于條件復雜的邊坡。傳統方法還包括數值模擬方法,有限元法、邊界元法、離散元法等方法在邊坡穩定性分析中得到了廣泛應用[9]。雖然數值模擬方法操作方便,但精度在很大程度上取決于本構模型和力學參數。邊坡作為一個復雜系統,具有高維性、非線性、不確定性、動態演變性和協同性等特點,導致穩定性分析具有一定的復雜性和難度。因此,傳統方法的應用顯現出很大的局限性,分析結果的可靠度不高。隨著邊坡案例的積累,研究人員使用機器學習算法開發邊坡穩定性預測模型[10-13],主要有2種類型的預測輸出:安全系數(FOS)和穩定性狀態。機器學習算法在邊坡穩定性預測方面表現良好,然而,需要大量的邊坡穩定性案例來提高其可信度[14]。
本文提出一種正弦余弦算法(Sine Cosine Algorithm,SCA)優化梯度提升樹(Gradient Boosting Decision Tree,GBDT)預測模型進行邊坡穩定性預測。構建了一個包含436個邊坡案例的數據庫并進行特征分析,選擇6個特征參數(邊坡高度H、邊坡角β、容重γ、內聚力C、內摩擦角φ、孔隙水壓系數ru)作為模型輸入,邊坡穩定性作為模型輸出。基于五重交叉驗證,使用SCA優化GBDT模型對邊坡穩定性數據進行訓練和測試。將SCA-GBDT模型與5種常規模型進行性能對比;通過特征重要性分析來評估特征重要性權重。本研究建立的方法為邊坡穩定性預測提供了新思路。
1算法原理
1.1梯度提升樹
GBDT是一種廣泛應用于機器學習領域的集成學習算法[15],由FRIEDMAN在2001年提出,已成為機器學習領域最具影響力的算法之一,尤其在結構化數據上具有顯著優勢。它通過構建和組合多個決策樹模型來提高預測性能。GBDT通過逐步迭代的方式,構建一組弱學習器(通常為決策樹),每次迭代時擬合當前模型殘差的負梯度,從而逐步減少預測誤差。其在分類、回歸任務,尤其是結構化數據上的表現尤為突出,已成為許多機器學習任務中的基準模型。
GBDT的基本步驟為:①給予模型一定的訓練集作為訓練數據樣本。②構建基于訓練集的初始化模型,該初始化模型的輸出通常選擇為使損失函數最小化的常數。對于回歸任務,初始化值通常是目標變量的均值;對于分類任務,初始化值則是目標類別的先驗概率。③在第 m 輪迭代中,GBDT通過計算當前模型的負梯度來捕捉模型的誤差信息。④在第 m 輪迭代中,GBDT通過訓練一個新的決策樹來擬合上一步計算得到的殘差。⑤在擬合新的學習器后,GBDT將當前輪次的弱學習器與之前的模型進行加權組合,形成新的模型。⑥計算殘差、擬合弱學習器、更新模型反復進行,直到模型達到預設的停止條件,如指定的迭代次數M或誤差下降到某一閾值。⑦生成一個強大的集成模型,并對數據進行預測。
1.2正弦余弦算法
SCA由MIRJALILI[16]于2016年提出,是一種基于三角函數(正弦和余弦)尋優機制的元啟發式全局優化算法。SCA算法受到自然界中正弦波和余弦波的啟發,通過模擬這些波動的特性,來平衡全局探索與局部開發的能力。
SCA算法的核心思想是利用正弦波和余弦波在搜索空間中引導解的更新。具體步驟如下:
1)初始化。在n維空間中,初始化N個候選解的位置:
3)幅度與頻率的控制。頻率B可以是一個常數,默認值通常為1,表示波動的頻率。
幅度C通常設置為一個遞減的值,以便隨著迭代次數的增加,搜索范圍逐漸縮小。其可以表示為:
4)終止條件。當達到最大迭代次數或滿足其他設定的終止準則時,算法迭代終止。
2邊坡穩定性預測混合模型的開發
2.1數據庫收集與分析
邊坡穩定性受地形地貌、地質構造、地層巖性、水文條件及人為活動等多種內外部因素的綜合影響。在重力和孔隙水壓的作用下,邊坡潛在滑動面的最大剪切力大于抗剪強度時,發生局部邊坡失穩,失穩邊坡結構示意圖如圖1所示。根據工程案例和理論分析,主要影響因素可歸納為邊坡的物理力學參數、幾何結構參數和水文條件、邊坡狀態。本研究選擇了6個關鍵因素作為預測模型的輸入,包括邊坡高度(H)、邊坡角(β)、容重(γ)、內聚力(C)、內摩擦角(φ)、孔隙水壓系數(ru),并以邊坡穩定性作為模型輸出。數據來源于文獻[17-20],總共包括436個邊坡案例。這些邊坡案例不僅包含來源于中國、美國、加拿大、澳大利亞等的邊坡工程案例,還包含部分有限元仿真案例。數據庫已廣泛應用于邊坡穩定性的預測工作,其描述性統計結果如表1所示。
繪制了各特征之間相關性和分布情況的矩陣散點分布圖(如圖2所示),定量分析特征之間的相關關系。圖2中每個單元表示2個變量之間的關系。根據邊坡狀態分為2組數據,用不同顏色(藍色和紅色)表示。同時,圖2中顯示了不同邊坡狀態下,相關系數的差異。其中,對角線上的是各個變量的分布直方圖,2組邊坡數據有相似分布。在每個單元格中顯示了2個特征之間的線性相關系數,其代表2個變量間線性關系的強度,取值為 -1~1,數值接近 1 或 -1 表示強相關性,接近 0 表示無線性相關。每個散點分布圖中還包含1條趨勢線,表示2個變量間的線性回歸關系,整體斜率較小,表明這些變量間相關性較低。變量間的相關性大多為 0.1~0.3,可認為大部分變量是弱相關或中等相關,即這些特征之間相對獨立。因此,有必要結合多種特征對邊坡穩定性進行綜合預測。
2.2SCA-GBDT模型
本研究依托Pycharm軟件與多個Python開源庫進行,基于包含436個邊坡案例的數據庫,使用GBDT模型進行初步建模;基于五重交叉驗證通過SCA優化GBDT模型的超參數,包括決策樹數目(N_estimators)、學習率(learning_rate)、決策樹最大深度(max_depth)、最小分離樣本數(min_samples_split);將五重交叉驗證后的平均準確率作為適應度函數,在訓練集上進行多次迭代優化,獲得最優超參數組合;將最優SCA-GBDT模型對測試集進行驗證并評估。模型構建和分析的各個步驟都確保了建立的模型既科學又系統,從而能夠為實際的邊坡穩定性預測提供有力支持。SCA-GBDT模型構建流程如圖3所示。具體步驟為:
1)收集包含436個邊坡案例的數據庫,對數據庫進行描述性統計和歸一化處理。
2)將數據庫隨機劃分為訓練集(80 %)和測試集(20 %)。
3)通過GBDT模型對訓練集進行初始建模。
4)構建SCA模型,設置粒子群數量,并確定GBDT模型待優化參數及參數范圍。
5)SCA模型進行迭代搜索,一重交叉驗證后的平均準確率作為目標函數,記錄每次迭代搜索的目標函數值。
6)滿足終止迭代條件時,獲得最優SCA-GBDT模型的超參數組合。
7)通過混淆矩陣以多種指標評估SCA-GBDT模型的性能,并將SCA-GBDT模型與多種模型的性能進行對比。
8)通過SHAP(SHapley Additive exPlanation,SHAP)算法分析模型特征的重要性排序。
2.3模型評估
本研究使用了4個評估指標:準確率(A)、精確率(P)、召回率(R)和F1分數(F1-Score),來綜合評估SCA-GBDT模型的性能。這些指標都是正向的,數值越高,表示模型性能越好。
準確率為正確分類的實例與實例總數之比,表示為:
除上述4個指標外,ROC曲線下面積(AUC)是評估分類模型的另一個廣泛使用的指標。ROC曲線從真陽性率(TPR)和假陽性率(FPR)都為零的點開始,在點(1,1)結束。模型的ROC曲線越接近圖的左上角,表明AUC越高,模型性能越好。因此,AUC是反映分類器整體有效性的重要指標。
3結果與討論
3.1模型訓練結果
為獲得最優模型,不僅需要調整GBDT的超參數,還需要考慮SCA的參數,即種群規模。因此,SCA的種群規模分別設置為10,20,35,50,65,80和100,對GBDT進行8次訓練。每次訓練設置100次迭代。模型迭代訓練過程適應度值變化如圖5所示。
從圖5可以看出:不同種群規模的SCA優化的GBDT模型經過100次迭代后都是穩定的,收斂速度快,并且是一致的,這證明了智能算法的優越性。同時,不同模型收斂曲線的相似性反映了本研究提出模型的可靠性。通過對模型收斂曲線進行比較,證明了該混合模型在評估邊坡穩定性方面具有有效性和優越性。此外,使用智能算法可以有效選擇超參數,從而提高模型的泛化能力。這些發現強調了在邊坡穩定性評估中使用混合模型和智能算法的重要性。SCA-GBDT模型在種群規模為35時,模型適應度函數值最先穩定且最小。因此,本研究中SCA-GBDT模型的種群規模設置為35。利用確定的種群規模進行模型訓練,并進一步調整GBDT模型的超參數,包括N_estimators、learning_rate、max_depth、min_samples_split。在模型訓練過程中,使用五重交叉驗證來提高其泛化性能。SCA-GBDT模型的最佳種群規模及輸出的GBDT模型最佳參數組合如表2所示。
3.2不同模型對比分析
本研究的主要目的是提出SCA-GBDT模型,并確定評估邊坡穩定性的最佳模型。引入一個未優化的GBDT模型和4種經典分類模型(XGboost、Adaboost、RF、SVM)進行對比,以證明SCA算法在超參數選擇方面的潛力及本研究提出模型的優越性。在SCA-GBDT模型中,使用預定義的最佳參數組合進行訓練,而其他經典模型則通過網格搜索算法確定最佳參數。為了比較不同模型的性能,本研究使用了五重交叉驗證,并在測試集上測試了模型的性能。5個經典模型和SCA-GBDT模型的結果如表3所示。從表3可以看出:SCA-GBDT模型在測試階段的表現均優于其他模型,為邊坡穩定性評估提供了強有力的工具。
3.3混淆矩陣
混淆矩陣通過顯示預測結果和實際情況之間的差異來衡量模型的準確性。本研究使用混淆矩陣分析了各種模型的性能,對角矩陣值表示預測準確數量。不同模型的混淆矩陣如圖7所示。從圖7可以看出:SCA-GBDT模型的混淆矩陣顯示出相對較多的對角矩陣值,表明預測值與真實值存在較高的一致性。混淆矩陣的分析進一步驗證了SCA-GBDT模型在評估邊坡穩定性方面的高性能和可靠性。綜合6個模型的評價指標,SCA-GBDT模型是邊坡穩定性預測的最佳模型。
3.4特征重要性分析
SHAP是一種基于博弈論的特征重要性解釋方法[21]。其結合了Shapley值和加性特征模型,為機器學習模型提供一致且解釋性強的特征重要性評估。這對優化模型、減少特征和深入了解數據集的突出特征具有重要意義。使用SHAP算法分析了SCA-GBDT模型中特征的重要性,結果如圖8所示。從圖8可以看出:參數φ的重要性得分最高(4.310 3),參數C、β、γ、H和ru的重要性得分分別為2.883 1,2.368 3,1.155 0,1.120 7和0.498 3,結果強調了參數φ在邊坡未來,需進一步研究各種參數組合對模型的影響,這可以減少工作量,節省時間,并在擴展數據庫時最大限度地降低經濟成本。這些信息將有助于準確預測邊坡穩定性,提高模型魯棒性,從而防止過擬合并確保可靠的預測。
4結論
1)邊坡失穩的智能預測和預警對于減少滑坡和防災減災至關重要。本文基于正弦余弦算法優化梯度提升樹的邊坡穩定性預測混合模型的研究中,通過構建一個包含436個邊坡案例的數據庫,成功應用機器學習技術來提高邊坡穩定性評估的準確性和可靠性。
2)研究結果表明,SCA-GBDT模型在多個評估指標上均優于經典模型(GBDT、XGboost、Adaboost、RF、SVM),顯示出其在邊坡工程實踐中的廣泛應用潛力。SCA-GBDT模型測試集的準確率、精確率、召回率和F1-Score值分別為0.886 0,0.877,0.915和0.896,AUC為0.955。
3)研究強調了不同特征參數在模型構建中的關鍵作用,φ的特征重要性最高;其他參數C、β、γ、H、ru也對SCA-GBDT模型的構建具有顯著影響。這為后續研究提供了方向,即在數據收集和模型優化過程中,需重點關注這些關鍵特征。
4)未來的研究可以進一步探索不同參數組合對模型性能的影響,以優化模型的魯棒性和泛化能力。此外,擴展數據庫的多樣性和規模也將有助于提高模型的適用性和準確性。
5)SCA-GBDT模型為邊坡穩定性預測提供了一種創新且有效的方法,具有重要的理論價值和良好的實際應用前景,符合國家對工程安全和科技創新的重視。
[參考文獻]
[1]羅戰友,楊曉軍,龔曉南.基于支持向量機的邊坡穩定性預測模型[J].巖石力學與工程學報,2005,24(1):144-148.
[2]劉春,杜俊生,王敬堃.基于灰色關聯分析理論的邊坡穩定性預測[J].地下空間與工程學報,2017,13(5):1 424-1 430.
[3]LAWAL A I,HOSSEINI S,KIM M,et al.Prediction of factor of safety of slopes using stochastically modified ANN and classical methods:A rigorous statistical model selection approach[J].Natural Hazards,2023,120(2):2 035-2 056.
[4]SHEN Y X,WU S C,CHENG H Y,et al.Uncertainty analysis method of slope safety factor based on quantile?based ensemble learning[J].Bulletin of Engineering Geology and the Environment,2023,82(3):1435.
[5]張金鐘,孫文敬,侯俊,等.測量機器人地表位移監測系統在露天礦邊坡監測的應用[J].黃金,2017,38(4):66-70.
[6]胡光球,璩世杰,梁新民.高程放大效應對露天采場爆破震動衰減的影響研究[J].黃金,2015,36(7):28-32.
[7]肖歡,劉銀,何杰華,等.萬硐山采區邊坡監測方法的選擇及應用[J].黃金,2018,39(12):67-70.
[8]SALMASI F,JAFARI F.A simple direct method for prediction of safety factor of homogeneous finite slopes[J].Geotechnical and Geological Engineering,2019,37(5):3 949-3 959.
[9]吳子牛,王莎,盧欣奇.基于C#語言的ABAQUS二次開發及其在邊坡穩定性計算中的應用[J].黃金,2022,43(2):61-64.
[10]鄭志成,徐衛亞,徐飛,等.基于混合核函數PSO-LSSVM的邊坡變形預測[J].巖土力學,2012,33(5):1 421-1 426.
[11]段志宏,伍林林.基于灰色理論與BP神經網絡的邊坡變形預測模型研究[J].湖南交通科技,2024,50(3):57-60.
[12]DENG C,HU H X,ZHANG T L,et al.Rock slope stability analysis and charts based on hybrid online sequential extreme learning machine model[J].Earth Science Informatics,2020,13(3):729-746.
[13]LIN Y,ZHOU K P,LI J L.Prediction of slope stability using four supervised learning methods[J].IEEE Access,2018,6:31 169-31 179.
[14]AHMAD F,TANG X W,HU J L,et al.Improved prediction of slope stability under static and dynamic conditions using tree?based models[J].Computer Modeling in Engineering amp; Sciences,2023,137(1):455-487.
[15]HANCOCK J T,KHOSHGOFTAAR T M.CatBoost for big data:An interdisciplinary review[J].Journal of Big Data,2020,7(1):94.
[16]MIRJALILI S.SCA:A Sine Cosine Algorithm for solving optimization problems[J].Knowledge?Based Systems,2016,96:120-133.
[17]祝傳兵.邊坡穩定性分析與評價 [D].昆明:昆明理工大學,2005.
[18]KARDANI N,ZHOU A N,NAZEM M,et al.Improved prediction of slope stability using a hybrid stacking ensemble method based on finite element analysis and field data[J].Journal of Rock Mechanics and Geotechnical Engineering,2021,13(1):188-201.
[19]ZHOU J,LI E M,YANG S,et al.Slope stability prediction for circular mode failure using gradient boosting machine approach based on an updated database of case histories[J].Safety Science,2019,118:505-518.
[20]CHAKRABORTY A,GOSWAMI D.Prediction of slope stability using multiple linear regression (MLR) and artificial neural network (ANN)[J].Arabian Journal of Geosciences,2017,10(17):385.
[21]MANGALATHU S,HWANG S H,JEON J S.Failure mode and effects analysis of RC members based on machine?learning?based shapley additive explanations (SHAP) approach[J].Engineering Structures,2020,219:110927.
[22]QI C C,TANG X L.Slope stability prediction using integrated metaheuristic and machine learning approaches:A comparative study[J].Computers amp; Industrial Engineering,2018,118:112-122.
Hybrid model for slope stability prediction based on SCA-GBDT
Yang Xingyu1, Wang Ning2
(1.Zijin (Changsha) Engineering Technology Co., Ltd.;
2.School of Resources and Safety Engineering, Central South University)
Abstract:Intelligent prediction of slope stability is a critical foundation for slope governance and slope structure design. Due to the complexity and nonlinearity of slope stability assessment, various intelligent prediction models often exhibit superior performance, offering new directions for addressing slope stability challenges. This study constructs a slope stability prediction hybrid model based on the Sine Cosine Algorithm (SCA) optimized Gradient Boosting Decision Tree (GBDT). A database was established using 436 slope cases, comprising 6 parameters (slope height H, slope angle β, unit weight γ, cohesion C, internal friction angle φ, and pore water pressure coefficient ru) along with slope stability status data. The dataset was divided into an 80 % training set and a 20 % testing set. The hyperparameters of the model were tuned by integrating 5?fold cross?validation with the Sine Cosine Algorithm (SCA). The performance of the proposed method was evaluated using accuracy, precision, recall rate, F1?Score, and AUC. Additionally, 5 classical classification machine learning models were compared to assess their applicability and predictive capabilities for slope stability. Results demonstrate that SCA significantly enhances the performance of the GBDT model, with the SCA-GBDT model achieving accuracy, precision, recall rate, F1?Score, and AUC of 0.886 0, 0.877, 0.915, 0.896, and 0.955, respectively. Characteristic importance analysis via the SHAP algorithm revealed that the internal friction angle has the most significant impact on prediction outcomes. The SCA-GBDT model provides a reliable method for slope stability prediction, applicable to practical slope engineering.
Keywords:slope stability; prediction model; machine learning; Sine Cosine Algorithm; Gradient Boosting Decision Tree; internal friction angle