999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于隨機森林算法的邊坡穩定性預測

2020-03-08 06:01:54姜泓任董慶波姜相松羅國成
現代計算機 2020年36期
關鍵詞:模型

姜泓任,董慶波,姜相松,羅國成

(1.大連海事大學輪機工程學院,大連116026;2.中鐵建大橋工程局集團第一工程有限公司,大連116033)

近年來,邊坡相關工程在我國迅速發展,而對于邊坡穩定性的評估與預測是邊坡工程安全性的保障,也是邊坡工程的重中之重。因此,對邊坡工程的穩定性進行及時有效的預測有著重要意義。為了解決非線性邊坡系統的復雜性,建立隨機森林邊坡穩定性預測模型。選取邊坡土體重度、邊坡高度、孔壓值、黏聚力、內摩擦角以及邊坡傾角6個特征作為隨機森林的輸入特征向量組成元素;安全系數作為隨機森林的輸出。對實際數據的訓練預測結果表明,模型的決定系數接近于1,回歸效果好,對于邊坡的穩定性預測準確。研究結果證明隨機森林邊坡穩定性模型的可行性。

邊坡工程;隨機森林;機器學習;穩定性

0 引言

隨著我國經濟發展以及基礎的建設,道路橋梁工程、礦山建設工程、水利工程等工程發展迅速,其中存在著大量與邊坡相關的工程。邊坡的穩定性事關重大,一旦出現滑坡災害,會嚴重危害到人們的人身安全以及國家財產。因此,找到一種準確且便捷的道路邊坡穩定性預測方法便顯得尤為重要。

邊坡穩定性受到多個因素影響,在實際的邊坡工程中,各個影響因素相互作用,組成一個復雜的非線性系統。長期以來,研究者們在預測邊坡穩定性時,往往采用將影響邊坡穩定性的因素量化后帶入物理模型進行分析這一傳統方法。例如肖歡等人[1]采用極限平衡法分析礦山的局部邊坡穩定性;年庚乾等人[2]利用雙重介質模型對裂隙巖質邊坡的滲流及穩定性進行分析;彭超等人[3]將基于張拉剪切復合破壞的強度折減法應用于邊坡穩定性分析。然而由于邊坡系統的復雜性,建立的物理模型不僅復雜,還可能對實際情況的反應有所偏頗,因此其對于穩定性預測的準確程度相對不足。而近年來機器學習算法的興起很好地彌補了傳統物理模型的不足。

機器學習的核心目的是使機器能從大量數據中尋找學習規律,并將獲得的學習規律應用到其他的同類數據中[4],無需建立具體的物理模型,可以較好地預測非線性復雜系統。迄今為止,已經有很多研究人員將巖土學科與機器學習算法相結合,建立邊坡穩定性預測模型。例如,何永波等人[5]將通過卷積神經網絡建立了邊坡穩定性分析模型;牛鵬飛等人[6]利用PCA-LMBP神經網絡建立了邊坡穩定性預測模型;黎璽克[7]采用了遺傳算法改進BP神經網絡建立了邊坡穩定性預測模型。相較于其他機器學習算法,隨機森林具有更好的泛化性以及準確性,且計算量更少,在訓練集樣本分布不均以及解決非線性回歸問題中有著更好的表現。

筆者隨機抽取某組邊坡樣本數據中的一部分作為訓練集建立了基于隨機森林算法的邊坡穩定性預測模型,并對剩余部分數據進行了預測與分析,為道路邊坡穩定性預測提供了一種新的機器學習算法模型思路。

1 隨機森林模型基本原理

1.1 隨機森林的特點

隨機森林是一種以決策樹為基學習器的有監督的集成學習算法。集成學習是一種十分重要且實用的機器學習方法,隨機森林算法便是集成學習算法中的典型算法之一,它以簡單而且高效的特點為人所知。在隨機森林模型中,包含著多個由Bagging集成算法訓練的決策樹,當待計算樣本輸入后,模型通過集成眾多決策樹的輸出結果并以投票的方式輸出結果。隨機森林預測模型可分為兩類,一類是回歸模型,另一類是分類模型。兩者的區別在于預測結果的性質:前者預測結果為具體數值,后者預測結果為劃分的類別。本文所采用的邊坡穩定性預測算法為隨機森林的回歸算法,通過邊坡的幾項特征對于邊坡安全系數進行回歸預測。在隨機森林的回歸模型中,集成算法為Bagging系列算法,基學習器采用的為CART回歸樹模型。

1.2 Bagging系列算法

Bagging系列算法[8]是一種并行的集成學習算法,它的提出是為了處理數據的不平衡問題,能夠有效地增強回歸器的回歸效果。在Bagging算法中,基學習器的訓練集是通過對原始樣本進行隨機抽樣得到的。假設原始樣本總數為M,對其進行N組取樣。每組取樣為有放回的隨機取樣,樣本容量也為M。從而得到N組采樣集,將這N個采樣集分別進行獨立訓練,可得N個基學習器,將N個基學習器通過集合策略即可得到通過Bagging算法抽樣的強學習器。原始樣本集中每個樣本未被抽中的概率為,當M足夠大時,概率趨近為,約為36.8%[9],這說明了每次抽樣原始樣本集中約有1/3的樣本沒有被抽中,這可以有效地增加模型對噪聲的容忍度,適和應用于一些穩定性差或傾向于過擬合的模型,如決策樹模型。

1.3 CART決策樹的建立

CART決策樹是一種基本樹模型,廣泛應用于各類樹模型中,其特點是既能處理分類問題也能處理回歸問題。所謂回歸,即根據輸入的特征向量決定對應的輸出值,在CART回歸樹結構中,特征空間被劃分成了若干單元,每個單元對應著一個輸出值,因其為二叉樹結構,特征節點處的取值只有“是”與“否”。對于訓練集數據,需找出每個特征的最佳劃分點以及對于不同的特征劃分的先后順序,再根據其特征在每個特征節點處進行判斷,按照其特征將其劃分到某個單元,便能得到對應的輸出值。

在尋找最佳特征劃分點時,使用最小化均方差法。假設X和Y分別為輸入和輸出變量,并且Y是連續變量,假設訓練數據集如下:

其中輸入特征向量為:n為特征個數,i=1,2,…,N,N為樣本容量。

在進行劃分前,從特征向量中等概率隨機抽取一個特征子集,在進行每一次的劃分時,遍歷子集中的所有特征的所有取值,選擇一個使平方誤差最小的點作為最優切分點。記作訓練集中第j個特征變量和它的取值s,并定義兩個區域:

與:

為找出最優j和s,對下式求解:

也就是找出j和s,使要劃分的兩個區域平方誤差和最小。根據證明,c1,c2為兩個區域內分別對應的Y的均值。

找到最優的切分點(j,s)后,按照最優切分點將輸入空間依次劃分為兩個區域,接著對新生成的每個區域都重復上述劃分過程,直到滿足停止條件。如此,一棵回歸樹便被成功地構建了出來,通常稱這種回歸樹為最小二乘回歸樹。

劃分結束后得到的若每個葉節點上輸出數值唯一則以該值作為該葉節點的預測數值,若最終葉子節點上輸出數值不唯一,則以該節點上所有人的平均數值做為該葉節點的預測數值。

1.4 隨機森林模型的建立

簡單來說,隨機森林模型是Bagging集成算法與決策樹的結合。

(1)使用Bootstrapping方法,從初始數據集中隨機、有放回的進行n次采樣,每次采集m個樣本,生成n個訓練集。

(2)對n個訓練集分別進行訓練,得到n個決策樹模型。

(3)對于每個決策樹模型,按照之前所述的方法進行二分裂。

(4)將生成的多顆決策樹組成隨機森林。對于分類問題,按照多棵樹分類器投票決定最終分類結果;對于回歸問題,由多顆樹預測值的均值決定最終預測結果。

2 基于隨機森林邊坡模型建立

2.1 數據集

為了驗證基于隨機森林的邊坡穩定性預測模型的預測效果,引用《基于網格搜索支持向量機的邊坡穩定性系數預測》[10]一文中的邊坡樣本數據42組。其中每組數據樣本都包含特征向量以及對應的安全系數兩部分,特征向量由邊坡土體重度、邊坡高度、孔壓值、黏聚力、內摩擦角以及邊坡傾角六個特征變量組成。通過隨機森林預測模型對樣本數據進行學習,找到邊坡特征向量中六項特征值與邊坡安全系數的非線性關系。具體數據樣本如表1。

表1 邊坡樣本數據集

2.2 模型建立

從上述邊坡樣本中隨機抽取34組樣本作為訓練集(樣本序號1到34),剩余的8組樣本作為測試集(樣本序號35到42),在進行歸一化處理后通過尋優方法,確定該隨機森林模型決策樹數量為101,在每個節點處進行分割的特征子集數量為5,然后建立隨機森林邊坡穩定性預測模型。

3 預測的結果與分析

3.1 評價指標

為了對隨機森林邊坡穩定性預測模型進行客觀評估,引入決定系數(coefficient of determination)這一概念作為模型的評價標準。決定系數的數學表達式如下:

決定系數的值代表了在回歸模型中,能由自變量解釋的變化程度占總變化程度的比例,總變化程度即為樣本的方差,不能由自變量解釋的變化程度由(真實值-回歸值)的平方和來表示,因此決定系數可以用1減去不能由自變量解釋的變化程度占總變化程度的比例來表示,決定系數越接近1,說明預測值可以被解釋的程度越高,預測結果越準確,回歸模型的效果越好。

3.2 結果分析

為了體現基于隨機森林的邊坡穩定性預測模型相比傳統機器學習算法的優勢,將隨機森林模型的回歸及預測結果與BP神經網絡的回歸預測結果進行對比。

繪制隨機森林的邊坡穩定性模型的回歸擬合曲線與BP神經網絡回歸擬合曲線同時與真實值進行對比,如圖1所示。從圖中可知,在對訓練集進行回歸時,與BP神經網絡相比,回歸森林模型所得到的結果與真實值更加的接近,并且回歸效果更加穩定。通過計算,隨機森林回歸模型的決定系數為0.989;而BP神經回歸模型的決定系數為0.936。相比之下,隨機森林模型的決定系數更接近于1,擬合效果更好。接著多次抽取訓練集,得到的安全系數擬合曲線都與真實值曲線接近,決定系數均與1接近,由此可得隨機森林回歸模型的穩定性同樣良好。

兩種模型對于測試集的安全系數預測擬合曲線與真實值曲線對例如圖2。

兩種模型對測試集預測結果對例如表2所示。

結合圖2和表3可以看出,基于隨機森林的邊坡穩定性預測模型預測結果與BP神經網絡模型相比,平均誤差更小,對于邊坡安全系數的預測值與真實值更加接近,預測的結果更加穩定。若將安全系數大于1視作穩定,小于1視作不穩定,隨機森林邊坡穩定性預測模型能夠更加準確地對于邊坡的穩定與否做出預測。

圖1 兩種模型回歸值與真實值對比

圖2 兩種模型預測值與真實值對比

表2 預測結果對比

4 結語

本文基于隨機森林機器學習算法,基本搭建了一種可行的邊坡穩定性預測模型,能夠數值化的預測邊坡的穩定系數。相比較于傳統的物理模型,本模型更加適合于邊坡工程這類非線性復雜系統的預測;而相較于BP神經網絡這類的回歸預測模型,本模型有著計算量小、回歸結果更加準確和穩定、適合用于樣本分布不均的情況等優點。

目前來說,訓練集樣本容量偏小,因此在進行邊坡穩定性預測時,可能會對預測結果的準確度有一定的影響;樣本特征類別偏少,可能對與更加特殊以及復雜的邊坡穩定性預測造成影響。將來應該對邊坡數據以及邊坡特征類別的數量進行擴充,以提高模型的預測精度,和模型對不同種類邊坡的區分度。

猜你喜歡
模型
一半模型
一種去中心化的域名服務本地化模型
適用于BDS-3 PPP的隨機模型
提煉模型 突破難點
函數模型及應用
p150Glued在帕金森病模型中的表達及分布
函數模型及應用
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 老汉色老汉首页a亚洲| 久久精品无码一区二区日韩免费| 国产99视频在线| 在线精品亚洲国产| 亚洲av无码牛牛影视在线二区| 幺女国产一级毛片| 全部免费毛片免费播放| 狠狠色狠狠色综合久久第一次| 一区二区三区高清视频国产女人| 一级片一区| 欧美一区二区自偷自拍视频| 在线观看国产小视频| 亚洲欧美h| 亚洲人免费视频| 久久9966精品国产免费| 亚洲综合欧美在线一区在线播放| 国产在线精彩视频二区| 国产亚洲精久久久久久无码AV| 99热国产在线精品99| 性色在线视频精品| 国产亚洲欧美在线专区| 一区二区三区四区在线| 亚洲欧美日韩精品专区| 国产欧美日韩va| 久久国语对白| 欧美不卡在线视频| 午夜久久影院| 亚洲av无码专区久久蜜芽| 国产剧情一区二区| 欧美日韩亚洲国产主播第一区| 久久九九热视频| 久久婷婷色综合老司机| 四虎综合网| 老司机久久精品视频| 久久青青草原亚洲av无码| 国产欧美视频一区二区三区| 中国毛片网| 欧美在线视频不卡第一页| 美女国产在线| 天堂在线视频精品| 99精品国产电影| 狠狠做深爱婷婷久久一区| 精品国产一区91在线| 在线观看视频一区二区| 亚洲午夜福利在线| 成人午夜精品一级毛片 | 久久一日本道色综合久久| 亚洲第一区精品日韩在线播放| 日韩在线第三页| 亚洲色无码专线精品观看| 人妻中文久热无码丝袜| 午夜性刺激在线观看免费| 成人国产免费| 毛片网站在线看| 国产亚洲视频播放9000| 亚洲欧美一区二区三区图片| 成人福利在线观看| 午夜少妇精品视频小电影| 免费激情网站| 亚洲欧美日本国产专区一区| 国产系列在线| 美女无遮挡免费网站| 成人在线观看一区| 国产区人妖精品人妖精品视频| 成年A级毛片| 秋霞一区二区三区| 精品视频福利| m男亚洲一区中文字幕| 日本亚洲成高清一区二区三区| 亚洲成年人片| 97人妻精品专区久久久久| 高清国产va日韩亚洲免费午夜电影| 四虎永久在线精品影院| 亚洲精品中文字幕无乱码| 欧美翘臀一区二区三区| 丝袜亚洲综合| 欧美在线伊人| 色有码无码视频| 91在线中文| 一级毛片免费观看不卡视频| 手机在线看片不卡中文字幕| A级全黄试看30分钟小视频|