999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

煤與瓦斯突出預測的隨機森林模型

2014-01-31 12:10:24溫廷新張波邵良杉
計算機工程與應用 2014年10期
關鍵詞:分類模型

溫廷新,張波,邵良杉

WEN Tingxin,ZHANG Bo,SHAO Liangshan

遼寧工程技術大學系統(tǒng)工程研究所,遼寧葫蘆島125105

System Engineering Institute,Liaoning Technological University,Huludao,Liaoning 125105,China

1 引言

隨著煤礦開采深度和開采強度的增加,以及復雜的地質(zhì)條件和應力環(huán)境變化等因素導致各種動態(tài)災害的發(fā)生。其中,煤與瓦斯突出是煤礦進行深部開采過程中一個主要的動力災害。我國煤礦開采場眾多,煤與瓦斯突出是最為常見卻危害最為嚴重的事故,煤與瓦斯突出問題日益顯著[1-2]。煤與瓦斯突出是另一種類型的瓦斯特殊涌出,是圍巖和煤體內(nèi)部聚積的大量潛能的快速釋放。煤與瓦斯突出能夠在短時間內(nèi)向巷道噴出大量瓦斯及碎煤,破壞巷道內(nèi)的設施和風流狀態(tài),直接危害人的生命,造成人員傷亡和財產(chǎn)損失[3-4]。我國煤礦生產(chǎn)每年都會因為煤與瓦斯突出導致數(shù)百人傷亡,煤與瓦斯突出是煤礦安全生產(chǎn)的巨大威脅。因此,煤與瓦斯突出預測研究是煤礦工程中值得重視的研究領域,構建有效的煤與瓦斯突出預測模型對煤與瓦斯突出實現(xiàn)有效預測具有重大意義。

煤與瓦斯突出預測方法是指導煤與瓦斯突出防治工作的前提,目前對于煤與瓦斯突出預測和評價已經(jīng)出現(xiàn)很多研究方法。其中,劉俊娥等[5]人用支持向量機方法對煤與瓦斯預測作評價;郭德勇等[6]人在煤與瓦斯預測中運用了神經(jīng)網(wǎng)絡模型;高衛(wèi)東[7]運用Fisher判別法預測煤與瓦斯突出;以及還有時間序列法[8-9]等對煤與瓦斯突出作預測。雖然各位學者在煤與瓦斯突出預測和監(jiān)控問題中提出了自己的方法,每種方法都有各自的優(yōu)點,取得較好的應用效果,促進了該研究領域向前發(fā)展,但各方法也有自己的不足,如神經(jīng)網(wǎng)絡存在過學習、收斂速度慢,支持向量機依賴于核參數(shù)和懲罰參數(shù)的選取等缺陷。再加上煤礦井下深部開采所處的是一個自然的環(huán)境,地質(zhì)條件以及外界因素復雜,影響煤與瓦斯突出的因素多樣,以及因素之間存在一定的相關性,傳統(tǒng)的預測方法在預測結果上與實際情況會存在一定出入,煤與瓦斯突出等級的正確預測率仍需要進一步提高。

在煤與瓦斯突出影響因素分析中,對選取的相關程度較高的影響因素,利用因子分析提取公共因子,進行因素間的濃縮,減少影響因素之間的相關性,然后以分析得到的影響因素共同作為隨機森林的輸入變量,用隨機森林算法進行訓練預測。隨機森林算法是基于決策樹(decision tree)的分類器集成算法,融合了Bagging和隨機特征選取兩大機器學習技術[10]。隨機森林具有需要調(diào)整的參數(shù)較少、分類速度很快,能有效處理高維大樣本數(shù)據(jù)等特點,它避免了決策樹中出現(xiàn)的過擬合問題。因此,文中基于因子分析建立了煤與瓦斯突出預測的隨機森林模型,將其運用到實際工程當中,驗證其預測模型的有效性。

2 相關理論

2.1 因子分析

因子分析(Factor Analysis)是多元統(tǒng)計分析的一個重要分支,是由英國心理學家C.Spearman提出的[11-13]。因子分析是通過對變量之間關系的研究,找出能夠綜合原始變量的少數(shù)幾個因子,使得少數(shù)幾個因子能夠反映原始變量的絕大部分信息,進行數(shù)據(jù)的濃縮。因子分析的研究內(nèi)容十分豐富,常用的因子分析類型有R型因子分析和Q型因子分析。其中R型因子分析是針對變量作因子分析,Q型因子分析是針對樣品作因子分析。

根據(jù)文中研究的實際需求,選用R型因子分析。假設原有p個變量x1,x2,…,xp,且每個原有變量在進行標準化之后都是均值為零、標準差為1的標準化變量,將原變量x1,x2,…,xp用m(m<p)個因子F1,F(xiàn)2,…,F(xiàn)m線性組合來表示,因子分析的數(shù)學模型表示如下:

式(1)中εi是特殊因子,表示了因子變量不能解釋原有變量的部分;公共因子F1,F(xiàn)2,…,F(xiàn)m彼此之間是兩兩正交的;aij表示的是公共因子的負載,在各個因子變量不相關的情況下,因子載荷aij相當于多元回歸中的標準回歸系數(shù),就是第i個原有變量和第j個因子變量之間的相關系數(shù)(即xi在第j個公共因子變量上的相對重要性),aij的絕對值越大,則公共因子Fi和原有變量xi關系就越強。

2.2 隨機森林算法

隨機森林算法[14]是由Breiman于2001年提出的一種集成學習算法,常見的集成學習算法還包括裝袋算法和提升算法。集成學習是一種機器學習范式,現(xiàn)已成為國際機器學習界研究的熱點,集成學習方法彌補了單一方法的不足。隨機森林是以分類回歸樹CART為基本分類器,并且包含多個由Bagging集成學習技術訓練得到的決策樹,當輸入待分類的樣本時,最終的分類結果由單棵決策樹的輸出結果投票決定[15-16]。

隨機森林是一個樹型分類器{h(x,θk),k=1,2,…,n}的集合。其中元分類器h(x,θk)是用CART算法構建的沒有剪枝的分類回歸樹;x是輸入向量;θk是獨立同分布的隨機向量,決定了單棵樹的生長過程;隨機森林的輸出采用簡單多數(shù)投票法(針對分類)或所有樹輸出結果的簡單平均(針對回歸)得到。隨機森林算法步驟如下:

(1)從原始訓練數(shù)據(jù)集S={(xi,yi)} (i=1,2,…,n)中bootstrap抽樣生成k個訓練樣本集,每個樣本集是每棵分類樹的全部訓練數(shù)據(jù)。

(2)每個訓練樣本集單獨生長成為一棵不剪枝葉的分類樹hi。在樹的每個節(jié)點處從M個特征中隨機挑選m個特征(m≤M),在每個節(jié)點上從m個特征中依據(jù)Gini指標選取最優(yōu)特征進行分支生長。這棵分類樹進行充分生長,使每個節(jié)點的不純度達到最小,不進行通常的剪枝操作。

(3)根據(jù)生成的多個樹分類器對新的測試數(shù)據(jù)xt進行預測,分類結果按每個樹分類器的投票多少而決定,即分類公式為:

上式中,用majority vote表示多數(shù)投票,Ntree表示隨機森林中樹的個數(shù)。在訓練過程中每次抽樣生成自助訓練樣本集,原始訓練數(shù)據(jù)集中不在自助樣本中的剩余數(shù)據(jù)被稱為袋外數(shù)據(jù)(out-of-bag,OOB),OOB數(shù)據(jù)被用來預測分類的正確率,每次的預測結果進行匯總得到錯誤率的OOB估計。

隨機森林的邊緣函數(shù)[17]:

隨機森林的泛化誤差上界:

式(4)中,ρ是相關系數(shù)的均值,s是分類器的強度,s=Ex,ymr(x,y)。隨機森林通過在每個節(jié)點處隨機選擇特征進行分支,最小化了各棵分類樹之間的相關性,提高了分類精確度。

3 煤與瓦斯突出預測的隨機森林模型及應用

3.1 影響因素的相關性分析

對于煤礦井下深部開采是處于一個復雜的自然環(huán)境,影響煤與瓦斯突出的影響因素具有多樣性等,通常是在突出危險區(qū)域測取和煤與瓦斯突出密切相關的一些物理參數(shù)或指標觀察數(shù)據(jù),同時考慮實際預測中影響指標數(shù)據(jù)的易取性,選取能夠間接反映煤與瓦斯突出的影響因素進行相關預測分析。

文中根據(jù)文獻[18]提供的數(shù)據(jù),選取了最大主應力(X1)、瓦斯壓力(X2)、瓦斯含量(X3)、頂板巖性(X4)、距斷裂距離(X5)、煤層厚度(X6)、開采垂深(X7)、絕對瓦斯涌出量(X8)和相對瓦斯涌出量(X9)9個影響因素作為煤與瓦斯突出預測的評價指標,這幾個評價指標對于煤與瓦斯突出的影響在文獻[18]中已相應說明。

為了減少變量因素之間信息的冗余,提高相互獨立性,對這9個影響煤與瓦斯突出的因素(如表2)運用SPSS軟件進行普通相關性分析,求得Spearman等級相關系數(shù)和T檢驗的統(tǒng)計值Sig。由分析的結果表明,最大主應力(X1)、瓦斯壓力(X2)、瓦斯含量(X3)、開采垂深(X7)、絕對瓦斯涌出量(X8)和相對瓦斯涌出量(X9)這6個變量因素之間的T統(tǒng)計量的檢驗值Sig小于0.05,相關系數(shù)是顯著異于0的,說明了這六個變量因素之間的相關性較強,存在著信息交互;而另外三個變量因素之間的T統(tǒng)計量的檢驗值Sig大于0.05,說明了這三個變量之間的相關性比較弱,彼此關聯(lián)程度低。

3.2 因子分析檢驗

在進行相關性分析之后得到相關性較強的6個變量(最大主應力、瓦斯壓力、瓦斯含量、開采垂深、絕對瓦斯涌出量和相對瓦斯涌出量),對這6個變量進行因子分析提取公共因子,對影響因素進行降維。但在對變量因素進行因子分析之前,先要檢驗這6個變量因素是否適合進行因子分析。

運用SPSS軟件對這相關性較強的6個變量因素進行KMO檢驗和巴特萊特球體檢驗(Bartlett)。其檢驗的結果如表1所示,KMO的檢驗值為0.851,適合做因子分析;同時Bartlett球體檢驗統(tǒng)計值的顯著性概率Sig為0,小于0.05的顯著水平,因此接受備擇假設,認為適宜作因子分析。根據(jù)這兩個檢驗的結果,表明了相關性較強的這六個變量因素可以進行因子分析。

表1 KMO和Bartlett檢驗

3.3 基于因子分析的煤與瓦斯突出的隨機森林預測模型

煤與瓦斯突出強度大小可以分為4個不同程度類型[18],即無突出,小型突出,中型突出和大型突出四類。在該預測模型中數(shù)據(jù)來源于文獻[18],選取了19組煤與瓦斯突出樣本作為訓練數(shù)據(jù)(表2),另外選取其中5組樣本作為模型的測試數(shù)據(jù)(表4),對影響煤與瓦斯突出相關性較強的6個變量因素進行因子分析,實現(xiàn)數(shù)據(jù)的降維,提取公共因子,再結合相關性較弱的影響因素共同作為預測模型的輸入,以四個不同突出強度作為輸出,建立基于因子分析的隨機森林預測模型。

將表2中相關性較強的最大主應力、瓦斯壓力、瓦斯含量、開采垂深、絕對瓦斯涌出量和相對瓦斯涌出量,這六個變量因素運用SPSS 16.0軟件進行因子分析,由得到的碎石圖如圖1所示,由圖中可以看出前兩個公共因子的特征值變化比較明顯,從第二個公共因子之后的特征值變化就變得平緩許多,根據(jù)碎石原則,相關性較強的這6個變量因素進行因子分析之后能提取出兩個公共因子F1和F2,這兩個公共因子的累計貢獻率為96.246%,即這兩個公共因子解釋了原來6個變量96.246%的信息。

提取F1和F2兩個公共因子,由因子載荷矩陣難以看出兩個公共因子的實際含義,所以通過旋轉坐標軸,使負載盡可能向正負一或零的方向靠近,因而得到因子載荷旋轉矩陣(表3)。載荷旋轉矩陣使得兩個公共因子的實際意義凸顯出來,由表3可知,公共因子F1主要由瓦斯含量、開采垂深、絕對瓦斯涌出量和相對瓦斯涌出量四個因素組成,公共因子F2由最大主應力以及瓦斯壓力組成。由碎石圖可看出公共因子F1的特征值變化明顯,說明了它在煤與瓦斯突出預測的影響因素當中,其影響性比較大。再由旋轉后的因子得分矩陣可求得因子值,求出的F1和F2的對應值如表2所示(部分數(shù)據(jù))。

表2 測試樣本數(shù)據(jù)(部分)

圖1 碎石圖

表3 因子載荷旋轉矩陣

通過相關性分析得到的三個相關性較弱的變量因素(頂板巖性、距斷裂距離、煤層厚度),和進行因子分析所提取的兩個公共因子(F1和F2),這五個變量因素共同作為隨機森林預測模型的輸入,基于Matlab 7平臺上做隨機森林編程訓練,設置變量個數(shù)mtry=4,隨機森林的樹的個數(shù)ntree=500,用表2中樣本數(shù)據(jù)進行預測模型的訓練,確定5個變量因素與4個煤與瓦斯突出強度之間的非線性關系,在樣本集的訓練過程中,圖2是袋外數(shù)據(jù)的錯誤率變化,估計了隨機森林的泛化誤差,從圖中可看出隨機森林預測模型的錯誤率極低。

隨機森林預測模型訓練好之后,用表4中5組數(shù)據(jù)進行煤與瓦斯突出強度的測試,表4中數(shù)據(jù)依然需進行因子分析提取公共因子作為預測模型變量輸入。為了驗證該模型分類預測的準確率,同時將其與Fisher判別分析方法(FDA,F(xiàn)isher Discriminant Analysis)[11]及BP神經(jīng)網(wǎng)絡方法進行比較,其中運用SPSS軟件操作完成Fisher判別預測,并設定BP神經(jīng)網(wǎng)絡的輸入層神經(jīng)元個數(shù)為5(輸入變量個數(shù)),隱含層神經(jīng)元個數(shù)為10,輸出層神經(jīng)元個數(shù)為3:0-0-0(無突出),0-0-1(小型突出),0-1-0(中型突出),1-0-0(大型突出),因此建立5-10-3結構的BP神經(jīng)網(wǎng)絡。隨機森林(RF)測試類別、Fisher測試類別(FDA)和BP神經(jīng)網(wǎng)絡(BPNN)測試類別與真實類別的對比結果如表4中所示。圖3是隨機森林對煤與瓦斯突出強度的測試結果,從圖中可看到,對于這5個小樣本測試數(shù)據(jù),隨機森林的誤判率為0,同時從表4中各預測模型的結果對比得出:其他兩種預測模型在預測結果上與瓦斯突出實際類別存在出入,RF預測的準確率要高于其他兩種算法模型,由此可以表明,基于隨機森林建立的煤與瓦斯突出強度預測模型具有較高的準確率。

圖2 袋外數(shù)據(jù)錯誤率

圖3 RF預測結果

表4 預測模型測試結果對比

4 結束語

(1)本文在借鑒國內(nèi)外文獻的基礎上,運用了因子分析方法,對影響煤與瓦斯突出預測的相關程度較高的影響因素進行因子分析,減少變量因素之間的信息冗余,以提高模型預測精度,同時,通過相關性分析得到,就煤與瓦斯突出強度預測而言,文中選取的最大主應力、瓦斯壓力、瓦斯含量、開采垂深、絕對瓦斯涌出量和相對瓦斯涌出量這個六個變量之間相關性極高。

(2)由相關性較弱的三個影響因素頂板巖性、距斷裂距離以及煤層厚度和因子分析提取的公共因子F1、F2,這5個變量共同作為隨機森林預測模型的輸入,經(jīng)過訓練以及預測結果的對比顯示,基于因子分析建立的煤與瓦斯突出強度預測的隨機森林模型,其預測準確率極高,預測的結果與煤礦的實際情況較為吻合,為煤與瓦斯突出預測提供了指導作用,同時也為該領域的研究提供了新的思路。

(3)本文嘗試著將因子分析理論和隨機森林理論結合運用到煤與瓦斯突出等級預測問題當中,通過測取一些與瓦斯突出相關的靜態(tài)因素的數(shù)據(jù)進行預測。在后續(xù)工作當中,需要考慮影響煤與瓦斯突出的時變性因素,測取大樣本數(shù)據(jù),分析提取更具有代表性的影響因素,提高隨機森林的泛化能力,進一步提高煤與瓦斯突出等級預測的正確率。

[1] Wold M B,Connell L D,Choi S K.The role of spatial variability in coal seam parameters on gas outburst behaviour during coal mining[J].International Journal of Coal Geology,2008,75(1):1-14.

[2] 聶百勝,何學秋,王恩元,等.煤與瓦斯突出預測技術研究現(xiàn)狀及發(fā)展趨勢[J].中國安全科學學報,2003,13(6):43-46.

[3] 劉俊娥,曾凡雷,郭章林.基于RS-SVM模型的煤與瓦斯突出多因素風險評價[J].中國安全科學學報,2011,21(7):21-26.

[4] 李坤,由長福,祁海鷹.煤礦煤與瓦斯突出數(shù)學模型的建立[J].工程力學,2012,29(1):202-206.

[5] 劉俊娥,曾凡雷,郭章林.基于RS-SVM模型的煤與瓦斯突出多因素風險評價[J].中國安全科學學報,2011,21(7):21-26.

[6] 郭德勇,李念友,裴大文,等.煤與瓦斯突出預測灰色理論-神經(jīng)網(wǎng)絡方法[J].北京科技大學學報,2007,29(4):354-357.

[7] 高衛(wèi)東.Fisher判別法在煤與瓦斯突出危險程度預測中的應用[J].中國安全科學學報,2010,20(10):26-30.

[8] 董春游,曹志國,商宇航,等.基于G-K評價與粗糙集的煤與瓦斯突出分類分析[J].煤炭學報,2011,36(7):1156-1160.

[9] 鄧明,張國樞,陳清華.基于瓦斯涌出時間序列的煤與瓦斯突出預報[J].煤炭學報,2010,35(2):260-263.

[10] 馬昕,郭靜,孫嘯.蛋白質(zhì)中RNA-結合殘基預測的隨機森林模型[J].東南大學學報:自然科學版,2012,42(1):50-54.

[11] 馬慶國.管理統(tǒng)計[M].北京:科學出版社,2008:308-335.

[12] 邵良杉,趙琳琳.露天采礦爆破振動對民房破壞的旋轉森林預測模型[J].中國安全科學學報,2013,23(2):58-63.

[13] 王玉寶,單仁亮,蔡煒凌,等.西山礦區(qū)煤巷掘進速度影響因素因子分析[J].煤炭學報,2011,36(6):925-929.

[14] Breiman L.Random forests[J].Machine Learning,2001,45(1):5-32.

[15] 董師師,黃哲學.隨機森林理論淺析[J].集成技術,2013,2(1):1-7.

[16] 楊帆,林琛,周綺鳳,等.基于隨機森林的潛在k近鄰算法及其在基因表達數(shù)據(jù)分類中的應用[J].系統(tǒng)工程理論與實踐,2012,32(4):815-825.

[17] 莊進發(fā),羅鍵,彭彥卿,等.基于改進隨機森林的故障診斷方法研究[J].計算機集成制造系統(tǒng),2009,15(4):777-785.

[18] 朱志潔,張宏偉,韓軍,等.基于PCA-BP神經(jīng)網(wǎng)絡的煤與瓦斯突出預測研究[J].中國安全科學學報,2013,23(4):45-50.

猜你喜歡
分類模型
一半模型
分類算一算
垃圾分類的困惑你有嗎
大眾健康(2021年6期)2021-06-08 19:30:06
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
分類討論求坐標
數(shù)據(jù)分析中的分類討論
教你一招:數(shù)的分類
3D打印中的模型分割與打包
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
主站蜘蛛池模板: 国产一区二区视频在线| 一级福利视频| 国产网友愉拍精品| 国产在线观看91精品| 九九热精品视频在线| 欧美一级特黄aaaaaa在线看片| 国产肉感大码AV无码| 精品在线免费播放| 欧美性猛交xxxx乱大交极品| 99爱在线| 精品色综合| 国产全黄a一级毛片| 五月综合色婷婷| 嫩草影院在线观看精品视频| 免费激情网站| 亚洲三级色| 亚洲三级成人| 99一级毛片| 日本免费福利视频| 91网红精品在线观看| 日本爱爱精品一区二区| 国产成人亚洲精品无码电影| 51国产偷自视频区视频手机观看| 国产在线第二页| 国产精品欧美激情| 午夜视频免费试看| 国产黄网永久免费| 欧美性精品| 成人精品区| 又爽又大又黄a级毛片在线视频| 成年人免费国产视频| 日韩免费毛片| 精品国产一二三区| 91毛片网| 久久激情影院| 无码日韩人妻精品久久蜜桃| 国产黄色视频综合| 国产亚卅精品无码| 中文无码影院| 亚洲精品日产精品乱码不卡| 成人av专区精品无码国产| 女人一级毛片| 国内自拍久第一页| 免费国产高清视频| 天天摸夜夜操| 色悠久久综合| 国产乱人伦AV在线A| 激情综合婷婷丁香五月尤物| 国产成人亚洲欧美激情| 日本三级精品| 国产免费好大好硬视频| 99ri精品视频在线观看播放| 日韩在线2020专区| 另类综合视频| 亚洲欧美日韩天堂| 国产午夜精品一区二区三| 五月天综合婷婷| 99久久精品免费视频| 亚洲美女视频一区| 欧美一级黄色影院| 五月综合色婷婷| 欧美性爱精品一区二区三区| 92午夜福利影院一区二区三区| 亚洲水蜜桃久久综合网站| 亚洲国产欧美中日韩成人综合视频| 国产特一级毛片| 国产精品免费p区| 久久人体视频| 成人午夜精品一级毛片| 午夜电影在线观看国产1区| 伊人久久大香线蕉影院| 国产在线欧美| 最新国产精品鲁鲁免费视频| 日本a∨在线观看| 日韩精品一区二区三区免费在线观看| 再看日本中文字幕在线观看| 日韩精品一区二区深田咏美| 国产成人高清精品免费软件| 国产成人资源| 午夜久久影院| 国产精品第页| 22sihu国产精品视频影视资讯|