閻 馨,朱永浩,屠乃威,吳書文,王雨虹
(遼寧工程技術(shù)大學(xué)電氣與控制工程學(xué)院,遼寧葫蘆島 125105)
煤炭開采時常發(fā)生工作面煤和瓦斯突出事故,這對我國經(jīng)濟造成極大損失。采用突出預(yù)防方法可以防止事故的發(fā)生,其首要工作是突出預(yù)測。經(jīng)過數(shù)十年發(fā)展,國內(nèi)外研究者針對事故發(fā)生提出多種預(yù)測方法,如鉆孔涌出初速度方法[1-2]、鉆屑指標(biāo)方法[3-4]、綜合指標(biāo)方法[5]、電磁輻射法[6]、邏輯回歸法[7]、神經(jīng)網(wǎng)絡(luò)方法[8-10]、支持向量機方法[11-13]、樸素貝葉斯方法[14-15]等。這些方法對工作面突出預(yù)測具有一定的積極作用,但存在一些不足,如瓦斯涌出初速度、鉆屑量指標(biāo)、綜合指標(biāo)和電磁輻射監(jiān)測方法預(yù)測時不能綜合考慮多種影響因素,因而難以準(zhǔn)確確定指標(biāo)臨界值與突出時指標(biāo)變化趨勢的特征。部分指標(biāo)數(shù)據(jù)常存在噪聲,不能保證突出預(yù)測的準(zhǔn)確性。神經(jīng)網(wǎng)絡(luò)方法考慮工作面煤與瓦斯突出多種影響因素,根據(jù)訓(xùn)練樣本數(shù)據(jù)構(gòu)建預(yù)測模型,此模型具有隨機性,因此該方法常存在訓(xùn)練失敗問題。支持向量機方法適于小規(guī)模數(shù)據(jù)建模,從而構(gòu)建模型實現(xiàn)突出危險性預(yù)測。樸素貝葉斯分類方法將工作面煤與瓦斯突出預(yù)測問題歸結(jié)為分類問題,利用樣本數(shù)據(jù)構(gòu)建突出預(yù)測模型進行突出預(yù)測。但該模型在假設(shè)模型輸入變量(分類變量)間相互獨立條件下構(gòu)建的,而實際構(gòu)成分類變量的突出影響因素是相互的,因此模型預(yù)測的準(zhǔn)確性不高。研究發(fā)現(xiàn)在樸素貝葉斯模型中考慮分類變量對分類影響的權(quán)重,構(gòu)成權(quán)重貝葉斯模型,改進后的模型能有效提高分類的準(zhǔn)確性[16-18]。
本文將主成分分析(Principal ComponentAnalysis,PCA)和權(quán)重貝葉斯模型結(jié)合,構(gòu)建工作面煤與瓦斯突出預(yù)測的權(quán)重貝葉斯模型。該模型的預(yù)測方法具有較高的預(yù)測準(zhǔn)確性,可以快速獲得突出預(yù)測結(jié)果。利用主成分分析確定構(gòu)建突出預(yù)測模型輸入變量的突出影響因素(分類變量)權(quán)重,再構(gòu)建煤與瓦斯突出預(yù)測的權(quán)重貝葉斯模型。
工作面煤與瓦斯突出是多種因素共同作用的結(jié)果。通常情況下,突出危險性與開采深度、瓦斯放散初速度、瓦斯壓力呈正相關(guān);與煤層堅固性系數(shù)呈負(fù)相關(guān)。由不同地質(zhì)構(gòu)造的煤礦發(fā)生工作面煤與瓦斯突出的可能性也不同。其中,高瓦斯煤礦相對于低瓦斯煤礦更易發(fā)生工作面煤與瓦斯突出事故。
工作面煤與瓦斯突出預(yù)測看作是利用檢測到的工作面煤與瓦斯突出多種影響因素信息進行突出危險性等級劃分問題。將瓦斯壓力、瓦斯放散初速度、地質(zhì)構(gòu)造、煤層堅固性系數(shù)、開采深度作為工作面煤與瓦斯突出預(yù)測分類模型的輸入變量,又稱分類變量[19]。由于后3 個分類變量是在開采環(huán)境發(fā)生大變化時才會改變,而且煤層堅固性系數(shù)和地質(zhì)構(gòu)造信息的檢測過程復(fù)雜且較長,因此采用離線檢測方式獲取信息數(shù)據(jù)。采用多傳感器在線檢測方式獲得瓦斯壓力、瓦斯放散初速度信息數(shù)據(jù),以提高獲取數(shù)據(jù)的可靠性和準(zhǔn)確性。
樸素貝葉斯(Naive Bayesian,NBS)模型假設(shè)分類變量間相互對立。權(quán)重貝葉斯模型是通過對分類變量權(quán)重考慮,從而消弱獨立性假設(shè)條件。如何確定分類變量權(quán)重是建立權(quán)重貝葉斯模型的關(guān)鍵。常用的權(quán)重確定方法有專家給定權(quán)重法、層次權(quán)重決策法、熵值確定法等。專家給定權(quán)重法和層次權(quán)重決策法受主觀影響較大,有時誤差會很大;熵值確定法對于異常數(shù)據(jù)過于敏感,實際操作時對某些結(jié)果影響較小的分類變量權(quán)重計算量過大,導(dǎo)致綜合權(quán)重不切實際。解決不足之處的有效方法是給每個指標(biāo)增加一個合理范圍限制。PCA 是通用的權(quán)重確定方法,在多個領(lǐng)域取得較好的應(yīng)用效果[20-22],因此應(yīng)用PCA 對突出預(yù)測模型的輸入變量(分類變量)進行權(quán)重確定。工作面煤與瓦斯突出預(yù)測模型建立過程如圖1 所示。

圖1 工作面煤與瓦斯突出預(yù)測模型建立過程Fig.1 Prediction model building process of coal and gas outburst in mine working
整理瓦斯壓力、瓦斯放散初速度、地質(zhì)構(gòu)造、煤層堅固性系數(shù)、開采深度等信息數(shù)據(jù),形成樣本數(shù)據(jù)Xk={xk1,xk2,…,xko}和dk(k=1,2,…,m,o=5,m為樣本數(shù))。xk1,xk2,…,xk5分別為第k個樣本的5 種分類變量數(shù)據(jù),dk為第k個樣本的突出危險性等級數(shù)據(jù)。
對樣本數(shù)據(jù)Xk={xk1,xk2,…,xko}進行Z-Score 標(biāo)準(zhǔn)化處理,處理后的數(shù)據(jù)Y如式(1)所示:

對標(biāo)準(zhǔn)化處理后的數(shù)據(jù)Y進行主成分分析,計算出瓦斯壓力、瓦斯放散初速度、地質(zhì)構(gòu)造、煤層堅固性系數(shù)和開采深度作為分類變量時的權(quán)重。確定以分類變量權(quán)重為基礎(chǔ),利用數(shù)據(jù)Y進行貝葉斯學(xué)習(xí),完成類別的先驗概率計算以及獲取條件概率公式。利用樸素貝葉斯的學(xué)習(xí)結(jié)果和分類變量權(quán)重構(gòu)建工作面煤與瓦斯突出預(yù)測的權(quán)重貝葉斯模型。
利用主成分分析,確定分類變量權(quán)重過程如下:
步驟1計算數(shù)據(jù)Y的相關(guān)系數(shù)矩陣R。R的表達式如式(2)所示:

步驟2計算相關(guān)系數(shù)矩陣R的特征值λi(i=1,2,…,o,λ1≥λ2≥…≥λo)和特征向量μij(i,j=1,2,…,o)。
步驟3根據(jù)式(3)確定主成分個數(shù)n。

其中,δ為參數(shù),表示主成分貢獻率閾值。
步驟4根據(jù)式(4)計算主成分因子載荷矩陣βij(βij代表第i個分類變量與第j個主成分間相關(guān)系數(shù),i=1,2,…,o,j=1,2,…,n)。

步驟5根據(jù)式(5)~式(7)計算得各分類變量的權(quán)重θi(i=1,2,…,o)。

由式(5)~式(7)可知,分類變量的權(quán)重與相關(guān)系數(shù)βij密不可分。一類分類變量在一個主成分上的影響權(quán)重由式(5)表示,|βij|越大,第i個分類變量與第j個主成分間相關(guān)系數(shù)越大,第i個分類變量對第j個主成分的影響就越大,即當(dāng)?shù)趇個分類變量發(fā)生定量變化,則第j個主成分相應(yīng)發(fā)生變化量越大。將煤與瓦斯突出事故發(fā)生時看作是o個分類變量(本文中是5 種分類變量)構(gòu)成系統(tǒng)相互作用的結(jié)果,而n個主成分構(gòu)成系統(tǒng)是o個分類變量構(gòu)成系統(tǒng)的另一種表達,因此煤與瓦斯突出發(fā)生也是n個主成分構(gòu)成系統(tǒng)作用的結(jié)果。當(dāng)把在n個主成分上相加得到即一個分類變量對n個主成分構(gòu)成系統(tǒng)影響的量化,再對進行歸一化得到該分類變量權(quán)重θi。θi越大,當(dāng)?shù)趇個分類變量發(fā)生定量變化,n個主成分構(gòu)成系統(tǒng)發(fā)生變化量越大,對煤與瓦斯突出危險性影響的量化也就越大。
設(shè)工作面煤與瓦斯突出危險性等級為B1,B2,…,Bf(f為突出危險性等級數(shù)量),在m個樣本數(shù)據(jù)中,突出危險等級為Bl(l=1,2,…,f)的樣本數(shù)量為Sl(l=1,2,…,f)。為避免出現(xiàn)頻率為0 的情況,影響煤與瓦斯突出預(yù)測的準(zhǔn)確性,引入拉普拉斯平滑計算,Bl(l=1,2,…,f)類的先驗概率P(Bl)為:

對5 種分類變量采用數(shù)值化描述,而這些信息數(shù)據(jù)近似為正態(tài)分布,因此采用高斯函數(shù)確定條件概率。條件概率如式(9)所示:

工作面煤與瓦斯突出預(yù)測的權(quán)重貝葉斯模型如式(10)所示:

其中,B為貝葉斯最大后驗概率值[23],對應(yīng)突出危險性等級。通過計算每個突出危險性等級的后驗概率值,進而比較得到最大后驗概率值以及對應(yīng)的突出危險性等級。
考慮工作面煤與瓦斯突出的多種影響因素,基于工作面煤與瓦斯突出預(yù)測的權(quán)重貝葉斯模型進行突出危險性等級預(yù)測。工作面煤與瓦斯突出預(yù)測的主要步驟如下:
步驟1通過多傳感器在線檢測或離線檢測方式,獲得反映工作面煤與瓦斯突出危險性的5 種分類變量動/靜態(tài)數(shù)據(jù)。
步驟2對所得檢測數(shù)據(jù)進行Z-Score 標(biāo)準(zhǔn)化處理,得到無量綱數(shù)據(jù)qi(i=1,2,…,o)。
步驟3將無量綱數(shù)據(jù)qi(i=1,2,…,o)作為工作面煤與瓦斯突出預(yù)測的權(quán)重貝葉斯模型的輸入,計算得到工作面煤與瓦斯突出危險性等級的預(yù)測值B。
步驟4輸出工作面煤與瓦斯突出預(yù)測的預(yù)測結(jié)果B,并將預(yù)測結(jié)果B存儲到數(shù)據(jù)庫。
工作面煤與瓦斯突出預(yù)測的過程如圖2 所示。工作面煤與瓦斯突出預(yù)測的權(quán)重貝葉斯模型準(zhǔn)確性與樣本數(shù)據(jù)的完備性密切相關(guān)。工作面煤與瓦斯突出具有多樣性、突發(fā)性、影響因素的不確定性、非線性等特點,而完備性的樣本數(shù)據(jù)需要長時間積累過程,因此基于樣本數(shù)據(jù)構(gòu)建的突出預(yù)測模型需要適時更新才能保證模型預(yù)測的準(zhǔn)確性。采用樣本更新后進行模型重構(gòu)的方法來完成工作面煤與瓦斯突出預(yù)測的權(quán)重貝葉斯模型更新。

圖2 基于PCA 和權(quán)重貝葉斯的工作面煤與瓦斯突出預(yù)測Fig.2 Prediction of coal and gas outburst in mine working face based on PCA and weighted Bayesian
如果新數(shù)據(jù)與樣本數(shù)據(jù)有高相似度,則不進行樣本數(shù)據(jù)更新;如果沒有相似度,則將新數(shù)據(jù)存儲到樣本數(shù)據(jù)中完成樣本數(shù)據(jù)的更新。
設(shè)新數(shù)據(jù)為Z={z1,z2,…,zo+1},z1,z2,…,zo為5 種分類變量,zo+1為突出危險性等級數(shù)據(jù),第k個樣本的數(shù)據(jù)Xk={xk1,xk2,…,xko},則z1,z2,…,zo與Xk的相似度為:

其中,θi為分類變量權(quán)值,si(zi,xki)為新數(shù)據(jù)中第i個元素與第k個樣本的第i個元素的相似度。
當(dāng)新數(shù)據(jù)Z滿足式(13)時,將新數(shù)據(jù)Z存儲到樣本數(shù)據(jù)中。

其中,φ為相似度閾值,sgn()為符號函數(shù),其表達式如式(14)所示:

整理國內(nèi)礦井工作面煤與瓦斯突出數(shù)據(jù)對本文方法進行驗證。整理前15 組數(shù)據(jù)作為突出預(yù)測建模時的訓(xùn)練樣本數(shù)據(jù),訓(xùn)練數(shù)據(jù)的平行坐標(biāo)如圖3所示。后8 組數(shù)據(jù)作為測試數(shù)據(jù)。

圖3 訓(xùn)練數(shù)據(jù)的平行坐標(biāo)圖Fig.3 Parallel coordinates plot of training data
采用Python 語言對本文方法進行編程實現(xiàn)。令突出危險性等級數(shù)量f=4,訓(xùn)練樣本數(shù)量m=15,分類變量數(shù)量o=5,主成分貢獻率閾值δ=0.8,相似度閾值φ=0.90。利用圖3 所示的訓(xùn)練數(shù)據(jù),構(gòu)建工作面煤與瓦斯突出預(yù)測的權(quán)重貝葉斯模型。其中,本文方法得到的分類變量權(quán)重為θ1=0.246 2,θ2=0.146 5,θ3=0.258 4,θ4=0.212 1,θ5=0.136 7 測試數(shù)據(jù)及其預(yù)測結(jié)果如表1所示。
本文方法對煤與瓦斯突出預(yù)測具有較高的準(zhǔn)確率,采用圖3 所示的訓(xùn)練數(shù)據(jù),構(gòu)建工作面煤與瓦斯突出預(yù)測的樸素貝葉斯(NBS)模型和專家給定分類變量權(quán)重的權(quán)重貝葉斯(EWBS)模型,并對測試數(shù)據(jù)進行突出危險性預(yù)測。利用NBS 模型進行突出預(yù)測的方法記為NBS 方法,而利用EWBS 模型進行突出預(yù)測的方法記為EWBS 方法。EWBS 方法與本文方法都是利用式(10)所示模型進行突出危險性預(yù)測。兩種方法的區(qū)別在于分類變量權(quán)重確定方法不同,EWBS 方法的分類變量權(quán)重具有主觀性,受專家經(jīng)驗知識影響,而本文方法的分類變量權(quán)重是通過對突出數(shù)據(jù)的主成分分析獲得,具有客觀性和科學(xué)性,對突出數(shù)據(jù)有一定的依賴性。NBS 方法可以看作是本文方法的特殊情況,即各分類變量權(quán)重值都為1 的預(yù)測方法。煤與瓦斯突出的發(fā)生受多種因素共同影響,但各因素對突出的影響不同。因此NBS方法是在較理想條件下實現(xiàn),本文方法更符合實際。NBS 和EWBS 方法對測試數(shù)據(jù)的預(yù)測結(jié)果如表1 所示。EWBS 方法中的θ1=0.16,θ2=0.16,θ3=0.30,θ4=0.19,θ5=0.19。

表1 測試數(shù)據(jù)及其預(yù)測結(jié)果Table 1 Testing data and prediction results
由表1 可知,本文與EWBS 方法所得的預(yù)測結(jié)果與實際完全一致,并優(yōu)于NBS 方法,NBS 方法的預(yù)測結(jié)果準(zhǔn)確率為75%。
本文方法和EWBS 方法針對測試數(shù)據(jù)進行突出預(yù)測時得到最大后驗概率值如表2 所示。本文方法得到最大后驗概率值均大于EWBS 方法,且預(yù)測不確定性優(yōu)于EWBS 方法。相比專家給定方法,本文方法所確定的分類變量權(quán)重更合理。

表2 最大后驗概率值Table 2 Maximum posterior probability value
NBS 方法和本文方法建模所需的時間如表3 所示。本文方法建模所需時間僅為2.5 s,比NBS 方法建模時間多了1.1 s。而實際利用所建模型進行突出預(yù)測時間不超過10 ms,滿足工作面煤與瓦斯突出動態(tài)預(yù)測的時間要求。

表3 建模時間Table 3 Time for building model s
本文將工作面煤與瓦斯突出預(yù)測問題歸結(jié)為分類問題,考慮突出的動靜多種影響因素,提出一種基于PCA和權(quán)重貝葉斯的工作面煤與瓦斯突出預(yù)測方法。實驗結(jié)果表明,與樸素貝葉斯與權(quán)重貝葉斯模型相比,該預(yù)測方法具有預(yù)測準(zhǔn)確性高、預(yù)測不確定性低、設(shè)置參數(shù)較少的特點,可以快速獲得預(yù)測結(jié)果,為現(xiàn)場指導(dǎo)礦井工作面安全生產(chǎn)提供一定的參考。后續(xù)將在權(quán)重貝葉斯模型中融入電磁輻射、聲發(fā)射實時因素信息,進一步提高突出預(yù)測準(zhǔn)確性。