李長(zhǎng)興,辛程鵬,李回貴,劉義磊
(1.貴州工程應(yīng)用技術(shù)學(xué)院礦業(yè)工程學(xué)院,貴州 畢節(jié) 551700; 2.中國(guó)礦業(yè)大學(xué)(北京)應(yīng)急管理與安全工程學(xué)院,北京 100083)
煤與瓦斯突出是在地應(yīng)力和瓦斯的共同作用下突然從煤體或巖體內(nèi)向巷道和采掘空間拋出大量煤巖和瓦斯的異常動(dòng)力現(xiàn)象,具有極強(qiáng)的破壞性,給煤炭企業(yè)造成了巨大的經(jīng)濟(jì)損失和人員傷亡[1]。隨著我國(guó)煤礦機(jī)械化開(kāi)采水平的提高和采掘深度的延深,煤與瓦斯突出現(xiàn)象日趨更加嚴(yán)重[2]。近年來(lái),國(guó)內(nèi)外學(xué)者對(duì)煤與瓦斯突出預(yù)測(cè)做了大量的研究工作,提出了多種有效的預(yù)測(cè)方法,這些方法極大地推動(dòng)了煤與瓦斯突出預(yù)測(cè)研究工作的快速發(fā)展,如綜合指標(biāo)法、神經(jīng)網(wǎng)絡(luò)法、電磁輻射法、灰色理論法、免疫遺傳法、可拓聚類法等[3-8]。由于煤與瓦斯突出極其復(fù)雜,突出預(yù)測(cè)的敏感指標(biāo)和臨界值很難確定,目前對(duì)突出發(fā)生的機(jī)理也尚不能完全掌握,因此,如何對(duì)煤與瓦斯突出準(zhǔn)確無(wú)誤地進(jìn)行預(yù)測(cè)預(yù)報(bào)成為了煤礦安全開(kāi)采中的關(guān)鍵一環(huán)。筆者基于數(shù)理統(tǒng)計(jì)分析理論,利用逐步判別法對(duì)影響煤與瓦斯突出的指標(biāo)進(jìn)行篩選,建立煤與瓦斯突出的Fisher判別分析模型。從雜亂無(wú)章的突出實(shí)例數(shù)據(jù)中來(lái)尋求它們之間的內(nèi)在聯(lián)系,用直觀的數(shù)學(xué)方法來(lái)反映總體間的差異性,以尋求一種能夠判定新樣本總體類別歸屬問(wèn)題的最優(yōu)方法,從而有效地對(duì)煤與瓦斯突出危險(xiǎn)性進(jìn)行判別預(yù)測(cè)。
Fisher判別法的基本思想就是將高維特征向量空間投影到低維空間。該方法的基本思路就是將n維空間中的某一個(gè)點(diǎn)x=(x1,x2,x3,…,xn)轉(zhuǎn)換為一維函數(shù)y(x):y(x)=∑Cjxj,然后利用該一維函數(shù)把n維空間中的所有已知類別總體和求知類別歸屬的樣本數(shù)據(jù)都轉(zhuǎn)換成一維數(shù)據(jù),再根據(jù)樣本數(shù)據(jù)點(diǎn)之間的親疏程度來(lái)判定未知樣本數(shù)據(jù)點(diǎn)的歸屬類別。通過(guò)降維,根據(jù)組間距離最大、組內(nèi)距離最小的原則確定的判別分析函數(shù)不僅能將新的樣本進(jìn)行判別分類,而且能獲取非常高的判別效率。

ei=E(y|Gi)=a′μ(i),i=1,2,…,k
(1)

(2)
令:

(3)

(4)
B0相當(dāng)于一元方差分析中的組間差,E0相當(dāng)于組內(nèi)差。令μ′為式(5)。

(5)
則可得Δ(a)=B/E=a′Ba/a′Ea。很顯然,B,E均為非負(fù)定陣,Δ(a)的極大值為方程|B-λE|=0的最大特征根,取a為對(duì)應(yīng)于λ1的特征向量即為判別函數(shù)的系數(shù),即可求出判別函數(shù)。由數(shù)學(xué)知識(shí)可知,特征根的個(gè)數(shù)m是不會(huì)超過(guò)min(k-1,p)個(gè)的,由此可構(gòu)造出m個(gè)判別函數(shù),為式(6)。
yl(x) =c(l)Tx,l= 1,2,…,m
(6)
對(duì)于每一個(gè)判別函數(shù)必須要用一個(gè)指標(biāo)pi來(lái)其衡量判別能力,其中pi可定義為式(7)。

(7)
m0個(gè)判別函數(shù)y1,y2,…,ym0的判別能力定義為式(8)。

(8)


(9)
j=1,2,…,k。由此可得判別規(guī)則,見(jiàn)式(10)。

(10)
在判別分析問(wèn)題中,影響判別能力的變量很多,且影響程度大小不一。如果把主要變量誤剔除,那么建立的判別函數(shù)其判別效果一定不佳;但判別變量很多而又不加剔除地全部被選入會(huì)造成在求解逆矩陣時(shí)計(jì)算精度下降。選取國(guó)內(nèi)典型突出礦區(qū)的30個(gè)突出實(shí)例(收集自不同礦井的同一組煤層,且工程地質(zhì)條件類似),其中20個(gè)作為訓(xùn)練樣本(表1),另外10個(gè)作為待判樣本(表5)。采用逐步判別分析法[11]對(duì)影響煤與瓦斯突出的敏感指標(biāo)進(jìn)行逐步判別篩選,由于收集到的突出實(shí)例中常用的敏感指標(biāo)最大鉆屑量Smax、鉆屑解吸指標(biāo)K1和Δh2等數(shù)據(jù)缺失,故采用其他5個(gè)敏感指標(biāo)(即瓦斯壓力、放散初速度、堅(jiān)固性系數(shù)、煤體破壞類型和埋藏深度,分別用x1、x2、x3、x4、x5表示)進(jìn)行逐步判別篩選,其中煤體破壞類型分為5類:1(非破壞煤)、2(破壞煤)、3(強(qiáng)烈破壞煤)、4(粉碎煤)、5(全粉煤)。取F進(jìn)=5.0,F(xiàn)出=3.5作為逐步判別停止的臨界值。若某一變量F≥5.0時(shí),則表明該變量判別能力顯著,需將其加入到判別模型中;若某一變量F≤3.5時(shí),則表明該變量判別能力微弱,應(yīng)將其剔除出判別模型。重復(fù)以上過(guò)程,直至計(jì)算到既沒(méi)有變量加入也無(wú)變量被剔除,逐步判別分析過(guò)程才算結(jié)束。由于篇幅所限,對(duì)于逐步判別篩選判別因子的具體步驟不再詳述。最終從給定的5個(gè)評(píng)價(jià)指標(biāo)中將堅(jiān)固性系數(shù)x3、煤體破壞類型x4剔除出突出判別函數(shù),將瓦斯壓力x1、瓦斯放散初速度x2、埋藏深度x5選入作為突出判別因子。

表1 樣本數(shù)據(jù)及分類結(jié)果Table 1 Sample data and discriminant results
根據(jù)多元統(tǒng)計(jì)方差分析原理,定義A為樣本數(shù)據(jù)點(diǎn)的組內(nèi)離差平方和,T為樣本數(shù)據(jù)點(diǎn)的總離差平方和,此時(shí)有:Λ=|A|/|T|,要對(duì)某一變量的判別能力的顯著性進(jìn)行分析,可按下面步驟來(lái)操作。
判別函數(shù)中假設(shè)已有q個(gè)變量,記X*,若考慮是否有必要添加變量Xj,可通過(guò)計(jì)算偏威爾克斯統(tǒng)計(jì)量,見(jiàn)式(11)。

(11)
式中,Λ(X*,Xj)為X*與Xj的威爾克斯統(tǒng)計(jì)量??梢宰C明,見(jiàn)式(12)。
Fα(k-1,n-k-q)
(12)
即F進(jìn)=Fα(k-1,n-k-q),如果有F≥F進(jìn),則表明變量Xj判別能力顯著,在判別函數(shù)中相應(yīng)地有必要增加變量Xj。針對(duì)判別函數(shù)中已有的q個(gè)變量X*,如若存在有對(duì)判別能力不顯著的變量,則需將其剔除出判別函數(shù)。如考慮變量Xk是否可從判別函數(shù)中剔除,記剔除Xk的變量組為X*(k),則有式(13)。
Fα(k-1,n-k-q+1)
(13)
此時(shí),若有F≤Fα(k-1,n-k-q+1)=F出,則說(shuō)明變量Xk的判別能力不顯著,需要把Xk從X*中剔除掉。重復(fù)以上引入和剔除變量的過(guò)程,直到既不能將新變量引入,又不能把已選入判別函數(shù)的變量剔除掉為止,至此便可用已選入的變量來(lái)構(gòu)建判別分析函數(shù)。
根據(jù)以上計(jì)算公式,取F進(jìn)=5.0,F(xiàn)出=3.5作為逐步判別停止的臨界值。重復(fù)以上過(guò)程,直至計(jì)算到既沒(méi)有變量加入也無(wú)變量被剔除,逐步判別分析過(guò)程才算結(jié)束。由于篇幅所限,對(duì)于逐步判別篩選判別因子的具體步驟不再詳述。最終從給定的5個(gè)評(píng)價(jià)指標(biāo)中將堅(jiān)固性系數(shù)x3、煤體破壞類型x4剔除出突出判別函數(shù),將瓦斯壓力x1、瓦斯放散初速度x2、埋藏深度x5選入作為突出判別因子。
《防治煤與瓦斯突出規(guī)定》指出[12],在進(jìn)行煤與瓦斯突出危險(xiǎn)性鑒定時(shí),給出的礦井鑒定結(jié)果是否為突出礦井,而對(duì)突出礦井的突出類別大小沒(méi)有給出。研究表明[13],對(duì)于有些礦井其各項(xiàng)突出指標(biāo)值并沒(méi)有超過(guò)其臨界值,但也有可能會(huì)發(fā)生煤與瓦斯突出;根據(jù)突出時(shí)拋出煤的重量不同將突出分為4類:Ⅰ-無(wú)突出、Ⅱ-小型突出(50 t以下)、Ⅲ-中型突出(50~100 t)、Ⅳ-大型突出(100 t以上)。根據(jù)上面所述建模過(guò)程,將表1中所列出的20組煤與瓦斯突出實(shí)例作為學(xué)習(xí)訓(xùn)練樣本建立Fisher判別模型,經(jīng)訓(xùn)練學(xué)習(xí)并計(jì)算可得到表2中各個(gè)Fisher判別函數(shù)的系數(shù),因此建立的判別函數(shù)分別為:y1=2.217x1+0.151x2-0.007x5-2.578;y2=0.551x1-0.19x2+0.012x5-5.894;y3=-0.4x1+0.266x2+0.004x5-3.661。
表3為各判別函數(shù)特征值及組質(zhì)中心值。從表3中給出的方差百分比可知:第1個(gè)判別函數(shù)方差的貢獻(xiàn)率為77.2%,說(shuō)明此函數(shù)可以解譯77.2%的樣品信息,利用該函數(shù)能夠?qū)^大部分樣品類屬進(jìn)行判別;第2個(gè)判別函數(shù)方差的貢獻(xiàn)率為14.4%,說(shuō)明該函數(shù)可以解譯14.4%的樣品信息;第3個(gè)判別函數(shù)方差貢獻(xiàn)率為8.4%。當(dāng)利用第1個(gè)判別函數(shù)對(duì)樣本屬類無(wú)法作出明確判斷時(shí),可分別依次使用第2個(gè)判別函數(shù)和第3個(gè)判別函數(shù)來(lái)對(duì)樣本分屬類別進(jìn)行判斷。從3個(gè)判別函數(shù)的累積方差貢獻(xiàn)率為100%可知,當(dāng)把3個(gè)判別函數(shù)聯(lián)合起來(lái)使用時(shí),可以完成對(duì)所有樣品分屬類別的判斷。

表2 Fisher判別式函數(shù)系數(shù)Table 2 Coefficient of Fisher discriminant function

表3 判別函數(shù)方差貢獻(xiàn)率及組中心值Table 3 Discriminant function variance contribution rate and group center value
為了考察上述所求判別函數(shù)的準(zhǔn)確度,可采用計(jì)算其誤判率的檢驗(yàn)方法。通常采用以樣本數(shù)據(jù)回代估計(jì)的方法來(lái)計(jì)算誤判率,即把所有訓(xùn)練樣本重新作為新樣本代入構(gòu)建的判別函數(shù)中,根據(jù)判別準(zhǔn)則對(duì)其類別歸屬進(jìn)行判別,并用被誤判的樣本個(gè)數(shù)與所有訓(xùn)練樣本個(gè)數(shù)的比值來(lái)代表誤判率,誤判率越低表明建立的模型判別效果越好。對(duì)20組訓(xùn)練樣本進(jìn)行回代估計(jì)檢驗(yàn),其回判結(jié)果見(jiàn)表4。圖1是利用第1判別函數(shù)和第2判別函數(shù)對(duì)樣本進(jìn)行類別分組的示意圖,從圖中可清晰地看出,絕大部分樣本都集中在各自所屬類別的組中心值附近,組均值和組間離差大,組內(nèi)離差較小,20組樣本的聚合程度及分離效果均非常明顯。

表4 樣本數(shù)據(jù)及分類結(jié)果Table 4 Sample data and discriminant results
注:“*”為誤判樣本
從表4中給出的判別結(jié)果可知,20個(gè)突出訓(xùn)練樣本回判后只有1個(gè)訓(xùn)練樣本出現(xiàn)判別結(jié)果與實(shí)際不相符的情況,其誤判率僅為5.0%。出現(xiàn)判別錯(cuò)誤的樣本為編號(hào)9,它的實(shí)際突出類別為Ⅲ,結(jié)果利用所建立的判別函數(shù)將其突出類型判為Ⅰ。出現(xiàn)這種誤判的情況,可能跟數(shù)據(jù)采集點(diǎn)的地質(zhì)條件和人的因素有關(guān)。另外,從圖1也可清楚地看出,編號(hào)9的樣本處在突出類別Ⅰ和類別Ⅲ的交界處,很容易引起誤判。因此,在實(shí)際突出判別應(yīng)用時(shí),需密切結(jié)合突出地點(diǎn)的地質(zhì)條件,以保證煤與瓦斯突出判別的準(zhǔn)確性。從誤判率可見(jiàn),F(xiàn)isher-逐步判別分析方法能夠有效地對(duì)煤與瓦斯突出進(jìn)行判別預(yù)測(cè),而且方法簡(jiǎn)單可靠,準(zhǔn)確率高。

圖1 第1判別函數(shù)和第2判別函數(shù)分組Fig.1 Groups of the first and second discriminant function
利用建立好的Fisher判別分析模型對(duì)選取的另外10個(gè)突出實(shí)例進(jìn)行突出危險(xiǎn)性判識(shí),見(jiàn)表5。將各實(shí)例的判別因子數(shù)值逐一分別代入第1判別函數(shù)、第2判別函數(shù)和第3判別函數(shù),得到3個(gè)判別函數(shù)值,得到的3個(gè)函數(shù)值形成的是一個(gè)空間坐標(biāo)位置,根據(jù)該坐標(biāo)位置點(diǎn)與各組中心值坐標(biāo)位置點(diǎn)間的距離(即歐式距離)最小原則便可對(duì)待測(cè)樣本的類別歸屬進(jìn)行判別預(yù)測(cè)。以編號(hào)為1的樣本為例,先利用3個(gè)判別函數(shù)計(jì)算出的函數(shù)值分別為0.85、-1.88、0.07,然后計(jì)算空間坐標(biāo)點(diǎn)(0.85,-1.88,0.07)與各類中心值之間的歐式距離分別為2.89、0.99、4.90、3.92,由于與第Ⅱ中心值間的歐式距離最短,因此將該樣本的突出類別判別為Ⅱ類。依此類推,可對(duì)其它樣本的類別歸屬進(jìn)行判別預(yù)測(cè),判別結(jié)果見(jiàn)表5。結(jié)果表明:10個(gè)突出實(shí)例的判別結(jié)果與實(shí)際情況完全一致,判別正確率達(dá)100%。因此,在實(shí)際應(yīng)用中,可根據(jù)所建立的Fisher-逐步判別分析模型對(duì)煤與瓦斯突出進(jìn)行有效地預(yù)測(cè)。
Fisher-逐步判別分析模型用于煤與瓦斯突出預(yù)測(cè),是建立在對(duì)已有煤與瓦斯類型特征規(guī)律訓(xùn)練學(xué)習(xí)的基礎(chǔ)上,訓(xùn)練學(xué)習(xí)樣本的代表性及數(shù)量對(duì)煤與瓦斯突出的準(zhǔn)確判別預(yù)測(cè)極其重要。因此,利用該判別模型進(jìn)行煤與瓦斯突出預(yù)測(cè)時(shí)需注意以下問(wèn)題:①在對(duì)學(xué)習(xí)樣本進(jìn)行篩選時(shí)應(yīng)優(yōu)先考慮常用的突出預(yù)測(cè)敏感指標(biāo);②所建立的判別模型適用于煤層地質(zhì)條件和采煤技術(shù)工藝類似的待預(yù)測(cè)區(qū)域,在實(shí)際工程應(yīng)用過(guò)程中,可根據(jù)現(xiàn)場(chǎng)工程地質(zhì)情況,盡可能選取具有代表性的實(shí)例和判別能力顯著的指標(biāo);③在不增加計(jì)算負(fù)擔(dān)的前提下,應(yīng)盡可能增加樣本數(shù)量以提高判別模型的準(zhǔn)確性。

表5 待判樣本數(shù)據(jù)及判別分類結(jié)果Table 5 Sample data to be determined and classification results
1) 為減弱非敏感指標(biāo)對(duì)煤與瓦斯突出預(yù)測(cè)結(jié)果的干擾,利用逐步判別法對(duì)影響突出的5項(xiàng)評(píng)價(jià)指標(biāo)進(jìn)行篩選,選取對(duì)突出判別能力影響顯著的瓦斯壓力、瓦斯放散初速度和埋藏深度3個(gè)敏感指標(biāo)作為判別因子。通過(guò)篩選,最大限度地避免了非顯著性指標(biāo)的加入而影響計(jì)算精度和判別結(jié)果,同時(shí),也削弱了評(píng)價(jià)不同指標(biāo)對(duì)煤與瓦斯突出影響程度的隨意性和主觀性,一定程度上反映了各指標(biāo)對(duì)突出影響的差異性。
2) 基于多元統(tǒng)計(jì)分析理論,建立了煤與瓦斯突出預(yù)測(cè)的Fisher-逐步判別分析模型。利用所構(gòu)建的判別模型對(duì)20組煤與瓦斯突出實(shí)例數(shù)據(jù)進(jìn)行訓(xùn)練學(xué)習(xí)得出相應(yīng)的判別函數(shù),用回代估計(jì)的方法進(jìn)行逐一驗(yàn)證,誤判率僅為5%。將建立的判別模型對(duì)10組突出實(shí)例進(jìn)行判別預(yù)測(cè),判別結(jié)果與實(shí)際情況完全吻合,正確率為100%,F(xiàn)isher-逐步判別分析模型是一種有效的煤與瓦斯突出預(yù)測(cè)方法。
3) Fisher-逐步判別分析模型用于煤與瓦斯突出預(yù)測(cè),是建立在對(duì)已有煤與瓦斯類型特征規(guī)律訓(xùn)練學(xué)習(xí)的基礎(chǔ)上,有一定的適用范圍,在實(shí)際應(yīng)用過(guò)程中需綜合考慮待預(yù)測(cè)區(qū)域的煤層地質(zhì)條件及開(kāi)采技術(shù)工藝等。