熊 偉 崔光磊
(中國礦業(yè)大學安全工程學院,江蘇省徐州市,221116)
貝葉斯判別分析在礦井突水水源預測中的應用
熊 偉 崔光磊
(中國礦業(yè)大學安全工程學院,江蘇省徐州市,221116)
選用多項化學指標作為判別因子,建立了適用于不同水質類型礦井多類水源分析的貝葉斯(Bayes)判別分析模型進行礦井突水預測。通過對河南焦作礦區(qū)樣本進行預測,對比實測數(shù)據(jù),驗證了該方法在突水預測中具有較高的準確性。
貝葉斯判別分析 突水 預測 焦作礦
隨著社會的發(fā)展,對能源需求量不斷增大,煤礦的開采量急劇增加,導致開采深度不斷增加和開采規(guī)模不斷擴大,礦井突水危害日益嚴重。研究煤礦突水規(guī)律及其機理,迅速判定突水水源位置及采取有效的治理措施,是礦井實現(xiàn)高效高產的重要保障內容,也是煤礦安全生產中亟待解決的課題。
地質條件的差別使得不同含水層地下水化學成分各不相同,利用水文地球化學方法,分析礦井涌出水的化學成分及組成,確定其水質類型,就可判定礦井涌水來自哪個含水層。據(jù)此原理,目前已發(fā)展出了很多識別礦井突水水源的方法,例如數(shù)量化方法、專家經(jīng)驗法、人工神經(jīng)網(wǎng)絡法、模糊綜合評價法等。
本文提出采用貝葉斯(Bayes)判別分析方法對礦井突水水源的地下水化學樣品進行歸類和分析,以建立用于識別突水水源的判別模型,并依據(jù)該模型對新的突水水樣進行判別分類,為礦區(qū)防治水工作提供了一種簡便快捷的新工具和途徑。
所謂判別方法就是給出空間Rm的一種劃分:D={D1,D2,…,Dk},一種劃分對應一種判別方法,不同的劃分就是不同的判別方法。貝葉斯判別法也是給出空間Rm的一種劃分。
貝葉斯的統(tǒng)計思想總是假定對研究的對象已有一定的認識,常用先驗概率分布來描述這種認識;然后抽取一個樣本,用樣本來修正已有的認識(先驗概率分布),得到后驗概率分布。各種統(tǒng)計推斷都通過后驗概率分布來進行,將貝葉斯思想用于判別分析就得到貝葉斯判別法。
設有k個總體(G1,G2,…,Gk)。假設事先對所研究的問題有一定的認識,這種認識常用先驗概率來描述,即已知這k個總體各自出現(xiàn)的概率(驗前概率)為(q1,q2,…,qk),其中qi>0,q1+q2+…+qk=1。
先驗概率是一種權重,所謂“先驗”是指先于我們抽取樣品作判別分析之前。貝葉斯判別法要求給出qi(i=1,2,…,k)的值。qi的賦值方法采用訓練樣本中分類樣品占的比例ni/n作為qi的值,其中ni是第i類總體的樣品數(shù),而n=n1+n2+…+nk。這時要求訓練樣本是通過隨機抽樣得到的,分類樣品被抽到的機會大小就是驗前概率。
設總體G為m元總體(考察m個指標),均值向量為μ=(μ1,μ2,…,μm)′,協(xié)方差陣為Σ,則樣品X=(x1,x2,…,xm)′與總體G的馬氏距離定義為:

在馬氏距離判別的基礎上,進一步考慮先驗概率及各組內協(xié)方差陣的不同,定義樣品X到總體Gt(t=1,…,k)的廣義平方距離(X)或D2(X,Gt)為:

式中:

St為第t類的組內樣本協(xié)方差陣。由以上公式可見,當(X)不變,而某個qt大(即總體Gt出現(xiàn)的機會大)時,g2(t)變小,故廣義平方距離(X)也變小,進而判X為Gt的可能性大。利用廣義平方距離的判別法判X∈Gt,當(X)<時,i≠t(i=1,…,k)。
標準的貝葉斯判別法應該計算后驗概率分布,即計算當樣品X已知時,它屬于Gt的概率,記為P(Gt|X)或P(t|X),這個概率作為判別歸類的準則,其概率意義更為直觀。假定總體Gt的概率密度函數(shù)ft(x)(t=1,2,…,k)給定,由條件概率的定義可以導出:

若假設Gi(i=1,…,k)為正態(tài)總體,其密度函數(shù)fi(x)為:

則X屬于第t組的后驗概率為:

在正態(tài)假設下按后驗概率最大進行歸類的準則,等價于按廣義平方距離最小準則進行歸類。后驗概率最大準則歸類的判別法就是貝葉斯判別法的一種情況。一般地,貝葉斯判別法既考慮先驗概率的不同,還考慮了錯判損失的大小,在這里我們假定錯判損失相等。

表1 各類水源學習樣本
焦作礦區(qū)位于河南省北部,平均煤厚6 m,礦井涌水量大,突水頻繁。歷史上共發(fā)生過大小突水700余次,其中突水量大于10 m3/min的突水61次,最大突水量320 m3/min,共造成淹井事故14次。表1給出了焦作礦區(qū)12例樣本的四類水源數(shù)據(jù),其中I類為二灰和奧陶紀含水層;II類為八灰含水層;III類為頂板砂巖含水層;IV類為第四系含水層。選取6種離子組合作為判別指標,分別是Na++K+、Ca2+、Mg2+、Cl-、S、HC。
分別把水源I類、II類、III類、IV類作為4個總體G1、G2、G3、G4,這里假設各個總體為正態(tài)總體,各正態(tài)總體的協(xié)方差矩陣相等且錯判損失也相等。6種離子組合項指標依序分別作為貝葉斯判別分析模型的判別因子。根據(jù)表1中4個總體的學習樣本數(shù)據(jù)確定先驗概率為:

由于本例假設協(xié)方差陣相等并且從表1中可知各總體的先驗概率相等,因此由(1)式和(2)式可得(5)式中Di2(X)為:

為得到樣本X屬于第t個總體的后驗概率,先利用數(shù)學軟件MATLAB求得兩個總體的樣本均值向量和協(xié)方差矩陣分別為:

協(xié)方差矩陣為:

然后利用MATLAB中的inv命令求得S的逆矩陣為:


表2 各類水源預測樣本
采用后驗概率的判別準則對已經(jīng)確定水源的4個突水水樣進行實際驗證,見表2。
將表2中4個樣本由公式(5)計算各個預測樣本的后驗概率,從中選取最大值,則所對應的類別即為該預測樣本所屬的類別。4個樣本判別結果見表3。

表3 預測樣本判別結果
通過貝葉斯分析判別方法得出如表3所示的歸屬判別結果,與表2中的實際歸屬類別完全一致,說明貝葉斯判別方法在礦井突出水源預測方面具有很高的準確性與可信性,對礦井突出水源預測判別具有一定作用和意義,具有一定的推廣應用價值。
[1] 張許良,張子戌等.數(shù)量化理論在礦井突(涌)水水源判別中的應用[J].中國礦業(yè)大學學報,2005(3)
[2] 馮利軍,李競生等.具有線性功能函數(shù)的神經(jīng)元在礦井水質類型識別中的應用[J].煤田地質與勘探,2002(4)
[3] 鄧波.基于貝葉斯判別準則的地下礦山開采安全評價法[J].采礦技術,2011(5)
[4] 馮利軍,郭曉山.人工神經(jīng)網(wǎng)絡在礦井突水預報中的應用[J].西安科技學院學報,2003(4)
[5] 吳喜之.現(xiàn)代貝葉斯統(tǒng)計學[M].北京:中國統(tǒng)計出版社,2000
[6] 林杰新,羅偉其等.Bayes判別信用評價模型及其應用研究[J].統(tǒng)計與決策,2005(1)(下)
[7] 宋曉梅,桂和榮等.安徽淮北煤田地下水微量元素Bayes多類線性判別分析[J].中國煤炭,2005(5)
[9] 聞新.MATLAB神經(jīng)網(wǎng)絡應用設計[M].北京:科學技術出版社,2002
Application of Bayes discriminant analysis on prediction of water inrush source
Xiong Wei,Cui Guanglei
(School of Safety Engineering,China University of Mining and Technology,Xuzhou,Jiangsu 221116,China)
Several chemical indexes were selected as the discriminant factors.Then several bayes discriminant analysis modes were established for different coal mines with different quality water to predict the water inrush.The prediction data of samples from Jiaozuo Mining area in Henan proved that this method has high accuracy in water inrush prediction.
bayes discriminant analysis,water inrush,prediction,Jiaozuo Mining
TD742
A
熊偉(1986-),男,四川自貢人,碩士研究生,現(xiàn)就讀于中國礦業(yè)大學安全工程學院,主要研究方向為煤礦安全管理。
(責任編輯 張艷華)