扶祥祥,江澤標, ,余照陽, ,郭亞玲,吳少康
(1.貴州大學 礦業學院, 貴州 貴陽 550025;2.貴州省非金屬礦產資源綜合利用重點實驗室, 貴州 貴陽 550025)
在煤礦的生產過程中,礦井突水事故是礦井安全事故中危害最大的自然災害之一[1?2]。當礦井突水事故時,及時、有效、準確地判別突水水源的種類是預防和解決突水事故的重要前提。因此,準確判斷突水水源類型,預測其涌水量,對于礦井水害防治和礦井生產安全具有十分重要的意義。
利用水文地球化學數據進行判別分析突水水源的方法,得到廣泛的應用和研究,取得了一些進步和發現[3?4]。水文地球化學數據的差異性是水源的本質特征,通過這些有差異性的數據結合各種方法來判別分析突水水源類別必然十分快捷、有效[5?6]。聶榮花等[7]以邢臺煤礦為研究對象,通過Bayes逐步判別法建立了礦山涌水快速判別模型。張春雷等[8]以淮南顧橋礦為例,結果表明,貝葉斯多類線性判別模型優于神經網絡模型,其計算過程簡單,模型結構穩定。徐星等[9]用逐步 Bayes 判別方法判別突水水源,結果表明其具有易建模、準確率高的優點。曲興玥等[10]用因子分析和距離判別法判別突水水源,提高了判別準確率。
本文采用PCA法和Bayes逐步判別法建立Bayes逐步判別模型和PCA-Bayes綜合判別模型對福建煤礦突水水源進行判別分析,通過結果預測對比,PCA-Bayes綜合判別法比Bayes逐步判別法更準確。
突水水源的含水層中的水源水化學成分眾多。本文選取Na++K+、Ca2+、Mg2+、Cl?、SO42?、HCO3?等6種離子及酸堿度共7項指標的組分作為預測礦井突水的判別因子。
以文獻[11]中福建典型煤礦的35個水源數據為樣本,其中老空水13份,灰巖水7份,地表水6份,裂隙水9份。隨機選取樣本編號為2,5,10,17,25為待測樣本,以剩余樣本為訓練樣本。樣本數據見表1。
利用SPSS軟件[12]對訓練的樣本數據進行Bayes逐步判別處理,可以得到4種水源的判別分類函數,其函數表達式:


表1 福建典型煤礦突水水源數據
式中,S1、S2、S3、S4分別為老空水、裂隙水、灰巖水以及地表水的判別函數值;X1、X2、X3分別為碳酸氫根離子濃度、硫酸根離子濃度、pH值。
將每一組樣本數據代入表達式,得到最大值的樣本數據歸于該類。由SPSS判別的分類結果可知,第1類水源誤判率為0,第2類水源誤判率為37.5%,即有3個第2類水源被判為第3類水源,第3類水源誤判率為0,第4類水源誤判率為0,在該模型下判別正確率為90.0%。
2.2.1 訓練樣本的主成分分析
先對原始樣本數據進行因子分析,從因子分析的結果中可知KMO的值為0.647,顯著性值為0,小于0.05,說明變量間存在相關關系,適合進行因子分析,亦適合進行主成分分析。
各主成分的解釋總方差見表2,從表2中可知,提取3個主成分累積貢獻率已達到86.18%,提取3個成分即可,可以達到降維的目的。

表2 解釋的總方差
根據主成分分析的成分矩陣可以得到特征向量矩陣,從而得到成分矩陣和特征向量矩陣(見表3),從而可以得到PCA處理的綜合指標數據的表達式:

式中,X1、X2、X3、X4、X5、X6、X7分別代表鈉鉀離子濃度、鈣離子濃度、鎂離子濃度、氯離子濃度、碳酸氫根離子濃度、硫酸根離子濃度、pH值。

表3 成分矩陣和特征向量矩陣
將原始數據標準化處理后,代入函數表達式,即可得到主成分分析后的綜合指標數據(見表4),用于建立綜合模型。
2.2.2 PCA-Bayes綜合模型
用PCA處理過的綜合指標數據在SPSS軟件上進行Bayes判別處理,可以得到4類突水水源的判別分類函數表達式:


表4 PCA處理得到的綜合指標數據
式中,W1、W2、W3、W4分別為老空水、裂隙水、灰巖水以及地表水的判別函數值;X1、X2分別為綜合指標Z1、Z2的值。
由SPSS判別的分類結果可知,第1類水源誤判率為18.2%,一個判別為2類水源,一個判別為3類水源;第2類水源誤判率為0;第3類水源誤判率為0;第4類水源誤判率為0。所以該樣本數據在PCA-Bayes綜合判別模型下判別正確率為93.3%。
首先將待測樣本代入Bayes逐步判別模型得到判別函數,然后將待測函數進行主成分分析并將所得到的主成分樣本數據代入PCA-Bayes綜合判別模型得到判別函數(見表5)。
由表5可知,5個待測樣本在Bayes逐步判別模型中有一個判別錯誤,判別的正確率為80%,5個待測樣本在PCA-Bayes綜合判別模型下的判別全部正確,判別正確率為100%。
(1)本文對福建典型礦的突水水源建立Bayes判別模型和PCA-Bayes綜合判別模型,并對待判樣本進行判別。
(2)運用Bayes逐步判別模型對訓練樣本的回判正確率為90%,待測樣本的判別正確率為80%;運用PCA-Bayes綜合判別模型對訓練樣本的回判正確率為93.3%,待測樣本的判別正確率為100%。
(3)從兩個模型的對比分析可以看出,通過PCA降維的PCA-Bayes綜合判別法的正確率要優于單一的Bayes逐步判別法,PCA-Bayes綜合判別法是一種對突水水源判別快捷、準確、有效的方法。

表5 待測樣本模型驗證