邵良杉 徐 波(遼寧工程技術大學系統工程研究所,遼寧 葫蘆島 125000)
基于Fisher判別分析的沖擊地壓危險性等級預測
邵良杉 徐 波(遼寧工程技術大學系統工程研究所,遼寧 葫蘆島 125000)
針對礦井中發生的沖擊地壓危險性分級問題,應用因子分析和Fisher判別分析理論,選取煤層厚度、煤層傾角、埋深、構造情況、煤層傾角變化、煤層厚度變化、瓦斯濃度、頂板管理、卸壓、響煤炮聲為影響因素,分析影響因素之間的相關性,對相關性較強的因素進行因子分析,提取恰當的公共因子,進而建立基于因子分析的沖擊地壓危險性等級Fisher判別分析(FDA)模型。利用四川硯石臺煤礦23組實測數據作為學習樣本對模型進行訓練。采用回代估計法檢驗模型的有效性,回判的誤判率為0。將另外未參加訓練的12組煤礦動力現象數據作為測試樣本,對其危險性等級進行預測,并與傳統的Fisher判別方法進行對比。結果表明,經過對樣本因子分析后,指標個數減少,相關性降低,可以有效預測沖擊地壓的危險性等級,用該模型所得到的預測結果的誤判率為0。
沖擊地壓 預測 分級 因子分析 Fisher判別分析 回代估計法
沖擊地壓是礦井中一種較為典型的災害現象,它是聚積在礦井巷道和采場周圍煤巖體中的能量突然釋放,造成煤巖體振動和破壞、巷道跨壞、設備和支架損壞甚至人員傷亡的一種動力災害現象。沖擊地壓還可能引發瓦斯爆炸、火災、水災,破壞通風系統,甚至會造成地震和居民房屋、建筑物破壞等災害。因此,沖擊地壓已經成為煤礦中重大災害之一[1-3]。世界上很多采煤國家,如英國、波蘭、印度、南非、德國等都有沖擊地壓事故的發生[4-5],最早的沖擊地壓事故煤礦是1738年發生在英國的南斯塔福煤田。自從1933年在撫順勝利煤礦發生沖擊地壓事故以來,我國有30%以上的國有重點煤礦也都發生過沖擊地壓的災害[6],包括北京、棗莊、開灤、徐州、阜新、大同、鶴壁、雞西、七臺河、淮南、大屯、鶴崗、義馬、平頂山等百余個礦井[7-8]。我國煤礦中發生的沖擊地壓除了瞬時震動性、突然性和破壞性等顯著特征外,還具有以下特點:①發生條件極為復雜;②類型多種多樣,災害嚴重程度不同;③隨著礦井開采深度的增加,越來越多的礦井發生沖擊地壓災害,造成的危害也愈來愈重[9]。沖擊地壓的預測和防治具有重要的實用價值和現實意義,已成為礦山安全生產中亟待解決的重大課題[10]。世界上許多國家都提出了對沖擊地壓進行預測的方法,比較有代表性的傳統方法有采用經驗類比分析法、鉆屑法、地音監測法、微震監測法、含水率測定法、電磁輻射法等[11-12]。這些方法的特點是在應用的過程中只考慮了單一因素或主要因素。但沖擊地壓是一個復雜的動力學系統,它受到井下復雜的采礦地質條件和自然條件共同影響,存在一定的非線性和不確定性,因此用單一指標來進行預測會存在很多不足。為此,近些年,很多學者在考慮多因素影響的情況下,將神經網絡[13]、PSO-SVM模型[14]、時間序列模型[15]等應用到沖擊地壓的預測中,使預測結果更加客觀和準確。這些方法在實際應用中都有一定的成果,但是每種方法都存在一定的局限性,如神經網絡容易陷入局部最優,對解決小樣本問題能力有限;支持向量機的核函數及其參數的選擇較為復雜;而時間序列在應用時常常忽略了外界因素的影響,因此,若外界發生較大變化時,會出現較大偏差。
1.1 因子分析的數學模型
因子分析主要目的是濃縮數據,通過對諸多變量的相關性研究,把一些信息重疊、具有錯綜復雜關系的變量歸結為少數幾個不相關的綜合因子,是多元統計分析的一個重要分支。
設有k個變量,分別為X1,X2,…,Xk,其中,
即每個變量由n個指標構成,且每個變量都是標準化變量,即均值為0,標準差為1。因子分析的數學模型可以表示為
(1)
式中,Fj是公共因子,m(m X=AF+e, (2) 其中, 是負載矩陣。 因子分析的前提是X1,X2,…,Xk之間具有較高的相關性。判斷變量之間是否適合作因子分析的方法主要有KMO樣本測度法和巴特利特球體檢驗[16]。 在確定了公共因子變量之后,要計算這些變量在不同因子上的具體數據值,即因子值,以便進一步研究。設第j個公共因子的因子值是fj,可以根據X1,X2,…,Xk的樣本值計算出來,計算公式如下: (3) 上式可以簡記為 fj=xβj, 式(3)中,βkj是因子值的系數。因子值的求法一般有以下3步:①求出標準化數據xij的相關系數矩陣R;②從xij與負載矩陣A,利用公式 為負載矩陣的A的第j列,計算出βj;③由公式fj=xβj,計算出公共因子fj的因子值。 1.2 Fisher判別分析方法的求解過程和思路 Fisher判別分析的基本思想是投影[16-17],即將高維數據點投影到低維空間上,使數據點變得比較密集,從而克服由于維數高而引起的“維數禍根”[18]。投影的原則是將總體與總體之間盡可能地分開,然后根據類間距離最大、類內距離最小的原則確定判別分析函數,達到正確分類的目的,進而對新的樣本進行分類判別。 設有m個總體G1,G2,…,Gm,每個總體的特征指標都是p個,相應的均值向量和協方差矩陣分別為μ1,μ2,…,μm(p維),V1,V2,…,Vm(p×p階)。對于樣本 假定其判別函數為 Y=u1x1+u2x2+…+upxp=uTx, (4) 其中,u為p維向量,Y為一維的隨機變量。那么,Y在各類中的均值和方差分別為 ei=uTμi,i=1,2,…,m, (5) (6) 記B0為Y在各類中的均值ei的離差平方和: (7) B0反映的是均值ei之間的離散程度,B0的值越大,離散程度就越大,各個總體就越容易被劃分開來。 記E0是Y在各類中的方差之和: (8) E0是Y在各類中的方差之和,其值越小,則G1,G2,…,Gm就越容易被劃分開來。Fisher判別法的準則就是選擇能夠使B0/E0最大的u,來作為判別函數 Y=u1x1+u2x2+…+upxp=uTx 中的系數向量。令 設λ是矩陣[E-1B]的最大特征根,對應于λ的特征向量u就是所要求的判別函數中的系數向量。當存在大于或等于3個總體時,通常找出對應于[E-1B]的前幾個較大特征根 λ1,…,λt,t≤min(m-1,p), 并根據衡量判別函數判別能力的指標——貢獻率 進行分類,記 對于建立的FDA模型,要對其判別效果進行檢驗,模型的有效性主要表現在2個方面:①對已知類型的樣本的回代判別正確率高,可以用回代估計法求誤判率;②對未分類樣本的判別正確率較高。 來自總體Gm,容量為nm的樣本為 將所有的訓練樣本作為n1+n1+…+nt個新樣本,依次代入建立的判別函數并進行判別,這個過程就是回判。知道總的誤判個數N后,就可以求出誤判率η,η的計算公式為 2.1 特征屬性的選取及其相關性分析 影響礦井沖擊地壓危險的因素有很多,根據多年的工程經驗,認為對沖擊地壓的重要影響因素主要分為地質因素(煤層厚度、煤層傾角、煤層傾角變化情況、煤層厚度變化情況、埋深、構造情況等)和開采因素(瓦斯含量、頂板管理、卸壓、響煤炮聲等)。以四川硯石臺煤礦為例,結合硯石臺煤礦的地質結構和沖擊地壓的重要影響因素,共選擇10個影響硯石臺煤礦沖擊地壓的因素,分別為煤層厚度(X1)、煤層傾角(X2)、埋深(X3)、構造情況(X4)、煤層傾角變化(X5)、煤層厚度變化(X6)、瓦斯濃度(X7)、頂板管理(X8)、卸壓(X9)、響煤炮聲(X10)作為沖擊地壓危險性分級評價指標。這些指標中,構造情況(X4)、煤層傾角變化(X5)、煤層厚度變化(X6)、頂板管理(X8)、卸壓(X9)、響煤炮聲(X10)是狀態參量,為了進一步研究,要先將這些參量進行數量化處理,其賦值方法見表1。 表1 沖擊地壓危險性預測的狀態參量指標分級與賦值Table 1 Classification and valuation of state parameter indexes in rock burst risk prediction 在硯石臺煤礦多年來實測的各個指標和沖擊地壓危險性的數據中,選取具有代表性的35個樣本,其中23個作為FDA模型的訓練樣本,如表2,另外12 作為預測樣本進行判別檢驗,如表3。根據表2中的工程數據,利用SPSS17.0軟件對這10個變量進行兩兩分析,得到檢驗結果為:構造情況、煤厚變化、頂板管理、卸壓和響煤炮聲相互之間的t統計量的值的顯著性概率p<0.01,相關系數顯著異于0,因此,彼此之間存在較強的相關關系;煤層厚度、煤層傾角、埋深、煤層傾角變化、瓦斯濃度相互之間以及與其他5個變量之間的t統計量的值的顯著性概率p>0.01,相關系數不異于0,因此,彼此之間的相關關系較弱。 表2 FDA預測模型學習樣本數據Table 2 Training sample data for the FDA forecast model 表3 FDA預測模型測試樣本數據Table 3 Test sample data of the FDA forecast model 2.2 因子分析的KMO和Barlett檢驗 為了使指標的選擇更加可靠,對存在較強相關關系的5個指標(構造情況、煤厚變化、頂板管理、卸壓和響煤炮聲)進行KMO和巴特利特球體檢驗。運行SPSS可得二者的檢驗結果:樣本的KMO值為0.807,按照統計學家Kaiser給出的判斷標準,KMO值在0.8~0.9,很適合作因子分析;巴特利特球體檢驗的顯著性概率為0.000,小于顯著性水平0.01,拒絕相關系數矩陣為單位矩陣的零假設,可以作因子分析。 2.3 FDA預測模型 礦井中發生的沖擊地壓危險性程度不等,根據造成的危險性情況來看,將硯石臺煤礦發生的沖擊地壓危險性分為4個等級,分別為微沖擊(T1)、弱沖擊(T2)、中等沖擊(T3)和強沖擊(T4)。以表2中的23個樣本作為訓練樣本,建立基于因子分析的FDA預測模型。將10個影響沖擊地壓的因素中的 5 個相關程度較高的指標進行因子分析,提取少數公共因子,實現對沖擊地壓影響因素的降維,用新得到的公共因子及 5 個相關程度較弱的指標作為FDA模型的判別因子。根據因子分析理論和Fisher判別分析理論進行訓練和學習,用未參加訓練的12個樣本(見表3)對建立的FDA模型進行效果檢驗。 對訓練樣本進行因子分析可分為3個步驟: (1)提取合適的公共因子。將訓練樣本中的有較強相關性的構造情況、煤層厚度變化、頂板管理、卸壓和響煤炮聲5個指標作為因子分析的變量,運行SPSS17.0,根據得到的碎石圖(見圖1)和總方差解釋表,前2個公共因子的累計方差貢獻率為86.365%,說明,這2個公共因子可以解釋原始5個變量的86.365%的信息。 圖1 碎石圖 (2)構造因子變量。確定提取2個公共因子之后,應用方差最大法對得到的負載矩陣進行正交旋轉,可以得到旋轉后的負載矩陣,見表4。正交旋轉的目的是為了降低初始因子的綜合性,以便更容易找出因子的實際意義。從表3中各個指標的因子得分可以看出,公共因子F1由構造情況、煤厚變化及頂板管理組成,公共因子F2由卸壓和響煤炮聲組成。 表4 因子載荷旋轉Table 4 Rotation of factor loading (3)計算因子值。采用回歸方法得到因子得分系數矩陣,如表5,進而可以計算出因子值。根據表5可以寫出2個公共因子值的表達式分別為 F1=0.551X4+0.443X6-0.392X8+ 0.528X9+0.019X10; (10) F2=-0.314X4-0.216X6+0.157X8- 1.061X9+0.382X10. (11) 利用式(10)和(11)及表2中的變量值,計算出因子值,并將F1和F2作為新變量保存到表1中。 表5 因子值的系數Table 5 Factor score coefficient 由于煤層厚度、煤層傾角、埋深、煤層傾角變化和瓦斯濃度相互之間以及與另外5個變量之間的相關性較弱,所以將這5個變量(煤層厚度、煤層傾角、埋深、煤層傾角變化和瓦斯濃度)與2個公共因子(F1和F2)作為Fisher判別分析模型的判別因子。應用上述理論,可得到Fisher判別函數為 Z1(x)=-0.180X1+0.057X2+0.003X3+ 0.493X5+0.426X7+2.852F1+ 2.346F2-4.910, (12) Z2(x)=1.032X1+0.027X2+0.063X5- 0.902X7-0.134F1-0.612F2-3.119, (13) Z3(x)=0.217X1+0.055X2+0.004X3- 0.438X5+0.480X7-0.889F1+ 0.787F2-5.070. (14) 同時可以得到判別函數的附加特征值和組中心值如表6所示。可見,所得到的3個判別函數的判別能力是顯著的。第1個判別函數的特征值為24.899,方差貢獻率是94.9%,說明其判別效率非常高,可以解釋樣本94.9%的信息,同時,其正則相關系數為0.981。運用3個判別函數來對樣本進行判別,可以使得累計方差貢獻率達到100%,即可以解釋樣本全部信息,因此,利用3個判別函數能夠進行更準確的判別。根據表6中的組中心值,以第1個函數為例,其在T1類沖擊地壓危險性(微沖擊)的中心得分為-7.460,在T2類沖擊地壓危險性(弱沖擊)的中心得分為-3.358,在T3類沖擊地壓危險性(中等沖擊)的中心得分為0.408,在T4類沖擊地壓危險性(強沖擊)的中心得分為5.502。以此為基礎,可以通過比較待判沖擊地壓危險性等級的樣本函數值與4類危險性等級類別的中心值的距離來判別新樣本屬于哪一類別。 為了檢驗建立的FDA模型的有效性,采用回代估計法計算誤判率,將23組訓練樣本的數據代入到FDA模型中,得到的分類結果列入表2,與實際分類結果完全一致,誤判率為0,證明模型的正確率高,是可靠的,可以運用到實際的工程項目中。 表6 Fisher判別函數附加特征值和組中心值Table 6 Additional eigenvalues and central values of Fisher discriminant function 2.4 模型的檢驗和實例分析 表7 FDA預測模型測試結果Table 7 Test results of the FDA forecast model (1)基于因子分析的Fisher判別模型的預測能力較強,科學合理,性能可靠,簡便可行,適合預測礦井中沖擊地壓的危險性等級。 (2)應用因子分析理論研究影響礦井中沖擊地壓發生的因素,避免因素之間較強的相關性導致的某些信息重合,進而避免對建立的Fisher判別模型在判別樣本類別時產生不利影響。 (3)利用反映原始變量(構造情況、煤層厚度變化、頂板管理、卸壓和響煤炮聲)大部分信息的公共因子F1和F2以及煤層厚度、煤層傾角、埋深、煤層傾角變化和瓦斯濃度共7個指標建立FDA模型,對沖擊地壓的危險性等級進行預測,模型學習效率高,預測精度高,預測結果與實際結果完全符合。對樣本數據進行因子分析處理后,沖擊地壓危險性等級的判別精度比單純使用Fisher判別法有較大提高。 (4)基于因子分析的FDA預測模型以有限的實測工程數據為基礎,受到原始數據的典型性、代表性以及正確性的影響,同時,沖擊地壓是一個非常復雜的問題,受到多種因素的共同影響。因此,在實際工程應用中,應廣泛收集資料,選取合適的樣本數據,對模型進行訓練,提高模型的訓練精度以獲得更加可靠的預測結果。 [1] 竇林名,何學秋.沖擊礦壓防治理論與技術[M].徐州:中國礦業大學出版社,2001. Dou Linming,He Xueqiu.Prevention Theory and Technology of Rock-burst[M].Xuzhou:China University of Mining and Technology Press,2001. [2] 姜耀東,趙毅鑫,劉文崗,等.煤巖沖擊失穩的機理和實驗研究[M].北京:科學出版,2009. Jiang Yaodong,Zhao Yixin,Liu Wengang,et al.Investigation on the Mechanism of Coal Bumps and Relating Experiments[M].Beijing:Science Press,2009. [3] 竇林名,何學秋.煤礦沖擊礦壓的分級預測研究[J].中國礦業大學學報,2007,36(6):717-722. Dou Linming,He Xueqiu.Technique of classification forecasting rock-burst in coal mines[J].Journal of China University of Mining and Technology,2007,36( 6):717-722. [4] 趙生才.深部高應力下的資源開采與地下工程-香山會議第175次綜述[J].地球科學進展,2002,17(2):295-298. Zhao Shengcai.Deep resources exploitation and underground engineering under high stress-xiangshan conference for the 175th time[J].Advance in Earth Sciences,2002,17(2):295-298. [5] Bieniawski A T,Denkhaus H G,vogler U W.Failure of Fracture Rock[J].Rock Mech Min Sci,1969(6):323-341. [6] 國家煤礦安全監察局.“十一五”期間( 2006—2010 年)全國煤礦事故分析報告[R].北京:國家煤礦安全監察局,2011:7-10. China Administration of Coal Mine Safety.Report of the National Coal Mine Accidents in “Eleven Five” Period( 2006-2010)[R].Beijing:China Administration of Coal Mine Safety,2011:7-10. [7] Cook N G W.A note on Rock-bursts considered as a problem of stability[J].South Afr Int Min and Metallurgy,1965,65:437-446. [8] 孫 學.復雜開采條件下沖擊地壓及其防治技術[M].北京:冶金工業出版社,2009:3-4. Sun Xue.Under the Condition of Complicated Mining Impact Ground Pressure and Its Prevention and Control Technology[M].Beijing:Metallurgical Industry Press,2009:3-4. [9] 吳財芳,曾 勇.神經網絡在沖擊地壓危險性預測預報研究中的應用[J].工程地質學報,2003,11(3):263-268. Wu Caifang,Zeng Yong.Application of neural networks to study and prediction forecast rock-burst[J].Journal of Engineering Geology,2003,11(3):263-268. [10] 何滿潮,謝和平,彭蘇萍.深部開采巖體力學研究[J].巖石力學與工程學報,2005,24(16):2803-2813. He Manchao,Xie Heping,Peng Suping.Study on rock mechanics in deep mining engineering[J].Chinese Journal of rock mechanics and engneering,2005,24(16):2803-2813. [11] 竇林名,何學秋.沖擊礦壓危險預測的電磁輻射原理[J].地球物理學進展,2005,20(2):427-431. Dou Linming,He Xueqiu.Monitoring rock burst by electromagnetic emission[J].Progress in Geophysics,2005,20(2):427-431. [12] 閔文江,卜凡啟.煤礦沖擊礦壓及防治技術[M].徐州:中國礦業大學出版社,1998. Min Wenjiang,Bu Fanqi.Coal Mine Rock-burst and Prevention Technology[M].Xuzhou:China University of Mining and Technology Press,1998. [13] 孫鳳琪.AdaBoost 集成神經網絡在沖擊地壓預報中的應用[J].吉林大學學報:信息科學版,2009,27(1):79-84. Sun Fengqi.Rock-burst prediction modeling based on ensemble neural network[J].Journal of Jilin University:Information Science,2009,27(1):79-84. [14] 趙洪波,茹忠亮.沖擊地壓預測的PSO-SVM模型[J].巖石力學與工程學報,2007,26(S1):3479-3483. Zhao Hongbo,Ru Zhongliang.PSO-SVM model for prediction of rock burst[J].Chinese Journal of Rock Mechanics and Engineering,2007,26( S1):3479-3483. [15] 陶 慧.基于監測時間序列的沖擊地壓混沌特性分析及其智能預測研究[D].徐州:中國礦業大學,2013. Tao Hui.Chaos characteristics analysis and intelligent prediction study of roc-kburst based on monitoring time-series[D].Xuzhou:China University of Mining and Technology,2013. [16] 董隴軍,李夕兵,白云飛.急傾斜煤層頂煤可放性分類預測的Fisher判別分析模型及應用[J].煤炭學報,2009,34(1):58-63. Dong Longjun,Li Xibing,Bai Yunfei.A Fisher discriminant analysis model for classifying of roof coal cave-ability of steep seam[J].Journal of China Coal Society,2009,34(1):58-63. [17] 鐘 沖,郭 強.費歇爾判別法及其應用[J].西南交通大學學報,2008,43(1):136-141. Zhong Chong,Guo Qiang.Fisher discrimination method and its application[J].Journal of Southwest Jiaotong University,2008,43(1):136-141. [18] 付玉華,王興明.巖體質量分級的 Fisher 判別分析模型及應用[J].金屬礦山,2012(12):107-110. FuYuhua,Wang Xingming.Study and application of fisher discriminant analysis model to classification of rock mass quality[J].Metal Mine,2012(12):107-110. (責任編輯 徐志宏) Prediction on Classification of Rock Burst Hazard Based on Fisher Discriminant Analysis Shao Liangshan Xu Bo(SystemEngineeringInstitute,LiaoningTechnicalUniversity,Huludao125000,China) In view of the issues of rock-burst hazard classification in the mine,the factor analysis and Fisher discriminant analysis theory are applied to select coal thickness,coal seam dip angle,buried depth,structure condition,dip angle of coal seam,coal seam thickness changes and the gas concentration,the roof management,unloading,ring of coal guns as influence factors.Through the analysis of the correlation between the influencing factors,the appropriate public factors are extracted from the factors with strong correlation with the application of factor analysis.The Fisher discriminant analysis(FDA) model based on factor analysis is built to predict the rock-burst hazard rating.23 sets of measured data from Sichuan Yanshitai Mine are used as samples to make training.Then,the backward substitution method was adopted to verify the effectiveness of the model,with the misjudgment rate of 0.With another 12 groups of measured coal mine dynamic phenomena data that are not trained as cases,their hazard classification are predicted and compared with that obtained by the traditional Fisher discriminant method.The results show that the sample index number decreases and the correlation reduced by the factor analysis.It can effectively predict the level of rock burst hazards,and the prediction misjudgment rate is zero through this model. Rock burst,Prediction,Classification,Factor analysis,Fisher discriminant analysis,Re-substitution method 2014-11-04 國家自然科學基金項目(編號:71371091),遼寧省科學研究計劃項目(編號:2010230004)。 邵良杉(1961—),男,博士,教授,副校長,博士生導師。 X936 A 1001-1250(2015)-01-138-07


2 沖擊地壓危險性等級預測的FDA模型









3 結 論