曲 方 安文超 李迎業 李忠群
(1.中國計量學院質量與安全工程學院,浙江省杭州市,310018;2.山西潞安環保能源開發股份有限公司五陽煤礦,山西省長治市,046025)
基于GRA-SVM方法的煤與瓦斯突出預測模型研究
曲 方1安文超1李迎業2李忠群2
(1.中國計量學院質量與安全工程學院,浙江省杭州市,310018;2.山西潞安環保能源開發股份有限公司五陽煤礦,山西省長治市,046025)
通過分析煤與瓦斯突出的主要影響因素,采取灰熵關聯分析法進行關聯度排序及特征向量的提取,利用支持向量機強大的模式識別能力,提出基于支持向量機的煤與瓦斯突出預測方法。以典型的煤與瓦斯突出樣本為訓練實例,利用Matlab平臺下的Libsvm工具包建立預測模型,通過測試樣本對模型進行驗證,表明此模型具有較高的分類精度,適合于解決小樣本的突出預測問題。
煤與瓦斯突出 灰色關聯度 支持向量機 預測
煤與瓦斯突出是一種極其復雜的礦井瓦斯動力現象,它能摧毀井巷設施、造成人員窒息,甚至可能引起瓦斯爆炸與火災事故,是煤礦最嚴重的災害之一。近年來隨著開采深度增加,瓦斯壓力與地應力的增大,加劇了煤與瓦斯突出災害事故的發生。因此,提前做好煤與瓦斯突出的預測預報工作,能夠有效地遏制此類災害事故的發生。
目前,國內外學者已提出了多種預測方法,如神經網絡預測、灰色理論法、模糊聚類分析法。盡管這些方法在工程實際中取得了一定的效果,但它們一般需要通過大量的學習樣本才能得到較為準確的預測模型,然而由于受作業環境的影響,煤與瓦斯突出的樣本量往往是有限的。因此,本文提出一種能夠利用小樣本來解決高維度、非線性問題的預測方法——支持向量機法(Support Vector Machine,SVM)。同時,考慮到煤與瓦斯突出影響因素錯綜復雜,進一步提出了用灰熵關聯分析確定煤與瓦斯突出預測的優選指標,并以典型突出礦井的煤與瓦斯突出控制因素為實例,建立SVM模型,對煤與瓦斯突出進行預測,通過分析和驗證,表明該模型具有良好的預測功能。
灰色關聯分析(Grey Relational Analysis,GRA)是根據因素之間發展趨勢的相似或相異程度作為衡量兩個因素關聯程度的一種方法。由于關聯分析是按發展趨勢作分析,因而對樣本的大小沒有太高的要求,也不需要典型的分布規律,而且分析得到的結果一般與定性分析相吻合,因而得到了廣泛的使用。
設X0={x0(k)|k=1,2,…,n}為參考序列,Xi={xi(k)|k=1,2,…,n}(i=1,2,…,m)為比較序列。因此,用平均值法求得各個比較序列與參考序列的鄧氏關聯度為:

其中:

式中:ρ——分辨系數,且ρ∈[0,1]。
支持向量機算法的實質是通過訓練數據建立分類超平面函數,使其與最近的訓練數據之間的間距達到最大值,從而實現最佳分類的一種算法。
設訓練樣本集為:

為求其最優分類超平面可將其轉化為以下凸二次規劃目標函數問題:

約束條件:yi(ωTxi+b)≥1-ξi,i=1,2,…,n
式中:Φ——風險;
ξi——松弛變量;
C——懲罰系數,C>0;
ω——上述約束條件的權向量;
b——上述約束條件的閾值。
通過拉格朗日乘子法以及Kuhn-Tucker互補條件,將上式轉化為對偶問題。為進一步簡化上述非線性的不可分問題,可根據Mercer定理引入內積核函數K(xi,xj),其作用是將原始樣本投影到一個高維空間中,使非線性問題轉化為線性問題,并在此基礎上構造最優超平面。因此可將上述二次規劃轉化為如下式子:

式中:αi,αj——拉格朗日乘子。
式中與αi≠0對應的樣本為支持向量,對于待分類向量x,可根據實際情況,選擇某一合適的核函數K(xi,xj),由此可得最優超平面分類函數為:

式中:m——支持向量的數目;
b*——約束條件yi(ωTxi+b)≥1-ξi的閾值最優。
根據突出機理綜合假說,目前人們普遍認為煤與瓦斯突出是由地應力、包含在煤體中的瓦斯以及煤體自身物理力學性質三者綜合作用的結果,因此選擇瓦斯放散初速度Δp、煤的堅固性系數f、軟分層厚度、煤體破壞類型、開采深度、煤層瓦斯壓力和瓦斯含量這7個主要影響因素作為突出指標,并選取某一典型突出礦井的實測數據作為灰色關聯分析的樣本,見表1。
近年來,已有很多研究人員對鄧氏關聯度、B型關聯度、C型關聯度、斜率關聯度等多種關聯度進行分析,從算法的完善性能、計算量大小、關聯離散度和應用范圍等方面作了評價。結果表明,只有鄧氏關聯度是數據序列的極差問題,并對時間和指標序列都適用,因此能夠解決本文提出的多指標關聯度問題。
然而,自灰色系統理論創立以來,關于灰色關聯度模型的研究都是在等權平均數的基礎上建立起來的,這樣就會造成信息丟失,并致使局部點關聯測度值有控制整個灰色關聯序的傾向。為此,提出利用熵關聯度計算法對灰色關聯度系數作不等熵權計算,使灰色關聯系數的波動性得到了有效控制,進一步完善了灰色關聯分析方法,其計算公式為:

式中:ωj——熵權值。
最后根據關聯度大小對突出影響指標進行排序,所得關聯序即為對突出強度影響大小的順序。為此本文對表1進行了關聯度計算,并對兩種關聯度以及加熵權后各自的特點進行對比,計算結果見表2。

表1 煤與瓦斯突出影響因素的原始數據

表2 突出強度和各影響因素之間的灰色關聯度
通過表2容易看出,經歸一化后的關聯度以及鄧氏關聯度的關聯序有很大差別,無法判斷哪種關聯序更加符合實際情況,而兩種關聯度在熵化后的排列順序是一致的,這表明各個影響因素在其權重基礎上建立起來的灰色關聯度具有更好的精度。另一方面,由于開采深度在未進行熵權計算時,其關聯度始終都大于除放散初速度以外的因素指標,表明對突出具有非常大的影響,若不考慮開采深度,勢必造成預測結果失真。因此,本文將瓦斯放散初速度、瓦斯壓力、煤破壞類型、煤堅固性系數和開采深度這5個主要突出指標作為訓練樣本進行建模和預測。
支持向量機模型的建立首先需要從原始數據中提取出訓練集和測試集,然后進行一定的預處理(特征向量提取以及數據歸一化等),然后用已經處理好的數據集進行訓練,以此獲得最佳的分類模型,最終用該模型來預測測試集的分類標簽。算法流程見圖1。

圖1 模型整體流程
為了對突出強度進行更準確的分類預測,可將突出強度按其大小分為:無突出、小型突出(0~50 t/次)、中型突出(50~99 t/次)和大型突出(>100 t/次)。最后根據已知數據及實際分類情況選定訓練集和測試集。本文選取我國一典型煤與瓦斯突出礦井的25組數據進行分析預測,將其中20組數據作為訓練樣本,剩余5組數據作為預測樣本對訓練得到的SVM模型進行驗證。其訓練樣本見表3。
如表3所示,先對4種突出強度類型進行量化,并以表中20組實測數據作為學習樣本建立預測模型。本文采用臺灣大學林智仁教授及其團隊所開發設計的SVM軟件包(A Library for Support Vector Machines,LIBSVM)進行建模。由于突出強度與各個影響因子之間存在著復雜的非線性關系,一般以徑向基函數(Radial basis function)作為核函數進行運算。經深入研究發現,合理調節相關參數(懲罰參數c和核函數參數g)可使預測結果更加準確,因此本文在此基礎上提出一種用于驗證分類器性能的統計分析方法——交叉驗證法(Cross validation,CV),并已通過matlab得到了最佳SVM模型及上述參數值,其中最佳懲罰參數c為1.1487,核函數參數g為3.0314。訓練結果見圖2。

圖2 突出強度的實際分類和預測分類圖

表3 典型突出礦井的煤與瓦斯突出實測數據
圖2橫坐標為訓練樣本序號,縱坐標為樣本突出強度的類型,由0~3分別表示無突出、小型突出、中型突出和大型突出4種突出強度類型,預測結果顯示只有第18組樣本與實際不符,表明基于灰熵關聯度的SVM模型的分類準確率較為理想。為進一步證實該模型具有較強的實用性和可靠性,本文利用已得到的模型對5組測試集進行了驗證,預測結果見表4。

表4 5組測試樣本的預測結果與實際情況的對比
從表4結合圖2可以看出,測試集利用該模型得到的預測結果和實際情況基本一致,另外,由于大型突出的樣本量明顯比小型突出和無突出的少,通過訓練集第18組和測試集第5組樣本的錯誤預測表明訓練集突出樣本類型所占總樣本比例的多少在一定程度上影響模型的預測精度。
上述分析表明,基于SVM分類算法所建立的的預測模型適用于煤與瓦斯突出強度類型的預測標定。其模型不僅有效地解決了煤與瓦斯突出與其影響因素之間的非線性映射關系,而且表現出了良好的分類預測效果。另一方面也反映了訓練樣本所占總樣本比例對于預測模型有一定影響,因此,為提高模型的準確率,可對樣本量及類型的合理篩選作進一步研究。
(1)本文通過灰熵關聯分析法優選出了放散初速度、瓦斯壓力、煤體破壞類型、堅固性系數以及開采深度5個最重要的煤與瓦斯突出指標。計算表明在熵權基礎上建立的灰色關聯度更加符合實際,灰熵關聯分析法對于突出特征向量的提取是合理有效的。
(2)由于受到各種條件的限制,突出影響因素的實測數據偏少。但是本文提出的支持向量機分類模型表明小樣本訓練能夠達到較高的預測精度,因此,支持向量機模型可以很好地應用到煤與瓦斯突出的預測預報中。但也從中得出只有對訓練集樣本按其類型進行合理分配,才能最終獲得理想的預測模型。
(3)基于上述理論和方法,利用Libsvm工具箱在Matlab中建立的支持向量機分類模型集成了基本分類函數、核函數以及交叉驗證函數等強大的功能,為成功預測提供了良好的技術平臺,最后可以將該方法應用到各種礦井突出預測中。
[1] 張宏偉.支持向量機在煤與瓦斯突出預測中的應用[J].中國煤炭,2008(3)
[2] 劉俊娥,曾凡雷等.基于RS-SVM模型的煤與瓦斯突出多因素風險評價[J].中國安全科學學報,2011(7)
[3] 邵劍生,薛惠鋒.基于PSO-SVM的煤與瓦斯突出強度預測模型[J].西華大學學報(自然科學版),2012(1)
[4] 伍愛友,姚建等.基于灰色關聯分析的煤與瓦斯突出預測指標優選[J].煤炭科學技術,2005(4)
[5] 張學工.關于統計學習理論與支持向量機[J].自動化學報,2000(1)
[6] 苗琦,楊勝強等.煤與瓦斯突出灰色-神經網絡預測模型及應用[J].采礦與安全工程學報,2009(3)
[7] 肖新平.關于灰色關聯度量化模型的理論研究和評論[J].系統工程理論與實踐,1997(8)
[8] 呂鋒,劉翔,劉泉.七種灰色關聯度的比較研究[J].武漢工業大學學報,2000(2)
Research on prediction model for coal and gas outburst based on GRA-SVM
Qu Fang1,An Wenchao1,Li Yingye2,Li Zhongqun2
(1.College of Quality and Safety Engeering,China Jiliang University,Hangzhou,Zhejiang 310018,China;2.Wuyang Coal Mine,Shanxi Lu'an Environmental Protection and Energy Development Co.,Ltd.,Changzhi,Shanxi 046025,China)
On the basis of the analysis of main influencing factors of coal and gas outburst,the grey relational analysis(GRA)was usedto rank the degree of association and to extract the eigenvectors.By the aid of powerful identifying function of support vector machine(SVM),a new methodology for predicting coal and gas outburst was proposed.Taking typical cases of coal and gas outburst as training examples,the prediction model was constructed based on Libsvm toolbox of Matlab platform.The verification results showed the prediction model has higher classification accuracy for coal and gas outburst,suitable to solve the prediction problem for small samples of coal and gas outburst in coal mines.
coal and gas outburst,grey relational analysis,support vector machine,prediction
TD713.2
A
曲方(1964-),男,陜西鳳縣人,教授、工學博士,浙江省安全生產專家。長期從事煤礦瓦斯災害防治、火災探測及防護、公共安全及應急救援等方面的科研及教學工作。
(責任編輯 張艷華)