拓萬兵,姜 偉,吳鳳民
(1.中國礦業大學銀川學院礦業工程系,寧夏 銀川 750011;2.山西藍焰煤層氣工程研究有限責任公司,山西 晉城 048012)
基于支持向量機的開采沉陷預計參數選取研究
拓萬兵1,姜 偉2,吳鳳民1
(1.中國礦業大學銀川學院礦業工程系,寧夏 銀川 750011;2.山西藍焰煤層氣工程研究有限責任公司,山西 晉城 048012)
為建立精確度高且具有自學習能力的開采沉陷預計參數選取模型,采用主成分分析方法,對文獻中的數據進行預處理,選擇累計方差達到96.79%的6個主成分因子和地表下沉系數為輸入和輸出變量,以徑向基(RBF)為核函數,建立了基于支持向量機開采沉陷預計參數選取模型。結果表明,支持向量機模型在訓練樣本較少的情況下,具有較高的預測精度和較強的泛化能力,平均相對誤差和均方根誤差值的對比證明了支持向量機模型的預測準確性和預測穩定性更好。
支持向量機;主成分分析;下沉系數;選取
采礦引起的覆巖和地表產生的連續移動變形和非連續破壞稱為開采沉陷[1]。開采沉陷預計是礦山開采沉陷學的核心內容之一,它對開采沉陷的理論研究和生產實踐都有重要的意義[2]。目前,開采沉陷預計方法主要有:基于實測資料的經驗方法、影響函數法和理論模型法等[3]。其中,影響函數法中的概率積分法是我國礦區最常用,最成熟的方法,此方法需要特定的預計參數,參數的選取是否正確直接決定預計結果的可靠性。目前選取預計參數常采實測資料求參和類比求參,不能集成開采沉陷預計的經驗性知識,缺乏自學習能力。此外,由于巖土體介質的復雜性,使得巖土介質的力學行為具有高維數、非線性等特點,使得實測或類比求參很難根據實際獲得的含有噪聲的信息求出令人滿意的結果[4]。支持向量機( Support Vector Machine,SVM) 是借助于最優化方法解決機器學習問題的新工具,其采用結構風險最小化原則,有效地解決了小樣本、非線性、高維數和局部極小值等問題,具有良好的泛化能力[5-7]。本文建立了基于支持向量機的開采沉陷預計參數選取模型。


(1)
式中:Φ(x)是從輸入空間到高維特征空間的非線性映射,系數w和b通過式(2)來估計。
(2)
式中: C是懲罰參數,Lε為ε不敏感損失函數,即給定ε>0。
(3)
基于式(3),則式(2)可歸結為式(4)凸約束條件下的二次凸規劃問題。
(4)

(5)
約束條件為,見式(6)。
(6)
式(5)中:K(x,y)為核函數,核函數的選擇應使其為特征空間的一個點積,即存在下式:K(x,y)=Φ(x)·Φ(y)。可以證明,對稱函數K(x,y)只要滿足Mercer[8]條件即可滿足核函數要求。常用的核函數有:線性核函數、多項式核函數、 樣條核函數、徑向基核函數(RBF)和Sigmoid核函數。
參照文獻[9],依據影響因素的代表性、科學性以及數據易得性原則,從地質賦存條件和煤礦開采設計條件2個角度,選取了2大類10個影響因子,見表1。

表1 開采沉陷影響因子
開采沉陷中地表下沉系數,是指充分采動或接近充分采動情況下,開采水平煤層時地表最大下沉值與開采厚度之比。是開采沉陷地表移動和變形預計時的關鍵性參數,故本文首選地表下沉系數為輸出的目標變量Y。
在研究多變量問題時,變量太多會增加分析問題的復雜性,同時也使預測模型變得更為復雜,降低模型的泛化能力,從而影響預測精度。為簡化預測模型的輸入變量個數,采用主成分分析法,對文獻[9]中神府礦區開采沉陷原始數據,見表2,進行降維處理,篩選出6個主成分,其方差貢獻率分別為33.70%、22.86%、14.10%、10.91%、9.63%、5.59%,累計方差貢獻率達到96.79%。若以此6個主成分代替表1中的10個影響因素作為SVM模型的輸入項,在保留原始數據絕大部分信息的前提下,既去除了因子間相關性和冗余信息,又降低建模工作量,提高了模型泛化能力。
徑向基(RBF) 核函數可調參數少,在一般光滑性假設條件下具有良好的性能,表現出較強的學習能力[10],本文選擇徑向基(RBF)核函數進行建模。以表3中提取出的6個主成分因子為輸入變量,地表下沉系數為目標變量,建立SVM模型。通過多次調試,確定模型相關參數如下:規則化參數C取10,γ取1,停止標準1.0E-6。預測結果見表3。
由表3可以看出,支持向量機的用于建模的數據結果有很多可以達到0偏差,說明支持向機的預測結果準確性比較高。經計算,支持向量機方法的預測結果和灰色關聯回歸方法的平均性對誤差MAPE分別為0.021、0.033,均方根誤差RMSE分別為0.00066、0.00068,雖然數值上差距很小,但卻具有統計學意義。前者說明支持向量機方法的預測精度優于灰色關聯回歸,后者說明支持向量機方法的預測結果與真實值的總體偏離程度要小,從性質上說明支持向量機預測方法優于灰色關聯的回歸預測。此外,MAPE和RMSE的值差距偏小,原因在于地表沉陷程度以地表下沉系數的形式來表征,其值本身就是一個比值,造成計算MAPE和RMSE的時候使用的偏差值為更小的數值。每厘米的沉陷都會對建筑造成一定的影響,如果將地表下沉系數轉化為以厘米甚至毫米的實際沉陷值表征,兩種預測方法的精度差別會很明顯。

表2 神府礦區開采沉陷影響因子原始數據

表3 SVM預測結果及與文獻結果比較
1)本文作者提出將支持向量機與主成分分析相結合,對多影響因素問題的分析進行分析,對支持向量機模型進行了優化,建立了主成分分析-支持向量機模型,其精度較高,能夠達到工程需要,對開采沉陷預測參數選取提供了新的思路。
2)支持向量機預測能描述多個預測量與其相關參數的非線性關系,適用于關系復雜的地質因素分析。具有誤差小、精度高的優點。
3)在處理多因素分析的問題時,采用主成分分析法對原始數據進行預處理可以達到有效降維的目的,同時降低模型復雜程度,增強模型泛化能力,有利于提高預測精度。
[1] 何國清,楊倫,凌賡娣.礦山開采沉陷學[M].徐州:中國礦業大學出版社,1991.
[2] 曹麗文,姜振泉.人工神經網絡在煤礦開采沉陷預計中的應用研究[J].中國礦業大學學報:自然科學版,2002(1):23-26.
[3] 張玉卓,陳立良,周萬茂.村莊下采煤的理論基礎——地表沉陷預測與控制[J].煤炭科學技術,1998(4):39-42.
[4] 趙洪波.巖土力學與工程中的支持向量機分析[M].北京:煤炭工業出版社,2008.
[5] 白鵬 ,張喜斌,等.支持向量機理論及工程應用實例[M].西安:西安電子科技大學出版社,2008.
[6] 楊志民 ,劉廣利.不確定性支持向量機:算法及應用[M].北京:科學出版社,2012.
[7] 魏好,鄧喀中,盧正,等.基于支持向量機的主要影響角正切求取方法研究[J].金屬礦山,2010(5):120-123.
[8] 方瑞明.支持向量機理論及其應用分析[M].北京:中國電力出版社,2007.
[9] 宋世杰,趙曉光,劉源,等.榆神府礦區開采沉陷的灰色關聯分析及其回歸預計[J].煤礦安全,2010(8):138-140.
[10] 田盛豐,黃厚寬.回歸型支持向量機的簡化算法[J].軟件學報,2002,13(6) :1169-1172.
Study on the selection of predication parameters on mining subsidence based on support vector machine
TUO Wan-bing1,JIANG Wei2,WU Feng-min1
(1.School of Mines and Engineering,China University of Mining and Technology Yinchuan College,Yinchuan 750011,China;2.Blue Flame of Coal Bed Gas in Shanxi Group Co.,Ltd.,Jincheng 048012,China)
In order to establish selection model of mining subsidence predicting parameters,which has self learning ability and with high accuracy.In this paper,using principal component analysis preprocessing the data in the literature,we have established the prediction parameters of mining subsidence selection model using support vector machine,based on radial basis function (RBF),by selecting main components factor with cumulative variance reaches 96.79% of 6 and surface subsidence factor as the input and output variables.Results show under the circumstances of less training samples Support vector machine (SVM) model,has high precision and strong generalization ability,the prediction accuracy and prediction stability is better.which was proved contrasting average relative error and root mean square error.
support vector machine;principal component analysis;subsidence coefficient;selection
2014-05-25
寧夏高等學校科學技術研究項目資助(編號:20130137)
拓萬兵(1984—),男,甘肅白銀人,講師,碩士,主要從事“三下”采煤與變形監測與控制方面的教學與研究工作。E-mail:cumtyc_wbtuo@126.com。
TD173+.4
A
1004-4051(2015)02-0114-03