劉夢杰,朱希安,王占剛
(北京信息科技大學,北京 100101)
礦井突水即“影響、威脅礦井安全生產,使礦井局部或全部被淹沒并造成人員傷亡和經濟損失的礦井涌水事故”,與瓦斯、煤塵并列為礦山生產建設過程中的三大主要災害。當礦井涌水量超過正常的排水能力時,就會發生礦井水災事故。突水事故的發生,會嚴重影響煤礦行業的安全生產,因此有效的突水預測和實時的突水預報是降低煤礦水害事故多發的重要途徑之一[1]。
目前對煤層底板突水預測分析大多局限于定性研究,最終得到煤層底板突水量的等級劃分,而對實際突水量預測的定性研究卻很少[2]。劉北戰等[3]通過PCA-SVR方法用較低維數包含了影響底板突水的多個因素,保證了預測效率及精度,得到了樣本點的突水等級;高衛東等[4]通過粒子群算法優化支持向量機方法針對底板突水量進行預測,并驗證了預測結果與實際情況吻合度較高,但也僅得到了樣本點的突水等級。之后,秦潔璇等[1]將SVR模型用于礦井底板突水量的預測,但SVR模型在單獨進行突水量預測時,存在訓練過程模型參數選取盲目性的問題。因此,本文通過FOA-SVR模型來實現礦井底板突水量的預測,有效地避免了上述問題。
當發生礦井水災時,按照突水點位置的不同,可以分為頂板突水、底板突水和側向突水三種類型,不同類型誘發突水的原因是不一樣的。由于底板突水的發生頻率相對更高,因此本文設計了一種FOA-SVR底板突水量預測模型,可以為該類型突水的突水量計算提供參考,如圖1所示。

圖1 FOA-SVR底板突水量預測模型Fig.1 FOA-SVR prediction model forfloor water inrush quantity
本模型首先需要整理國內一些典型的底板突水樣本集并進行歸一化處理消除量綱以及單位的影響,并將樣本集分為訓練集和測試集兩個部分。初始化果蠅種群參數之后調用SVR算法計算適應度值,并迭代尋優得到優化之后的SVR模型參數,通過訓練集學習建立FOA-SVR底板突水量預測模型,然后對測試集中的樣本進行預測,最后對該模型進行了實驗分析與驗證。
20世紀90年代中期,VPANIK等提出了支持向量機模型,該模型可以較好地解決下凹樣本、非線性、過學習和局部極小點等問題[5]。但是使用該模型時需考慮參數的選擇問題,這一直都是解決實際問題時所遇到的一大難點,它們的選取會直接影響模型的復雜程度以及預測精度[6]。
果蠅算法是繼遺傳算法、粒子群算法、蟻群算法等典型的優化算法之后,Wen-Tsao PAN于2011年從果蠅的覓食行為中得到啟發而提出的一種新型群體智能優化方法。與其他的優化算法相比較,果蠅算法實現起來比較簡單,它只有兩個參數需要調節,并且全局尋優能力強,對實際應用具有一定的幫助[7]。
FOA-SVR模型即通過果蠅算法優化支持向量回歸機參數,可以有效地解決參數選擇問題。
適應度函數也稱為評價函數,可以將優化問題的目標函數與果蠅個體的適應度值之間建立某種映射關系,即在果蠅尋優過程中通過適應度函數實現對優化問題目標函數的尋優。在FOA-SVR模型中適應度函數是建立該模型的關鍵。
適應度函數的選擇會影響FOA的收斂速度以及能否找到最優解,同時適應度函數的建立應該盡可能的簡單,使計算的時間復雜度最小。對實際問題進行分析可知,yi,test(x)為該模型所預測的某突水點的突水量,見式(1)。

(1)


(2)
式中,σ為核函數的寬度。
本文所選用的適應度函數計算見式(3)。

(3)
式中:n為測試樣本總個數;yi,true(x)為某突水點的實際突水量。
代入求解得適應度函數表達式見式(4)。

(4)
通過計算預測突水量與實際突水量之間的均方誤差,使得該取值最小,即預測精度最高。
FOA模型算法通過模擬果蠅個體以及群體的覓食過程,經過適當的迭代過程可以得到全局最優解[6]。
果蠅迭代搜尋食物的步驟如下所示。
步驟1:首先初始化果蠅群體位置(Xaxit,Yaxit),設置果蠅群體規模n及迭代次數m,見式(5)。
(5)
式中,Rand(LR)為果蠅群體的隨機位置。
步驟2:利用嗅覺搜尋食物的飛行距離及方向確定果蠅個體的位置,見式(6)。
(6)
式中,Rand(FR)為果蠅個體的固定步長。
步驟3:由于食物的位置是未知的,先估計果蠅距離原點坐標的距離Di(式(7)),距離越遠,嗅到的味道濃度越低,因此味道濃度判定值Si取距離的倒數(式(8))[7]。
(7)
Si=1/Di
(8)
步驟4:將味道濃度判定值代入到味道濃度判定函數(fitness function)即適應度函數中,求出該果蠅個體的味道濃度(式(9))。
Smelli=F(Si)
(9)
步驟5:根據味道濃度判定函數在果蠅群體中找出味道濃度最大的果蠅個體(式(10))。
[bestsmellbestindex]=max(smell)
(10)
式中:bestsmell為味道濃度最大的果蠅個體所對應味道濃度;bestindex為該果蠅個體對應的坐標位置。
步驟6:保留最佳味道濃度值及該果蠅對應的(X,Y)坐標位置,此時果蠅通過其敏銳的視覺朝著這個位置飛去,計算見式(11)和式(12)[8]。
smellbest=bestsmell
(11)

(12)
步驟7:進入迭代尋優過程,重復步驟2至步驟5,并判斷味道濃度是否優于上次,如果是,則繼續執行步驟6。
支持向量機回歸模型的目的是通過學習訓練集中的樣本點,使得它們可以盡量的擬合到線性模型yi=ω·φ(xi)+b上。為了使支持向量回歸機保持較好的稀疏性[2],定義不敏感損失函數ε>0,假設所有的訓練數據在精度ε下使用線性函數進行擬合,令z=yi-ω·φ(xi)-b,則加入松弛因子ξ,ξ*之后,SVR問題轉化為求優化目標函數最小化問題(式(13))[5]。

(13)
式中,C為懲罰因子。
求得SVR問題的對偶形式,計算見式(14)。

(14)

通過求解,求得支持向量回歸機的決策函數,見式(15)。
(15)
式中:m為支持向量回歸機個數;核函數是k(xi,xj)=φ(xi)φ(xj)。
選擇不同的核函數可以構造出不同的SVR模型。本文選用徑向基核函數,相比于其他的核函數,它只需要確定一個參數,并且函數復雜度較低。徑向基核函數表達式見式(16)。
(16)
參數ε控制著回歸函數對于樣本數據不敏感區域的寬度;參數C反映了算法對超出ε的樣本數據的懲罰程度;參數σ為核函數的寬度參數,控制了函數的徑向作用范圍[9]。為了選擇出最優的SVR參數,我們通過FOA來解決這個問題,對參數(ε,C,σ)進行訓練尋優,FOA尋優流程如圖2所示。

圖2 FOA尋優流程Fig.2 Optimization process of FOA
底板突水受到多種因素的綜合影響。其中,水壓是底板突水的基本動力,決定著是否會發生突水以及突水量的大?。缓畬拥母凰詻Q定突水量的大小及穩定性;隔水層有助于抑制底板突水,當其他條件都一樣時,隔水層厚度越大越不容易發生突水[10];采動裂隙是由礦壓和底板高承壓水共同作用產生的結果,由它所形成的導水通道會誘發底板突水的產生,其擴展程度受到多種因素的共同影響;斷層可縮短煤層與含水層之間的距離,逐漸形成突水通道,斷層構造與礦壓相互作用,使底板裂隙進一步擴展,隔水能力大大降低,更易發生突水現象[11]。
結合實際情況以及相關資料綜合分析,選取水壓、含水層厚度、隔水層厚度、底板采動裂隙帶深度以及斷層落差5個因素作為影響預測底板突水的主要因素,以此作為預測模型的輸入參數,輸出即為預測的突水量[3]。其中,輸入參數特征值的選取原則為:可以完全定量的用定量數據表示,不能定量的用二分量表示。則文中含水層厚度采用二分量類型,1表示薄層灰巖,0表示厚層灰巖;其他屬性則采用連續性參數進行設置[1]。
樣本集的選取要具有代表性,且每一個樣本應該包含相同的屬性特征[1]。筆者收集整理了一些煤層底板突水案例并從中選出18個,其中14個作為訓練樣本集,4個作為預測樣本集。由于樣本集中多指標的量綱和數量級不相同,為消除不同量綱數據對評價結果的影響,需要對樣本數據進行標準化處理[12],選用Min-Max標準化轉換方法,轉換公式為式(17)。
x′=(x-xmin)/(xmax-xmin)
(17)
式中:xmax為樣本數據的最大值;xmin為樣本數據的最小值。
經過處理之后標準化樣本集見表1。

表1 標準化樣本集Table 1 Standardized sample set
通過Matlab編寫程序,設置迭代次數為150,種群規模為35,迭代尋優后果蠅群體中出現最優解,參數尋優之后得到懲罰因子C=83.68、不敏感損失函數ε=0.324和核參數σ=1.8789的預測模型。
通過建立的FOA-SVR模型對預測樣本集進行突水量預測,得到預測值之后并對其預測結果進行反歸一化,將預測結果及誤差分析與通過SVR模型預測出來的做比較,結果見表2。

表2 不同模型預測結果對比Table 2 Comparison of prediction results based on different models
由表2中的預測結果分析可知,FOA-SVR模型對4個預測樣本集的預測相對誤差分別是2.7934%、2.1330%、6.8556%和1.7994%,用SVR模型的預測相對誤差分別是11.5400%、7.2246%、15.9150%和8.9713%,即FOA-SVR模型相比于直接使用SVR模型來說誤差更小,預測精度更高。說明果蠅算法選擇的模型參數合適,該突水量預測模型具有很強的泛化能力,可以達到預測底板突水量的目的,為煤礦采取合理的防治措施提供依據。
1) 本文選用支持向量回歸機模型對底板突水量進行預測,選擇水壓、含水層厚度、隔水層厚度、底板采動裂隙帶深度和斷層落差這5個影響因素作為輸入因子,輸出即為需要的突水量,可以有效地避免定性分析的局限性。
2) 人為去選擇支持向量回歸機參數的話,會有隨機性和盲目性,選擇國內一些典型的煤礦突水事故樣本集,分為訓練樣本集和測試樣本集兩部分,利用FOA模型對樣本數據進行訓練選擇最優參數建立FOA-SVR突水量預測模型,通過該模型對測試集突水量進行預測。通過實驗分析驗證,該模型比SVR模型具有更高的預測精度。