吳兆立
(江蘇建筑職業技術學院,江蘇 徐州 221008)
礦井突水一直是煤礦開采過程中最容易引發安全事故的重要原因之一。一旦礦井發生突水很有可能造成重大財產損失和人員傷亡事故,如何及時準確地對突水成因進行判斷,對突水水源進行判別,是預防和解決礦井突水災害的關鍵步驟。因此,準確判別突水水源,提前開展礦井水害防治,是保證礦井安全生產的重要措施。
在對礦井突水水源進行判別研究方面,楊建等[1]通過研究溶解性有機質在不同含水層之間的差異和分布規律,提出了一種有機-無機相結合的礦井突水水源判別方法,可實現水源的快速判別;毛志勇等[2]在對礦井各含水層水化學特征綜合考慮基礎上,提出了一種基于核主成分分析-改進粒子群算法-極限學習機(KPCA-MPSO-ELM)相結合的礦井突水水源判別模型,可以很好地對數據進行判別和優化,從而實現準確識別突水水源;曲興玥等[3]基于水樣變量因子,把水化學成分指標作為礦井突水水源判別依據,采用MATLAB因子分析及距離判別模型,實現了對不同礦井突水水源的識別;琚棋定等[4]結合主成分分析和貝葉斯(Bayes)方法,構建了突水水源識別模型判別法,對不同礦井的突水水源識別;牟林[5]通過利用已有勘探數據,提出了以“獨立識別區”和“關鍵離子”為主的水質動態曲線,用于突水過程的預測分析。此外還有一些方法根據水樣的水化學特征進行水源判別的方法,包括Fisher判別法、BP神經網絡、可拓判別法、灰色關聯度等。目前國內外學者對于礦井突水水源判別研究不斷深入,但主要從地面水質化驗指標判斷水源,對一些復雜地區的判斷結果往往與實際有很大出入,而且在實際應用過程中限制因素較多,不能實現對每類水源的全覆蓋,導致識別方法的推廣性略差。因此,本文提出采用蜻蜓算法和最小二乘支持向量機相結合的方式,對各類礦井突水水源進行科學的判別,為礦井安全生產提供參考。
最小二乘支持向量機(LS-SVM)是支持向量機(SVM)的一個變種,由于標準SVM算法計算復雜度與訓練樣本數量有關,當樣本數量較大時,求解的相應二次規劃問題變得非常復雜,計算速度就會變慢,而LS-SVM將標準SVM的算法轉化成為求解線性方程組的問題,使得求解速度加快,改善了傳統神經網絡的缺陷[6]。使用最小二乘支持向量機對礦井突水水源判別數據訓練步驟如下所述[7]。
1) 建立水源判別數據訓練樣本集S={(xi,yi)}(i=1,2,…,N),其中,xi和yi分別為LS-SVM的輸入量和輸出量;N為訓練集樣本的數量。
2) 對分類超平面進行描述,并設置其約束條件,計算見式(1)。
yi[ωTφ(xi)+b]-1+εi=0
(1)
式中:εi為松弛向量(即誤差量);φ(xi)為xi在高維空間的映射定義;ω為超平面的法線方向;b為常數。
3) 為了使訓練集到超平面的最小距離最大,將確定最優超分類面的問題轉化為二次規劃的問題,具體表達見式(2)。

(2)
式中,c為懲罰因子。
4) 利用拉格朗日函數L來解決上述問題,并對其進行進一步的優化,計算公式見式(3)。

(3)
進一步優化得到式(4)。

(4)
式中,α為拉格朗日乘子。
5) 結合以上步驟,得到最小二乘支持向量機的回歸函數模型見式(5)。

(5)
式中,κi(x,xi)為核函數。
根據LS-SVM特點,本文運用泛化能力較好的徑向基核函數作為核函數,其表達式見式(6)。
κi(x,xi)=exp(-‖x-xj‖2/2σ2)
(6)
式中,σ為核寬度。
在LS-SVM進行對礦井突水水源判別的數據訓練中,c和σ是必須要進行調整的兩個重要參數,這兩個參數取值不同將會得到不同的LS-SVM模型,c和σ的取值沒有非常準確的參數調節方法,本文在實際應用中引入蜻蜓算法,尋找最優,從而在蜻蜓算法和最小二乘支持向量機的基礎上對回歸模型進行預測。
蜻蜓算法(DA算法)是運用數學方法模擬蜻蜓狩獵行為和遷徙行為的一種新型群智能算法[8]。種群行為一般都遵循分離、對齊和內聚3個基本準則,據此衍生出5種行為計算。
1) 分離指防止個體與相鄰個體的靜態碰撞,其表達見式(7)。

(7)
式中:X為當前個體所在的位置;Xj為第j個相鄰個體的所處位置;N為蜻蜓個體的總量。
2) 對齊指個體與相鄰個體兩者保持著相同的速度,其表達見式(8)。

(8)
式中,Vj為第j個相鄰個體的速度。
3) 內聚指個體有向相鄰個體中心進行聚攏的傾向,其表達見式(9)。

(9)
4) 食物吸引力的計算見式(10)。
Fi=X+-X
(10)
式中:X+為食物源位置;X為當前個體所在的位置。
5) 天敵排斥力的計算見式(11)。
Ei=X-+X
(11)
式中:X-為天敵位置;X為當前個體所在的位置。
根據上述5種行為,為模擬下一代蜻蜓在搜索空間的位置,引入位置向量和步向量,計算見式(12)。
VXt+1=(sSi+aAi+cCi+fFi+eEi)+wVXt
Xt+1=Xt+VXt+1
(12)
式中:VXt+1為第t+1代蜻蜓種群的位置更新步長;Xt為第t代蜻蜓種群的個體位置;t為種群迭代的次數;s、a、c分別為蜻蜓種群的分離度、對齊度、內聚度權重;i為第i個蜻蜓個體;f為蜻蜓種群的食物因子;e為蜻蜓種群的天敵因子;w為蜻蜓種群的慣性權重。
為了提高蜻蜓探索狀態下的隨機性,當個體周圍沒有相近的個體時,則采用隨機游走的方式,種群的更新位置計算見式(13)。
Xt+1=Xt+Le′vy(d)Xt
(13)
在LS-SVM預測模型中,c值和σ值的選擇直接關系到預測精度,如果選值不合適,將會導致預測結果的可靠性低、精度不高。蜻蜓算法由于將群體行為的所有可能因素都進行了考慮,使算法能夠在最優值附近快速地收斂,具有全局尋優能力良好和穩定性良好的特點。將蜻蜓算法與LS-SVM相結合,尋找最合適的c和σ,其主要步驟如下所述。
1) 收集礦井突水水源判別的樣本數據,作為訓練集和測試集使用,對測試集數據要采取歸一化的處理方式。
2) 初始化蜻蜓算法參數,主要是設置蜻蜓種群個數及蜻蜓種群的最大迭代次數;初始化LS-SVM模型參數,主要是設置c值和σ值。
3) 隨機對蜻蜓種群的位向量和步長向量進行初始化,并將蜻蜓的個體位置信息依次賦值c值和σ值。
4) 根據LS-SVM模型,將預測模型的準確率數值作為蜻蜓個體當前的適應度值,每進行一次操作,計算一次蜻蜓個體的最大適應度值,并通過對比,選取最大適應度值作為最優值,保存尋找到最優值時所對應的c值和σ值。
5) 計算蜻蜓個體行為,對蜻蜓個體的鄰域半徑和相對位置進行更新。
6) 當滿足蜻蜓算法的最大迭代次數時,則停止LS-SVM模型的參數尋優過程,輸出蜻蜓的最大適應度值和最優值所對應的參數c值和σ值;否則繼續迭代,重復執行步驟4。
7) 用訓練好的礦井突水水源判別的模型進行預測和誤差分析。


表1 訓練樣本數據
補給條件等各類水的化學特征,將某礦區的礦井突水水源共分為4大類,即Ⅰ類為二灰和奧陶紀含水層、Ⅱ類為八灰含水層、Ⅲ類為頂板砂巖含水層和Ⅳ類為第四系含水層。在礦區的不同地點共采取24個突水水樣,選取以上6種離子組分作為輸入量,以類型判別作為輸出量,從而建立礦井突水水源判別的數學模型,模型訓練數據見表1。
為了進一步驗證基于蜻蜓算法和最小二乘支持向量機模型對礦井突水水源判別的準確性,用訓練好的判別模型對采集到的其他4組驗證數據進行檢驗,結果見表2。由表2可知,本文采用的基于蜻蜓算和最小二乘支持向量機的方法能夠較好地對礦井突水水源進行判別,預測結果和實際計算結果一致,滿足實際的判別需求。

表2 突水水源判別及驗證
礦井突水水源判別直接影響礦井的生產安全,正確對突水水源進行判別,提前采取相應的應急處理措施,對于提高礦井的生產安全、穩定性及經濟性具有重要意義。本文基于不同含水層的水化學成分存在的差異特性提出了一種新的判別礦井突水水源的方法,以最小二乘支持向量機為基礎,并輔以蜻蜓算法實現對礦井突水水源的準確判別,經過實際數據驗證顯示該模型具有操作簡單、快速高效、結果可靠等優點,對礦井水源的判別具有較高的辨識度,為礦井突水的預防和治理工作提供了參考和借鑒。