楊 超,管智峰,劉雨竹,李鵬杰,齊 冀
(1.中煤張家口煤礦機(jī)械有限責(zé)任公司,河北張家口 075000;2.遼寧工程技術(shù)大學(xué),遼寧葫蘆島 125105;3.潞安化工集團(tuán)李村煤礦,山西長(zhǎng)治 046000)
瓦斯突出已經(jīng)對(duì)煤礦安全生產(chǎn)構(gòu)成極大威脅。是煤礦事故中最危險(xiǎn)、最頻繁的事故類(lèi)型[1]。在煤與瓦斯突出發(fā)生前,完成煤與瓦斯突出預(yù)測(cè),對(duì)于保證煤與瓦斯突出安全生產(chǎn),保護(hù)礦工生命安全具有重要意義。常用的煤與瓦斯突出預(yù)測(cè)方法有指數(shù)預(yù)測(cè)法和數(shù)學(xué)模型預(yù)測(cè)法[2]。煤與瓦斯突出危險(xiǎn)性指標(biāo)預(yù)測(cè)方法是通過(guò)檢測(cè)各項(xiàng)指標(biāo)的值,并與各項(xiàng)指標(biāo)的標(biāo)準(zhǔn)值進(jìn)行比較,確定各項(xiàng)指標(biāo)是否具有煤與瓦斯突出危險(xiǎn)性。
常用指標(biāo)包括瓦斯含量、瓦斯壓力、煤體強(qiáng)度系數(shù)、巖屑指數(shù)和綜合指數(shù)[3],這些指標(biāo)的影響因素較多,測(cè)量誤差較大,往往導(dǎo)致預(yù)測(cè)精度較低。因此,近年來(lái),數(shù)學(xué)模型預(yù)測(cè)方法越來(lái)越受到研究者的重視。方法是選擇影響煤與瓦斯突出的幾個(gè)特征,利用數(shù)學(xué)模型預(yù)測(cè)煤與瓦斯突出危險(xiǎn)性。實(shí)際上,現(xiàn)有的預(yù)測(cè)方法都是基于理想數(shù)據(jù)來(lái)完成煤與瓦斯突出的預(yù)測(cè)。然而,與實(shí)際應(yīng)用程序還有很長(zhǎng)的距離,因?yàn)槠渲饕从沉? 個(gè)方面。首先,默認(rèn)使用的數(shù)據(jù)是完整的,事實(shí)上,在數(shù)據(jù)傳輸和數(shù)據(jù)融合的過(guò)程中,數(shù)據(jù)經(jīng)常丟失,導(dǎo)致部分甚至全部數(shù)據(jù)丟失。其次,默認(rèn)情況下使用的數(shù)據(jù)具有與實(shí)際值相同的值,實(shí)際上,由于實(shí)驗(yàn)條件和實(shí)驗(yàn)過(guò)程的限制,數(shù)據(jù)與實(shí)際值之間可能存在一些差異。第三,預(yù)測(cè)模型是基于以前的數(shù)據(jù),當(dāng)新的異常數(shù)據(jù)到來(lái)時(shí),由于缺乏處理能力,導(dǎo)致無(wú)法實(shí)時(shí)完成預(yù)測(cè)。
針對(duì)上述問(wèn)題,本文提出了一種煤與瓦斯突出預(yù)測(cè)模型。根據(jù)煤礦數(shù)據(jù)的特點(diǎn),使用皮爾遜相關(guān)系數(shù)和Pauta 準(zhǔn)則處理缺失數(shù)據(jù)和異常數(shù)據(jù),引入透鏡成像學(xué)習(xí)[4]和正余弦算法(Sine Cosine Algorithm,SCA)[5]改進(jìn)人工電場(chǎng)算法(Improvement Artificial Electric Field Algorithm,IAEFA)優(yōu)化最小二乘支持向量機(jī)(Least Square Support Vector Machine,LSSVM)進(jìn)行瓦斯突出預(yù)測(cè),實(shí)驗(yàn)表明,該預(yù)測(cè)模型具有優(yōu)秀的診斷性能。
人工電場(chǎng)算法(Artificial Electric Field Algorithm,AEFA)[6]是一種基于種群的元啟發(fā)式算法,它模仿庫(kù)侖引力定律和靜電力定律。在AEFA 中,給定問(wèn)題的可能候選解表示為帶電粒子的集合。與每個(gè)帶電粒子相關(guān)的電荷有助于確定每個(gè)候選解決方案的性能,吸引靜電力使每個(gè)粒子相互吸引,從而導(dǎo)致向具有更重電荷的粒子的全局運(yùn)動(dòng),該問(wèn)題的候選解對(duì)應(yīng)于帶電粒子的位置和適應(yīng)度函數(shù),它決定了它們的電荷和單位質(zhì)量。
任意粒子i在任意時(shí)刻t得到的最優(yōu)解值的位置定義如下:
所有電荷的全局最佳適應(yīng)度的粒子用Pbest=Xbest表示。d維空間中任意時(shí)刻t對(duì)第i個(gè)粒子的總電場(chǎng)力定義如下:
式中:randj為[0,1]之間的隨機(jī)數(shù),為電荷j作用在電荷i上的庫(kù)侖力。
根據(jù)牛頓第二運(yùn)動(dòng)定律,得出電荷i在時(shí)刻t的加速度:
式中:fitpi(t)為電荷i在時(shí)刻t的適應(yīng)度值;best、worst分別為最優(yōu)適應(yīng)度值和最差適應(yīng)度值。
反向?qū)W習(xí)方法[7]作為一種能夠提高優(yōu)化算法搜索空間各個(gè)體質(zhì)量的有效策略,其原理是當(dāng)前解根據(jù)一定規(guī)則生成對(duì)應(yīng)反向解,通過(guò)當(dāng)前解和反向解的比較競(jìng)爭(zhēng),從而得出更利于優(yōu)化算法進(jìn)化的優(yōu)質(zhì)解。如圖1 所示。反向?qū)W習(xí)方法已經(jīng)和許多群智能優(yōu)化算法結(jié)合,對(duì)算法起到了很好的提升效果。
圖1 反向?qū)W習(xí)
反向?qū)W習(xí)中反向數(shù)的定義為,在區(qū)間[a,b]的任意實(shí)數(shù)x,有以下關(guān)系:
透鏡成像學(xué)習(xí)是在反向?qū)W習(xí)的基礎(chǔ)上的進(jìn)一步改進(jìn),通過(guò)計(jì)算透鏡成像反向解來(lái)擴(kuò)大可選解的范圍,增加選取更優(yōu)解的概率,從而實(shí)現(xiàn)對(duì)初始種群個(gè)體質(zhì)量的提升。設(shè)xj和分別表示當(dāng)前粒子個(gè)體及其透鏡成像反向后個(gè)體。
式中:aj和bj表示第j維中的最小值和最大值;k為透鏡的縮放系數(shù)。
初始種群精英化的具體過(guò)程為:隨機(jī)初始化N個(gè)粒子個(gè)體組成初始電荷種群,X=[xi1,…,xid],i= 1,…,N,xi表示第i個(gè)電荷在第d維的位置;將X種群代入式(9)生成透鏡成像反向種群Z;將種群Z內(nèi)電荷個(gè)體根據(jù)適應(yīng)度值進(jìn)行排序,選擇前N個(gè)較優(yōu)個(gè)體構(gòu)成精英反向種群P;將種群P與原電荷種群X根據(jù)個(gè)體適應(yīng)度值進(jìn)行排序,選取前N個(gè)電荷個(gè)體組成新的初始電荷種群。
為防止人工電場(chǎng)算法丟失最優(yōu)解位置,引入正余弦算法更新最優(yōu)解位置,協(xié)調(diào)算法的探索與開(kāi)發(fā)。更新方式如下:
式中:a為常數(shù);t為當(dāng)前迭代次數(shù);Tmax為最大迭代次數(shù)。
改進(jìn)人工電場(chǎng)算法實(shí)現(xiàn)的基本步驟如下:
(1)在搜索空間中,初始電荷種群階段引入透鏡反向?qū)W習(xí)方法;
(2)隨機(jī)初始化電荷的速度和位置,并計(jì)算每個(gè)電荷的適應(yīng)度值;
(3)采用正余弦算法改進(jìn)最優(yōu)解位置;
(4)計(jì)算電荷的庫(kù)侖常數(shù),全局最優(yōu)值和最差值;
(5)計(jì)算電荷的庫(kù)倫力和加速度,更新例子的速度以及位置;
(6)判斷是否滿(mǎn)足停止條件,如果滿(mǎn)足則輸出最優(yōu)值,否則重復(fù)步驟(2)~(6)。
最小二乘支持向量機(jī)是支持向量機(jī)的一種新擴(kuò)展[8],將最優(yōu)化過(guò)程轉(zhuǎn)變?yōu)榫€(xiàn)性方程的求解,保留了結(jié)構(gòu)風(fēng)險(xiǎn)最小化、小樣本等特點(diǎn),有效避免了二次規(guī)劃的問(wèn)題的同時(shí)大大地降低了算法的復(fù)雜程度,相比SVM 具有更好的泛化能力、魯棒性、非線(xiàn)性擬合能力和訓(xùn)練時(shí)間等,在處理高維、非線(xiàn)性、小樣本數(shù)據(jù)問(wèn)題有著很好的效果。
對(duì)于給定煤與瓦斯突出訓(xùn)練集{xi,yi},i=1,2,…,N,其中xi是輸入向量,yi是輸出向量[9],LSSVM 的結(jié)果最佳化問(wèn)題可以表示為以下形式:
式中:C為正則化因子;μ和ζ為可調(diào)參數(shù);ei為松弛變量,表示期望輸出和實(shí)際輸出之間的差異;w為分離超平面的法向量;b為對(duì)應(yīng)的偏項(xiàng);φ為輸入空間到輸出空間的映射函數(shù)[10]。
考慮到RBF 核函數(shù)不僅易于實(shí)現(xiàn),而且是處理非線(xiàn)性問(wèn)題的有效工具,因此采用RBF 核函數(shù),公式如下所示:
式中:g為核函數(shù)參數(shù)。
LSSVM分類(lèi)預(yù)測(cè)流程如圖2所示。
圖2 LSSVM分類(lèi)預(yù)測(cè)流程
影響煤與瓦斯突出的因素很多。常用的因素包括瓦斯含量、瓦斯壓力、煤體強(qiáng)度系數(shù)、鉆屑指數(shù)、綜合指數(shù)、初始瓦斯釋放速度、孔隙度和煤層厚度。現(xiàn)選取瓦斯含量、瓦斯壓力、煤體強(qiáng)度系數(shù)、初始瓦斯釋放速度和孔隙度等5個(gè)指標(biāo)參數(shù)。建立IAEFA-LSSVM 瓦斯突出預(yù)測(cè)模型,利用IAEFA-LSSVM 完成煤與瓦斯突出的預(yù)測(cè),當(dāng)發(fā)生煤與瓦斯突出,應(yīng)啟動(dòng)視聽(tīng)報(bào)警裝置,通知礦工啟動(dòng)相關(guān)的風(fēng)險(xiǎn)防范設(shè)備,信息應(yīng)通過(guò)變電站傳輸?shù)降叵拢瑫r(shí)完成了數(shù)據(jù)的存儲(chǔ)和更新,并定期利用更新后的數(shù)據(jù)集對(duì)新的預(yù)測(cè)模型進(jìn)行訓(xùn)練。IAEFA-LSSVM煤與瓦斯突出危險(xiǎn)性預(yù)測(cè)模型的步驟為:
(1)提取煤與瓦斯突出指標(biāo)樣本數(shù)據(jù);
(2)IAEFA 參數(shù)和種群初始化,設(shè)置種群數(shù)量、尋優(yōu)迭代次數(shù)等參數(shù),在搜索空間內(nèi)精英化初始種群;
(3)確定LSSVM 參數(shù)c和g的 范圍,c∈( 0,100],g∈( 0,100];
(4)引入正余弦算法搜索最優(yōu)解,IAEFA 通過(guò)個(gè)體迭代更新不斷靠近LSSVM 關(guān)鍵參數(shù)最優(yōu)解,并更新迭代次數(shù)t;
(5)將煤與瓦斯突出指標(biāo)主成分?jǐn)?shù)據(jù)劃分為兩部分,即訓(xùn)練集和測(cè)試集,從而進(jìn)行模型訓(xùn)練和實(shí)際測(cè)試,將IAEFA-LSSVM 模型的輸出預(yù)測(cè)值和實(shí)際突出值的均方根誤差作為適應(yīng)度函數(shù),適應(yīng)度最優(yōu)時(shí)作為最優(yōu)解,適應(yīng)度函數(shù)公式如下:
(6)判斷是否滿(mǎn)足終止條件:t≥T,若滿(mǎn)足則繼續(xù)執(zhí)行步驟(7),否則返回步驟(4);
(7)輸出最優(yōu)解,即LSSVM 模型的核函數(shù)參數(shù)值和懲罰參數(shù)值,利用該優(yōu)化后的參數(shù)訓(xùn)練LSSVM 模型,即完成IAEFA-LSSVM 的煤與瓦斯突出預(yù)測(cè)模型的建立。
根據(jù)煤礦數(shù)據(jù)的特點(diǎn),完成了數(shù)據(jù)處理。首先,檢查數(shù)據(jù)集中是否有數(shù)據(jù)丟失,如果有數(shù)據(jù)丟失,使用相應(yīng)的處理方法完成數(shù)據(jù)填充,其次,檢查數(shù)據(jù)集中是否有異常值,如果有異常值,使用異常值處理方法對(duì)數(shù)據(jù)進(jìn)行處理。
有許多數(shù)據(jù)填充的都是基于現(xiàn)有的數(shù)據(jù)集,但隨著時(shí)間的推移,數(shù)據(jù)量將變得非常大,因此實(shí)現(xiàn)數(shù)據(jù)填充將花費(fèi)大量的時(shí)間,從而影響預(yù)測(cè)速度。現(xiàn)提出了一種變量相關(guān)性的數(shù)據(jù)填充方法,使用皮爾遜相關(guān)系數(shù)來(lái)完成新的缺失數(shù)據(jù)填充,保證了數(shù)據(jù)的完整性。皮爾遜相關(guān)系數(shù)可以用數(shù)值來(lái)表示,以衡量?jī)蓚€(gè)變量之間的相關(guān)性[11],其定義如下:
式中:E(x)為變量的數(shù)學(xué)期望值;σx為變量x的標(biāo)準(zhǔn)差;μx為變量x的平均值[12]。
現(xiàn)給出5種特性的相關(guān)矩陣,如表1所示。
表1 特征相關(guān)矩陣
異常數(shù)據(jù)值處理方法。由于設(shè)備精度和實(shí)驗(yàn)條件的限制,數(shù)據(jù)中不可避免地會(huì)混入噪聲,導(dǎo)致數(shù)據(jù)值異常,對(duì)數(shù)據(jù)的缺失值進(jìn)行處理后,根據(jù)Pauta準(zhǔn)則找到數(shù)據(jù)中的異常值。Pauta準(zhǔn)則定義[13]如下:
式中:Xi為異常值;Xˉ為數(shù)據(jù)平均值;Sx為數(shù)據(jù)標(biāo)準(zhǔn)差。
針對(duì)異常數(shù)據(jù)值,提出了數(shù)據(jù)集的5 個(gè)特征,在檢測(cè)異常數(shù)據(jù)值時(shí),采用上述方法進(jìn)行數(shù)據(jù)校正;現(xiàn)采集李村煤礦530 份事故數(shù)據(jù)和安全數(shù)據(jù),利用上述方法完成了異常數(shù)據(jù)的識(shí)別,異常值的鑒定結(jié)果如表2所示。
表2 異常數(shù)據(jù)識(shí)別結(jié)果
通過(guò)使用IAFEA-LSSVM 進(jìn)行煤與瓦斯突出預(yù)測(cè),如表3 所示,模型的靈敏度為100%,準(zhǔn)確率為97.5%。實(shí)驗(yàn)結(jié)果表明,該模型能較好地全面檢測(cè)煤與瓦斯突出。
表3 預(yù)測(cè)結(jié)果
本文首次根據(jù)特征間的相關(guān)性完成了缺失數(shù)據(jù)的填充,保證了所消耗的時(shí)間非常少,對(duì)異常值進(jìn)行識(shí)別和處理,使分析數(shù)據(jù)更接近實(shí)際數(shù)據(jù),對(duì)缺失數(shù)據(jù)和異常值的處理方法是有效的。采用IAEFA-LSSVM 對(duì)煤與瓦斯突出進(jìn)行預(yù)測(cè),取得了較好的效果。實(shí)驗(yàn)表明,該方法能夠完成煤與瓦斯突出的實(shí)時(shí)預(yù)測(cè)任務(wù),具有靈敏度100%、準(zhǔn)確率97.5%的優(yōu)良性能,可用于煤礦安全生產(chǎn)。