梁運培,栗小雨,李全貴,毛樹人,鄭夢浩,李建波
(1.煤礦災害動力學與控制國家重點實驗室,重慶 400044;2.重慶大學 資源與安全學院,重慶 400044)
智能化礦山建設是一個多系統、多層次、多技術、多專業相互融合的復雜的系統工程,是保障煤炭行業安全快速高質量發展的必由之路[1]。礦井瓦斯濃度監測是瓦斯事故預防的重要手段之一。瓦斯濃度是一種隨時間變化的時序數據,在時間上具有天然的連續性[2],挖掘其時變規律,預測其變化趨勢,對煤礦瓦斯事故的預防具有重要意義[3]。
目前,瓦斯濃度的預測方法主要包括兩類:
1)基于統計學的預測方法,如支持向量機模型(SVM)[4]、支持向量回歸算法(SVR)[5]、最小二乘支持向量機模型(LS-SVM)[6]、自回歸積分滑動平均模型(ARIMA)[7-8]、灰色預測模型[9],以及統計學方法集成學習的預測模型[10]。該類模型結構簡單、構建方便,但由于瓦斯濃度數據具有動態、高度非線性的特點,該類方法難以充分挖掘其隱含特征。
2)基于深度學習的預測方法,如基于循環神經網絡(RNN)的預測模型[11]、基于LSTM的預測模型[12-13]、基于門控遞歸單元(GRU)的預測模型[14]、基于雙向門控遞歸單元神經網絡(Adamax-BiGRU)的預測模型[15],以及與全連接神經網絡(FC)相結合構建的LSTM-FC瓦斯濃度預測模型等[16]。
基于深度學習的預測模型可對瓦斯濃度時序數據進行更深入的挖掘學習,但存在模型最佳參數需依靠經驗調整的弊端,無法確保預測精度。針對這一問題,MA X L等[17]提出了基于GA優化灰色神經網絡(GNN)參數的瓦斯濃度預測方法;賈澎濤等[18]利用粒子群優化算法(PSO)對卷積神經網絡(CNN)和Adamax優化的BiGRU相結合的瓦斯濃度預測方法。前人的研究提高了瓦斯濃度的預測精度,但尚未取得令人滿意的結果。究其原因,在于優化算法的選擇,部分優化算法存在易陷入局部最優的缺點,難以確保尋優的有效性。而CS算法與GA、PSO算法相比,具有參數少、易實現、搜索路徑優、尋優能力強的特點。目前基于CS算法優化的模型已應用于電力系統優化調度[19]、短期電力負荷預測[20]等電力領域,此外,在心電圖心電信號識別分類[21]、發動機故障診斷[22]等方面也有應用研究。上述應用研究證明CS搜索算法是一種有效的模型尋優算法,但其在瓦斯濃度預測方面的應用鮮見報道。
筆者針對瓦斯濃度監測數據在時間維度上存在的變化特性,通過CS搜索算法對LSTM模型超參數進行尋優,構建出最優的CS-LSTM瓦斯濃度預測模型,提高了瓦斯濃度的預測精度,旨在提高煤礦瓦斯安全態勢的預判能力。
瓦斯濃度可直觀反映工作面的瓦斯情況[23],其井下獲取過程及用途如圖1所示。

圖1 工作面瓦斯濃度數據獲取過程及用途
由煤礦開采環境及作業工序的復雜性分析可知,工作面瓦斯濃度的變化具有以下特征:
1)周期性。瓦斯濃度受到井下多種因素的影響,存在著周期性的變化規律,且在大多數周期內,其變化幅度相似。通過機器學習瓦斯濃度周期變化特征,可用于預測其在下一周期的變化情況[24]。
2)趨勢性。瓦斯濃度數據是一組隨時間變化的時間序列,其變化在時間上具有趨勢性,包括水平、上升和下降趨勢。趨勢性變化是預測的重要依據之一[25]。
3)波動性及高度非線性。井下復雜的開采條件,使瓦斯濃度監測數據具有較大的起伏波動,同時使其具備了高度非線性的特征。
瓦斯濃度的上述特征使得通過傳統統計學方法或簡單機器學習搭建的模型無法很好地學習其隱含規律,因此需要搭建合適的深度學習模型,以深入挖掘學習瓦斯濃度數據中存在的周期性及趨勢性,分析其波動性特征,進而有效預測未來某段時間內的瓦斯濃度變化,提高煤礦瓦斯安全態勢的預判能力,為工作面日常瓦斯監控監管工作提供決策支持。
根據瓦斯濃度時序性特征,以及監測數據的質量,利用樣條插值法對瓦斯濃度的缺失值進行插補,以獲得具有均勻時間間隔的監測數據。利用LSTM對瓦斯濃度進行預測,并利用CS對LSTM模型的層數、每層神經元的個數,以及全連接(Dense)層層數、Dense層神經元個數4個超參數進行尋優,從而探究具有最佳網格結構的LSTM預測模型,提升瓦斯濃度預測精度。
由于井下復雜的環境條件,以及設備故障、通信故障等原因,瓦斯濃度實際記錄數據常會存在缺失值,從而導致預測出現困難?;跇訔l插值法在對點源時間序列數據缺失值插補方面具備的優越性[26],通過樣條插值法可對瓦斯濃度時間序列數據缺失值進行補充。
樣條插值法是通過可變樣條做出1條經過一系列點的光滑曲線,從而將m個數據點劃分為m-1個區間,之后求解每個區間段的多項式,以此求出位于區間內部的缺失值[27],其求解過程基于以下原則:
1)曲線方程在節點處的值必須相等,即位于區間內部的點的值必須符合左右2個方程;
2)節點處的一階導數的值必須相等;
3)第一個端點和最后一個端點必須過第一個和最后一個方程。
LSTM網絡通過門控制將短期記憶與長期記憶相結合,具備良好的長時序列數據處理能力。LSTM由多個重復的結構模塊組成,每個結構模塊均包含3個門:遺忘門、輸入門及輸出門。LSTM結構模塊如圖2所示。LSTM網絡通過激活函數σ實現對3個門的控制,從而實現對歷史信息的保留和遺忘。

圖2 LSTM結構模塊
LSTM預測模型主要包括三步:
1)由Sigmoid函數層決定的遺忘門層ft,計算公式如下:
ft=σ(Wf[ht-1,xt]+bf)
(1)
式中:σ為Sigmoid激活函數;Wf為遺忘門權重矩陣;h為神經元輸出;x為神經元輸入;t為當前時刻;t-1為上一時刻;b為偏置項。
2)增加狀態量的輸入門層it,可選擇更新。計算公式見式(2)、(3)、(4):
it=σ(Wf[ht-1,xt]+bi)
(2)
(3)
(4)

3)輸出層Ot計算公式如下:
Ot=σ(Wo[ht-1,xt]+bo)
(5)
ht=OttanhCt
(6)
式中Wo為輸出門權重矩陣。
CS算法是模擬布谷鳥尋巢產卵行為的一種尋求目標函數最優化問題的仿生算法,為了簡化自然界中布谷鳥的繁衍習性,YANG X S等[28]將布谷鳥的產卵行為假設為3個理想狀態:
1)布谷鳥1次只產1個卵,并隨機選擇鳥窩位置來孵化它;
2)在隨機選擇的1組鳥窩中,最好的鳥窩將會被保留到下一代;
3)可選擇的寄生巢的數量是固定的,寄生巢主人發現外來鳥蛋的概率為P(0
CS搜索尋優過程中,布谷鳥根據Levy飛行規則進行巢穴的選擇與更新。Levy飛行是一類非高斯隨機過程,由長時間的短步長和短時間的長步長組成,其平穩增量服從Levy穩定分布。在飛行過程中,步長較小的短距離行走與偶爾較大步長的長距離行走相互交替,有利于增加種群多樣性、擴大搜索范圍,不至于陷入局部最優。
根據Levy飛行的巢穴更新公式如下:
Xt+1=Xt+α·L(λ)
(7)
式中:Xt、Xt+1分別為時刻t、t+1的巢穴位置;α為步長縮放因子;L(λ)為Levy隨機路徑;λ為步長規模參數。
采用Mantegna方法,生成服從Levy飛行的隨機步長,如式(8)所示:
(8)

CS-LSTM預測模型通過t-1時刻的瓦斯濃度數據,實現對t時刻瓦斯濃度的預測。CS-LSTM模型結構及預測流程如圖3所示。

圖3 CS-LSTM模型結構及預測流程
CS-LSTM瓦斯濃度預測步驟如下:
1)搜集整理原始數據,判斷數據是否存在缺失值。若存在缺失值,則利用樣條插值法對缺失值進行插補,然后利用最大—最小歸一化法對數據進行無量綱化處理(見式(9)),之后得到一維瓦斯濃度時間序列。
(9)
式中:x*為歸一化后的瓦斯濃度;x為單個瓦斯濃度。
2)搭建LSTM模型基礎框架,設置LSTM預測模型評價指標為均方誤差ems(MSE)。ems越小,表明預測模型準確度越高。ems計算公式如下:
(10)

3)利用CS算法對LSTM結構進行尋優。設置CS算法適應度函數F:
F=1/ems
(11)
設置CS算法的搜索參數、迭代次數等。
4)將CS算法最優參數組合輸入LSTM模型中,完成預測并輸出預測結果。
選擇平均絕對誤差ema(MAE)、均方根誤差erms(RMSE)與模型運行時間t作為預測模型的評估指標。其中,ema和erms越小,表明預測結果的精度越高;t越小,模型的預測速度越快。ema及erms的計算公式如下:
(12)
(13)
研究數據取自松藻礦區打通一礦采煤工作面生產數據,該工作面平均開采深度450 m,煤層厚度2.9 m,采用綜采的方式沿傾向仰采,絕對瓦斯涌出量為5.44 m3/min?;诿块g隔1 min取樣、同一分鐘取最大值的原則,共選取該工作面5 760組瓦斯濃度(CH4體積分數,下同)監測數據為原始樣本。預處理過程如下:
1)根據實際開采情況,剔除未進行開采活動時的記錄數據,將剩余共2 990組瓦斯濃度歷史監測數據作為樣本進行CS-LSTM模型的訓練與預測。
2)利用箱線圖方法對原始數據進行異常值識別。識別效果如圖4所示,異常值識別結果見表1。

圖4 箱線圖異常值檢測結果

表1 箱線圖檢測異常值
3)為驗證樣條插值法對于缺失值插補的有效性,假設第x個數據采集點為缺失值x=200i(i=1,2,…,14),構造生成一個預處理數據序列,然后利用樣條插值法對缺失值進行插補。插補后的數據與真實數據的ema為0.006 8、erms為0.008 7,驗證結果表明樣條插值法滿足本文數據處理的需求。
將步驟2)中檢測出的異常值視為缺失值并利用樣條插值法進行插補,最后將數據按照8∶2的比例劃分為訓練集與測試集。
4)缺失值填充后,利用式(9)對數據進行無量綱化處理。
將搭建好的LSTM基礎框架[i,j,nk,ml]輸入CS算法中進行尋優。設置CS算法搜索空間維度最低為4,最高為8。設置種群規模為10,巢穴丟棄(發現)率P=0.25,L(λ)隨機路徑中β=1.5,步長縮放因子α=0.1,適應度函數為F=1/ems。
CS尋優最終結果為F=1 831.232 34,最優巢穴位置為[2,1,58,63,188],即最佳LSTM模型網格結構為2層,其對應神經元個數分別為58、63,全連接層為1層,其對應神經元個數為188。
4.3.1 優化效果分析
對比CS算法優化結果與GA算法尋優結果,以驗證CS算法尋優的優勢,結果如圖5所示。

圖5 CS-LSTM、GA-LSTM尋優結果
由圖5可知,在相同的搜索步數下,CS算法搜索區間范圍為[297.955 675,1 831.232 340],GA算法搜索區間范圍為[375.222 092,702.368 742],即CS算法的搜索范圍相較于GA算法更廣,搜索區間更大。
GA算法的搜索結果區間變化小,數據分布比較均勻,其原因可能是陷入局部最優,而CS算法可以更好地避免這種現象。因此,基于Levy飛行CS算法具有更好的尋優性能。
4.3.2 預測效果分析
將最優超參數組合輸入到LSTM模型中,對未來12 h的瓦斯濃度進行預測。應用CS-LSTM模型預測瓦斯濃度結果如圖6所示。

圖6 CS-LSTM模型瓦斯濃度智能預測結果
由圖6可知,瓦斯濃度預測數據的擬合效果整體較好,但在極值點的擬合效果略差。原因可能是在極值點左右數值變化較大,存在突變的情況,因此其規律及特征更難以學習。未來需對極值點的預測精度進行改進。
將LSTM、GA-LSTM、CS-LSTM模型的預測結果進行比較,對比情況如表2所示。

表2 LSTM、GA-LSTM、CS-LSTM預測結果對比
3種模型的損失(Loss)曲線如圖7所示。

圖7 LSTM、GA-LSTM、CS-LSTM模型Loss曲線
由表2可知,在預測精度上,LSTM效果最差,GA-LSTM次之,CS-LSTM最佳。結合圖7中3個預測模型的Loss曲線,LSTM模型損失函數值下降速度明顯低于優化后的LSTM模型。CS-LSTM與GA-LSTM相比,Loss曲線下降速度稍快,但相差并不明顯。結合表2和圖7結果來看,CS-LSTM模型更勝一籌。
瓦斯濃度是煤礦安全監測監控系統的主要監測參數之一。在監測數據上傳至地面中心站之后,可以利用CS-LSTM預測模型對下一階段的瓦斯濃度變化曲線進行預測。隨著監測數據的持續上傳與分析預測,模型不斷得到更新,若模型多次預測均顯示某時間段瓦斯濃度變化存在異常,則系統提示異常信息并發出報警信號,同時結合生產實際提供可能的異常原因及解決方案,達到瓦斯智能治理的目的。
1)提出了一種CS-LSTM的瓦斯濃度智能預測模型。通過對瓦斯濃度實時監測數據隱含規律的分析,預測工作面未來12 h的瓦斯濃度變化,實現了對工作面瓦斯濃度的智能預測。
2)針對高度非線性的瓦斯濃度監測數據,利用CS算法對LSTM預測模型的網格結構進行優化,以Levy飛行的方式更新巢穴位置,避免陷入局部最優的情況,相較于GA算法具有更好的優化效果。
3)CS-LSTM模型相對于LSTM及GA-LSTM模型,RMSE為0.023,其值最小,預測效果較好,能夠滿足礦井工作面瓦斯濃度智能預測的需求。