秦 巖,盛 武
(安徽理工大學經濟與管理學院,安徽 淮南 232001)
長期以來,煤礦瓦斯災害防治一直是煤礦安全生產中備受關注的焦點之一。煤礦瓦斯災害的發生對國家經濟建設、人員的生命和財產安全帶來了巨大的損失[1-2]。因此,深度挖掘煤礦井下監測數據的內部規律,對礦井瓦斯濃度精準預測并超前預警具有非常重大的意義。
由于井下瓦斯濃度變化機制的復雜性,涉及到多種影響因素,且這些因素與瓦斯濃度變化間存在復雜的非線性關系,國內外學者大多采用數學模型和統計學模型研究礦井瓦斯濃度預測及預警。常用的模型有自回歸模型、多元回歸模型等。張儉讓等[3]將ARIMA模型與GARCH模型相結合實現了對煤礦綜采工作面瓦斯濃度預測并評價了預測效果;任曉東[4]通過對潞寧礦的瓦斯濃度監測數據進行分析,建立ARMA模型對煤礦瓦斯濃度進行了預測試驗,并將預測結果劃分為4個預警等級;牛嘉野軍[5]利用統計法對48組瓦斯監測數據進行分析,并將正態分布作為劃分瓦斯災害預警的重要指標。近年來,隨著人工智能的興起,機器學習為煤礦瓦斯濃度預測及預警提供了新的研究思路。如:程子均等[6]通過長短期記憶與全連接神經網絡組合模型,采集瓦斯監測數據實現了煤礦瓦斯濃度預測及預警;王雨虹等[7]提出一種改進的蝗蟲優化算法優化長短時記憶神經網絡的多參數瓦斯濃度預測模型,以此來提高模型尋優能力與預測效果;Wu等[8]提出了一種集成小波變換和極限學習機的煤礦瓦斯濃度混合預測模型,該模型有效分離了時間序列的特征信息,能夠提高煤礦瓦斯濃度預測的高效性與精度;Wang等[9]對比分析了LSTM-LightGBM組合模型與單個模型在煤礦瓦斯濃度預測中的泛化能力,為瓦斯事故預防提供了新的思路;Song等[10]基于遞歸神經網絡(RNN)構建了多參數融合的煤礦瓦斯濃度預測模型,降低了預測誤差。由于RNN和LSTM網絡模型存在結構復雜、訓練周期長且易出現梯度消失與爆炸等問題,影響了模型預測效果的穩定性。門控循環單元(GRU)模型是RNN、LSTM模型的優秀變體,其結構簡單且訓練參數較少,不但能夠解決梯度消失、過擬合等問題,還能保留數據內在關系的敏感度,可使得瓦斯濃度預測在保證精度的前提下獲得更好的實用性。但是,目前進行的研究主要側重于構建瓦斯時間序列數據預測,往往忽略了瓦斯監測數據具有時空演化的特征,因此有必要研究多參量融合的瓦斯災害特征。
鑒于此,本文擬選取某煤礦現場采集的瓦斯濃度實測數據,融合瓦斯濃度時空分布特征,通過鄰近均值法填充缺失數據,利用小波降噪去除噪聲,將數據歸一化處理后,再采用PCA實現數據降維以減少GRU模型輸入維度,并引入LSTM、RF和BP神經網絡模型對比分析了預測結果的精準度,最后通過構建SVM瓦斯濃度分級預警模型,實現了瓦斯風險的高準確率識別。建立基于PCA-GRU-SVM煤礦瓦斯濃度預測及預警模型,可為瓦斯安全態勢管理提供決策支撐。
主成分分析(principal component analysis,PCA)是統計學科領域的一種重要分析方法,該方法在保證信息受到最小損失的前提下,通過提取原始數據中的關鍵信息,采用少數新指標代替原始指標實現指標降維,將復雜問題簡單化[11-12],同時消除特征變量間的相關性信息。其數學表達式如下:
(1)
式中:Zx1,Zx2,…,Zxj為樣本Z經過標準化后的j項指標;A1i,A2i,…,Aji(i=1,2,…,m)為指標X協方差矩陣特征值對應的特征向量;Yi(i=1,2,…,m)為第i個主成分。
門控循環單元(gate recurrent unit,GRU)是LSTM的一種重要變體[13],包含兩個門函數,即更新門和重置門,如圖1所示。

圖1 門控循環單元網絡結構Fig.1 Gate recurrent unit network structure
GRU主要通過兩個門對瓦斯濃度數據信息進行更新,計算公式如下:
zt=σ(Wz·[ht-1,lt]+bz)
(2)
rt=σ(Wr·[ht-1,lt]+br)
(3)
(4)
(5)

多層GRU模型能夠通過自身記憶機制學到更好的結果,但過多的層數也易出現過擬合和陷入局部最優的情況。因此,本文選擇兩層GRU堆疊,通過建立全連接層實現多因素瓦斯濃度時間序列數據預測。

(6)
s.t.fA-{[w,?(VA)]-b}≤∈+ξ
(7)
上式中:VA和fA分別為第A個瓦斯預警等級的輸入和輸出變量;ξ為松弛變量;C為懲罰因子,C>0;w和b為超平面參數;ξA為第A個瓦斯預警等級的松弛變量;?(VA)為映射函數;∈為決定間隔邊界寬度的超參數。
本文提出的基于PCA-GRU-SVM的多參量瓦斯濃度預測及預警模型建立流程如圖2所示。主要的步驟如下:

圖2 基于PCA-GRU-SVM建立的多參量煤礦瓦斯濃度預測及預警模型流程圖Fig.2 Flow chart of multi-parameter coal mine gas concentration prediction and early warning model based on PCA-GRU-SVM model
步驟1:數據采集與處理。采集礦下多個傳感器的監測數據,瓦斯濃度不僅受自身時間變化的影響,還受到井下溫度、風速、礦壓等其他空間因素的影響。融合瓦斯時空的監測數據,并對數據進行填缺、降噪及歸一化。
步驟2:降維處理。采用PCA算法對瓦斯濃度的影響因素進行降維處理,減少GRU模型輸入節點的個數,以提高預測精度的有效性。
步驟3:構建多層GRU預測模型。設置網絡結構和參數,輸入變量利用訓練樣本進行訓練,直至達到滿意結果后結束,并利用評價指標判斷和對比預測精度。
步驟4:構建SVM分級預警模型。依據閾值劃分預警等級,將數據樣本輸入模型中,計算得出模型的準確率以驗證模型的可靠性。
本文采用平均絕對誤差(MAE)和均方根誤差(RMSE)來評價預測結果的準確程度,其計算公式如下:
(8)
(9)

MAE和RMSE值越小,則表明模型預測誤差越小,預測性能越好。
本文試驗數據來源于安徽某煤礦171105工作面,數據采集時間為2022年5月20日上午8點至2022年5月22日上午8點,每隔1 min采集一次,數據總量為17 286個。因煤礦井下環境復雜,瓦斯濃度值并非是獨立變量,受巷道溫度、礦壓、風速等各類因素的影響,瓦斯濃度發生不斷變化[15],通過煤礦井下工作面多傳感器的實時在線監控采集,獲得了瓦斯濃度D1、溫度D2、風速D3、瓦斯預抽采D4、CO濃度D5、礦壓D6的監測數據,部分原始數據見表1。

表1 部分原始數據
2.1.1 數據缺失值填補處理
在煤礦安全監測系統中,傳感器在數據采集過程中因自身故障或其他外部原因易造成在某些時間點上數據缺失[16],這會很大程度影響模型的預測精度。本文采用鄰近均值法對數據缺失值進行填補,從而獲得完整的數據集。
2.1.2 數據降噪處理
煤礦井下受傳感器噪聲干擾及復雜環境的影響,監測數據可能會在極短的時間內產生峰刺或跳變[17]。為了消除噪聲對預測效果的干擾,本文采用小波降噪方法對樣本數據進行降噪處理,選取固定閾值對噪聲進行剝離,具體計算公式如下:
(10)
(11)
式中:λ為閾值;N為數據長度;Wj,k為小波系數;σ為噪聲的標準差。
目前,常用的閾值函數有硬閾值函數和軟閾值函數。硬閾值函數和軟閾值函數的定義分別如下:
(12)
(13)

與硬閾值函數相比,軟閾值函數的小波系數具有較好的連續性,增加了平滑處理[18]。為獲取連續性更好的瓦斯濃度樣本數據,本文采用了固定閾值和軟閾值函數對樣本數據進行降噪處理。以工作面瓦斯濃度樣本數據為例,進行降噪前后對比如圖3所示。
由圖3可見,降噪后數據的曲線與原始數據相比,在各峰值、拐點的毛刺變小,曲線表現得較為光滑,變動的幅度下降,且與原始數據近似程度相對較高,更能夠準確描述出瓦斯濃度的變化趨勢。
2.1.3 數據歸一化處理
由于數據中涉及多個影響瓦斯濃度的指標且指標數值范圍各不相同,為統一指標數值,將時間序列數據縮放到[0,1][19],本文采用min-max標準化方法對樣本數據進行歸一化處理,處理后的相關數據如圖4所示,歸一化處理公式如下:

圖4 歸一化處理后的瓦斯濃度等相關指標數據Fig.4 Normalized gas concentration and other related indicator data
(14)
式中:y′為該指標無量綱化后的數據;y為原始樣本數據;max為最大樣本值;min為最小樣本值。
由歸一化處理后的數據具體分布小提琴圖(圖4)可知,數據分布較為集中,離群值較少。
采用PCA算法對數據進行降維,并將處理后的數據進行因子分析,經過KMO檢驗和Bartlett的球形度檢驗得到KMO值為0.650(大于閾值0.5),顯著性系數為0.000(小于0.05),說明因素間存在一定的相關性,可以進行因子分析。分析得到的解釋總方差見表2,主成分因子荷載矩陣見表3。

表2 解釋總方差

表3 主成分因子荷載矩陣
當主成分特征值大于1時,提取數目為3,其累計方差百分比即貢獻率大于70%,可將該成分提出作為主成分。依據表3可構建3個主成分表達式如下:
Y1=0.032X1-0.355X2+0.421X3-0.034X4+0.078X5+0.412X6
(15)
Y2=-0.025X1+0.037X2+0.119X3-0.654X4+0.686X5+0.005X6
(16)
Y3=0.896X1+0.288X2+0.154X3+0.033X4+0.012X5+0.089X6
(17)
由上述公式可得經PCA降維后的數據,部分數據見表4。

表4 降維處理后的數據
將經過PCA降維處理后的3個主成分作為GRU模型的輸入變量,瓦斯濃度數據作為輸出變量。試驗采用兩層的隱藏層結構,通過設置參數return_sequences=Ture來完成層數的改變,并且加入Dropout層防止模型過擬合。GRU模型結構與參數如表5所示。

表5 GRU模型結構與參數
表5中,Optimizer為優化器,本文采用Adam算法作為模型優化算法;Loss為損失函數,本文選取均方誤差(MSE)進行計算;epochs為88;batch_size為72,將數據集按照9∶1的比列進行分割,將其劃分為訓練集和測試集進行訓練與檢驗,測試集預測結果如圖5所示。
由圖5可知,多數預測值分布在理想直線附近,分散程度較小,說明模型具有較高的預測精度,能夠準確地描述預測值與真實值間的關系。經計算可得,該預測模型在測試樣本的預測誤差為MAE=0.003 36,RMSE=0.009 36,誤差結果較小,證明基于GRU的瓦斯濃度預測模型具有較強的泛化及學習能力。
為了驗證PCA-GRU模型性能的優越性,將該模型預測結果與PCA-LSTM、PCA-RF、PCA-BP模型預測結果進行對比,不同預測模型預測結果與性能的對比如圖6和表6所示。

表6 不同預測模型預測性能對比

圖6 不同預測模型的預測結果對比Fig.6 Comparison prediction results of different prediction models
由圖6可以看出:基于PCA-GRU的預測模型得到的瓦斯濃度預測值與實際值間整體擬合性更優,與其他預測模型相比其預測結果更接近瓦斯濃度的真實值。綜合評估指標MAE和RMSE對預測模型的整體性能進行對比結果(表6)表明:PCA-GRU預測模型運行所消耗的時間最少為40.38 s, MAE和RMSE值均低于其他預測模型,與PCA-LSTM、PCA-RF、PCA-BP預測模型相比,其MAE值分別降低了18.45%、56.36%和87.3%,RMSE值分別降低了5.17%、9.04%和67.52%,說明構建的PCA-GRU預測模型具有較好的預測性能,雖在數值上存在些許誤差,但這些預測誤差是可接受的。
根據前文圖1可知,設置瓦斯濃度預警系統可為煤礦井下作業人員提供重要的警示幫助,瓦斯濃度預警閾值的設置與瓦斯濃度預警方法的有效性有著密切的關系?!睹旱V安全規程》中所規定的瓦斯濃度上限值較大,在正常情況下通常達不到預警上限值水平的1%[20],故根據該煤礦實際生產情況將瓦斯濃度閾值采用標準規定的瓦斯濃度上限值的10%、15%、25%進行設置,此閾值設定方法更加貼近正常生產階段瓦斯濃度指標水平。在設置不同預警等級時,將瓦斯濃度風險預警等級劃分為4個等級:預警Ⅰ級、預警Ⅱ級、預警Ⅲ級、預警Ⅳ級,即風險預警閾值如表7所示。

表7 風險預警閾值表
其中,預警Ⅰ級為安全狀態,正常穩定生產,預警等級為綠色;預警Ⅱ級表示瓦斯聚集風險存在,需要關注瓦斯濃度變化趨勢并查明原因,預警等級為藍色;預警Ⅲ級為危險,需要特別關注,若觸發報警裝置,應停止工作,預警等級為黃色;預警Ⅳ級為十分危險,應設置警戒時間,切斷設備電源,撤出工作人員,并控制整改,預警等級為紅色。將瓦斯濃度風險預警等級采用二進制進行編碼,如(0,0,0,1)表示預警Ⅰ級,(0,0,1,0)表示預警Ⅱ級,(0,1,0,0)表示預警Ⅲ級,(1,0,0,0)表示預警Ⅳ級。將各預警等級所對應的十進制數分別表示為1,2,4,8。將上文數據后288組樣本數據隨機劃分為188組訓練數據和100組測試數據,采用SVM分類器作為瓦斯濃度預警模型,其中設置最優懲罰因子為65、最優核函數為0.93,得到基于SVM模型的瓦斯濃度分級預警結果,并將預測預警等級與真實預警等級進行了對比,其結果如圖7所示。

圖7 預測預警等級與真實預警等級對比Fig.7 Comparison between forecast warning level and real warning level
由圖7可見,基于SVM的礦井瓦斯濃度預警模型得到的預測預警等級與真實預警等級基本吻合。通過預警模型得到瓦斯濃度分級預警準確數據為271個,準確率為94.1%。由此可知,基于SVM模型對礦井瓦斯濃度預警分類具有較好的預測精度,并能夠根據預警等級做出相應的預警。其中,瓦斯濃度預警等級Ⅰ級~Ⅳ級的預測準確率結果如圖8所示。

圖8 瓦斯濃度分級預警模型的預警等級準確率Fig.8 Accuracy of early warning level of gas concentration classification early warning model
由圖8可見,瓦斯濃度風險Ⅰ級預警的準確率為75%,Ⅱ級預警的準確率為99%、Ⅲ級預警的準確率為74%、Ⅳ級預警的準確率為77%??傮w而言,預測模型的總體趨勢和預測預警方向正確,從而驗證了本文構建的瓦斯濃度預測與預警模型的準確性和實用性。
1) 本文融合礦井瓦斯時空變化的監測數據,利用鄰近均值法、小波降噪和歸一化處理對監測數據進行填補、降噪及歸一化處理清洗,保證了數據的完整性與可靠性。采用PCA對影響瓦斯濃度的6個因素進行降維,提取出3個主成分,減少了預測輸入集的維度,簡化了GRU模型的網絡拓撲結構,提高了模型預測精度。
2) 將PCA引入GRU、LSTM、RF、BP預測模型中,本文構建的PCA-GRU模型預測結果與試驗數據基本一致,與其他3個預測模型相比,其平均絕對誤差和均方根誤差等評估指標均小于其他模型,驗證了本文構建的組合模型具有較高的擬合優度和預測性能,能滿足實際煤礦井下生產活動的需求。
3) 依據瓦斯濃度風險預警閾值劃分為預警Ⅰ級、預警Ⅱ級、預警Ⅲ級、預警Ⅳ級4種等級,利用PCA-GRU-SVM模型得到的瓦斯濃度預測風險等級與真實預警等級基本吻合,并計算得出預警模型的預警等級準確率為94.1%,表明該模型能夠實現對礦井瓦斯濃度超前預警,提高煤礦瓦斯安全態勢的預判能力。
4) 后續研究中應采集更全面的礦井瓦斯時空特征,實現大量的訓練數據及模型優化,這是下一步的研究重點,將現場數據與機器技術相融合,進而完善煤礦瓦斯安全預警機制。