侯恩科 ,榮統瑞 ,衛勇鋒 ,夏冰冰 ,謝曉深
(1.西安科技大學 地質與環境學院,陜西 西安 710054;2.陜西省煤炭綠色開發地質保障重點實驗室,陜西 西安 710054;3.陜西陜煤黃陵礦業有限公司,陜西 黃陵 727307)
煤層瓦斯含量既是瓦斯地質規律分析的主要內容,也是預測瓦斯涌出量和煤與瓦斯突出危險性的重要參數[1]。但瓦斯含量受諸多地質因素影響,各因素條件復雜多樣,且對煤層瓦斯含量影響程度大小也存在較大差異,具有不確定性、動態性和復雜性的特點[2-3]。因此,精準預測煤層瓦斯含量對煤礦瓦斯災害事故的預防與治理具有重要意義[4]。
近年來,國內外學者提出眾多方法來解決煤層瓦斯含量預測問題,如多元回歸、灰色理論[5]、神經網絡[6]、支持向量機[7]和極限學習機[8]等算法被應用于煤層瓦斯含量預測研究中。其中,由于BP 神經網絡預測煤層瓦斯含量的效果較好而被廣泛運用。吳觀茂等[9]以煤層深度、煤層厚度、煤層頂底板巖性、井田地質構造和煤的變質程度為主要影響因素,建立了比多元回歸分析預測精度更高的煤層瓦斯含量預測模型;沈金山等[10]運用灰色關聯分析選取影響瓦斯賦存的主要因素進行建模預測,證明了灰色理論與神經網絡預測模型的可靠性;為了克服BP 神經網絡模型收斂速度慢和易陷入局部極小的問題,劉景艷等[11]采用粒子群算法優化BP 神經網絡的神經元個數和連接權值,建立了粒子群算法優化BP 神經網絡預測模型(PSO-BP);曹博等[12]先采用主成分分析降低變量間的相關性,然后用遺傳算法優化BP 神經網絡的權值和閾值,建立了PCA-GA-BP 神經網絡預測模型,證明該模型可以準確預測煤層瓦斯含量;趙偉等[13]提出了自適應混沌海鷗算法(ACSOA),建立了基于自適應混沌海鷗算法優化BP 神經網絡的瓦斯含量預測模型(ACSOA-BP),證明該模型具有更高的預測精度和穩定性;馬磊等[14]提出了遺傳算法(GA)和模擬退火算法(SA)混合初始化BP 神經網絡的瓦斯含量預測模型(GASA-BPNN 模型),該模型將GA 和具有時變概率突跳性的SA 整合為GASA 算法協同初始化BPNN 的權值和閾值,有效提高了BPNN 的參數學習能力。由于影響煤層瓦斯含量的因素眾多且各因素之間存在復雜的非線性關系,使得預測模型的精度和效率還有待提高[11]。綜上,為了解決瓦斯預測的精度和效率,利用Logistic 混沌映射算法麻雀種群進行初始化,增加麻雀種群位置的多樣性,提升麻雀算法的全局搜索能力,再將改進的麻雀搜索算法用于優化BP 神經網絡,使得LSSA-BP 預測模型較其他模型,收斂速度更快、預測精度更高、穩定性更佳[15]。
因此,以黃陵一號煤礦為例,先采用灰色關聯分析法篩選出影響煤層瓦斯含量的主控因素作為BP 神經網絡輸入層神經元,建立基于Logistic 混沌映射改進的麻雀搜索算法優化BP 神經網絡的煤層瓦斯含量預測模型(LSSA-BP),并通過將該模型的預測結果與麻雀搜索算法優化BP 神經網絡模型(SSA-BP)及標準BP 神經網絡模型的預測結果進行綜合對比分析,以期得到準確率和穩定性更優的預測模型。
麻雀搜索算法(sparrow search algorithm, SSA)是由XUE 等[16]受麻雀捕食過程引導啟發而提出的一種新型群智能優化算法,主要通過麻雀的捕食和反捕食行為進行迭代尋優,包括發現者、跟隨者和預警者3 種群體。捕食行為主要與算法中的發現者和跟隨者相對應,一般占種群的70%,作為發現者在迭代尋優過程中適應度較高,具有更廣泛的搜索能力,其作用是為跟隨者的捕食行為提供向導,隨后交由跟隨者進行捕食;而反捕食行為則與算法中的偵查預警機制相對應,一般占據種群的20%,種群的部分麻雀作為預警者,其作用是根據捕食過程中危險的出現與否來決定是否放棄捕食。
發現者位置更新如式(1):
跟隨者位置更新如式(2):
式中:Xbest為全局最優位置;β為步長參數,服從[0,1]的正態分布;K∈[-1,1]為隨機數;fi為適應度值;fg、fw分別為全局最優和最差的適應度值;ε為常數。
利用logistic 混沌映射如式(4):
式中:yn(t)為logistic 混沌映射對麻雀種群分布進行初始化后的序列;t為迭代次數;υ為控制參數。
對式(1)中的麻雀種群分布進行初始化,以增強種群多樣性,并擴大種群搜索區域范圍,其中yn∈ [0,1],y0為初始條件,其產生的映射序列是非周期性的且不收斂,此外生成的映射序列必于某一特定值收斂; υ為控制參數,決定該算法的演變過程,一般1≤υ≤4,隨著 υ值的增大,映射序列的取值范圍也隨之增大,且映射分布更均勻,并當υ=4 時均勻性達到頂峰[17]。
BP 神經網絡預測模型的精度是通過不斷調整模型的權值和閾值來提高的。因此,可使用SSA算法解決由權值和閾值隨機初始化導致模型局部最優的問題,并引入logistic 混沌映射初始化麻雀種群位置,增加麻雀種群位置的多樣性,擴大麻雀種群的搜索范圍[18],從而提升LSSA-BP 模型的預測精度、收斂速度和穩定性。LSSA-BP 模型預測流程如圖1。
圖1 LSSA-BP 模型預測流程Fig.1 LSSA-BP model prediction flowchart
以黃陵一號煤礦2#煤層為例,該礦瓦斯地質較為簡單且瓦斯資料數據有限,根據前人對煤層瓦斯含量預測的研究,將影響煤層瓦斯含量X0的樣本數據初步選取為以下7 個具有代表性且易于量化表達的影響因素:煤層厚度X1、煤層埋深X2、煤層上覆基巖厚度X3、煤層頂板20 m 內砂巖(粗粒砂巖、中粒砂巖、細粒砂巖)厚度X4、煤層頂板20 m 內泥巖厚度X5、揮發分X6和灰分X7。選取45 組瓦斯含量及影響因素的數據作為模型的數據集,其中數據前80%的部分作為訓練集,剩余數據作為測試集,瓦斯含量及影響因素數據見表1。
表1 瓦斯含量及影響因素數據Table 1 Gas content and influencing factors dat a
借助MATLAB R2021a 平臺,利用灰色關聯分析法篩選主控因素作為模型的輸入層節點數[19],步驟如下:
1)確定參考序列和比較序列。瓦斯含量X0為參考序列,影響瓦斯含量的7 個因素為比較序列Xe。
2)數據按式(5)進行歸一化處理。
式中:re為關聯度; θ 為 樣本數量;wk為指標權重。
灰色關聯度分析結果見表2。
表2 灰色關聯分析結果Table 2 Gray association analysis results
由表2 可知:7 個影響因素的關聯度均高于0.7,當關聯度不小于0.8 時,認為關聯性很好,因此選取關聯度在0.8 以上的作為模型的輸入層節點數。影響因素X6和X7的關聯度值一致,說明這2 個因素對瓦斯含量的影響效果一樣,只需保留1 個即可,剔除X7。最終確定將煤層厚度、煤層埋深、煤層上覆基巖厚度、煤層頂板20 m 內砂巖厚度和煤的揮發分共5 個影響因素作為模型的輸入層節點數。
為驗證LSSA-BP 模型的穩定性、預測精度和運行速度,借助MATLAB R2021a 平臺,將篩選出的5 維樣本數據按照圖1 預測流程進行訓練,并利用SSA-BP 模型和BP 模型與該模型的預測結果進行綜合對比。經過BP 模型的反復訓練,隱含層節點數和均方誤差見表3。
表3 隱含層節點數與均方誤差Table 3 Implied layer node count and mean squared error
當隱含層節點數為11 時,BP 神經網絡訓練集的均方誤差最小。因此,將構建結構為5-11-1的BP 神經網絡,訓練次數設置為1 000,學習速率為0.01,訓練目標最小誤差為0.000 01。SSA 算法中的初始種群規模為20,最大迭代次數為30,發現者占比為全部種群的70%,其余作為跟隨者,預警者比重為20%,安全值為0.6。
優化收斂曲線如圖2。
圖2 優化收斂曲線Fig.2 Optimizing convergence curves
由圖2 可知,LSSA-BP 模型在迭代15 次后達到全局最優,具有較強的尋優能力,而SSA-BP 模型在迭代25 次后才趨于平穩,且LSSA-BP 模型訓練的均方誤差更低;LSSA-BP 模型較SSA-BP模型具有更強的全局搜索能力、更高的預測精準度和更快的收斂速度。
為驗證LSSA-BP 模型在煤層瓦斯含量預測方面的有效性和優越性,選取數據樣本中的后9 組數據作為預測樣本進行預測,LSSA-BP 模型預測結果見表4,預測樣本預測值與實測值對比如圖3,預測結果絕對誤差對比如圖4。
表4 LSSA-BP 模型預測結果Table 4 SSA-BP model prediction results
圖3 預測樣本預測值與實測值對比Fig.3 Comparison of predicted and measured values of predicted samples
圖4 預測結果絕對誤差對比Fig.4 Comparison of absolute error of prediction results
由圖3 可知:LSSA-BP 模型中除鉆孔L83 的預測值與實測值相差較大外,其余鉆孔的預測值與實測值在整體上接近程度較高;SSA-BP 模型,雖然部分鉆孔的預測結果較好,但是其中鉆孔L73 和L76 的預測值與實測值偏離幅度較大;而BP 模型的預測值與實測值偏離幅度總體較大,預測結果較差。
由圖4 可知:LSSA-BP 模型的預測穩定性較其他模型最好,在整體上最接近于0,且較為平緩,其中鉆孔L83 的預測誤差最大,誤差達到了0.734 4 m3/t,小于SSA-BP 模型的最大誤差1.304 2 m3/t;而單一的BP 模型預測誤差總體上均較大,最大誤差高達2.191 9 m3/t。
由以上各模型的預測值以及預測誤差對比可知,LSSA-BP 模型預測結果準確度較高且穩定性更佳。
為了能夠有效反映模型預測的精度,選擇平均絕對誤差(MAE)、均方誤差(MSE)、均方根誤差(RMSE)和平均絕對百分比誤差(MAPE)4 個指標作為模型預測精度的評價指標[20-21]。模型精度指標見表5。
表5 模型精度指標Table 5 Model accuracy indexes
LSSA-BP 模型的4 項指標均優于SSA-BP 模型和BP 模型;較SSA-BP 模型4 項指標分別提升了 0.059 5 m3/t、 0.181 4 m3/t、 0.179 7 m3/t 和18.385 3%,其中在MSE、RMSE 和MAPE 這3 項指標的提升效果較明顯。
LSSA-BP 模型的4 項指標較BP 模型4 項指標分別提升了0.867 8 m3/t、1.672 2 m3/t、0.943 2 m3/t 和76.598 0%;總體提升效果非常明顯,表明LSSA-BP 模型在煤層瓦斯含量預測方面具有一定優勢;而對BP 模型的4 項指標數值均較大的情況,是由于BP 模型在搜索過程中易陷入局部極小值,且搜索效率較低,甚至出現“過擬合”現象的原因。
通過對比3 種模型預測結果的4 項指標,LSSA-BP 預測模型的各項指標均為最優,可滿足在煤層瓦斯含量準確預測的需要。
1)通過灰色關聯分析法計算出各個因素與煤層瓦斯含量之間的關聯度,可篩選出影響煤層瓦斯含量的主控因素,從而能確定模型的輸入層節點個數,降低模型的數據維度,減小模型的計算量和預測誤差。
2)利用Logistic 混沌映射初始化麻雀種群,可增加種群多樣性,擴大全局搜索能力,并通過LSSA 對BP 神經網絡權值和閾值的優化,所建立的基于LSSA-BP 的煤層瓦斯含量預測模型,有效解決了單一BP 模型收斂速度慢和易陷入局部極小的問題。
3)就訓練結果對比,LSSA-BP 模型較SSABP 模型對數據的學習迭代次數明顯減少,具有較強的尋優能力。通過對比LSSA-BP、SSA-BP 和BP 模型預測結果,LSSA-BP 模型的預測值與實測值貼合度較好,具有更佳的穩定性。同時,LSSABP 模型的平均絕對誤差(MAE)、均方誤差(MSE)、均方根誤差(RMSE)和平均絕對百分比誤差(MAPE)分別為0.346 9 m3/t、0.172 1 m3/t、0.414 9 m3/t 和27.403 6%均優于其他模型,具有較高的精準度。由此表明,LSSA-BP 模型在煤層瓦斯含量預測方面具有一定的優勢,可為煤礦瓦斯災害防治提供比較可靠的分析和決策依據。
4)在本次煤層瓦斯含量預測研究中,樣本數據初步選取為7 個具有代表性且易于量化的影響因素,并且樣本數量有限;在今后的研究中,進一步豐富樣本數據的類型和數量預測效果會更佳。另外,當訓練樣本數目較多時,LSSA-BP 模型訓練耗時較長,未來需在這方面有進一步的優化提升,以提高模型在煤層瓦斯含量預測方面的實用性。