基于門循環(huán)單元神經(jīng)網(wǎng)絡(luò)模型的煤層底板突水動態(tài)預測

2021-09-22 08:03:26張召千

太原理工大學學報 2021年5期

關(guān)鍵詞：模型

鄧強，張召千，王震

(1.太原理工大學礦業(yè)工程學院，太原 030024；2.秦皇島工程設(shè)計研究院有限公司，河北秦皇島 066000)

煤炭是我國的戰(zhàn)略性能源，在貧油、少氣、富煤的能源結(jié)構(gòu)下，煤炭依然會被長期依賴[1]。而在煤礦開采過程中，經(jīng)常會存在大量的安全隱患[2]。其中煤層底板突水問題一直是受到專家學者關(guān)注的安全問題[3-6]。目前，煤炭開采環(huán)境復雜，煤層底板突水頻發(fā)，但突水預測能力依舊不足，對煤礦的安全生產(chǎn)造成了重大威脅。

國內(nèi)外專家學者研究煤層底板突水問題時，會將其與煤層底板突水機理有效地結(jié)合，科學提出煤層底板突水影響因素指標體系，再通過一系列靜態(tài)預測模型，如回歸分析[7]、數(shù)據(jù)挖掘[8-9]、支持向量機[10-12]、神經(jīng)網(wǎng)絡(luò)[13-15]及極限學習機[16-17]等方法對煤層底板突水進行預測。這些煤層底板突水預測模型在煤礦生產(chǎn)中的應用，提高了煤礦突水的預測能力，防范于未然。

但在煤礦的實際開采過程中，某一回采點對煤層底板突水影響是由多種因素組成的，如地質(zhì)構(gòu)造、煤層厚度、煤層傾角等，并且這些因素會隨著采動的進行影響權(quán)重，所以煤層底板突水預測不能簡單地當成一個靜態(tài)問題處理，需要考慮采動影響下的動態(tài)變化[18]。針對該問題，本文提出了動態(tài)預測模型：門循環(huán)單元(gated recurrent unit，簡稱GRU)神經(jīng)網(wǎng)絡(luò)預測模型，該模型能夠充分利用采動過程中收集的時間序列數(shù)據(jù)，過濾監(jiān)測過程中的缺失數(shù)據(jù)及干擾數(shù)據(jù)，通過對一系列樣本數(shù)據(jù)變化規(guī)律的學習，實時更新影響因素的變化，精確地對煤層底板突水進行預測，提高煤礦生產(chǎn)安全。

1 煤層底板突水指標體系

煤層底板突水是復雜的非線性問題，它受到多種因素的影響，并且隨著開采的進行其影響因素也會產(chǎn)生動態(tài)變化。早在20世紀60年代就有學者提出突水系數(shù)法用于煤層底板突水預測[19]。后來的許多學者不斷對突水系數(shù)法進行完善，同時，“下三帶”理論、薄板理論、“強滲通道”說及關(guān)鍵層理論等基于經(jīng)驗公式和力學模型的突水理論也相繼發(fā)展起來[18]。

通過總結(jié)以往煤層底板突水理論，本文選擇煤礦突水實例的工作面煤層底板突水數(shù)據(jù)以及正常回采實測數(shù)據(jù)進行分析，如表1所示。

表1 礦區(qū)部分現(xiàn)場實測數(shù)據(jù)Table 1 Partial field measured data in mining area

影響突水的因素是多方面的，突水機理是非常復雜的，一般影響突水的因素包括地質(zhì)構(gòu)造、底板隔水層、底板承壓水、礦山壓力和開采活動等幾個方面。這些因素對煤礦突水影響程度各不相同，具體到某突水事故可能是單個因素的作用結(jié)果，也可能是幾個因素組合反映的作用。我們需要具體研究分析每一種因素對礦井突水的影響方式和作用，就可以有針對性地進行預測和采取有效的預防措施。

抗突水的唯一重要因素阻抗突水能力的大小取決于巖石的力學性質(zhì)隔水層的厚度及其組合關(guān)系。底板承壓水對突水的影響受到水壓大小和所含水量等因素的影響，水壓是造成底板突水的前提條件和動力源泉，其作用主要是對底板巖層中的裂隙和節(jié)理進行沖刷，使得承壓水滲透量上升，當遇到不同路徑的通道接近煤層時，承壓水可能趁勢流入導致突水。除了導水斷層造成工作面突水或采掘工作揭露充水之外，礦山壓力對采煤工作面底板突水有著非常大的影響。因此，開采活動對底板突水的影響是通過對以上幾個方面的部分或綜合影響表現(xiàn)出來。但是隨著回采工作的進行，煤層自身及上覆和下覆巖層的原始應力狀態(tài)發(fā)生了變化，承壓含水層和底板各巖層之間所處的相對平衡狀態(tài)發(fā)生改變，其開采活動的影響正是表現(xiàn)在使原始的應力狀態(tài)重新分布，頂?shù)装鍘r層受到破壞的過程。

本文提出了煤層底板突水影響因素指標體系，如表2所示。煤層底板突水影響因素指標體系被劃分成5個一級指標和15個二級指標。

表2 煤層底板突水影響因素指標體系Table 2 Index system of influencing factors of water inrush from coal floor

2 GRU神經(jīng)網(wǎng)絡(luò)

數(shù)據(jù)在傳統(tǒng)神經(jīng)網(wǎng)絡(luò)中傳遞是先從輸入層到隱含層，再從隱藏層進入輸出層，層間傳播呈現(xiàn)全連接形式，而層內(nèi)的節(jié)點之間不存在聯(lián)系，模型無法很好地處理數(shù)據(jù)的時間序列問題。循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural networks，RNN))的提出很好地解決了數(shù)據(jù)的時間序列問題，但RNN在計算時存在梯度消失問題，GRU的出現(xiàn)徹底解決了這個問題[20]。圖1為GRU神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖。GRU是RNN的改進版本，它在RNN的基礎(chǔ)上通過增加狀態(tài)c來確保在長期狀態(tài)下能夠長久保存，解決了之前僅僅一個隱層狀態(tài)h的局面。

圖1 GRU神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖Fig.1 GRU neural network structure

圖2為GRU神經(jīng)網(wǎng)絡(luò)模型單位結(jié)構(gòu)圖。GRU單元中含更新門zt、重置門rt、輸入xt、輸出ht，t-1表示上一時刻，t表示當前時刻。重置門決定上一時刻的單元信息是否被記住或者遺忘，更新門決定單元信息是否被刪除或新信息是否被添加。隱藏層通過使用One-Hot編碼進行二維向量輸出，在隱藏層傳遞最后一個時間單元的輸出值給輸出層后，SoftMax分類器會對其進行解碼，將其轉(zhuǎn)化為代表預測結(jié)果的0和1，其中1代表突水，0代表不突水。

圖2 GRU神經(jīng)網(wǎng)絡(luò)模型單元結(jié)構(gòu)圖Fig.2 GRU neural network model unit structure

式(1)表示此模型的損失函數(shù)：

J(θ)=-∑(x(i),y(i))∈Dlog(p(y=y(i)|x(i),θ)) .

(1)

式中：θ為模型參數(shù)；D表示樣本數(shù)據(jù)構(gòu)成的訓練集；(x(i)，y(i))表示訓練集中第i個樣本數(shù)據(jù)，x(i)是10維的向量，y(i)的取值僅有0和1，分別表示不突水和突水；p(y=y(i)|x(i))，θ)表示樣本(x(i) ，y(i))突水(不突水)的概率。

3 煤礦實測數(shù)據(jù)采集及處理

3.1 數(shù)據(jù)來源

本文研究的某煤礦含煤層為侏羅系中統(tǒng)延安組，根據(jù)巖性、巖相、沉積旋回及煤巖組合特征分為三段:第一段含4、4-1、4-2煤，第二段含4上-2、4上-1煤，第三段含3煤。礦井目前開采4煤層，4煤層屬于穩(wěn)定可采煤層，底板為泥巖。礦區(qū)主要屬中生代承壓水盆地范疇，勘探階段未揭露大型斷層，僅在采掘過程中揭露部分小型斷層，因此該礦的充水通道主要受采動影響。

回采工作面位于礦區(qū)二采區(qū)中部。煤層頂板為深灰色炭質(zhì)泥巖和灰白色中砂巖，工作面地質(zhì)構(gòu)造相對簡單。工作面三岔口以北263 m存在一正斷層，斷層面膠結(jié)性良好，透水性較差。三岔口以北516 m處存在一逆斷層，斷層發(fā)育高度較小，掘進過程中頂板存在淋水現(xiàn)象，水量較小且持續(xù)時間較短。NY103工作面中部有一走向EW的向斜構(gòu)造，北翼傾向SW，傾角3°～8°，南翼傾向NW，傾角3°～11°.回采過程中頂板淋水、NY105工作面采空區(qū)積水等將全部流向向斜軸部，有可能造成工作面突水。

本文選取該煤礦突水實例的工作面煤層底板突水數(shù)據(jù)以及正?；夭蓪崪y數(shù)據(jù)進行分析(如表1所示)。

3.2 數(shù)據(jù)歸一化處理

由于原始數(shù)據(jù)中各項數(shù)據(jù)相互間有較大的差別，例如其數(shù)據(jù)類型有差別、數(shù)據(jù)采用的量綱也不同、絕對值存在較大的差值，因此需要對數(shù)據(jù)進行歸一化處理，否則會對模型的運行產(chǎn)生較大影響。輸入樣本中包含邏輯型數(shù)據(jù)和數(shù)值型數(shù)據(jù)，前者使用0和1表示，后者運用線性轉(zhuǎn)換方式把輸入數(shù)據(jù)的范圍投射到[0，1]區(qū)間，其轉(zhuǎn)換方式如式(2)所示：

(2)

式中：x(p，i)為樣本p中第i個數(shù)據(jù)進行歸一化處理后的數(shù)值；x0(p，i)為樣本p中第i個數(shù)據(jù)進行歸一化處理前的數(shù)值；xmin(i)為全部樣本中第i個數(shù)據(jù)的最小值；xmax(i)為全部樣本中第i個數(shù)據(jù)的最大值。

3.3 基于Wrapper評價的特征選擇

特征選擇是將冗余特征去掉，將輸入向量空間維數(shù)減小，同時將學習樣本進行優(yōu)化，是對輸入數(shù)據(jù)使用降維操作的一個步驟，可以明顯提升訓練效率。針對煤層底板突水預測問題，各個地區(qū)的煤礦處于不同的地理位置，并且各個地區(qū)煤礦的主控因素千差萬別，因此存在各種各樣導致突水的原因。在現(xiàn)場收集的數(shù)據(jù)不僅數(shù)據(jù)量非常大，同時存在許多無關(guān)緊要的冗余數(shù)據(jù)，而這些數(shù)據(jù)會對模型的訓練效率產(chǎn)生影響，所以需要預先去掉這些冗余數(shù)據(jù)。

在突水預測問題方面，可以采用Wrapper評價策略，因為原始樣本的數(shù)據(jù)量比較小，其數(shù)據(jù)特征只有15維，在保證準確率的情況下，運算速度也不至于太慢。因此本文選用基于Wrapper評價策略的特征選擇方法[21]。

以下為該特征選擇方法的詳細過程和計算結(jié)果：

將原始特征集合內(nèi)的所有特征進行編號，開始第一輪的特征選擇，號碼“1，2，…，15”分別代表“煤層傾角、煤層厚度、構(gòu)造有無、斷層落差、裂隙帶有無、采動破壞深度、采高、開采面積、走向長度、含水層厚度、水壓、距工作面距離、灰?guī)r段厚度、砂巖段厚度、泥巖段厚度”。在15維的原始特征集合內(nèi)每次刪掉號碼i的特征(i=1，2，…，15)，把剩下的14維特征用特征子集Mi(i=1，2，…，15)表示，從而獲得M1，M2，…，M15共15個特征子集；并且，用子集M0表示原始特征集合。把子集M0，M1，M2，…，M15按順序輸入模型，對GRU神經(jīng)網(wǎng)絡(luò)模型進行訓練，將預測準確率的大小用作評判結(jié)果好壞的標準，選用“十折交叉驗證法”對錯誤率進行運算。Mi(i=0，1，…，15)的錯誤率分別由xi(i=0，1，…，15)表示。把xi(i=1，2，…，15)分別與x0做對比，如果相互間的差值很小，就假設(shè)僅去掉號碼i的特征之后，對整體的誤差率不會產(chǎn)生太大影響，將其認定為待定冗余特征。

圖3為各個子集第一輪特征選擇時的誤差率計算結(jié)果，由圖可知，“x0，x3，x9，x12，x15”這5個點的誤差率較低，將不去除子集中任意特征的誤差率設(shè)為x0，“x3，x10，x13，x15”代表在原始的特征子集中僅單獨去掉“構(gòu)造有無、含水層厚度、灰?guī)r段厚度、泥巖段厚度”這四個特征后的誤差率。故而，“構(gòu)造有無、含水層厚度、灰?guī)r段厚度、泥巖段厚度”被判定為待定冗余特征。同時，因為x3和x0最為相近，因此認定與其對應的“構(gòu)造有無”為冗余特征，再把該特征從原始集合中剔除，集合變成14維，然后進行第二輪特征選擇。和第一輪相同，第二輪特征選擇對每個特征重新編號，重復一遍第一輪的過程。

圖3 各個子集在第一輪特征選擇時的誤差率Fig.3 Error rate of each subset in the first round of feature selection

圖4為各個子集在第五輪特征選擇時的誤差率。如圖所示，從集合中單獨去除某一特征后，都顯著影響了最后的誤差率，可以表明“煤層傾角、煤層厚度、斷層落差、裂隙帶有無、采動破壞深度、采高、開采面積、走向長度、水壓、距工作面距離、砂巖段厚度”這11項特征和煤層底板突水是密切相關(guān)的。同時前四輪已去除的4項特征被認定為冗余特征，分別為“構(gòu)造有無、含水層厚度、灰?guī)r段厚度、泥巖段厚度”。

圖4 各個子集在第五輪特征選擇時的誤差率Fig.4 Error rate of each subset in the fifth round of feature selection

4 煤層突水GRU神經(jīng)網(wǎng)絡(luò)預測模型的建立

4.1 GRU預測模型的訓練

GRU神經(jīng)網(wǎng)絡(luò)模型可以學習時間序列數(shù)據(jù)。由上文可知，數(shù)據(jù)維數(shù)已由15維降到11維，在進行分類和劃分數(shù)據(jù)集后，就可輸入到模型中。通過回采點與時間段的差異，對數(shù)據(jù)進行排序分組，然后把分組好的數(shù)據(jù)分為訓練集、驗證集和測試集；每個部分所占的比例不同，其中訓練集是分組好的數(shù)據(jù)中隨機抽取60%所構(gòu)成，驗證集為20%，測試集為20%.

在訓練過程中，每次訓練輸入一組數(shù)據(jù)，把模型預測結(jié)果和實際結(jié)果對比，從而得到誤差率，之后采用優(yōu)化算法對權(quán)重矩陣進行更新，提高預測準確率。在全部數(shù)據(jù)都輸入模型得到預測結(jié)果，并進行權(quán)重調(diào)整后，對模型的一輪訓練才算結(jié)束。同時，根據(jù)實際情況確定訓練的輪數(shù)。

4.2 訓練結(jié)果分析

圖5為GRU神經(jīng)網(wǎng)絡(luò)模型準確率及損失情況。圖5(a)代表訓練集上預測的準確率變化動態(tài)，圖5(b)表示訓練集上損失值變化動態(tài)，圖5(c)表示驗證集上預測的準確率變化動態(tài)，圖5(d)表示驗證集上損失值變化動態(tài)。因Dropout的啟用，一部分節(jié)點被隱藏，模型的準確率以及損失會隨迭代次數(shù)的加大而發(fā)生抖動，而訓練集準確率低于驗證集，同時明顯的過擬合顯現(xiàn)沒有發(fā)生。由圖5可以得到，GRU預測模型在訓練集上的準確率可以達90.42%，在驗證集上的準確率可以達96.29%.

圖5 GRU神經(jīng)網(wǎng)絡(luò)模型準確率及損失情況Fig.5 Accuracy and loss of GRU neural network model

5 煤層底板突水動靜態(tài)模型預測對比

結(jié)合前文礦區(qū)的現(xiàn)場實測數(shù)據(jù)，本文使用支持向量機、BP神經(jīng)網(wǎng)絡(luò)、極限學習機這三個靜態(tài)神經(jīng)網(wǎng)絡(luò)預測模型與動態(tài)的GRU神經(jīng)網(wǎng)絡(luò)預測模型進行對比。每個模型均按前文所述方法，將數(shù)據(jù)劃分成訓練集、驗證集及測試集，應用各模型將訓練集數(shù)據(jù)進行訓練，以測試集準確率為準進行模型預測精度評估。

不同預測模型的準確度結(jié)果如圖6所示，動態(tài)的GRU神經(jīng)網(wǎng)絡(luò)預測模型在訓練、驗證和測試三個階段的準確率均要高于靜態(tài)的支持向量機、BP神經(jīng)網(wǎng)絡(luò)和極限向量機。尤其是在最終的測試階段，動態(tài)的GRU神經(jīng)網(wǎng)絡(luò)預測模型的準確率要達到95.23%，而其他的靜態(tài)預測模型的準確率均低于90%.

圖6 不同預測模型在訓練、驗證及測試階段的準確率Fig.6 Accuracy of different prediction models in the training, verification, and testing phases

GRU神經(jīng)網(wǎng)絡(luò)模型與BP神經(jīng)網(wǎng)絡(luò)等向前反饋的靜態(tài)預測模型相比，GRU神經(jīng)網(wǎng)絡(luò)模型依靠對大量的數(shù)據(jù)樣本進行學習，并自身總結(jié)出煤層底板突水的變化規(guī)律及該動態(tài)變化對突水的影響，從而對突水變化因素進行高精度的篩選，較其余三種靜態(tài)神經(jīng)網(wǎng)絡(luò)預測模型在煤層底板突水預測能力上具有更高的準確率，運用到煤礦開采中可以極大地提高生產(chǎn)安全。

工程現(xiàn)場表明，大部分礦井突水都與斷層、陷落柱等構(gòu)造密切相關(guān)。該礦統(tǒng)計的大部分數(shù)據(jù)中都是有構(gòu)造的，但通過Wrapper評價的特征選擇，最終確定“構(gòu)造有無”為冗余特征；相反，“煤層厚度、開采面積”卻被特征選擇為與煤層底板突水密切相關(guān)。后續(xù)研究需要進一步改進相關(guān)的特征選擇方法。

6 結(jié)論

1) 以煤礦突水理論及現(xiàn)場實測數(shù)據(jù)為依據(jù)，建立了煤礦突水影響因素指標體系，并基于Wrapper評價策略的特征選擇，確定“煤層傾角、煤層厚度、斷層落差、裂隙帶有無、采動破壞深度、采高、開采面積、走向長度、水壓、距工作面距離、砂巖段厚度”這11項特征和煤層底板突水密切相關(guān)。

2) 煤層突水GRU神經(jīng)網(wǎng)絡(luò)模型通過對現(xiàn)場實測數(shù)據(jù)的學習，確定其在訓練集上的預測準確率達90.42%，在驗證集上的準確率達到96.29%，可以很好地進行煤層突水預測測試。

3) 將動態(tài)的GRU神經(jīng)網(wǎng)絡(luò)預測模型與支持向量機、BP神經(jīng)網(wǎng)絡(luò)及機器學習機這三個靜態(tài)的神經(jīng)網(wǎng)絡(luò)預測模型進行比較，發(fā)現(xiàn)動態(tài)的GRU預測模型預測的準確率在訓練、驗證及測試階段都要高于其他的靜態(tài)模型。因此，GRU模型比其他靜態(tài)神經(jīng)網(wǎng)絡(luò)預測模型要更適合應用到煤層底板突水預測。