馮雅杰,文廣超,吳冰潔,胡祖棟
(河南理工大學 資源環境學院,河南 焦作 454003)
我國大部分煤田的地質構造十分復雜,在煤炭開采的過程中,小斷層容易引起瓦斯突出、礦井突水、頂板冒頂等事故,嚴重威脅著煤炭開采安全[1-2],因此,在開采過程中對整個工作面的構造進行深度感知,精準識別工作面內部的異常地質環境,實現對工作面地質構造的超前探測,對保障煤炭的安全開采至關重要[3-5]。
目前的斷層識別方法主要分為鉆探法和物探法。物探法是對地層進行物理勘探的一種間接觀測的方法[6],孫振宇等[7]根據振幅和相位等特征,在地震剖面上通過目視解譯識別出5 m 以上斷層,但是小于5 m的小斷層由于變化微小,很難通過目視解譯直接劃分;An Yu 等[8]開源了一個用于地震圖像的專家標記字段數據集,通過對專家標記的圖像數據集進行深度卷積神經網絡訓練,實現了斷層邊緣的檢測,該方法縮短了斷層的識別周期,但依賴于大量地震圖像的專家解譯標記;A.Cunha 等[9]使用遷移學習技術開發分類器標記地震數據,能夠幾分鐘內在CPU 上完成模型的調整和訓練,但基準模型敏感度低,容易遺漏大部分斷層;路鵬飛[10]、豐超[11]、常德寬[12]等利用地震數據訓練深度學習網絡的方法對斷層進行自動智能識別,但是這種方法需要大量的訓練時間[13],而且識別精度受地區構造的復雜度影響[14-17],據此可知,現有的物探方法在探測煤層中小斷層方面還有待深入研究。鉆探法是在采煤工作面內實施專門的勘探鉆孔工程[18],通過對地層打孔取樣進行勘探的一種直接觀測的方法,但是這種方法不僅工作量大并且成本很高。根據《防治煤與瓦斯突出細則》要求,突出礦井需要開展瓦斯預抽工作,瓦斯預抽實施了大量的鉆孔工程,高密度的瓦斯抽采孔為斷層識別積累了豐富的地質資料,有助于突破工作面斷層識別瓶頸。崔洪慶等[19]提出通過瓦斯抽采鉆孔數據繪制等高線及三維立體圖,對隱伏小斷層定量預測,但是需要有專業地質知識的人員對繪制結果目視解譯;薛洪來等[20]在崔洪慶提出的方法上構建數學模型繪制等高線圖,通過對繪制結果進行圖像處理來識別斷層,但是對落差小于1 m 的斷層識別能力較弱。
本文以煤礦井下采煤工作面小斷層有效識別為研究目標,擬基于高密度瓦斯抽采孔數據,采用統計分析方法,建立小斷層識別模型,為采煤工作面安全回采提供技術支撐。
基礎數據源自某礦采煤工作面,共獲取到兩個研究區域內的665 個鉆孔的鉆探數據,其中A、B 研究區鉆孔分別為303、362 個,鉆探數據包含瓦斯抽采孔原始記錄表、底抽巷施工平面圖。瓦斯抽采孔原始記錄表是施工過程中鉆孔數據表,包含了鉆孔所屬地點、孔號、鉆孔的夾角、傾角、方位角、孔深、鉆孔見煤情況和距離拱基線的高度等基礎數據。
依據底抽巷施工平面圖(圖1)中建立局部坐標系,獲取鉆孔終點坐標和控制點坐標信息,建立鉆孔終點坐標解算模型(圖2),計算鉆孔終點的高程值。利用瓦斯抽采孔的數據記錄中的終孔坐標、見煤情況、傾角和方位角的信息分別計算鉆孔與煤層的交點,得到巷道線和煤層頂底板平面(圖3)。從底抽巷施工平面圖中拾取真實斷層邊界,采用Shpfile 格式存儲二維斷層的空間位置和屬性信息。

圖2 鉆孔終孔高程計算剖面Fig.2 Calculation profile for the final hole elevation of a borehole

圖3 鉆孔分布示意Fig.3 Schematic showing borehole distribution
1.2.1K-Means 聚類
K-Means 聚類算法的原理是通過特征數據之間的相似性對數據進行聚類[21],一般選擇歐氏距離作為相似性評價指標,最佳聚類簇數除了通過經驗人為給定,還可以通過手肘法和輪廓系數法自動確定,手肘法通過計算誤差平方和確定最佳聚類簇數,輪廓系數法通過計算輪廓系數來度量最佳聚類簇數的選擇是否合理。誤差平方和ESS和輪廓系數S(n)的計算公式如下:
式中:k為最佳聚類簇數;Ci為第i簇;p為Ci中的數據點;mi為Ci的質心。
式中:n為樣本數據點;an為樣本點所屬簇內其他樣本的平均距離;bn為樣本點與其他簇的樣本平均距離的最小值。
1.2.2凝聚層次聚類
凝聚層次聚類算法的原理是將樣本中的每一個數據點作為一個簇,然后合并2 個相似度最高的簇得到一個新簇,重復這個過程直到滿足停止循環的條件時結束聚類,最后形成樹形結構,停止循環的條件一般為目前存在簇數。
凝聚層次聚類算法中的相似度遵循一定原則,Scikit-learn 庫中提供了3 種度量相似度的策略。
(1) Ward 策略。將所有的類簇之間距離的方差最小化。
(2) Maximum 策略。將所有類簇之間距離最大值最小化。
(3) Average linkage 策略。將所有類簇之間距離的平均值最小化。
1.2.3算法對比
根據數據特征選擇合適的聚類算法能夠提高分類準確度,4 種聚類算法對比見表1。高密度的瓦斯抽采孔數據在計算距離時會大大增加算法的時間成本,結合數據特點,選擇原理簡單且適合高維數據的K-Means聚類算法,選擇手肘法為K-Means 聚類算法計算最佳聚類簇數。

表1 聚類算法優缺點對比Table 1 Comparison of clustering algorithms
1.3.1聚類精度評價
聚類內部評價指標有3 種:CH 分數、戴維森堡丁指數DBI 和輪廓系數,其對比見表2。瓦斯抽采孔是按照一定距離間隔打孔,煤層上鉆孔點的二維空間分布不聚集,煤層除了異常地質條件帶來的地層起伏之外還有正常的地層起伏,高程上同樣不具有高聚集、簇類少的特點,所以本文中選取了戴維森堡丁指數作為評價指標,選擇歐氏距離作為評價指標的評價因子。

表2 聚類精度評價指標對比Table 2 Comparison of clustering accuracy evaluation indices
1.3.2擬合精度評價
常見的擬合評價指標有3 種,分別為誤差平方和ESS、均方根差ERMS、決定系數R2。如果單純利用和方差進行評價,受到變量絕對大小的影響,會影響到同一個斷層在不同巖層面中的擬合精度評價結果,所以本文選擇決定系數R2進行擬合精度評價。R2的計算公式如下:
式中:TSS為總離差平方和;RSS為回歸平方和,即類間方差。
1.3.3斷層參數評價
斷層參數評價以走向、傾角及落差3 個參數為主,通過誤差值量化識別精度,評價標準見表3。

表3 斷層識別評價指標Table 3 Fault identification evaluation indices
需要說明的是,傾角和落差的誤差具有同向性,即FP和FD應同為正或同為負,走向誤差與傾角、落差誤差之間相互獨立,走向誤差的絕對值越小代表斷層走向的識別精度越高。
不同工作面中由于地質概況不同,對斷層識別精度的要求有所不同,以本文礦區的工作面為例,走向誤差和傾角誤差的絕對值小于5°,落差誤差的絕對值小于0.5 m 屬于正常誤差。
小斷層識別包括數據預處理、斷層識別及精度驗證、斷層可視化三步(圖4):(1) 數據預處理。基于鉆孔及控制點數據計算煤層數據,基于斷層位置、走向和落差構建斷層Shpfile 文件。(2) 斷層識別及精度驗證。通過K-Means 聚類算法構建多層次聚類模型,識別不同埋深范圍下的異常點用于擬合斷層面,對聚類結果,擬合結果和識別結果進行評價,反復修正模型參數直到精度評價滿足要求,最后計算斷層參數。(3) 將斷層在三維場景中進行可視化[22-24],通過目視解譯判斷識別結果的合理性和準確度。

圖4 小斷層識別技術流程Fig.4 Technical flow chart of minor fault identification
本節根據第2 章的技術流程對2 個研究區域中的斷層分別進行識別,然后與真實揭露的斷層數據進行對比,評估該方法對斷層識別的有效性和合理性。
采用圖4 所示的技術流程識別位于斷層破裂面上的異常點(圖5),通過對異常點的埋深進行聚類分析,得到2 個埋深范圍內的異常點,這兩類異常點分別分布在斷層上下盤。從圖5a 中可以看出A 研究區內異常點呈現聚集狀態,異常點的埋深范圍為2.4~3.3 m,其中埋深較大的異常點分布在真實斷層的上盤,埋深較小的異常點分布在真實斷層的下盤;從圖5b 中可以看出B 研究區的異常點呈條帶狀分布,異常點的埋深范圍為7.6~10.4 m,其中埋深較大的異常點分布在真實斷層的上盤,埋深較小的異常點分布在真實斷層的下盤。

圖5 異常點識別結果Fig.5 Anomalous point identification results
從圖6 可知,兩類異常點投影的趨勢線存在一定高程差,即異常點滿足位于斷層兩盤的條件。可見根據煤層頂板點的埋深和空間分布識別出異常點,可以準確識別出小斷層的位置。

圖6 異常點分類Fig.6 Anomalous point classification
對異常邊界之間的異常點進行線性擬合,得到擬合精度符合要求的擬合斷層線(圖7),通過擬合斷層線計算斷層走向;對異常點空間平面擬合得到擬合斷層面(圖8),通過斷層面與平面的夾角計算斷層傾角。

圖7 擬合走向線Fig.7 Fitted fault strikes

圖8 擬合斷層面Fig.8 Fitted fault planes
根據埋深范圍計算斷層落差,A 研究區擬合斷層面的埋深范圍為2.4~3.3 m,計算得到擬合斷層的落差為0.9 m,落差誤差0.1 m;B 研究區擬合斷層面的埋深范圍為7.6~10.4 m,計算得到擬合斷層的落差為2.8 m,落差誤差0.2 m,2 個擬合斷層面的傾角和落差均小于真實斷層,且傾角和落差呈正相關。
擬合斷層參數和真實斷層參數結果見表4,擬合斷層走向、傾角和落差的誤差均在允許范圍內,擬合結果與真實情況相符。

表4 斷層參數對比Table 4 Comparison of fault parameters
通過Rhino 三維建模軟件構建煤層和斷層面(圖9),根據可視化結果可知,A 研究區中的煤層不平整,從整體來看,東北方向的煤層高程高于西南方向的煤層,由于采煤工作面的煤層厚度變化遠小于東北方向煤層和西南方向煤層的高程差,由此可推斷出東北方向上的煤層面抬升是由于沉積環境引起的,在擬合斷層面附近,斷層上下盤發生小錯動,上盤抬升,下盤下降,可知該斷層是斷距較小的逆斷層,和真實斷層的上下盤一致,都是逆斷層;B 研究區中的煤層較為平整,但在擬合斷層面附近,斷層上下盤的錯動較大,上盤抬升,下盤下降,可知該斷層也是逆斷層。

圖9 斷層三維可視化Fig.9 3D visualization of faults
為了說明數學統計分析和空間擬合方法對斷層識別的有效性,將某工作面內2 個研究區的瓦斯抽采孔數據作為基礎數據進行斷層識別,同時采用多種評價方法評估模型精度,對比2 個擬合斷層面和真實斷層的參數,擬合斷層面的相關參數略小于真實斷層,屬于正常誤差范圍,擬合結果基本一致。工作面的可視化結果可以清晰看到工作面中的2 個斷層都屬于上盤抬升,下盤下降的逆斷層,與真實斷層情況一致。此結果說明數學統計分析方法能有效識別出受斷層影響的異常數據點,空間擬合方法可以根據異常點數據有效擬合斷層面,證明了這一方法在斷層識別中的可行性。
為了評估斷層的識別精度,選擇本文中2 個研究區的瓦斯抽采孔數據作為基礎數據,與崔洪慶等[25]提出的繪制煤層底板等高線圖的斷層識別方法進行對比,其中孔深誤差設為1.0~2.5 m 區間內的隨機數,使用克里金插值繪制受孔深誤差影響的煤層等高線,結果如圖10 所示。A 研究區中真實斷層落差較小,等高線受斷層干擾較大,需要根據地質因素對孔深誤差進行校正,由結果圖可知斷層位置大概一致,斷層落差約為0.7 m;B 研究區中落差較大,等高線受斷層干擾較小,從結果圖中可知高程4~8 m 和12~16 m 處的等高線間距遠小于8~11 m 處等高線間距,斷層位置清楚可辨,落差約為3 m。與前人的研究結果相比,斷層的識別結果基本一致,表明本方法的合理性和有效性。

圖10 等高線法驗證識別斷層識別結果Fig.10 Verification of fault identification results using contours
本文采用未經插值的高密度瓦斯抽采孔數據作為基礎數據,進行異常點識別及斷層面擬合,通過Python 語言將識別模型程序化,準確完成數據預處理,自動識別工作面中1 m 以下的小斷層。但斷層面的擬合仍存在一些缺陷,通過異常點數據擬合斷層面,將實際斷層面近似為一個規則平面,在復雜地質構造的工作面中難以反映真實斷層的三維形態。在后續研究中將繼續對空間擬合方法進行改進,提高擬合斷層面對真實斷層形態的表達,為透明工作面中斷層的可視化研究提供更加精細的斷層模型。
a.提出基于數學統計和空間擬合的煤層小斷層識別方法,并對某工作面中斷層進行識別,結果表明:未經插值的高密度瓦斯抽采孔數據可以最大程度保留煤層的真實埋深,為異常數據識別提供大量的樣本數據。
b.相較于繪制煤層底板等高線等斷層識別方法,采用數學統計分析和空間擬合方法構建斷層自動識別模型,通過Python 對識別模型程序化,具有較高的自動化和識別精度,在對1 m 以下小斷層的識別上,識別結果更加接近真實斷層情況。
c.本文提出的方法具有較高的識別精度,但斷層面的擬合近似為規則平面,對真實斷層三維形態的表達存在不足,根據異常點的空間位置,提高對擬合斷層面對真實斷層形態的表達是下一步研究中需要解決的問題。