王 杰
(1.瓦斯災害監控與應急技術國家重點實驗室,重慶 400037;2.中煤科工集團重慶研究院有限公司,重慶 400039)
目前,煤礦瓦斯災害治理的根本途徑是煤層瓦斯抽采。其中,巷道法預抽鄰近層及卸壓層瓦斯是瓦斯治理中有效的區域性措施,該方法需在底(頂)板巷中向突出煤層施工大量的鉆孔,通過鉆孔工程的擾動使煤體部分卸壓[1-3]。根據瓦斯抽采鉆孔的施工要求,底抽巷穿層鉆孔需進入煤層底板后再穿出煤層頂板不少于0.5 m。而現階段的全液壓回轉鉆機,在施工過程中無法準確地判斷鉆頭層位,只能依靠人的經驗知識來判斷鉆孔是否到達設計層位,一般根據鉆孔泥漿顏色、排渣特征、鉆機壓力變化情況等信息來進行巖層或煤層識別,該方法受經驗積累程度、信息滯后、干擾因素多的影響,判斷結果往往具有一定的偏差、延遲和誤差。若不能及時識別煤層的頂、底板,則可能出現鉆孔不到位,導致抽采空白帶的出現。
在工程實踐中,基于鉆進參數的地層信息識別方法廣泛用于地層評價和界面識別[4-5]。在煤礦巷道圍巖分類方面,提出了一種基于鉆進參數的核模糊Cmeans 聚類(Kernel Fuzzy C-means,KFCM)算法的含煤地層巖性模糊識別方法,主要用于巷道圍巖特征識別[6]。研發的煤礦巷道液壓錨桿鉆機隨鉆參數系統可通過計算破巖比能對巖石的力學性能進行識別[7]。在煤礦井下自動鉆進方面,提出了一種基于地層識別的自動鉆進控制方法,系統通過比功法自動識別3 種地層并匹配相應的鉆進參數[8]。在地質鉆進方面,采用數字式鉆孔過程監測(Drilling Process Monitor,DPM)系統對香港地區復雜風化花崗巖地層的界面進行了成功識別[9]。在鑿巖掘進方面,提出一種基于PCA-BP(Principal Component Analysis-Back Propagation)神經網絡隨鉆參數巖性智能感知方法,通過鑿巖鉆機試驗臺采集的6 種敏感鉆進參數對泥巖、砂巖和軟弱層進行了識別[10]。在石油鉆井方面,將3 種機器學習模型應用于基于鉆進參數的地層巖性和頂部實時預測,研究成果表明優化后的人工神經網絡模型(Artificial Neural Network,ANN)的精度性能優于自適應神經模糊推理系統(Adaptive Neuro-Fuzzy Inference System,ANFIS)和函數神經網絡(Functional Neural Network,FNN)[11]。上述研究表明了基于鉆進參數進行地層識別的可行性,但多數應用于巷道圍巖分類、地質鉆進、鑿巖掘進和油氣井等工程領域,在瓦斯抽采鉆孔工程中的相關文獻較少。
由于煤礦井下環境的特殊性和鉆孔類型的多樣性,鉆進參數的獲取和分析難度較大。因此,在煤礦井下鉆進參數采集系統設計和煤巖界面識別方法中開展相關研究工作,并將機器學習算法應用于煤巖分類中,獲得鉆進參數和地層之間的分類關系,建立基于鉆進參數的煤巖界面識別模型,以期實現煤巖界面的自動識別,為鉆孔層位判定提供一套技術裝備。
對于回轉切削的成孔方式,鉆進過程包括回轉和推進兩個主要做功部分,鉆進參數主要有鉆桿轉速、回轉扭矩、推進力(鉆壓)和推進速度(鉆速)4 個基本參數。研究表明某些巖石的物理性質與鉆進參數之間存在一定的響應關系,在理想環境下,鉆進參數的差異可明顯區分不同的模擬地層,可較準確地對地層進行界面識別[12-14]。
在實際應用中,由于地質條件的復雜性及鉆孔過程的隨機性,鉆機的工作參數是動態變化的,難以用準確的閾值范圍來區分不同地層類型。而能量指標綜合考慮了各種因素的影響大小,有效的避免了上述不利因素。在施工設備和技術水平固定的條件下,破碎單位體積巖石所需的能量與巖石物理力學性質之間存在一定的相關性,利用能量參數可較為精確的表征鉆進過程中物理參數與地層信息之間的響應關系[13]。在各種能量指標中,破碎比功是近年來被許多科學家認可的比較合理的一種方法,即通過破碎單位體積巖石消耗的能量評價巖石破碎的難易程度。其計算公式[15-16]為:
式中:E為破碎比功,MPa;Fd為推進軸向力,N;Az為鉆孔橫截面積,m2;n為鉆桿轉速,r/min;Tr為鉆機回轉扭矩,N·m;vd為推進速度,m/min。
從式(1)可以看出,當鉆孔橫截面積確定后,破碎比功主要由4 個基本參數決定,是鉆進參數的一個派生參數。因此,只需要在鉆孔過程中采集鉆進參數,就可得到頂板巖層和煤層的破碎比功值,近似反映當前鉆進地層的強度大小,從而識別鉆進地層。
支持向量機(SVM)是機器學習中的一種分類方法,本質上是一種按監督學習方式對數據進行二元分類的廣義線性分類器。其基本思想是:對于線性可分的數據集,在原空間尋找兩類樣本的最優分類超平面,該超平面不僅能正確分類每一個樣本,且使得每一類樣本中距離超平面最近的數據到超平面的距離盡可能遠。當線性不可分時,通過使用非線性映射將低維度輸入空間的樣本映射到高維度空間使其變為線性可分,從而在該映射空間中尋找最優分類超平面[17-18]。其分類原理如圖1 所示。

圖1 支持向量機分類原理Fig.1 Classification principle of SVM
圖1 中,實心和空心圓點分別代表兩類二維數據,分割它們的任一超平面可用線性方程描述為:
式中:w為法向量,決定了超平面的方向;x為二維數據構成的樣本向量;b為位移量,決定了超平面與原點的距離,w和b這兩組參數可通過訓練得到。
對于訓練樣本(xi,yi),定義yi=1 時為正樣本,yi=-1 時為負樣本,則可用以下公式表達:
距離超平面最近的幾個樣本點使得yi(wTxi+b)=1成立,它們被稱為“支持向量”,支持向量到超平面的距離之和被稱為“間隔”。由解析幾何中的距離公式可得到間隔d的表達為:
則優化目標為求間隔d最大值時對應w和b,顯然,最大化間隔等于最小化||w||,也等價于最小化||w||2,加上約束條件后,求解的優化問題可以寫成:
煤巖界面的識別工作包括煤巖分類預測和界面位置確定兩方面需求。整個過程的識別流程如圖2 所示。其中,界面位置的確定由鉆機的工況識別系統實現鉆桿數量的自動記錄,通過鉆機液壓系統的各種條件判斷和邏輯規則識別進、退桿工況,在進桿時增加鉆桿數量,實現鉆孔深度的記錄,具體原理在本文中不再詳細贅述。

圖2 基于鉆進參數的煤巖界面識別流程Fig.2 Coal-rock interface recognition process based on drilling parameters
煤巖分類預測采用機器學習的方法進行自動識別,基于鉆機工作時壓力、扭矩和相關能量的動力傳遞過程,在鉆機每根鉆桿的鉆進過程中,對鉆機的4 個鉆進參數和破碎比功開展隨鉆檢測與自動采集。在此基礎上,對鉆進數據進行整理和標記工作,構建基于鉆進參數的樣本數據庫和基于支持向量機的煤巖分類識別模型。通過模型訓練和參數調整不斷提高預測準確率和泛化能力,直到獲得理想的輸出為止,最后再根據此最優的模型訓練結果去識別未知的鉆進參數。
為了實現煤巖界面識別過程的自動化,設計了基于鉆進參數的鉆孔煤巖界面識別系統,整套系統由數據感知層、采集層和分析層組成。其中,數據感知層主要用于測量和變送鉆機參數,是該系統的基礎部分,由各類物理量傳感器和相應的電氣線路及液壓管路組成。數據采集層主要用于鉆進參數的采集與計算、鉆進工況識別、鉆孔深度記錄和破碎比功曲線繪制,是整個系統的核心部分,由數據采集儀、工控計算機和相應的數據采集程序組成。數據分析層主要用于樣本數據收集、數據學習、煤巖識別和結果輸出,是該系統的人機交互部分,由專用軟件和輸入輸出設備組成。整個系統的結構框架如圖3 所示。

圖3 基于鉆進參數的煤巖界面識別系統架構Fig.3 Architecture of coal-rock interface recognition system based on drilling parameters
鉆機數據采集系統主要用于采集鉆機液壓系統工作參數,同時完成數據計算、顯示和記錄等功能[19]。該系統由礦用隔爆兼本質安全型電控箱、礦用本質安全型傳感器、礦用防爆手機和配套附件等組成,其中數據采集器、工控計算機和各類電氣輔件均安裝在礦用隔爆兼本質安全型電控箱內,從而滿足煤礦井下防爆環境的使用要求;數據采集器通過安全隔離電路完成各類傳感器的模擬量和頻率量信號采集,再交由工控計算機進行數據處理和顯示,所有的人機交互操作通過礦用防爆手機完成,其電氣原理如圖4 所示。

圖4 鉆機數據采集系統電氣原理Fig.4 Electrical principle of drilling rig data acquisition system
煤巖界面識別軟件是基于鉆進參數的數據分析類軟件,運行在工控計算機的操作系統上。因此,在功能上應具備數據采集、鉆進參數計算和數據分析與輸出三大功能。其中,數據采集模塊負責與數據采集器通信獲取傳感器輸出信號,并實時顯示傳感器當前數值。鉆進參數計算模塊主要是讀取配置參數、根據傳感器數值實時計算各類鉆進參數。數據分析與輸出模塊可完成樣本標記、模型訓練、煤巖識別結果輸出等功能。整個軟件的工作流程如圖5 所示,工作界面如圖6 所示。

圖5 煤巖界面識別軟件工作流程Fig.5 Workflow of coal-rock interface recognition software

圖6 煤巖界面識別軟件工作界面Fig.6 User interface of coal-rock interface recognition software
煤巖界面識別系統的現場應用在河南省鶴壁中泰礦業有限公司實施,鉆孔施工巷道為3116 上底抽巷,施工位置距二煤層底板約40 m,煤層走向132°~270°、傾向42°~160°、傾角4°~18°,平均煤層厚度8.1 m。預測瓦斯含量在6~8 m3/t,瓦斯壓力0.60~0.74 MPa,煤的堅固性系數為0.8~1.5。
本次試驗共設計4 個鉆孔,1-3 號鉆孔為試驗鉆孔,4 號鉆孔為測試鉆孔,各鉆孔的設計參數見表1。

表1 鉆孔設計參數Table 1 Design parameters of boreholes
鉆進參數的獲取采用間接測量法,即通過液壓系統相關回路的流量和壓力參數來計算對應的鉆進參數。因此,鉆孔施工前,需將對應的傳感器安裝在鉆機的液壓系統中,使用的傳感器類型、數量及安裝位置見表2。

表2 傳感器參數及安裝位置Table 2 Sensor parameters and positions
安裝完畢后,為了確保傳感器均能正常工作,進行了數據采集測試,如圖7 所示。

圖7 傳感器數據采集測試Fig.7 Sensor data acquicition testing
現場施工采用ZYWL-4000 型礦用全液壓鉆機,鉆孔過程中,控制鉆機轉速約65 r/min,鉆壓約14 MPa,所有鉆進參數由鉆機數據采集系統按設定的采樣頻率(1 Hz)自動記錄,再用其平均值作為當前鉆桿的鉆進參數,試驗現場如圖8 所示。

圖8 煤巖界面識別系統試驗現場Fig.8 Experimental site of coal-rock interface identification
在1-4 號鉆孔的每個鉆進階段,鉆機數據采集系統實時顯示傳感器采集參數和鉆孔深度,鉆進參數中的轉速和鉆壓兩個參數由鉆機液壓系統控制,基本處于穩定狀態;回轉扭矩、推進速度和破碎比功3 個參數隨地層和孔深的變化發生改變。鉆孔結束后繪制出這3 個參數隨鉆孔深度的變化規律,如圖9 所示。

圖9 鉆進參數隨鉆孔深度的變化規律Fig.9 Variation law of drilling parameters with drilling depth
從圖9 中可以看出以下規律。
(1)回轉扭矩、推進速度、破碎比功3 個鉆進參數的變化過程和地層之間具有明顯的對應關系,這些參數在煤巖界面處均會出現明顯的漲落,與煤巖分類結果之間具有較大的相關性。
(2)由參數變化過程可以判斷出:1 號鉆孔的實際鉆孔深度為28 m,其中19~27 m 為煤層段,2—4 號鉆孔的深度和煤層段可同理得出,該結果與現場有經驗的司鉆人員判斷一致。
(3)整個鉆進過程中,除開孔時的數據外,巖層中鉆進的回轉扭矩在1 200~2 800 N·m;煤層中鉆進時基本在1 200 N·m,但2 號鉆孔的回轉扭矩存在較大波動。
(4)在穩壓鉆進模式下,推進速度會產生明顯變化,在巖層中推進速度基本在0.3~1.0 m/min,在煤層中該值則為1.2~2.0 m/min,差異明顯。
(5)在煤層中鉆進的破碎比功基本處于30~60 MPa;在巖層中多數大于90 MPa,具有較強的區分性,但在巖石中開孔時的數值和煤層段存在重疊,可能出現誤判。
采用Python 機器學習庫Scikit-Learn 中的支持向量機算法(SVM)進行鉆進參數的煤巖分類學習,相關步驟[18]如下。
(1)對樣本數據集進行分類標記和標簽的數字化處理,用不同的數字表示各種分類。
(2)數據集分割:將樣本數據集分割為訓練集和測試集,訓練集用于模型訓練和參數調整;測試集用于模型準確度評價。
(3)對數據集進行標準化或歸一化處理。
(4)選擇SVM 算法的核函數和對應的超參數。
(5)通過訓練集獲得最優超參數下的分類模型。
(6)利用測試集測試模型的分類準確度,觀察預測結果。
具體流程如圖10 所示。

圖10 支持向量機(SVM)模型訓練步驟Fig.10 Model training steps of SVM
根據鉆進參數與地層信息之間的響應過程,將3 個與煤巖分類結果具有較大相關性的鉆進參數作為模型訓練的特征參數。確定特征參數后將1-4 號鉆孔的數據按順序進行煤巖分類標記和標簽數字化,用數字“0”和“1”分別作為巖石和煤層分類的數據標簽,得到用于模型訓練的樣本數據集,見表3。

表3 樣本數據集Table 3 Sample data sets
根據模型訓練需要,再將數據集分割為訓練集和測試集,各數據集的樣本信息見表4,訓練集和測試集的數量比例約為3∶1。

表4 數據集分類信息Table 4 Classification information on data sets
模型參數搜尋主要是選擇SVM 算法的核函數和對應的超參數,常用的核函數有線性核函數,徑向基核函數(高斯核函數)和多項式核函數等,其中線性核函數主要用于線性可分的數據集,徑向基是SVM 默認的核函數,多項式核函數可以將低維的輸入空間映射到高維的特征空間。每種核函數都有其對應的調整參數,其中有兩個重要的參數,即懲罰系數C和影響系數γ;C為分類誤差的寬容度,數值越大則對誤差的容忍程序越??;γ定義了單個樣本對于整個超平面的影響大小,數值越大支持向量越少,越小則支持向量越多[20-21]。
模型參數的確定通過訓練集獲得,為了解訓練集各樣本點的分布規律,首先繪制了數據散點圖,用黑色圓點表示巖石樣本點,灰色圓點表示煤層樣本點,則分布規律如圖11 所示。該圖可以表示3 個維度的信息:x軸為樣本點的推進速度參數,y軸為回轉扭矩參數,圓點的面積由每個樣本點的鉆進參數計算的破碎比功參數確定,面積越大則代表該樣本點消耗的能量越高。

圖11 訓練集數據的散點分布Fig.11 Scatter plots of the training set data
從圖11 中可以看出,巖石和煤層樣本點之間具有明顯的分界線,說明特征參數和分類結果之間為線性可分的關系,因此,使用SVM 中的線性核函數即可滿足分類要求。
線性核函數可以調整的超參數只有懲罰系數C一個參數,采用網格搜索函數(GridSearchCV)在指定的參數范圍內按步長依次調整參數并進行比較,直到從所有的參數中找到在驗證集上精度最高的參數。設置搜索范圍0.1~10.0,步長50,最終獲得C的最佳參數為0.1。
對于小樣本數據,為了最大程度地驗證模型的精確度和泛化能力,在模型訓練時常采用交叉驗證法劃分訓練集和驗證集??紤]到訓練集分類數據的不平衡性,采用分層K折交叉驗證法,首先將訓練集樣本劃分成K個大小相等的樣本子集,并確保每一個子集中的樣本類別分布與整個數據集的類別分布一致;依次遍歷這K個子集,每次把當前子集作為驗證集,其余K-1 個子集作為新的訓練集,進行模型的訓練和評估;最后把K次評估指標的平均值作為最終的評估指標。
本次訓練進行了K=10 的交叉驗證實驗,具體分組結果如圖12 所示。

圖12 訓練集10 折交叉驗證分組結果Fig.12 Cross validation results of training set (K=10)
圖中橫坐標代表樣本號0~88,縱坐標代表10 次分組情況,用分組1~10 表示。其中,黑色部分為劃分的訓練集樣本號,綠色部分為驗證集樣本號。分組確定后,再用同一測試集對所有分組進行模型評估,得到最終的測試結果見表5。

表5 10 折交叉驗證模型精度Table 5 Model accuracy of cross validation model (K=10)
從表中可以看出,只有分組7 對應的模型驗證集精度為0.888 9,其他9 組模型的驗證集精度全部為1.0,驗證集的平均精度為0.988 9;測試集的平均精度為1.0。
分組7 雖在驗證集中出現了分類誤差,但在測試集中分類全部正確。通過數據定位,找到分組7 中驗證集分類錯誤的樣本點序號為60,該樣本為2 號鉆孔第31 m 時的鉆進數據,即該鉆孔穿出煤層再次進入巖層中的第一根鉆桿的鉆進參數,該數據的分類錯誤主要是由于煤巖界面處的樣本點數量太少導致的。
a.開發的基于鉆進參數的煤巖界面識別系統,初步解決了底抽巷穿層鉆孔煤巖界面識別缺少技術手段的問題。通過分析鉆進參數與煤巖地層之間的響應關系,找到了與地層變化相關性較大的3 個特征參數:回轉扭矩、推進速度和破碎比功。其中,破碎比功是綜合考慮鉆進參數影響的能量指標,在煤巖識別方面,較其他兩個特征參數具有更強的參考意義,但在鉆孔開孔段的適用性較差。
b.在煤巖分類方面,采用的支持向量機(SVM)分類算法在3 個特征值的二元分類中具有非常高的準確性,特別適合小樣本數據集的訓練,使用線性核函數的分類模型在測試集中取得了100%的準確度,該結果也驗證了特征參數和分類結果之間是線性可分的。
c.經現場試驗驗證,該煤巖界面識別系統可準確采集和記錄鉆機的鉆進參數,并通過特征參數分析獲得當前鉆進地層的煤巖分類結果,從而指導司鉆人員進行鉆孔層位判定,確保鉆孔達標,避免抽采空白帶的產生。
d.現有煤巖分類模型的學習結果僅對應用煤礦的識別效果最佳。當在新鉆場應用(地質條件改變)或改變鉆機轉速和鉆壓時,為保證識別的準確度,應增加2~3 個鉆孔的鉆進參數進行數據學習和模型更新。后續可開展半監督或無監督機器學習算法在煤巖分類識別中的應用,從而減少人的參與程度。