高 潔 , 伊 雨 , 趙雯宇 , 王元軍 , 王 亮
(1.山東科技大學 電子信息工程學院, 山東 青島 266590;2.中天合創能源有限責任公司, 內蒙古 鄂爾多斯 010300;3.山東科技大學 機械電子工程學院, 山東 青島 266590)
煤礦事故的發生會造成大量的人員傷亡和巨大的經濟損失,煤層異常構造的存在會增加煤礦事故發生的概率[1],因此含煤地層異常構造識別研究對提高煤礦開采的安全性十分重要。槽波地震勘探作為一種極具發展前景的地球物理勘探方法,不僅能夠有效探測陷落柱、小斷層等,同時對采空區及廢棄巷道等探測效果也較顯著[2]。該技術具有探測精度高、距離大、波形特征易于識別、抗干擾能力強等優勢[3],尤其在探測精度和距離方面優于其他煤礦井下物探方法[4],近年來被廣泛應用[5-7]。
槽波地震數據的處理與解釋是槽波地震勘探的重要一環,目前常用的方法有層析成像、偏移成像等成像法[8-11],通過成像能直觀地確定構造的種類和位置,但數據處理與成像過程繁雜,耗時耗力,并且成像結果多依靠人工經驗解釋,易出現偏差,此外,共中心點疊加法、速度分析法也常用于處理槽波數據[12-14],但多與成像技術結合,同樣易出現偏差。近些年,機器學習也被應用到地震勘探領域[15],通過地震數據識別異常地質構造,但多以識別斷層為主[16-19],在其他構造識別方面研究較少。
極限學習機(ELM)是由HUANG 等[20]于2004年提出的一種單隱含層前饋神經網絡,與傳統訓練算法相比,ELM 具有設置參數少、學習速度快、訓練誤差小以及泛化性能好等優勢[21-23],但由于ELM 的輸入權值與隱含層偏置是隨機產生的,導致分類性能不穩定[24-26];鵜鶘優化算法(POA)是2022 年由Pavel Trojovsky 和Mohammad Dehghani 提出的,是一種模擬鵜鶘群體狩獵的智能優化算法,其在逼近最優解方面具有較強的挖掘能力,并且不易陷入局部最優[27],能夠為極限學習機尋到最優的輸入權值與隱含層偏置,經過優化后的極限學習機更加適合處理數量龐大、包含信息復雜的槽波數據,可以更好地完成煤層構造的識別分類任務。因此,筆者提出基于POA-ELM 的含煤地層構造識別分類方法,對小斷層、沖刷帶和陷落柱進行識別分類研究,并對分類結果進行評價與分析。
與傳統的前饋神經網絡不同,ELM 未采用基于梯度的算法,而是隨機選擇輸入權值和隱含層偏置[28-29],并根據最小二乘準則,依據Moore-Penrose 廣義逆矩陣理論求出輸出權值[30]。xin]T∈Rn,ti=[ti1,ti2,···,tim]T∈Rm,n為輸入層節點數,
假設有N個任意樣本(xi,ti),其中xi=[xi1,xi2,···,m為輸出層節點數,中間有L個隱含層,第k個隱含層節點的輸出為hk(xi),可表示為
式中,wk=[ωk1,ωk2,···,ωkn]T為輸入節點與第k個隱含層節點的輸入權值向量;bk為第k個隱含層節點的閾值;wk·xi為wk和xi的內積;g(wk,bk,xi)為激活函數。
ELM 原理如圖1 所示。ELM 的學習目標可轉化為使輸出誤差最小,即存在βk、wk和bk,使得

圖1 極限學習機原理Fig.1 Principle diagram of extreme learning machine
式中,βk=[βk1,βk2,···,βkm]T為第k個隱含層節點與輸出層節點的輸出權重向量;yi為第 個樣本對應的模型輸出。
式(2)用矩陣表示為
其中,H為隱含層節點的輸出矩陣;β為隱含層與輸出層連接權重矩陣;Y為期望輸出矩陣。式(3)展開形式為
通常將期望輸出矩陣Y與樣本標簽T求殘差最小平方和作為評價目標函數,使該目標函數最小的解就是最優解,目標函數可表示為
通過線性代數和矩陣理論的知識推導得出式(6)的最優解為
式中,H?為矩陣H的Moore-Penrose 廣義逆矩陣。
鵜鶘優化算法模擬了鵜鶘在狩獵過程中的自然行為,每個種群成員代表一個候選解。鵜鶘種群初始化數學描述為
式中,qu,v為第u個鵜鶘的第v維位置;M為鵜鶘的種群數量;r為求解問題的維度,即待優化變量的個數;rand為 [0,1] 內的隨機數,dv和lv分別為求解問題的第v維的上、下邊界。
鵜鶘種群可用種群矩陣表示,即
其中,Q為鵜鶘的種群矩陣;Qu為第u個鵜鶘的位置。鵜鶘的目標函數值可用目標函數向量表示為
其中,F為鵜鶘種群的目標函數向量;Fu為第u個鵜鶘的目標函數值。
鵜鶘的狩獵過程主要為逼近獵物和水面飛行,在POA 算法中,則主要分為勘探階段和開發階段。
(1)勘探階段。
式中,Q為第u個鵜鶘的新位置;F為基于第1 階段更新后的第u個鵜鶘的新位置的目標函數值。
(2)開發階段。
筆者利用COMSOL Multiphysics5.5 仿真軟件,分別建立小斷層、沖刷帶和陷落柱的三維含煤地層異常構造仿真模型,模型尺寸為100 m×10 m×10 m,上下圍巖厚度均為4 m,煤層厚度為2 m,采用主頻為200 Hz的雷克子波作為地震子波。在煤層中激發后,檢波器會接收到攜帶各構造信息的槽波信號。三維等效介質模型參數見表1,模型結構如圖2 所示,為了更好的模擬實際煤層,避免模型表面邊界發生反射現象影響仿真結果的準確性,在3 種構造模型中均設置了低反射邊界。

表1 3 種仿真模型物性參數Table 1 Physical parameters of three simulation models

圖2 3 種構造仿真模型Fig.2 Simulation model of three structures
筆者采用槽波地震勘探中的透射波法[31],分別采集小斷層、沖刷帶、陷落柱的槽波信號。將震源激發點置于模型x=0 的中央處,在模型x=100 m 處共設置606 個檢波器,檢波器在模型中的位置如圖3 所示,所有檢波器在x=100 m 處的排列如圖4 所示,圖4 中每條紅色線由101 個檢波點排列形成,紅色線間距均為3 m,6 條紅色線共排列606 個檢波點,檢波點間距為0.1 m,坐標見表2,Range(2,3,10)表示在y方向檢波器位于從2~10 m 以3 m 為步長取點處。

表2 檢波器位置坐標Table 2 Position coordinates of the detector

圖3 檢波器位置示意Fig.3 Schematic diagram of the position of geophones

圖4 檢波器布置示意(x=100 m)Fig.4 Schematic diagram of geophones(x=100 m)
每種構造模型采集到606 個槽波數據樣本,3 種構造模型共得到1 818 個樣本,每個樣本為時長0.2 s的時序數據,包含501 個采樣點,得到1 818×501 的樣本數據,如圖5 所示,3 種模型的槽波信號能量都集中于0.05~0.10 s,但每類信號的輪廓與幅值具有明顯差異,這為實現3 種構造模型的分類提供了可能。

圖5 槽波樣本數據Fig.5 In-seam wave sample data
在利用極限學習機處理分類問題時,數據的預處理效果直接關系到模型的分類效果。采集到槽波數據后,首先對其進行z-score 標準化,消除由不同量綱與數值量級所引起的數據偏差,使得數據具有可比性。最后采用主成分分析法(PCA)對標準化后的數據進行降維,消除冗余數據,提高分類模型的訓練速度,同時也盡可能保留各數據的原始特征,保證分類結果的準確率。PCA 降維時,若第p個特征貢獻率接近于1,則選取前p個主成分代替原來的槽波數據。特征累計貢獻率情況如圖6 所示,第30 個特征貢獻率達0.998 5,因此選取前30 個特征,最終將501 個數據特征降為30 個數據特征,得到1 818×30 的樣本數據。

圖6 特征累計貢獻率Fig.6 Cumulative contribution rate of characteristics
筆者對極限學習機分類模型的激活函數、隱含層節點數進行研究。如圖7 所示,通過比較分類準確率,選擇最佳激活函數和隱含層節點數,實驗結果表明:隨著隱含層節點數的增多分類準確率總體趨勢也增高,能夠明顯看出,當激活函數為Sigmoid 函數或Hardlim 函數時,分類準確率遠高于Tribas 函數和Radbas 函數。當隱含層節點數設為20、激活函數設為Sigmoid 函數時,ELM 分類準確率達到了最大值95.24%,隱含層節點數大于20 時分類準確率趨于平穩。根據以上分析,筆者將Sigmoid 函數作為極限學習機分類模型的激活函數,隱含層節點數設置為20。

圖7 隱含層節點與激活函數的選擇Fig.7 Selection of hidden layer nodes and activation function
基于前文的ELM 分類模型,利用鵜鶘優化算法對極限學習機進行優化,在有限的迭代次數里,找到使得ELM 分類效果最佳的輸入權值和隱含層偏置,從而彌補ELM 因隨機生成輸入權值和隱含層偏置導致分類效果不穩定的缺點,提高分類模型性能,優化過程如圖8 所示。將極限學習機的分類準確率作為鵜鶘優化算法的適應度函數,進行數次迭代,比較適應度值,不斷更新鵜鶘位置,并保存目前最優輸入權值與隱含層偏置。筆者將鵜鶘種群數量設置為30,最大迭代次數設置為100,迭代過程如圖9 所示,當迭代次數為37 時,POA 為ELM 尋到全局最優解,收斂速度較快。

圖8 鵜鶘算法優化極限學習機Fig.8 Flowchart of pelican optimization algorithm optimizing extreme learning machine

圖9 POA 尋優迭代過程Fig.9 POA optimization iterative process
實驗中隨機選取70%的樣本數據作為訓練集,剩余30%個樣本數據作為測試集,將小斷層標簽設為1,沖刷帶標簽設為2,陷落柱標簽設為3。ELM 測試集的分類結果如圖10 所示,分類準確率為95.238 1%,共有26 個樣本被分類錯誤。POA-ELM 測試集的分類結果如圖11 所示,分類準確率達99.450 5%,共有3 個樣本被分類錯誤,從準確率和錯誤分類樣的本分布情況來看,POA-ELM 分類效果優于傳統ELM。

圖10 ELM 分類結果Fig.10 Classification result of ELM

圖11 POA-ELM 分類結果Fig.11 Classification result of POA-ELM
前文通過準確率對整體分類效果進行了分析,下面通過精確率(P)、召回率(R)2 個評價指標,對ELM和POA-ELM 的分類結果進行評價和對比,P和R均是針對每類模型的分類結果進行評價。將ELM 和POA-ELM 分類結果的P和R整合為如圖12 所示,ELM 各模型的P和R指標均大于93%;POA-ELM各模型的P和R指標均在99%以上,POA-ELM 分類效果明顯優于傳統ELM,分類效果較為理想。

圖12 分類結果評價指標Fig.12 Evaluation index of classification results
為消除數據集分布帶來的分類性能波動,筆者采用十折交叉驗證評估分類模型的性能,將1 818×30 的樣本數據集和1 818×1 的標簽數據集打亂順序并均勻分為10 份,依次選取其中1 份作為測試集,其余9 份作為訓練集,每份數據均作為測試集后,完成1 次十折交叉驗證,取均值作為1 次十折交叉驗證的結果。將以上過程重復10 次,結果如圖13 所示,經驗證傳統ELM 分類準確率波動較大,而POA-ELM 基本保持平穩狀態,且分類準確率均保持在99%左右,說明本文構建的POA-ELM 分類模型對于含煤地層異常構造識別分類具有穩定且良好的分類性能。

圖13 十折交叉驗證結果Fig.13 Result of ten-fold cross validation
為說明本文構建的POA-ELM 模型對實際構造的分類性能,將長城五號礦1901N 工作面的槽波地震勘探數據引入測試集進行分類。1901N 工作面中槽波觀測系統如圖14 所示,在1901N 運輸巷布置53 個炮點,1901N 回風巷布置61 個接收點,采用透射法勘探,得到2 個異常區YC1 和YC2(圖14 洋紅色線圈定的范圍),經分析YC1、YC2 異常區均為貫穿工作面的斷層影響區。選取P1-34~P1-36三炮槽波數據用于實際斷層的識別,共183 組槽波數據樣本,為保證POA-ELM 模型對實際斷層的識別效果,與仿真槽波數據中斷層測試集樣本量一致,將P1-36炮中包含斷層信息較少的第61 組槽波數據剔除,剩余182 組作為識別實際斷層的測試集樣本,如圖15 所示。為保證分類速度與準確率,首先對三炮斷層槽波進行4 層小波去噪,去噪前后的槽波如圖16 所示,去噪之后波形噪聲有所減少,進而對其進行z-score 標準化和PCA降維,得到182×30 的斷層測試集數據。182 組斷層槽波數據經過數據預處理后,將代替原本的仿真斷層測試集數據進行識別分類。

圖14 槽波觀測系統示意Fig.14 In-seam wave observation system diagram

圖15 P1-34 至P1-36 炮槽波時間-振幅Fig.15 Time-amplitude diagram of P1-34 to P1-36 shot in-seam wave

圖16 原始槽波數據與去噪槽波數據對比Fig.16 Comparison of original in-seam wave data and denoised in-seam wave data
分類結果如圖17 所示,整體分類準確率為97.435 9%,與圖11 仿真分類結果相比,準確率有所下降,小斷層被錯誤分類的數據有所增多。結合圖18混淆矩陣分析,有4 組斷層數據被錯誤分類為沖刷帶,8 組被錯誤分類為陷落柱,小斷層召回率為93.4%,相對于圖12 召回率下降6.1%,準確率和小斷層召回率下降的主要原因是相對于仿真槽波數據,實際槽波會含有部分殘留噪聲,且與訓練集的仿真數據特征存在差別。總體來看,準確率、召回率及精確率均高于93%,分類結果較為理想,說明本文構建的POA-ELM 模型能夠有效分類實際槽波數據,實現地質構造的分類識別。

圖17 POA-ELM 實際數據分類結果Fig.17 POA-ELM classification result of real data

圖18 實際數據分類混淆矩陣與評價指標Fig.18 Confusion matrix and evaluation index of real data
基于相同的樣本數據,分別采用支持向量機(SVM)和BP 神經網絡2 種方法對含煤地層異常構造進行識別分類,分類結果如圖19 所示,對于仿真數據4 種方法的分類準確率都達到了90%以上,其中POA-ELM 和SVM 的準確率都達到了97%以上;對于含斷層的槽波數據POA-ELM 的分類準確率達97.44%,高于其他3 種方法。綜合分析,無論是仿真槽波數據還是含實際斷層槽波數據,筆者提出的POA-ELM 分類模型都更具優勢。

圖19 分類結果對比Fig.19 Comparison of classification results
(1)提出了一種鵜鶘優化算法優化的極限學習機分類模型POA-ELM,利用鵜鶘優化算法對極限學習機的輸入權值和隱含層偏置進行尋優,提高了極限學習機分類模型的分類準確率和穩定性。
(2)將POA-ELM 分類模型應用到含煤地層異常構造識別分類中,通過建立含煤地層仿真模型,對斷層、沖刷帶和陷落柱模型進行了識別分類,取得了良好的分類效果,分類準確率達99%以上,分類性能更穩定,效果遠優于原始ELM,證明了POA 對ELM 的良好優化效果和POA-ELM 在含煤地層異常構造識別分類中應用的可行性。
(3) POA-ELM 模型對于實際斷層的識別準確率達97%以上,識別效果較為理想。與ELM、SVM、BP 的分類結果進行對比,無論是仿真槽波數據還是含實際斷層槽波數據,POA-ELM 的分類識別準確率都最高,更具優勢。
由于實際槽波數據資源有限,本文只對實際斷層進行了識別,今后將對沖刷帶、陷落柱等其他含煤地層異常構造進行識別,并進一步應用于槽波地震勘探。