張逸倫, 喻志超, 胡天躍, 何川*
1 北京大學地球與空間科學學院, 北京 100871 2 國家超級計算深圳中心(深圳云計算中心), 深圳 518055
微地震壓裂監測是通過識別地下巖石破裂或錯斷引發的微小地震信號來監測水力壓裂施工過程中人工裂縫發育情況的地球物理技術(Maxwell and Urbancic,2001;Warpinski,2009;Bao and Eaton,2016).在微地震監測資料處理中,震相識別和初至拾取作為其中兩個關鍵步驟,是最終事件定位及壓裂裂縫縫網解釋的基礎(Maxwell et al.,2010).井中微地震監測通常采用布置于壓裂井周邊鄰井中的多級三分量檢波器接收微地震信號,信號具有震級小、頻率高、能量弱等特點,不易被準確地識別與記錄,因此有效且精確的低信噪比事件識別和初至拾取至關重要.
提取并分析微地震信號和噪聲的特征差異是震相識別和初至拾取的主要依據.傳統人工微地震震相識別和初至拾取的工作模式容易受拾取標準不一致及人為因素干擾而產生誤差,難以滿足實際處理中對計算效率的要求.自動識別及拾取方法中代表性的三類方法分別是:①單道特征法,②多道互相關法,③模板匹配法.單道特征法中,基于振幅差異的STA/LTA方法(Allen,1978;Sabbione and Velis,2010)在單道連續波形的滑動時窗內分別計算長短時窗能量比值,當比值超過設定閾值時所對應的時刻視為初至到時.該類方法計算效率高,但對低信噪比事件的敏感度較低,具有較高的漏拾/誤拾率.此外,基于其他單道特征差異的偏振分析法(Deflandre and Dubesset,1992)、高階統計量法(Saragiotis et al.,2004)、AR-AIC方法(Sleeman and Van Eck,1999)及結合上述多種算法的單道特征法(譚玉陽等,2016)相繼被提出(Akram and Eaton,2016).多道互相關法考慮同一事件相鄰道集間事件的波形相似特征,與單道方法相比,有效提高了低信噪比事件的拾取精度(De Meersman et al.,2009;Tan and He,2016).模板匹配法利用相鄰發震位置處不同事件間的波形相似特征拾取事件,以高信噪比事件波形作為模板可有效檢測和拾取低信噪比事件,但其應用效果強烈依賴于模板事件的選取,容易漏拾部分有效事件(Song et al.,2010;翟尚等,2020).上述方法均需通過分析信號與噪聲的特征差異,并通過建立的特征目標函數將原始波形記錄轉化到相應的“特征域”來拾取事件,因此拾取效果依賴于方法的特征函數等的選取,且不同方法應用于同一套實際資料的拾取效果存在偏差.針對事件間時差校正后仍存在對齊差異而產生拾取誤差的問題,喻志超等(2019)利用相鄰道間及事件間的波形相似特征對初至拾取結果進行了全局優化,克服了拾取標準一致性差的缺陷.
計算機運算能力的快速提高使得利用機器學習、深度學習等技術進行地震資料處理成為可能(Bergen et al.,2019),其優勢在于構建的模型本身具有自動特征提取能力,省去了人為提取信號特征的復雜過程.在地震波識別和拾取應用中,首先利用具有不同特征的波形記錄樣本構建模型,模型自適應地學習波形特征,建立輸入波形與識別/拾取結果間的對應關系;然后,待處理的原始波形記錄經簡單預處理后饋入模型,即可完成地震波識別和拾取處理工作.機器學習作為深度學習技術應用的基礎,可采用各種優化策略進行數據挖掘,如機器學習中的人工神經網絡方法、支持向量機法等均被應用于地震波拾取工作中(Maity et al.,2014;Qu et al.,2019;蔣一然和寧杰遠,2019).深度學習運用以深度神經網絡參數結構為基礎的模型,具備處理復雜問題的能力,其中卷積神經網絡方法(Convolutional Neural Networks)(Lecun et al.,1998)利用卷積操作從離散采樣數據中提取豐富特征,取得了較好的應用效果(Perol et al.,2018;Ross et al.,2018;Yuan et al.,2018;Dokht et al.,2019;Zhou et al.,2019;Duan and Zhang,2020),已成為近年來的研究熱點.
U-Net語義分割模型最早被應用于醫學圖像分割任務中(Ronneberger et al.,2015),它省去了卷積神經網絡中的全連接層,增加了高維到低維的多級特征融合,使得其既能準確識別目標體,同時可對目標體邊界準確定位.Zhu和Beroza(2019)、趙明等(2019)將U-Net模型應用至天然地震震相拾取領域,針對單道地震記錄進行了直達P波、S波的拾取,實現了“逐采樣點”的拾取效果;同樣地,與U-Net類似的SegNet模型被Wu等(2019)應用于壓裂監測微地震事件初至拾取中.上述方法均采用單道地震/微地震記錄進行模型構建與預測(統稱為ST-Net),但對于由井中多級檢波器構成的微地震觀測系統而言,ST-Net在模型構建階段存在無法利用相鄰道間波形相似性的缺陷,在實際應用中容易出現低信噪比事件漏拾、震相間誤拾和拾取結果偏差嚴重等問題.
本文基于卷積神經網絡中的U-Net模型,提出一種多道聯合微地震震相識別和初至拾取方法(記作MT-Net).與ST-Net不同,模型構建中將井中相鄰多道的微地震波形記錄同時饋入,使得相鄰道的波形信息對模型形成有效約束,一方面提高了對低信噪比事件的震相識別效果,同時構建的加權交叉熵損失函數增強了模型對有效震相初至誤差的敏感度,使得微地震震相識別和初至拾取工作僅利用單個深度學習模型即可完成,保證了識別和拾取處理結果的標準一致性.我們從方法原理、數據預處理、模型訓練與測試等方面闡述了本文方法的操作流程,作為對比,使用本文方法與單道方法(ST-Net)處理同一套微地震資料,驗證MT-Net在壓裂監測實時微地震資料處理中的應用效果.
基于卷積神經網絡的U-Net模型最早應用于生物醫學圖像分割任務中(Ronneberger et al.,2015),其主要優點是對圖像邊緣部分的檢測較為敏感.與圖像分割任務類似,直達P波、S波的識別和初至拾取可認為是一個多分類優化問題,波形記錄中的每個采樣點均屬于P波、S波和噪聲三類中的一類,我們希望對所有采樣點正確分類,并對噪聲與有效震相間的邊緣部分進行檢測與定位,進而準確拾取P波和S波初至.本文的MT-Net首先利用具有不同特征的多道微地震記錄樣本構建模型,然后將待處理的多道波形記錄饋入構建好的模型即可完成微地震震相識別和初至拾取工作.
MT-Net的網絡結構如圖1所示,模型輸入以連續微地震記錄中截取的多道分段波形為單元,三個分量(兩個水平分量和一個垂直分量)分別對應三個通道;輸出為與輸入相同尺寸的概率分布值,三個通道分別對應P波、S波和噪聲的概率分布曲線.設輸入和輸出均為N×M×K大小的三維數據,第一維是“道內”維度,N代表截取波形單道記錄內的采樣點數,理論上至少應保證截取波形段內可包含一個完整的雙震相事件;第二維是“道間”維度,M代表多道聯合數量,MT-Net將相鄰檢波器的波形記錄同時作為輸入,M取值與觀測系統中排布的檢波器數量保持一致;第三維是“通道”維度,K代表通道個數,三分量波形記錄對應的K取值為3.

圖1 MT-Net示意圖參數含義:采樣點數N×檢波道數M(標注于每層側方),通道數K(標注于每層上方).Fig.1 The sketch map of MT-NetParameters:number of sampling points×number of receivers (marked on the side of each layer),number of channels (marked on the top of each layer).
如圖1所示,MT-Net從輸入層到輸出層包含若干個下采樣階段和上采樣階段.下采樣階段為收縮路徑,主要作用是逐層提取數據特征,每個下采樣階段包含一個卷積層和一個池化層.卷積操作(Convolution)采用多個卷積核提取特征,得到的特征圖數量取決于卷積核的個數.MT-Net在第一和第二維度上進行卷積操作,可以同時提取道內和道間的波形信息,模型可以自適應地對道間初至信息進行約束.池化層對卷積層輸出的所有特征圖進行最大池化操作(Max-pooling),降低特征圖分辨率,減少模型參數量.上采樣階段為擴展路徑,每個上采樣階段包含一個轉置卷積層和一個融合層,轉置卷積操作(Deconvolution)的作用是特征恢復,特征圖放大倍數與對應的上采樣階段池化層保持一致.融合操作(Concatenate)將5個同級別的下采樣階段輸出特征圖與上采樣階段輸出特征圖進行融合,實現“端到端”的連接.上述卷積層和轉置卷積層均采用ReLU非線性激活函數(Glorot et al.,2011).經過上采樣階段后特征圖大小恢復至原始輸入尺寸(N×M×K).最后經Softmax層,使輸出轉換為0~1之間的概率分布,本文使用的具體函數形式為
(1)
式中,Z(i)表示Softmax層第i個采樣點的輸入值;label取值1、2、3,分別代表P波、S波和噪聲三個通道;Q即為P波、S波和噪聲的輸出概率分布.
與輸出概率分布Q一致,樣本標簽同樣為P波、S波和噪聲通道的概率分布.對于噪聲樣本(標簽為T,三個通道的概率分布分別記作TP、TS、TN),我們只需將其識別正確即可,因此設置TP、TS均為0,TN均為1;對于包含P波、S波的樣本(標簽為T',三個通道的概率分布分別記作T′P、T′S、T′N),我們需要同時完成識別和初至拾取,因此,標簽T′以手動拾取的震相初至作為參考標準進行設定.以一個典型的單道雙震相樣本標簽(圖2)為例,考慮到手動初至拾取結果(圖中紅色豎線:P波初至為實線,S波初至為虛線)也并非絕對準確,設置P波和S波標簽分別為以P波初至到達點(μP)、S波初至到達點(μS)為中心的高斯概率分布(圖中紅色實線和紅色虛線),對應標準差分別為σP、σS.T′P、T′S、T′N對應第i個采樣點處的計算公式如下:
(2)
在MT-Net模型訓練階段,我們需要設定損失函數來表示模型輸出的概率分布與樣本標簽間的差異,通過最小化損失函數得到最優化訓練模型.Zhu和Beroza(2019)使用了簡單的交叉熵損失函數,由于沒有考慮到非震相部分在一個分段波形內所占的比例顯著大于震相部分的數據特點(如圖2中0.6 s的雙震相事件內:P波、S波震相部分約占10%,噪聲部分約占90%),可能導致損失函數在震相部分的誤差敏感度較低.針對這一問題,我們構建了加權的交叉熵損失函數,依據震相和非震相部分在分段波形所占的比例,分別采用不同的加權因子,效果上增大了對震相部分誤差的懲罰.具體形式為

(3)
式中,pP(i)、pS(i)、pN(i)分別表示第i個采樣點處P波、S波和噪聲的真實概率分布,qP(i)、qS(i)、qN(i)分別表示第i個采樣點處P波、S波和噪聲的模型輸出概率分布,ω0、ω1分別表示震相部分(P波、S波)和非震相部分的加權因子,具體設置時可將震相與非震相部分分別占分段記錄比例的倒數作為ω0、ω1的參考取值.
測試階段根據模型輸出得到震相識別和初至拾取結果.首先,對于每個樣本輸出的P波和S波概率分布,分別記錄概率分布的最大值和其對應的位置.然后通過設定閾值識別震相,若P波和S波概率分布最大值均超過閾值,則認為該樣本是雙震相事件;若其中一個超過閾值,則認為是單震相事件;若均未超過閾值,則認為是噪聲.對于識別出的單震相和雙震相事件,其概率分布最大值所對應的位置即為模型預測的初至時刻(Zhu and Beroza,2019).
與MT-Net相比,ST-Net中分段記錄以單道波形為單元輸入模型(Wu et al.,2019),在輸入和輸出尺寸設置中,N、K取值與MT-Net一致,M取值為1;同時只在第一維度進行卷積操作,模型只能自動提取道內的波形特征,因此無法利用相鄰道間波形的相互約束提高整體識別和拾取準確率.
本文使用勝利油田樊154區塊一多段壓裂水平井的微地震監測記錄作為模型訓練及后繼測試對比的樣本集(Tan and He,2016),數據共包含11個壓裂段,連續監測時間約16小時.觀測系統為布設于壓裂水平井附近一口直井中的15級檢波器串,檢波器等間距排布,級間距為10 m,采樣率為2000SPS(sample per second).我們首先需要對原始地震記錄進行預處理,采用30~350 Hz的帶通濾波去除原始記錄低頻和高頻干擾信息.由于連續監測記錄無法直接輸入模型,需要以特定窗長將其分段截取.本文數據記錄中同一雙震相事件的P波和S波到時差均小于0.25 s,考慮到井中微地震監測數據資料的普遍特點,我們設定截取長度N為1200(0.6 s),同時相鄰的截取段重疊200個采樣點,防止因人為截斷而漏拾部分有效震相.對截取的分段記錄進行去均值處理,去除波形記錄中的直流成分,使振幅范圍分布于0附近;并按照標準差進行歸一化,在保留波形特征的前提下使振幅均衡化.
如圖1中MT-Net模型的各層參數設置,輸入/輸出層尺寸為1200×15×3,卷積/轉置卷積核尺寸設置為(10,2);前2個池化層壓縮尺度為(5,1),后3個池化層尺度壓縮為(2,1);原始輸入先經過5個下采樣階段,單道內的采樣點數N由1200減少至6,同時為了防止信息丟失,通道數K由3增加至128,后經5個上采樣階段逐漸恢復至原尺寸;在損失函數中,ω0、ω1分別設置為6.7、1.2.ST-Net的輸入(輸出)層尺寸為1200×1×3,卷積/轉置卷積核尺寸設置為(10,1),其余與MT-Net保持一致.
截取的分段記錄經前述預處理后即可作為輸入樣本,在本文實際資料中,樣本類型包括背景噪聲、噪聲事件、單震相事件和雙震相事件.如圖3所示為典型的多道三分量波形記錄(紅色、綠色和藍色線條分別為垂直分量Z和兩個水平分量h1、h2).背景噪聲(圖3a)的振幅變化范圍較小,可認為不包含任何有效信息;典型噪聲事件包括井筒波信號(圖3b)和儀器干擾信號(圖3c),井筒波信號沿著井筒傳播,Z分量上有明顯振幅異常,與有效震相類似同樣存在道間時差,但相鄰檢波道間的時差保持一致;儀器干擾信號也存在明顯振幅異常,其道間時差幾乎為0;有效微地震事件中包含標準的雙震相事件(圖3e)和單震相事件(圖3d),單震相事件產生的原因可能是受微地震事件震源機制及觀測系統的影響,事件記錄中某個震相的信噪比可能較低,影響其被有效識別.
在實時監測中,我們只希望準確快速地得到震相識別和初至拾取結果,因此將除單震相事件和雙震相事件之外的其他樣本都歸類為噪聲樣本.如圖2所示,受實際資料中P波、S波信噪比及主頻成分的影響,P波的手動拾取精度往往高于S波,因而在對含有效震相樣本制作標簽時本文設置TP、TS的標準差σP、σS分別為0.01 s(20個采樣點)、0.02 s(40個采樣點).
實際處理資料截取的分段記錄中絕大部分是噪聲樣本,單震相和多震相樣本只占很小的一部分.在模型訓練階段,若將連續記錄中的所有樣本作為輸入構建模型,會產生深度學習中典型的樣本不均衡問題,導致數量較少的含有效震相樣本的拾取效果變差(López et al.,2013).因此,本文在保證訓練樣本集可以完全覆蓋連續波形記錄中所有類別事件的前提下,選取部分噪聲樣本和其余所有含震相樣本作為訓練樣本集.最終訓練樣本集來源于水平井11個壓裂段微地震監測記錄中的前7個壓裂段,單震相、雙震相和噪聲樣本數分別為480、6540、12225,共計19245個樣本.

圖3 連續波形記錄中截取的不同類型樣本示例(a) 背景噪聲; (b) 噪聲事件(井筒波信號); (c) 噪聲事件(儀器干擾信號); (d) 單震相事件; (e) 雙震相事件.Fig.3 Samples of different types from continuous waveform records(a) Background noise; (b) Noise event (tube wave signal); (c) Noise event (tool interference signal); (d) Single-phase event; (e) Double-phase event.
以神經網絡庫Keras(http:∥keras.io)為基本庫函數,基于Tensorflow深度學習框架(http:∥www.tensorflow.org)搭建并訓練MT-Net模型.訓練階段采用小批量梯度下降法,以一個batch大小的分段波形記錄為單元進行損失函數計算和網絡參數更新,本文設置batch大小為32.采用Adam優化算法更新模型參數,同時使用動量和自適應學習率加快模型收斂速度(Kingma and Ba,2015).整個訓練樣本集經過多次迭代,當損失函數不再下降時訓練階段結束.模型訓練中,劃分訓練集中10%的樣本作為驗證集調整模型超參數,經調整優化的MT-Net模型即可作為最終的訓練模型用于模型測試.
測試樣本集為水平井11個壓裂段微地震監測記錄中的后4個壓裂段.微地震監測記錄經預處理后進行連續分段截取,共得到439605個分段記錄樣本.本節采用相同模型及參數設置的單道方法(ST-Net)作為對比,驗證基于U-Net的多道聯合方法(MT-Net)在震相識別和初至拾取中的應用效果.作為評價標準,我們對這4個壓裂段的監測記錄進行了人工精細事件識別與初至拾取,得到含單震相、雙震相事件的樣本數分別為120、1275,其余均為噪聲樣本.
在震相識別中,需要為P波、S波通道的輸出概率分布曲線設定閾值以判別震相類型.閾值選取的大小至關重要,閾值過高可能導致部分低信噪比震相被誤拾為噪聲;閾值過低則可能將部分噪聲事件誤拾為有效事件.本文設定P波和S波的概率分布閾值均為0.5.
如圖4所示,從測試集中選取了4個雙震相事件(圖4a、4c、4e、4g)說明MT-Net與ST-Net的識別與拾取結果.同一事件相鄰15級檢波器的三分量波形記錄從上到下依次排列,每道記錄中依次為h1、h2和Z三個分量;P波、S波輸出概率分布的最大值對應的位置分別以短實線和短虛線標注于各道記錄上.對于事件中的單道記錄(圖4b、4d、4f、4h),若概率分布最大值超過設定閾值則將其對應的位置認為是該震相的初至拾取時刻,并以豎線標注于圖中;若未超過設定閾值則不進行標注.手動拾取(manual pick)、ST-Net拾取(ST-Net pick)和MT-Net拾取(MT-Net pick)的初至分別以紅色、藍色和綠色豎線表示,概率分布閾值線以黑色雙劃線表示.
圖4a為選取的一個高信噪比事件(事件1),可以看出整體上ST-Net與MT-Net的拾取效果十分接近,與手動拾取結果之間均無顯著差異;圖4b為事件1中的第5道波形記錄及模型輸出概率分布,ST-Net和MT-Net的概率分布曲線形態也較為接近,在P波和S波初至附近均出現了明顯的概率分布高值,均顯著超過了閾值0.5,表明兩種方法對于高信噪比事件的拾取結果均較為理想.
圖4c為事件2的波形記錄,該事件中部分單道的S波能量較弱,導致ST-Net對第3、15道兩個震相的拾取結果均發生嚴重偏離,將第14道記錄(圖4d)誤拾為只包含P波的單震相事件,MT-Net可將事件中各道的兩個震相正確識別,整體上MT-Net的拾取效果明顯好于ST-Net.
事件3的波形記錄和其中第15道波形記錄如圖4e、4f所示,圖4f中由于該道內信號與噪聲的特征無顯著差異,ST-Net對其邊界部分不敏感,導致在整個概率分布內均未超過設定閾值,無明顯峰值出現;而MT-Net仍可以在大量背景干擾噪聲中正確識別出兩個震相.
圖4g所示事件的信噪比更低(事件4),且各單道內的P波、S波能量逐漸減弱.整體上MT-Net較ST-Net拾取的初至更接近于手動拾取結果.在靠后幾道(11-14道)中,ST-Net拾取的初至較手動拾取初至發生明顯偏離,而MT-Net的拾取誤差均小于0.01 s,仍在誤差允許范圍內.第12道波形記錄中(圖4h)受背景噪聲干擾,ST-Net將P波初至到達前的局部噪聲誤拾為P波,將P波初至誤拾為S波;而MT-Net有效避免了此類震相間誤拾情況的發生.
綜上,MT-Net拾取效果好于ST-Net的原因是由于MT-Net中的二維卷積操作可以利用空間信息的約束,使得具有較低信噪比道的拾取結果向相鄰的高信噪比道的拾取結果“靠攏”;而ST-Net為一維卷積操作,相鄰各道樣本間沒有任何約束,對背景噪聲干擾較為敏感.

圖4 雙震相事件識別與拾取結果示例(a) 事件1的波形記錄; (b) 事件1的第5道記錄; (c) 事件2的波形記錄; (d) 事件2的第14道記錄; (e) 事件3的波形記錄; (f) 事件3的第15道記錄; (g) 事件4的波形記錄; (h) 事件4的第12道記錄.藍色和綠色線條分別為ST-Net、MT-Net的輸出概率分布.Fig.4 Detection and arrival picking results of double-phase events(a) The waveform record of event 1; (b) The 5th trace record of event 1; (c) The waveform record of event 2; (d) The 14th trace record of event 2; (e) The waveform record of event 3; (f) The 15th trace record of event 3; (g) The waveform record of event 4; (h) The 12th trace record of event 4.The blue and green lines are the output probability distributions of ST-Net and MT-Net respectively.

圖5 噪聲事件識別結果示例(a) 井筒波信號樣本; (b) 儀器干擾信號樣本.圖注與圖4一致.Fig.5 Detection results of noise events(a) Sample of tube wave signal; (b) Sample of tool interference signal. The legend is consistent with that of Fig.4.
如圖5所示為兩個單道噪聲樣本的識別結果示例,圖5a中紅框位置處的Z分量振幅異常,h1、h2分量沒有明顯異常,是一個典型的沿井筒傳播的井筒波事件;圖5b中紅框位置處為儀器噪聲,三個分量均有幅值異常,但其頻譜成分明顯高于有效事件震相(圖4).雖然兩個噪聲事件均存在振幅異常,但紅框位置處對應的概率分布曲線均無峰值出現.結果表明無論ST-Net還是MT-Net,均自適應地提取到了干擾信號和有效信號間更加抽象的特征差異,有效避免了將噪聲事件誤拾為有效微地震事件的情況發生.
ST-Net和MT-Net對測試集中有效事件樣本(單震相和雙震相樣本)識別結果的統計情況如表1,對于某類樣本,我們定義識別正確率為正確識別的樣本數量占實際該類樣本總數的比例.由表可見,測試集中單震相樣本均被MT-Net正確識別,而ST-Net漏拾了3個樣本;兩種方法均漏拾了部分雙震相樣本,但MT-Net的漏拾個數明顯較少,識別正確率由ST-Net的89.88%提高至97.57%.在實時微地震監測中,我們主要利用雙震相樣本進行后續反演定位,可以看出MT-Net較ST-Net可以正確識別出更多的雙震相樣本,對這部分樣本進行初至拾取和事件定位,有助于得到更加完整的壓裂區域裂縫解釋縫網.

表1 測試集樣本的識別結果統計Table 1 Detection result statistics of test set samples
U-Net模型的輸出概率分布曲線可直接用于有效事件的初至拾取,我們以手動拾取初至為參考標準,統計對比了兩種方法對雙震相樣本的拾取誤差(如圖6所示,圖中ST-Net、MT-Net分別用藍線、綠線表示),P波、S波和P-S波到時差的誤差高斯統計分別如圖6a、6b和6c所示,圖中橫軸表示誤差值,縱軸表示對應誤差值概率分布的相對大小,表2為具體的拾取誤差定量統計.分析可見,ST-Net初至拾取結果的誤差分布均值(ME)與零點有較為明顯的偏差,而MT-Net的誤差分布均值更加接近零點,且其誤差分布的標準差(SD)明顯小于ST-Net,整體上具有更高的拾取精度.
在實際資料處理中,P-S波到時差是否準確對后續事件定位結果影響巨大.由圖4b、4h中ST-Net與MT-Net的輸出概率分布曲線可見,與ST-Net相比,MT-Net的輸出概率分布曲線峰值處相對平緩,這主要是受公式(2)中標簽概率分布函數設定的影響.但由表2的統計分析可見,對于MT-Net,P-S波到時差的誤差標準差不但比ST-Net的結果降低近一個數量級,而且顯著小于MT-Net對P波、S波的誤差標準差.這說明MT-Net較為平緩的輸出概率分布并沒有降低初至拾取的準確性,反而由于多道聯合的空間約束提高了某些低信噪比道的拾取效果,使得出現拾取結果與手動拾取嚴重偏離的概率大大降低.對于P-S波到時差結果,多道聯合的MT-Net拾取誤差的標準差只有0.004 s,已經可以滿足實時微地震監測數據處理需求,利用其拾取結果可以得到更加準確一致的事件定位結果.

表2 拾取誤差結果定量統計(均值:ME,標準差:SD)Table 2 Quantitative statistics of arrival picking errors(Mean:ME,Standard deviation:SD)
如圖7所示,我們從另一個角度觀察分析雙震相樣本的初至拾取誤差分布,圖示橫縱坐標分別為

圖6 MT-Net與ST-Net的拾取誤差高斯分布(a) P波; (b) S波; (c) P-S波到時差.Fig.6 Gaussian distribution of picking errors of MT-Net and ST-Net(a) P-phases; (b) S-phases; (c) Time differences between P-phases and S-phases.

圖7 雙震相樣本的拾取誤差分布(a) P波; (b) S波; (c) P-S波到時差.綠色圓圈:ST-Net拾取誤差絕對值大于MT-Net的樣本;藍色圓圈:MT-Net拾取誤差絕對值大于ST-Net的樣本.Fig.7 Arrival picking error distribution of double-phase samples(a) P-phases; (b) S-phases; (c) Time differences between P-phases and S-phases.Green circle:the absolute error of ST-Net is greater than that of MT-Net; Blue circle: the absolute error of MT-Net is greater than that of ST-Net.
ST-Net、MT-Net的初至拾取結果與樣本手動拾取結果之間的差值,所有樣本均以實心圓圈表示,藍色圓圈為ST-Net拾取誤差絕對值小于MT-Net的樣本,綠色圓圈為ST-Net大于MT-Net的樣本,圓圈的相對大小與其對應微地震事件的信噪比成正比,信噪比SNR的計算公式為
(4)
Anoise和Asignal+noise分別表示初至到達前、后波形記錄的均方根振幅,由于S波初至可能會受P波初至影響,我們利用P波初至(以手動拾取結果為準)前、后的波形記錄計算得到信噪比SNR.
根據實際處理經驗,我們認為拾取誤差在0.02 s內均在可接受的范圍內,在圖中以黑色實線圍成的正方形區域表示.在圖7a、7b、7c中,綠色圓圈的數量及分散程度遠遠大于藍色圓圈,說明總體上MT-Net較ST-Net的拾取誤差絕對值更小,且整體上信噪比較低(圓圈較小)的樣本對應的誤差絕對值更大.由圖可見,藍色圓圈基本都落在了正方形區域內,而綠色圓圈中有相當大一部分落于區域之外,說明MT-Net拾取誤差較大的樣本顯著少于ST-Net.綜上,圖6、圖7從兩個方面同時驗證了MT-Net可以有效避免較大拾取誤差出現的概率.
對于測試集中的有效事件樣本,我們認為拾取誤差約在一個震相范圍內即為拾取準確,分別設置P波、S波的拾取誤差小于0.01 s(20個采樣點)、0.02 s(40個采樣點)即為拾取準確,準確拾取的樣本數量統計情況如圖8所示,紅色柱形為測試集中某一信噪比范圍內所有的樣本數量.由圖可見,在不同信噪比范圍內,MT-Net(綠色柱形)相較ST-Net(藍色柱形)準確拾取的樣本數量均有增加:SNR分布于-5~0范圍內樣本的P波拾取準確率從77.45%提高至93.75%,S波拾取準確率從81.79%提高至94.57%;SNR分布于0~5范圍內樣本的P波拾取準確率從72.75%提高至92.42%,S波拾取準確率從75.28%提高至93.54%.驗證了與ST-Net相比,MT-Net對低信噪比事件拾取準確率的提高效果最為顯著.

圖8 兩種方法準確拾取的樣本數量統計(a) P波; (b) S波.Fig.8 Quantity statistics of samples accurately picked by the two methods(a) P-phases; (b) S-phases.
水力壓裂實時微地震監測需要對微地震事件進行快速識別、拾取和定位工作,一個高效、準確且無需人工經驗干預的自動化處理程序是我們的最終目標.本文提出的多道聯合方法MT-Net只需利用具有不同特征的波形記錄樣本搭建深度學習框架,模型在完成訓練和驗證之后即可自動建立輸入微地震波形與識別/拾取結果間的對應關系,并對連續記錄進行實時處理.實際數據測試結果表明MT-Net的識別和拾取結果已經與應用效果較好的多道互相關方法(Tan and He,2016)十分接近,說明了基于U-Net的多道聯合方法可滿足實際微地震處理中對識別與拾取精度的要求.
本文在使用MT-Net方法掃描連續記錄的過程中,將P波和S波輸出概率分布的判定閾值設置為0.5,沒有出現將噪聲樣本誤拾為有效事件的情況.進一步降低閾值可能識別出更多的低信噪比事件,但同時也可能出現將噪聲樣本誤判為有效事件的現象.在實際處理中,可根據具體的監測處理需求調整閾值大小,在漏拾和誤拾情況間達到平衡.
在實時監測任務中,模型的訓練樣本質量直接決定了深度學習模型最終的應用效果.因此,一個人工樣本質量控制與深度學習模型協同作用的現場工作流程是必不可少的.如圖9所示,在初始壓裂階段,首先利用自動微地震識別與拾取方法(如多道互相關法)快速得到疑似微地震事件,并人為對疑似微地震事件分類和排查,對有效事件進行初至拾取,并將結果作為樣本標簽完成MT-Net模型的構建與訓練;將這一初始模型應用于第二個壓裂段,對該段內的連續記錄進行掃描,在得到該段內微地震事件和初至拾取結果的同時,對其質量進行人工判別,將識別和拾取效果較差的事件剔除,將剩余樣本補充進訓練樣本集中,參與對MT-Net模型的重構與訓練;在后續壓裂施工中不斷重復上述過程直到壓裂施工結束.隨著壓裂施工的進展,MT-Net模型的樣本集在不斷擴大,模型的識別/拾取能力也相應地在不斷提高.

圖9 基于MT-Net的實時微地震震相識別和初至拾取流程Fig.9 The real-time microseismic phase detection and arrival picking process based on MT-Net
本文基于深度學習中的U-Net模型提出了一種井中多道聯合微地震震相識別和初至拾取方法(MT-Net).方法根據井中微地震觀測系統中多級檢波器依次排列的多道數據源特點,通過U-Net中的二維卷積操作同時約束道內和道間的波形信息,提高了震相識別的有效性和初至拾取的準確性.以此為基礎,結合水平井多段壓裂的施工特點,本文提出了滿足現場壓裂微地震監測實時性與準確性要求的工作流程,通過人工樣本質量控制與深度學習模型協同作用,逐段擴充樣本集,達到不斷修正和優化MT-Net模型的目的.基于數據驅動的深度學習技術在微地震震相識別和初至拾取工作中取得了初步的應用效果,但這并非意味著這一技術在目前階段可以完全取代基于信號特征差異的常規處理方法;相反,一個模型驅動與數據驅動相結合的壓裂微地震監測數據處理流程將展現出更大的應用潛力.
致謝感謝評審專家提出的寶貴意見,感謝中石化石油工程地球物理勝利分公司提供的現場微地震監測數據.