王博愛,楊瑞召,李德偉,張都,郭嘉梁
(中國礦業大學(北京)地球科學與測繪工程學院,北京 100083)
微地震地面監測中,有效信號能量弱,往往被淹沒在噪聲中,直接影響了微地震事件的識別和震源定位的效果。微地震信號在時間采樣方向具有局部脈沖的特點,可以據此進行手動識別微地震信號。壓裂監測需要快速得到壓裂結果,以此對開采方案進行及時調整,因此,需要對微地震監測資料進行實時處理、解釋。微地震監測數據量大,手動識別有效信號速度慢,難以滿足實時監測的需求,因此,尋找合適的自動識別方法是微地震地面實時監測資料處理與解釋的關鍵。
目前微地震有效信號常用的自動識別方法有短長時窗法(STA/LTA)、基于局部相似屬性識別法[1]、Akaike 信息準則法(AIC)[2]、分形分維法、神經網絡法[3]等。其中:短長時窗法和基于局部屬性識別法只利用了微地震數據的振幅屬性,難以識別低信噪比信號,且需要根據實際需要確定長短時窗長度和閾值[4];分形分維法難以識別低信噪比信號,且在識別過程中必須插值和選取時窗,識別結果嚴重依賴插值準確性和時窗大小[5];自回歸(AR)理論假設有效信號和噪聲有不同的AR模型,Akaike信息準則認為在有效信號到達時AIC值最小,該方法無法識別低信噪比信號[6];神經網絡法通過提取的特征集來訓練人工神經網絡模型,并對其進行參數調優,得到最優準確率后保存模型,以此對新數據進行分類預測。
采用單一特征量進行有效信號自動識別,抗噪聲能力弱,魯棒性差,因此,綜合地震數據的多種特征量來進行自動識別成為新的發展方向[7]。本文采用神經網絡法中的循環神經網絡模型(RNN),通過綜合地震信號的能量特征、頻譜特征、統計特征等特征量來對模型進行訓練,提高了信號自動識別速度和準確率,進而滿足了微地震地面實時監測資料處理與解釋的需要。
RNN源自1982年Saratha Sathasivam提出的霍普菲爾德網絡,因實現困難,在提出時并沒有被廣泛應用。直到更加有效的循環神經網絡結構(例如深度循環神經網絡[8-9])被提出后,循環神經網絡挖掘數據中的時序信息及語義信息的深度表達能力才被充分地利用。在地球物理領域,鄭晶等[10]利用神經網絡進行了微震波拾取的研究。
RNN基本結構如圖1。主體分為:輸入層;隱藏層,此層模型進行學習并優化參數;輸出層,包括分類器和標簽層,分類器也叫Softmax層,此層將隱藏層中的輸出進行分類估計,并選擇概率最大的作為標簽。

圖1 RNN結構示意
RNN的特點是1個序列當前的輸出與之前的輸出有關,即網絡會對前面的信息進行記憶并應用于當前的輸出計算中。隱藏層之間有連接且其輸入不僅包含輸入層的輸出,還有上一時刻隱藏層的輸出[11]。
圖2為隱藏層示意圖。圖2中:X為輸入樣本,h為隱藏狀態,O為輸出,W為輸入的權重,U為輸入樣本的權重,V為輸出的權重,上標0,1,2代表時間序列。在時刻1時,初始化h0,隨機初始化W,U,V,此時隱藏狀態h1和輸出值O1分別為

圖2 隱藏層結構示意

式中:f為激活函數(即一個非線性變換,常用的激活函數有sigmoid函數、tanh函數、ReLU函數)。
RNN另外一個重要的步驟是反向傳播,即將預測值與真實值進行對比,計算損失函數對每個參數的梯度,然后根據梯度和學習率使用梯度下降算法更新每個參數。隱藏層每次的輸出值O都會產生1個誤差值,這個誤差值用損失函數E表示。常用的損失函數有交叉熵損失函數(cross_entropy)、均方差損失函數[12],為了防止過擬合問題,還會加入L1,L2正則化,即在損失函數中加入刻畫模型復雜程度的指標[13]。

式中:λ,θ為各自權重系數。
隱藏層各參數的梯度計算式為

長短時記憶網絡(LSTM)是循環神經網絡的一種改進結構,LSTM通過一些門結構讓信息有選擇性地影響循環神經網絡中每個時刻的狀態[14]。
研究分為3個部分:數據準備、特征提取、RNN模型訓練。
各種處理方法或多或少都會造成微地震記錄振幅或者相位的變化,影響識別效果。Douglas[15]在研究中提到濾波過程越少,實現效果越好,因此,本次研究使用的資料是水力壓裂現場的原始地震記錄。地震噪聲主要從現場背景噪聲和人為步行信號、爆炸信號中提取。檢波器為三分量數字檢波器,采樣頻率為500 Hz。在地震記錄上,微震事件表現為清晰的脈沖(見圖3)。

圖3 微地震數據Z分量波形示意
地震波中P波傳播速度最快,其初至易于識別[16],所以研究的資料采用的是三分量檢波器中的Z分量信號。在原始的記錄數據中,微地震有效信號占的比例很小,導致正樣本和負樣本比例不均勻,使得神經網絡無法有效收斂學習[17]。本文采用分組處理的方法來解決樣本均衡問題,即截取一定數量的采樣點為1個數據集,包含微震事件的標記為正樣本,人工標記為1,不包含的為負樣本,人工標記為 0(見圖 4)[18]。 在經過后續測試后,確定100個采樣點為1個樣本。準備的訓練樣本一共有2 410個,其中含微震事件的樣本905個,不含微震事件的樣本1 505個。

圖4 微地震數據Z分量分割及標注
信號的特征主要從微地震信號與噪聲的能量差異、信號與噪聲自身各階統計量的差異入手選取。
1)STA/LTA最大值和最小值。地震信號進行遞歸STA/LTA計算,對應的數據曲線見圖5。圖5b中,紅線值為1.5,觸發代表事件開始;藍線值為0.8,觸發為事件結束。在樣本中(100個采樣點)提取STA/LTA值時,長、短時窗分別設為20,10個采樣點,分別選取樣本段內STA/LTA最大值和最小值作為特征輸入。

圖5 微地震數據Z分量波形及其STA/LTA波形
2)頻域最大幅值。分別對時域地震記錄中微震信號和噪聲所在位置進行傅里葉變換,2個窗口都為1 000個采樣點,頻域如圖6所示。由圖6可看出,微震信號最大幅值遠遠高于噪聲,因此,對樣本進行傅里葉變換并提取最大幅值作為特征輸入[19]。

圖6 微地震信號和噪聲傅里葉變換
3)時域振幅最大值。將樣本中地震記錄的振幅最大值作為特征輸入。各階統計量(包括均值、標準差、25%四分位數、75%四分位數、偏度、峰度等)反映了樣本在時域中的形態學特征。
4)梅爾頻率倒譜系數(MFCC)。MFCC是一種在語音識別中廣泛應用的特征,即對信號分幀、加窗后進行傅里葉分析得到各窗對應的頻譜,將頻譜通過梅爾濾波器運算,得到梅爾頻譜。將梅爾頻譜進行倒譜分析,即得到了梅爾頻率倒譜系數,MFCC代表著這段信號的動態特征[20-22]。
本次實驗使用Windows系統,基于Spyder和Python開發環境,算法框架使用Google研發的人工智能學習系統 Tensorflow[23]。
神經網絡的訓練過程是不可見的,為了使神經網絡的結構及參數調整反饋更加清晰,TensorFlow提供了1個可視化工具TensorBoard。TensorBoard可以有效地展示TensorFlow在運行過程中的數據信息。
本文設置的初始參數見表1。在對微地震有效信號進行模型訓練的過程中,迭代次數為2 000次之內,模型準確率和損失函數就可以達到穩定狀態。batch_size變量在模型訓練時,打標好的微地震和噪聲訓練樣本數目多,如果直接把所有的訓練樣本1次性放進模型中訓練,在網絡反向傳播時,會使用很大的計算內存,且無法對參數進行調整,因此,將訓練樣本分批次進行訓練,batch_size一般設置為2的n次冪,在實驗中結合訓練樣本的數目,最終將單次訓練數據樣本數量設置為32。RNN_hidden_size變量在網絡進行訓練時,1個結點對應1個樣本,本次實驗中設置為32個結點。RNN_hidden_layers變量值越大,整個模型的誤差越小,但是會出現網絡復雜化,增加訓練成本,以及過擬合問題,其值設為2層。learning_rate變量采用指數衰減法進行設置,在指數衰減法中,可以先設置為1個較大值,在模型的迭代過程中減小學習率的值,直至最優。n_classes變量在實驗中,將樣本分為微地震有效信號和噪聲2類。features_numbers包括振幅均值、振幅標準差、25百分位數、75百分位數、偏度值、峰度值、短長時窗比的最小值、短長時窗比的最大值、頻域最大幅值、梅爾頻率倒譜系數的前2個系數、偏振系數中的偏振角和偏振度。

表1 模型訓練參數
模型的最終準確率穩定在0.92左右,損失函數穩定在0.24左右。
為檢驗訓練出的RNN模型,將模型與傳統的STA/LTA識別法的研究結果進行比較。
1)利用微地震正演模擬[24-25]得到強度不同的3個有效信號,分別位于采樣點13 000,14 000,15 000處(見圖7a)。加入高斯白噪聲來模擬不同信噪比的信號,信號3已經完全被淹沒在噪聲中,如圖7b。

圖7 微地震模擬信號及加噪后模擬信號
2)采用STA/LTA識別法對模擬信號進行識別,長時窗設定為60個采樣點,短時窗為30個采樣點,計算結果見圖8a。

圖8 STA/LTA計算波形及識別效果
通過觀察計算波形,確定觸發閾值為1.3(紅虛線),此時可以正確觸發信號1,2。截止值設定為0.75(藍虛線),信號1可以正確觸發,但是信號2截止過早,識別效果如圖8b。在此情況下,無論如何設置閾值,信號3都無法正確觸發。
3)采用分形分維數法對模擬信號進行識別,窗口為20個采樣點,其分形分維數見圖9。設定觸發最低閾值為1.08,此時能正確識別事件1,但是無法識別事件 2,3。

圖9 分形分維數識別效果
4)使用訓練好的RNN模型對加噪后的模擬信號進行識別,模型自動將采樣點4 000個的整段信號分割為400段,然后對每段進行特征提取,在其預測標簽中,第101,201,301段預測為有效信號,預測效果如圖10所示。由圖10可看出,訓練好的RNN模型識別出了3個信號,表明其識別效果較好。

圖10 RNN模型識別效果
在實際水力壓裂微地震地面監測數據中,選取單個信號、多個信號、不同信噪比的幾段記錄,分別使用STA/LTA、分形分維法、循環神經網絡模型識別法對其進行識別。
單個信號的識別效果如圖11所示,多個信號的識別效果如圖12所示。

圖11 單信號實際數據信號識別

圖12 多信號實際數據信號識別
在實際檢測數據中,對25道檢波器的地震記錄信號進行循環神經網絡模型信號識別后,對模型識別出的有效信號保留,對識別出的噪聲時間進行置零操作,識別效果見圖13。

圖13 高信噪比信號及RNN模型識別
圖14的地震記錄信號信噪比不算高,存在2個有效信號,強度差異較明顯。由圖14可看出,RNN模型識別效果較好。

圖14 2個不同強度信號的地震記錄及識別后波形
1)采用單一特征量來進行信號自動識別,其噪聲能力弱,因此,綜合信號的多種特征量來進行信號自動識別成為新的發展方向。循環神經網絡是高度的非線性網絡方法,可以綜合地震相的多種特征量,具有準確、無需設定閾值等優點。
2)在人工智能方法中,循環神經網絡主要解決時序信號問題,比較適合處理微地震監測信號。循環神經網絡綜合信號的多種特征量來進行信號自動識別,具有準確、無需設定閾值等優點。
3)循環神經網絡模型可以識別強度較低的信號,且識別的信號長度較長,避免了有效信息的遺漏。
4)在對實際水力壓裂微地震多道監測數據進行循環神經網絡識別后,波形上絕大部分環境噪聲被去除,列脈沖信號被完整保留。循環神經網絡模型在識別過程中,通過對算法的優化和對識別流程結構進行調整,識別速度還可以進一步加快。