鄭 晶, 吳志祥, 李德偉, 邢立文
(中國礦業大學(北京)a.煤炭資源與安全開采國家重點實驗室;b.地球科學與測繪工程學院,北京 100083)
微地震監測技術通常用于非常規油氣勘探和CO2捕集與封存(Carbon Capture and Storage,CCS)工程的安全監測[1-2]。對于微地震監測技術而言,去噪是其數據處理技術的重要組成部分[3]。因為微地震(小震級)信號的振幅總是比傳統地震信號弱得多,實測數據始終受到噪聲的污染,所以與主動源地震事件相比,其信噪比(Signal-Noise Ratio,SNR)要低得多,故而原始的觀測數據難以直接進行事件到時拾取及定位等工作。大多數傳統的降噪方法都是基于域變換算法以及一些閾值化手段而提出的,例如時頻分析和時間(頻譜)-空間(波數)域分析[4-6]。域變換后的結果在反變換前通常先經過閾值處理,以達到噪聲濾除的目的。域變換的主要目的是為了獲得記錄數據的稀疏表示,因而如何選擇更好的變換方法和閾值策略將對降噪性能產生很大影響。
近年來,基于機器學習的地球物理數據處理方法得到了廣泛的研究和發展。一些研究側重于將字典學習應用于觀測數據更好的稀疏表示,以實現更好的降噪性能[7-8]。近年來,深度神經網絡以其極其復雜的表示能力在地球物理數據去噪中獲得了越來越多的應用。基于深度卷積神經網絡(Convolutional Neural Network,CNN)開發的去噪模型是噪聲衰減最常用的網絡模型[9-10]。
除了CNN之外,生成對抗網絡(Generative Adversarial Network,GAN)也具有圖像和語音處理的能力,在各個領域展現出巨大的應用和發展前景[11-12]。與基于CNN的方法相比,因為GAN網絡的損失函數不是最常用的簡單均方誤差或交叉熵損失[13],所以GAN可以克服CNN對輸出數據分布假設的缺點。Alwon[14]應用基于條件樣式轉換類型的GAN網絡從含噪聲的地震記錄剖面中預測干凈數據,但這種方法中必須將地震剖面作為二維圖像來考慮。
本文基于GAN網絡提出一種用于單通道微地震記錄降噪的方法。網絡的輸入是來自微地震儀器記錄的原始時間序列,在此之前不需要進行任何轉換,可以進行端到端的訓練。網絡包括生成器G和判別器D,構建G來生成處理后的數據。訓練后,G將恢復干凈數據,D負責區分真實數據和虛假數據。
Goodfellow等[15]2014年首先提出了Generative Adversarial Nets(GANs)。GAN包括兩個模型:一個是表示為G的生成器;另一個是表示為D的對抗判別器模型。G執行映射過程以學習實際數據分布;D像二進制分類器一樣工作以確定G的輸出是真實的還是虛假的。該網絡的工作流程如圖1所示。該網絡用于去噪,因此,它不同于傳統的GAN,后者的輸入只是噪聲。

圖1 基于GAN的去噪網絡的工作流程示意圖
圖2所示的生成器G網絡采用了全卷積編碼器/解碼器結構。與傳統的全卷積編碼器/解碼器結構相比,沒有用于下采樣的最大池化過程。采用>1的整數設置卷積步長來實現G網絡中的降采樣,該降采樣方法在GAN網絡中比其他池化方法更穩定。同時,G網絡還采用類U-net網絡在編碼器和解碼器的相應層之間添加“跳過并復制”步驟[16]。生成器是一個生成模型,該模型構建映射結構以使潛在表示z從簡單的先驗分布p(z)中學習訓練數據P(data)的分布。通過訓練過程,生成器能夠最小化p(x|θ,z)和P(data)之間的差異。因此,G不僅記憶輸入輸出對應關系,而且能學習數據分布特征。

圖2 生成器G網絡結構
判別器D是由卷積編碼器部分和全連接層部分組成,網絡結構如圖3所示。D是一個參數模型,其旨在判斷輸入x是從G網絡生成的數據還是干凈數據,可以將其視為判斷輸出是“真”還是“假”的一個二分類器。D的訓練目標為同時最大化D(x)(實際數據分類結果的損失)和最小化D(G(x))(生成的數據分類結果的損失)。D幫助G將其輸出波形朝干凈的數據分布進行校正,以避免生成的數據被判斷為是偽造的。

圖3 判別器D網絡結構
生成器G和判別器D通過反向傳播進行訓練,與傳統深度卷積神經網絡不同的是,GAN網絡的訓練分成3個步驟進行:
(1)使用帶噪音的和干凈的數據作為輸入,對D進行訓練,并標記輸出為“真”;
(2)利用G生成的數據和干凈的數據作為輸入,并標記輸出為“偽”,再次訓練D;
(3)固定D,使用生成的數據和干凈的數據作為輸入,并標記輸出為“真”來訓練G。
隨著訓練,G和D網絡將變得越來越強大。訓練后,G將能夠恢復實際信號分布并使去噪后的數據與干凈的數據相似;D將無法區分實際的不含噪音的數據和生成后的去噪數據。
應用合成數據訓練網絡,并使用實測數據集進行實驗以評估網絡的性能。對于訓練數據集使用不同的速度模型生成信號以考慮信號的多樣性。訓練數據集由30 000個波形組成,這些波形具有不同的SNR條件。
實測數據由共振頻率為4.5Hz±7.5%并包含12個通道的地面傳感器收集,通道在表面上不成一條直線對齊。系統將以2 ms的間隔連續幾個小時收集、存儲和傳輸數據。為了對比文中提出的濾波算法與其他方法在實際數據中噪聲壓制上的性能,選用了3個不同事件的多道微地震數據記錄進行實驗,并將3種方法分別應用于3個實測數據集。3個實測數據集如圖4(a)、5(a)和6(a)所示,它們的事件到時時間、對應道上信噪比都有一定的差異。信噪比的差異由不同震源強度和儀器噪聲水平等導致。實測數據和其經過3種方法處理后的結果見圖4~6。在圖4所示的第1個示例中,殘余噪聲在EEMD方法中最大,而在DWT方法中一些脈沖干擾未消除,因此這兩種方法均不被認為是成功的,而經本文方法去噪的數據獲得了更好的結果,之前的噪聲幾乎已消除。在圖5所示的第2個示例中,EEMD和DWT方法都留下了顯著的殘留噪聲,而從本文方法中獲得的去噪數據有更好的效果,事件的初至清晰。在圖6所示的第3個示例中,EEMD方法留下了更多的殘留噪聲,DWT方法在初至之前導致了一些不穩定的波形,但本文方法仍然可以獲得更好的結果。如果可以提供更多的訓練數據集,則該方法可以表現出更好的性能。

圖4 不同方法對實測數據集1的去噪效果對比

圖5 不同方法對實測數據集2的去噪效果對比

圖6 不同方法對實測數據集3的去噪效果對比
實現了基于生成對抗網絡的端到端微地震數據降噪方法。該模型分為兩個部分:一個是生成器G,使用編碼器-解碼器全卷積結構生成去噪數據集;另一個是判別器D,負責學習某種損失,以使G的輸出看起來真實。G部分的結構類似于U-net。在編碼階段,將輸入信號投影并壓縮用以學習數據的稀疏表示。在解碼階段,將去噪后的數據恢復為輸入數據的原始分辨率。G的損失函數也因D中的學習而具有自適應性。該方法不僅可以在含噪聲的記錄中清楚地檢測出能量較高的波形,而且去噪后能清楚地檢測出能量較低的波形。對含噪聲的合成數據和實測數據集的測試表明,該算法在強噪聲水平下獲得了令人滿意的結果。從重建的信號中可以清楚地識別出信號的初至,這意味著本文方法可以幫助事件拾取人員在低SNR的情況下拾取初至。測試結果表明,該方法是可靠的并且是當前方法的有效替代。
科學研究既要追求知識和真理,也要服務于經濟社會發展和廣大人民群眾。廣大科技工作者要把論文寫在祖國的大地上,把科技成果應用在實現現代化的偉大事業中。
——2016年5月30日,習近平在全國科技創新大會上講話