












關鍵詞:深度學習,數據處理,多次波壓制,Pix2Pix網絡
0 引言
在地震資料的分析過程中,多次波常常干擾了地震數據的成像與解釋[1],特別是對于海洋勘探數據,由于海面和海底等強波阻抗界面的存在,生成的強多次波會與有效信號混合在一起,生成錯誤的偽影,降低偏移圖像的分辨率。多次波與有效一次波在特征形態上極為相似,難以被有效區分。因此,開發高效可行的多次波壓制技術一直是地震勘探領域持續關注的熱點問題之一[2-3]。
主流的多次波壓制方法主要分為三大類:濾波法、波動方程預測相減法和機器學習類方法[4-8]。濾波法主要根據多次波和一次波在不同數據域內的特征差異,用信號處理技術分割和切除多余的多次波信息。這類方法在一次波和多次波之間的特征差異較為清晰時(例如簡單的層狀介質中)具有較高的成功率和處理效率,但當地質結構較復雜時,該方法的壓制效果會相應降低[5-7]。
波動方程預測相減法分為預測和相減兩個階段。首先通過數值模擬預測相應的多次波信息,然后再與實際數據匹配相減,去除相應的多次波。相較于濾波法,該方法更適合壓制復雜地質區域的多次波,但計算成本相對較高[8]。
近年來,機器學習方法被越來越多地應用于地球物理和地震學等領域的數據處理中[9-10]。在多次波壓制方面,深度學習類方法的優勢是可以自主發掘和學習數據的共有特征,不需要提供額外的地下介質模型信息,且訓練好的網絡具有極高的處理效率。例如,王坤喜等[11]在相關研究中使用數據增廣訓練的深度神經網絡,基于遷移學習方案對多次波進行了高效快速的壓制;Li等[12]使用了全卷積神經網絡變形形式(U-Net網絡)壓制多次波,該結構具有較強的抗噪能力,提升了網絡的預測效果;宋歡等[13]使用深層神經網絡(DNN)壓制多次波,對復雜地質區域的觀測數據具有較好的處理效果;劉小舟等[14]結合了去噪卷積神經網絡(DnCNN)和U-Net網絡實現了層間多次波的壓制,具有較高的抗噪能力。此外,在對自由表面多次波的壓制研究方面,卷積神經網絡(CNN)[15]、生成對抗神經網絡(GAN)[16]和自注意力機制的神經網絡[17]都表現出了良好的處理效果。以上深度學習類方法在訓練網絡時通常輸入含有多次波的原始數據,將不含多次波的數據作為目標,訓練網絡輸出有效的一次波信息,這一訓練過程為一對一的單任務轉換[18-19]。
本文針對自由表面多次波壓制問題,將地震數據處理任務視為相應的圖像轉譯任務,設置了多任務的輸出結構,以提升網絡的輸出效果。首先,采用在圖像轉譯領域表現優秀的Pix2Pix網絡[20]處理地震數據。該網絡能較好地學習圖片像素點與點之間的關聯性,對應地震數據,有助于識別相鄰道集間的連續同相軸信息,使處理后的數據在道集間保持良好的連續性。其次,對于多任務輸出,將目標數據集由常規單一的一次波形式修改為包含原始數據、一次波和多次波三種數據組合在一起的多輸出形式。這一改進不僅能夠利用多任務訓練更好地發揮網絡的數據處理潛力,提升輸出效果,而且可以根據目標數據間的關聯性,設計額外的損失函數,進一步限制和優化網絡的輸出。最后,基于數值模型對方法定量測試,證明方法的有效性。
1 條件生成對抗神經網絡
本文使用Pix2Pix網絡實現地震數據的自由表面多次波壓制。該網絡是一種條件生成對抗神經網絡(cGAN)[20-21],屬于GAN家族中的眾多分支之一。Pix2Pix使用神經網絡取代了常規的L2或L1損失函數對輸出效果進行評價,在處理數據時,能得到更高分辨率的輸出結果[20]。
GAN是一種基于對抗訓練進行自監督和無監督學習的深度學習方法[22]。如圖1所示,GAN由一個生成器和一個判別器組成,通過不斷迭代和優化生成器和判別器,網絡的最終目的是訓練生成器生成難以被判別器區分的,具有和目標數據共有特征的合成數據。
具體而言,圖1中判別器D的任務是盡可能地區分生成器G輸出的合成數據和真實的目標數據,并給出具體的概率評分;生成器G的任務則是盡可能地生成能夠迷惑判別器D的合成數據,合成數據盡可能與目標數據具有足夠多的相同特征。訓練過程中,生成器和判別器相互競爭優化,最終使生成器生成與目標數據足夠類似,難以被優化后的判別器分辨出的合成數據。
傳統的無條件GAN將隨機噪聲作為輸入,生成帶有目標數據特征的任意數據,這意味著輸入與輸出數據間沒有明確的對應關系[22]。對于數據處理類任務,希望輸出與輸入存在一定的關聯性(處理前后依然屬于同一份數據)。因此,條件生成對抗神經網絡被提出[21],并被用于解決類似問題,包括了本文所使用的Pix2Pix網絡[20]。
與GAN相比,cGAN在網絡的輸入和判別器的判別過程中都加入了額外的條件項來限制和指導網絡的輸出。cGAN的網絡結構如圖2所示,具體的目標函數形式為
式中:G為生成器;D為判別器;x為條件;y為目標;z為隨機噪聲;E為數學期望。該損失函數的前半部分為判別器D判斷目標數據為真的概率,這一項為固定的常數項;后半部分則是判別器D判斷生成器G輸出數據為假的概率,生成器G的目的就是使其盡可能的小,以使總損失函數最小化,即
式中:λ為權重系數,額外的L1損失項用于計算生成器G的輸入與輸出項之間的差別,目的是使網絡的輸出盡可能依賴輸入,直接使用帶額外損失函數的網絡進行訓練可能導致網絡難以收斂。
2 訓練數據集
與常見的卷積神經網絡(CNN)類似,本文使用的Pix2Pix也是一種監督學習類方法。這類方法需要一一對應的帶標簽數據作為訓練數據集,即輸入和目標數據都來自同一炮點。其優勢是數據間具有明確的對應關系,不足是由于實測地震數據質量普遍較低,目前只能應用合成數據進行訓練。
合理地設計訓練數據集能更好地提升網絡的輸出效果。對于地震數據的多次波壓制問題,深度學習類方法在訓練階段設置的輸入數據集通常為帶有一次波和多次波信息的原始數據,目標數據集則為去除了多次波的有效一次波數據。
本文將地震數據處理任務視為圖像優化任務,將數據轉換為圖片進行多任務處理。其優勢是相較于傳統的最小二乘形式的損失函數,Pix2Pix利用判別器D構建了更為靈活的損失判別方式(式2),網絡在處理圖像時能兼顧像素點與點之間的關聯性,保證圖像結構的連續性。對于地震數據,這一特點能很好地保證處理前后數據中反射同相軸的連續性。
如圖3所示,我們將地震數據分別存儲在R、G、B三個通道中,并將其轉換為對應的圖像。首先,對地震數據逐道歸一化至[-1,1]區域內,再映射到相應的圖像區間[0,255];其次,將輸入圖像固定為原始數據(一次波+多次波)存貯于R通道中,G和B通道設置為128;最后,不同于一般的訓練方案,目標數據不再被設置為單一的一次波,而是包含了原始數據、一次波和多次波組合在一起的目標圖像數據。
測試結果表明,多任務輸出的數據間具有一定的關聯性,能提升網絡的輸出效果;輸出數據間的關聯性允許添加額外的損失函數,以進一步優化網絡的輸出精度。圖4為與圖3相對應的將地震數據轉換為圖片后的輸入和目標圖片。
3 額外損失函數
根據原始數據、一次波和多次波間的關聯性(原始數據=一次波+多次波)設計一個額外的損失函數,限制網絡的輸出,以進一步提升Pix2Pix網絡對多次波的壓制效果。損失函數的具體形式為
式中:α為權重系數,經過大量測試驗證我們將其設置為0.2;dR、dG和dB分別對應三個輸出圖像通道R、G、B中的原始數據。通過最小化上述損失函數矯正網絡的輸出圖像,提升多次波壓制效果。
需要注意的是在網絡的訓練過程中,并不直接應用這一損失函數進行訓練,而是先基于原始的損失函數(式(2))進行網絡預訓練;等網絡收斂后,再基于改進后的損失函數(式(4))進一步額外訓練。這一過程與遷移學習方案類似,經過大量測試,該訓練方式有助于提升網絡的收斂效率。
4 數值測試
4.1 模型設置
為了驗證方法的有效性,使用Marmousi模型(圖5)生成的合成數據測試。數值模擬方法采用有限差分法,在交錯網格上使用聲波方程模擬地震波場的傳播[23]。觀測系統設置了720個炮點,每個炮點對應120個檢波點(圖6);炮間距為20m,道間距為20m,炮檢距為200m;震源為主頻15Hz的雷克子波,水層深度為0.5km,炮點和檢波點都位于水面下0.1km處;采樣時間為3.5s,采樣間隔為1ms。選取位于模型左側的540個炮點作為訓練數據集,選取右側的180個炮點作為驗證數據集測試,圖5中用紅色虛線劃分了模型相應的訓練和測試區間。
基于相同的觀測系統,分別在含有自由表面和將自由表面修改為吸收邊界條件下的模型進行數值模擬,并使用在完全水層中模擬的數值結果去除初至波。最終經過4次數值模擬,得到不含初至的原始數據和相應的去除自由表面多次波后的數據。
用以下三種網絡訓練方式對比和測試。第一種是將目標數據集設置為單一的一次波的一般形式;第二種是將目標數據集設置為如圖3所示的復合形式;第三種是在復合目標數據集基礎上,添加額外的損失函數的形式。為敘述簡便,下文分別將這三種方案用M1、M2和M3代指。其中M1和M2用于對比單一和復合形式的目標數據集對網絡輸出結果的影響;M2和M3則用于對比額外損失函數對網絡輸出的提升效果。
對于網絡的訓練方式,M1和M2都直接使用原始的Pix2Pix網絡,300次迭代后完成訓練;M3的訓練方式則為先使用原始的Pix2Pix網絡進行200次預訓練,然后添加額外的損失函數后,再進行100次的遷移訓練。三種方案的總迭代訓練次數保持一致。
4.2 層狀模型測試
為了更清晰地展示網絡對多次波的壓制效果,本文使用訓練好的網絡處理簡單的層狀模型(圖7)所生成的數據,將層狀模型生成的一次波(1和6)和能量較強的自由表面多次波(2、3、4和5)標記在模型和觀測數據中,如圖7和圖8a所示。圖8為輸入的原始數據、網絡處理后輸出的一次波結果和相應的準確結果。直觀上M3的輸出效果最佳,最接近準確結果,如圖中用紅色箭頭標記相應的一次波信息。網絡的輸出與準確結果之間的均方根誤差(RMSE)定量顯示在圖片的正下方,各方法間誤差關系有M3lt;M2lt;M1,誤差統計結果表明提出的改進措施可以減少輸出數據的誤差。
圖9進一步展示了原始數據和M3網絡輸出數據對應的共炮檢距道集結果(離炮點最近的檢波點,炮檢距為0.2km)。從共炮檢距道集圖像中可明顯看出,數據經過網絡處理后,對應的炮檢圖像中由自由表面多次波引起的虛假反射層被徹底地去除,基于M3輸出數據的共炮檢距道集結果準確地對0.5s和1.5s處的反射層清晰成像(圖中使用紅色箭頭標記了相應層位),證明了方法對簡單模型的有效性。
4.3 復雜模型測試
更進一步,統計圖5右側區域180炮驗證數據集的測試結果。如圖10所示,M1、M2和M3的平均均方根誤差(RMSE)分別為8.6%、7.2%和4.2%,其中相較于傳統單一形式的訓練方案(M1),改進后的多任務方案(M2)整體降低了約1/8的誤差,而在此基礎上進一步結合了額外損失函數的M3方案,其誤差僅為M1方案的一半左右。
圖11為測試數據集中第一個炮點的炮集記錄圖像,包括了網絡的輸入和輸出,以及對應的準確結果。對于更復雜的模型生成的數據,訓練好的Pix2Pix網絡依然表現出良好的多次波壓制能力。M3輸出的結果直觀上與準確結果非常相近(圖11d、圖11e),均方根誤差僅為4.2%,表明網絡具有良好的多次波壓制能力。
圖12為不同數據所對應的共炮檢距道集結果,圖13為圖12對應放大后的圖像,其中原始數據所對應的共炮檢距道集結果(圖12a和圖13a)中存在明顯的虛假反射層(圖中紅色箭頭)。M1對應的結果(圖12b和圖13b)對虛假反射層的壓制效果并不明顯,圖中仍然存在較多的虛假反射。改進后的M3方案對應的結果(圖12c和圖13c)對自由表面多次波所造成的虛假反射有較好的壓制效果,如對于1s左右較為明顯的虛假反射層,且圖像整體與準確的共炮檢距道集結果(圖12d和圖13d)接近,證明提出的多次波壓制方案有效提升了共炮檢距道集圖像的準確性和清晰度。
4.4 抗干擾測試
訓練方案不變,在輸入數據中添加額外的干擾項,以測試輸入數據質量較低時網絡的處理效果。如圖14所示,隨機將原始數據20%的道集歸零,模擬實際可能存在的壞道,并添加隨機噪聲將數據的信噪比降至5dB。添加干擾后網絡的輸入數據如圖14b所示,使用存在干擾的數據作為輸入重新訓練網絡。網絡訓練好后,輸出結果如圖14c和圖14d所示,其中圖14c為網絡輸出的原始數據,展示了網絡對數據的去噪和補全能力。網絡很好地重構了輸入數據中相應的缺失信息,處理后的數據在道集之間具有良好的連續性。此外,從圖中紅色方框標記的區域可以發現,由于網絡并非通過簡單的插值方式補全數據,而是基于從訓練數據集中所學習到的更復雜的特征信息,對數據進行了合適的補充,因此直觀上網絡輸出數據在道集間的連續性上表現良好,整體與準確結果相近。保持數據的連續性是GAN網絡在處理數據時的優勢之一,這增加了網絡的實際應用價值。
圖14d為網絡輸出的一次波結果,展示了網絡在輸入數據存在干擾時對多次波的壓制效果。整體上,網絡展現出了良好的處理效果,處理后的數據完整性強且很好地壓制了噪聲干擾。但需要注意的是,在部分區域網絡的輸出也客觀存在一定的不足,如圖14d和圖14e中紅色方框所示,當輸入數據存在部分道集缺失時,網絡輸出的一次波信息在能量上會有一定的損耗。其原因可能是網絡在補充缺失信息時對總體能量進行了平均化處理,從而一定程度降低了相應的幅值信息。
統計輸入和輸出的原始數據與準確結果間的均方根誤差(圖15a),并通過誤差大小評價方法的去噪和數據補全能力。統計結果表明,經過網絡處理,去除干擾后的輸入數據,平均誤差從9.1%降至了5.6%,誤差減少了接近一半。對于網絡輸出的一次波數據,相較于無干擾的輸入(圖15b中紅色實線)對應的結果,存在干擾的情況下其平均誤差增加了1%左右(圖15b中紅色虛線),較小的誤差增長同樣證明了方法的可靠性。
如圖16所示,網絡處理后的數據對應的共炮檢距道集結果更直觀地展示了網絡的去噪和數據補全能力,以及相應的多次波壓制能力。相較于網絡輸入的原始數據所對應的結果(圖16a),網絡輸出數據對應的共炮檢距道集結果(圖16b)具有更好的連續性和清晰度,較好地驗證了方法的有效性。
5 討論
本文分別使用了540張輸入和目標圖片作為網絡的訓練數據集。網絡訓練的迭代次數為300次,平均耗時約為2h。訓練好的網絡在處理驗證數據集的180張輸入圖片時,耗時約為5s。由此可見深度學習類方法的主要計算成本集中在網絡的訓練階段,訓練好的網絡在應用時具有非常高的處理效率。
對于方法的泛化問題,訓練出一個能處理任意輸入數據的神經網絡是非常具有挑戰性的。一種更易實現的方案是對某一特定勘探區域的觀測數據訓練與之對應的特定處理網絡。對于特定勘探區域內的數據,通常已知震源和檢波點的深度、排列或水層深度,未知信息主要為地下速度結構的分布情況。可以根據已知信息生成對應的訓練數據集,針對性訓練網絡,提升其對特定區域觀測數據的處理能力。
目前,機器學習類方法還在不斷快速發展,與Pix2Pix網絡類似的圖像處理類方法還包括了CycleGAN、StarGAN和擴散模型等。這些圖像轉譯類方法在處理數據時所關注的區域不再局限于單一的數據點,而是擴展到圖像某一小范圍內整體的優化程度,相關研究已證明這類方案能很好地提升網絡預測結果的分辨率,這也是本文將地震數據處理轉換為圖像處理任務的原因之一。在后續研究中,筆者也將嘗試更多前沿方法,進一步提升多次波壓制效果。
6 結論
對于地震數據的多次波壓制問題,本文將數據處理任務視為圖像轉譯任務,引入了相應領域表現優秀的Pix2Pix網絡實現多次波的壓制,這類方法的優勢是能關注和學習到相鄰區域間數據的連續特征,有助于處理具有連續性特征的地震數據。在這一過程中,對目標數據集和損失函數進行了優化,包括:①使用了復合形式的目標數據集進行多任務訓練;②添加了額外的限制性損失函數項。數值測試結果表明,本文方案有效可行,訓練好的Pix2Pix網絡能快速有效地壓制輸入數據中的多次波干擾,且具有較強的抗噪、抗數據缺失能力。