中圖分類號:P631 文獻標識碼:A DOI:10. 13810/j. cnki. issn. 1000-7210. 20240387
Abstract:Wave impedance inversion based on deep learning often requires a large number of label data to drive the model for network training,but in practice,the acquisition of label data(logging data)is difficult and costly,and usually only a small amount of label data is used for training. Therefore,a semi?supervised wave im ? pedance inversion method based on data augmentation and pseudo ?label generation is proposed. Firstly,the la? bel wave impedance data is interpolated by cubic spline interpolation method and then randomly resampled,and then the seismic records corresponding to the augmented wave impedance are calculated by forward modeling method. The amplified seismic record and wave impedance are used as the network training set to train the net? work and predict the wave impedance. High quality prediction data is selected as pseudo?labels,and the pseudo? labels are augmented to greatly expand the training data set. However,Temporal Convolutional Network (TCN)has advantages in time series data modeling,which can capture the long ? term dependency of data and complete the wave impedance inversion task well. In this paper,the Marmousi model test results show that the proposed method is suitable for the wave impedance inversion of a small amount of label data,has good anti ? noise performance,and still has good inversion accuracy for different label distributions. The inversion results of the actual exploration data show that this method can effectively solve the problem of seismic impedance in version.
Keywords:wave impedance inversion,temporal convolutional networks,data augmentation,pseudo?label,semi? supervised learning
程程,趙巖 . 基于數據增廣和偽標簽生成的波阻抗反演[J]. 石油地球物理勘探,2025,60(3):642?654.
CHENG Cheng,ZHAO Yan. Wave impedance inversionbased on data augmentation and Pseudo?label genera? tion[J]. Oil Geophysical Prospecting,2025,60(3):642?654.
0 引言
地震勘探是解決油氣勘探問題廣泛應用的技術方法之一[1],地震勘探技術經歷了從認識地下的構造形態到當前直接通過地震信息判斷巖性、分析巖相、定量計算巖層的物性參數及尋找油氣顯示等[2-3]。波阻抗信息是油氣勘探中的重要數據,在地震反演中波阻抗反演占據著特殊的地位。
地震波阻抗反演利用地震資料和測井資料,根據地震反射系數和波阻抗的關系,反演出地下巖層的波阻抗分布,從而推斷巖層的物理性質和油氣分布[4]。傳統的地震波阻抗反演有多種方法,如直接反演,模擬反演,非線性反演和疊前反演[5]。然而,由于地下介質的復雜性和地震數據的不確定性,波阻抗反演問題通常是一個非線性、非唯一性和多解性的問題,給反演結果的準確性帶來了挑戰。隨著對勘探和開發目標精細化需求的提升,地球物理勘探技術面臨著巨大的挑戰。
隨著大數據技術的逐步發展,支持向量機[6]、聚類算法[7]以及人工神經網絡[8]等機器學習方法逐步成為了地球物理數據處理、反演以及解釋的研究熱點之一。尤其是近年來深度學習[9]在計算機視覺[10]、語音識別[11]、自然語言處理[12]等領域取得了顯著的進展,隨后被專家學者廣泛應用于地震數據處理領域以解決復雜的地球物理問題[13-19]。一些基于神經網絡的反演方法被提出,利用神經網絡強大的非線性擬合和特征提取能力,直接從地震數據中學習反演的映射關系,無需依賴物理模型和數學模型,可以提高反演的效率和魯棒性。如 Das 等[20]提出一種基于 卷 積 神 經 網 絡 (Convolutional Neural Network,CNN)的波阻抗反演方法,利用挪威 Volve 油田數據進行實驗,結果與測井數據一致;Alfarraj 等[21]提出 使 用 循 環 神 經 網 絡 (Recurrent Neural Network,RNN)從地震數據中估計巖性物理性質的方法,表明了 RNN 在儲層表征方面具有巨大潛力;Wu 等[22]實 現 全 卷 積 殘 差 網 絡 (Fully Convolutional ResidualNetwork,FCRN)和遷移學習的地震波阻抗反演,取得了很好的效果,但未進行抗噪能力分析;Wang等[23]提出了一種基于物理驅動的循環網絡用于地震阻抗反演,采用了條件生成對抗網絡(ConditionalGenerative Adversarial Network,CGAN) 實 現 使 用有標簽和無標簽數據的聯合訓練;Mustafa 等[24]提出基 于 時 間 卷 積 網 絡 (Temporal Convolutional Net?work,TCN)的波阻抗預測結合了 RNN 和 CNN 的優勢,無需大量標簽數據即可捕獲數據的長期趨勢,證明 TCN 進行反演時序建模的優勢。
深度學習以數據為驅動,其模型通常包含大量的參數,這意味著它們需要大量的訓練數據來有效地學習這些參數。數據越多,模型越有可能捕捉到數據中的復雜特征,其性能也就越高。但在實際生產,尤其是油氣勘探領域中,標簽數據獲取代價高昂,但無標簽數據獲取相對容易。半監督學習便是通過利用少量的有標簽數據與大量的無標簽數據,從而提高模型的泛化能力和性能。偽標簽(Pseudo-Labels)[25-26]是半監督學習中的一種策略,通過使用一個初步訓練的模型對無標簽數據進行預測,并將這些預測作為“偽”標簽來增強數據集,從而在進一步的模型訓練中使用。 wu 等[27]使用訓練數據及其偽標簽對深度 CRNN 進行預訓練實現高光譜圖像的分類。數據增廣是另一種常用于增加樣本訓練集、提高模型泛化能力、增強魯棒性的方法[28]。如Shorten 等[29]討論了深度學習模型嚴重依賴于大型數據集以避免過擬合,以及如何使用數據增強來提升訓練數據集的大小和質量;王水濤等[30]提出了一種融合偽標簽生成和數據增強的級聯雙向長短期記憶—膠囊網絡算法,展示了融合偽標簽生成和數據增強的算法在解決嘈雜多標簽文本分類問題方面的強大魯棒性和泛化性能;伊小蝶等[31]提出了一種基于數據增廣和主動學習的地震波阻抗反演方法,將增廣后的地震數據和波阻抗數據作為訓練集,結合主動學習思想選擇最大誤差樣本對網絡進行迭代訓練。其方法能用較少的含標簽數據訓練出預測精度更高的網絡,較好地解決了實際生產中測井數據較少帶來的反演精度較差的難題。
基于以上算法的啟發,本文將偽標簽生成和數據增廣技術應用于地震波阻抗反演,對少量標簽數據進行擴充后用于模型訓練。結合 TCN 網絡在時序數據建模上的并行處理以及長依賴建模優勢,不僅在少量標簽數據情況得到較高精度的反演結果,且具有較好的抗噪聲性能。
1 內插重采樣的波阻抗增廣方法
1. 1 增廣原理
數據增廣是一種提高模型性能和魯棒性的方法,它通過對原始數據進行變換或擾動,生成新的數據,通過增加數據的多樣性和覆蓋度來提高網絡模型的泛化能力。常見的生成新的時間序列的增廣方式有縮放、翻轉、裁剪、滑窗等。這種方式相對簡單、直觀,但需要考慮不同變換對任務的影響,如翻轉可能改變趨勢,裁剪可能丟失異常點等。插值方法也有許多種,常用的有線性插值、多項式插值、三次樣條插值等。
為了確保增廣數據與原始數據變化趨勢相同,本文采用三次樣條插值法[32],用于在給定一組數據點的情況下,通過擬合一條光滑的曲線來估計數據點之間的值。具體而言,三次樣條插值使用三次多項式來擬合每個相鄰數據點之間的曲線段。這些曲線段在相鄰數據點處具有相同的斜率,并且確保插值函數的一階和二階導數是連續的。
以下是三次樣條插值的步驟。 ① 給定一組數據點 (x0,y0),(x1,y1),…,(xn,yn) 。 ② 計算每兩個相鄰數據點的差值 h=xi+1-xi 。 ③ 使用三次多項式來擬合每個相鄰數據點之間的曲線段。對于每個區間[xi,xi+1] ,插值函數 S(x) 可定義為

式中
是待求的系數。 ④ 依據以下要求確定插值函數的約束條件:在每個數據點處,插值函數通過數據點: S(xi)=yi 。在兩個相鄰數據點處,插值函數的一階導數是連續的: S′(xi+1)=S′(xi), 。在兩個相鄰數據點處,插值函數的二階導數是連續的:S′′(xi+1)=S′′(xi), 。 ⑤ 解出待求的系數
⑥ 使用求解得到的插值函數 S(x) 來估計數據點之間的值。
三次樣條插值方法可以產生平滑的曲線,并且 保持了一定的靈活性和準確性。
1. 2 增廣流程
地震記錄 s 通 過 Ricker 子 波 [33]W 與地震反射系數 r 褶積計算得到
s=W*r
依據縱向內插重采樣的方法,對波阻抗 Z 進行插值并重采樣,生成增廣后的波阻抗 {Z,Z′} ;再利用式(3)計算相對應的增廣反射系數 r′

便可以計算出增廣后的地震記錄 s′
s′=W*r′
上述數據增廣的詳細流程如下:
(1)選擇一道具有 N 個采樣點的波阻抗 Z ,通過三次樣條插值為 N* 個采樣點的波阻抗(本文實驗中, N*=10N) ;(2)為了保持與原始數據具有相同的長度,對插值后的波阻抗隨機重采樣 N 個采樣點,組成增廣后的波阻抗 Z′ ;(3)使用增廣后的波阻抗 Z′ 帶入式(3),求出增廣后的反射系數 r′ ;(4)將反射系數 r′ 帶入式(4),求出增廣后的地震記錄 s′ 。
循環上述流程可獲得若干組 {s′,Z′} ,即可達到數據增廣的目的。結合原始的波阻抗和地震記錄,便可組成大量用于本文反演網絡模型訓練的數據集。
1. 3 初步驗證
在 Marmousi 模型中任意選取一道波阻抗 Z ,依照上述流程對其進行 5 次數據增廣,如圖 1 所示,增廣后的 5 道波阻抗 Z′ (實線)與原始波阻抗 Z (紅色虛線)具有相同的變化趨勢。
圖1 原始波阻抗曲線(紅色虛線)與增廣后曲線對比

新的反射系數 r′ 和增廣后的波阻抗 Z′ 正演所得的地震數據 s′ 如圖 2 所示。增廣后的反射系數 r′ 與原始波阻抗計算得到的反射系數的變化趨勢相一致,而增廣后的地震記錄 s′ 與原始波阻抗正演得到的地震記錄 s 的變化趨勢也相符。這表明本文采用的數據增廣方法在保持與原數據相同的趨勢下,增加了數據多樣性,大大擴充了訓練集數據。
圖2 增廣反射系數和地震道與原始曲線(紅色虛線)的對比

2 反演網絡的搭建
2. 1 時間卷積網絡結構
TCN 是由 Lea 等[34]于 2016 年提出的一種用于處理和建模時間序列數據的深度學習網絡模型。他們 將 全 卷 積 網 絡 (Fully Convolutional Network,FCN) [35] 和 因 果 卷 積 (Causal Convolutions) 結 合 起來,實現了對序列數據的分層特征提取。TCN 主要是由一維卷積、因果卷積、膨脹卷積(Dilated Convo?lutions)和殘差塊(Residual Block)所構成。TCN 在進行時間序列建模和預測時具有一些重要的優勢。首先,TCN 具備處理更長時間序列數據的能力,而不需要像 RNN 那樣進行循環計算。這使得 TCN能夠并行計算,從而優化了模型的訓練效率。其次,TCN 能夠有效學習和傳遞時間序列中的長期依賴信息,對于處理長期相關性的任務具有優勢。此外,TCN 還可通過合適的超參數設置和網絡結構設計來適應不同的時間尺度和模式。
假設輸入時間序列為 x0,x1…,xT(T 為時間長度),期望得到的預測輸出為
。兩者的關系式為

對于任意時刻輸出的
僅與 Ψt 時刻及 t 時刻之前的輸入序列 x0,x1…,xt 有關,而與任何未來的輸入 xt+1,…,xT 無關,就是保證 Ψt 時刻以后的數據不參與預測任務。在 TCN 序列建模設計中,訓練的任務是找到一個映射關系 f, ,其目標函數的任務是最 小 化 真 實 輸 出 (y0,y1…,yT) 與 預 測 輸 出
之間的誤差損失。
TCN 的核心思想包括以下三點。 ① 因果卷積,是一種卷積神經網絡的變種,在序列建模任務中非常有用,特別是對于需要預測未來值的情況。為了確保時間序列的因果關系,索引為 {0,…,l-1} 的輸出序列中的第 i 個元素的信息必須來自于索引為{0,…,i} 的輸入數據中的元素,其中
為時間序列的長度。為了保證每一個輸出數據與輸入數據的長度一致,需要進行零填充操作。通過僅在輸入數據的左側進行填充零,可以確保因果卷積具有嚴格的時間約束。卷積核大小為 2 的因果卷積結構如圖 3 所示。 ② 膨脹卷積,也被稱為空洞卷積或者擴張卷積。膨脹卷積的原理是在卷積核中間填充一定數量的空洞,使得卷積核可以稀疏地采樣輸入信號,從而擴大感受野,較大的感受野可以幫助網絡捕捉更廣泛的上下文信息,有助于處理全局特征和長期依賴關系。通過引入膨脹系數 d ,控制卷積核的間距,使得卷積核在進行卷積操作時可以略過一些輸入值。通過調整 d 的大小,即可靈活地改變卷積操作的感受野大小。圖 4 展示了 d 等于 1、2、4,卷積核大小為 2 的膨脹卷積。根據圖 3 和圖 4 可以得出結論:在卷積層層數相等的情況下,膨脹卷積的引入大大增加了網絡模型的感受野,并且能夠在更少的卷積層數下獲取更長的時序依賴關系。 ③ 殘差塊,在傳統的卷積層或全連接層的輸出上,添加一個跳躍連接,將輸入直接與輸出相加,形成一個殘差(Residual)。這樣做的目的是讓網絡學習輸入與輸出之間的差異,而不是直接學習輸出。殘差模塊通常由兩個或多個卷積層組成,其中第一個卷積層用于特征提取,第二個卷積層用于將提取的特征融合。為了提高模型的泛化能力,采用加權標準層(Weight Norm)和 Dropout層[36]的正則化方式來防止網絡模型訓練的過擬合。在網絡中加入 ReLU 激活函數[37],引入非線性,增強網絡的表達能力,并幫助傳遞殘差信息,從而提高網絡模型的性能。隨著網絡深度的增加,TCN 模型的感受野也會相應擴大,但隨著網絡層數的增加,梯度消失或者爆炸的問題可能會變得更加嚴重。而殘差結構在網絡深度增加時可以有效地抑制梯度消失或者爆炸的問題,同時增加了網絡的非線性和表達能力。圖 5 為殘差塊結構示意圖。
圖3 因果卷積結構示意圖

圖4 膨脹卷積結構示意圖

圖6 網絡模型結構圖

的地震記錄特征映射到特定的波阻抗中進行預測。根據多次不同的卷積核大小、殘差塊數量以及通道數量的組合實驗,發現圖 6 所示網絡架構,即 k=3 、d=2n-1 、 n=8 、通 道 數 量 為 [50,50,100,100,150,150,200,200]的網絡參數在本文波阻抗反演實驗中表現出較好的反演精度。
圖5 殘差塊結構示意圖

2. 2 TCN 地震波阻抗反演流程
TCN 地震波阻抗反演的具體流程包括以下四個方面(圖 7)。
本研究的模型采用了圖 6 所示的網絡框架,其中在輸入層后連接多個具有相同結構的殘差塊,每個殘差塊的卷積核大小為 k ,膨脹系數 d 等于殘差塊數量 n 的 2n-1 。最后通過一層全連接層將學習到
(1)獲取數據:將 Marmousi 模型中的速度模型與密度模型相乘得到波阻抗模型。再通過正演合成地震記錄,構成數據集。
(2)數據預處理:首先將所獲得的地震記錄數據和對應的波阻抗數據進行標準化處理;然后均勻抽取 20 道相對應的地震記錄和波阻抗做訓練數據集;最后將所有的地震記錄數據劃分為測試數據集。
(3)模型訓練:模型訓練由一系列的網絡模型組成,將預處理好的訓練數據輸入到 TCN 反演網絡,網絡模型的輸入為地震記錄,輸出為波阻抗。訓練網絡得到反演映射模型并畫出訓練損失值變化圖像。將訓練好的網絡模型保存。
(4)模型預測:將測試數據集中的地震記錄作為輸入,輸入到以上步驟中保存的網絡模型中進行波阻抗反演,輸出為預測的波阻抗并對其進行反標準化處理,以獲得最終反演結果。
圖7 TCN 地震波阻抗反演流程

2. 3 反演結果的評價
為確定本文建模方法的預測效果,并為后續偽標簽的篩選提供依據,通過計算真實波阻抗與預測波阻抗的均方誤差(MSE)、相關系數(PCC)和確定系數 (R2) [38],定量評價反演精度和一致性。
MSE 是用來度量預測值與實際值之間的平方的平均值,用于衡量預測值與真實值之間的差異程度。越小的 MSE 值,表示模型的預測性能越好,擬合程度越高。其定義公式如下

式中: yi 是真實值;
是預測值; Ωm 是樣本數。
PCC 是真實值和預測值的線性相關程度的度量,反映了模型的預測方向的準確性。PCC 的取值范圍為?1 到 1,值越接近 1,表示兩個變量之間的線性正相關性越強;值越接近?1,表示兩個變量之間的線性負相關性越強;值接近 0,則表示兩個變量之間的線性相關性較弱或無線性關系。其定義如下

式中:
是真實值的均值;
是預測值的均值。
R2 是真實值和預測值的平方差與真實值和均值的平方差的比值的補數,反映了模型預測能力的優劣。 R2 的取值范圍為 0 到 1,越接近 1,表示模型的預測能力越強,擬合效果越好。其定義為

3 偽標簽生成
偽標簽是一種半監督學習的方法,用于在缺乏標簽數據的情況下擴充訓練集并提高模型性能。在半監督學習中,只有一部分數據有真實的標簽,而其他數據沒有標簽或者只有部分標簽。偽標簽的目標是通過使用少量有標簽數據對未標記數據進行標簽估計,然后將這些估計標簽作為訓練數據的一部分,與真實標簽一起用于訓練模型。
為了擴充訓練數據集,提高模型泛化能力,在以上增廣數據訓練模型后,對 TCN 網絡預測的波阻抗數據進行偽標簽篩選,篩選出高質量偽標簽,利用篩選后的偽標簽數據進行數據增廣。具體流程如下。
(1)置信度計算:將預測波阻抗進行正演得到地震數據,并與真實地震數據進行對比計算均方誤差以及相關系數,定量評價偽標簽質量。
(2) 置信度閾值:本文采用的置信度閾值是MSE lt;0.01 ,PCCgt;0. 996。根據置信度閾值,篩選出置信度高于閾值的樣本作為高質量的偽標簽。
(3)人工審核:對生成的偽標簽進行人工審核,檢查其準確性和可靠性。這可以通過專業領域知識和經驗來判斷標簽的合理性,排除那些明顯錯誤的偽標簽。
(4)偽標簽增廣:對篩選合格的偽標簽進行 1. 2節所述的內插重采樣增廣。
本文基于數據增廣和偽標簽生成的波阻抗反演的流程如圖 8 所示。
4 實驗
4. 1 參數設置
本文實驗采用 Marmousi 模型數據訓練并測試本文網絡性能。整個模型共有 2720 道波阻抗數據,首先利用 30Hz 的 Ricker 子波進行正演合成地震記錄。然后均勻地從整個模型中抽取 20 道地震記錄和對應的波阻抗數據作為訓練數據集。最后利用全部 2720 組數據進行網絡的反演測試。在實驗中,均方誤差函數作為網絡的損失函數,定義為式(6)。采用 200 輪次和批次大小為 3 的網絡參數,學習率大小為 0. 001 并設置學習率衰減器逐漸減小學習率。所有的網絡都通過 Adam 優化器優化。
4. 2 方法對比
設置三組數據進行對照。 ① 無數據增廣和偽標簽,用傳統 TCN 網絡訓練模型并反演波阻抗剖面。 ② 對 20 道標簽數據做數據增廣,用增廣后訓練數據集訓練模型并反演波阻抗剖面。 ③ 對 20 道標簽數據做數據增廣,用增廣后訓練數據集訓練模型并反演波阻抗剖面;并篩選偽標簽做數據增廣,結合先前增廣后的訓練數據集訓練模型并反演波阻抗剖面。圖 9a 為真實波阻抗剖面圖,圖 9b、圖 9d、圖 9f 為上述三組實驗波阻抗剖面圖。圖 9 右側圖 9c、圖 9e、圖 9g 展示了上述三組對照組地震波阻抗差。
圖8 基于數據增廣和偽標簽生成的波阻抗反演流程

從圖 9 對應的反演結果及相對應的差剖面圖可直觀地看出,在相同的 20 道波阻抗數據作為標簽的條件下,相比前兩種方案,本文利用數據增廣以及偽標簽的方案反演出的波阻抗具有較高的精度。根據表 1 的定量評價結果可以看出,本文方案相比前兩種方案,MSE 分別降低了 0. 0239 和 0. 0049,PCC分 別 提 高 了 0. 0124 和 0. 0027, R2 分 別 提 高 了0. 0238 和 0. 0049,反映出通過增廣以及偽標簽生成的方法擴充訓練數據集能夠有效地提高反演的精度,實現少量標簽數據訓練出高性能的網絡模型,從而預測出較高精度的波阻抗剖面,證明了該方法的有效性。
4. 3 抗噪能力分析
在真實的勘探環境中,地震數據往往包含了不同程度的噪聲,而這些噪聲會直接影響反演結果,因此抗噪能力實驗是評估網絡質量必不可少的步驟。
表1 20 道地震波阻抗不同方案反演性能統計

為測試網絡模型對噪聲數據的適應能力,在原地震數據的基礎上分別加入信噪比(SNR)為 25、15、
5 dB 的高斯隨機噪聲進行與前文相同的反演測試,并與前文無噪聲條件下的反演結果進行對比。圖 10 展示了單道地震記錄加入不同強度噪聲的效果,可以清晰地看出不同的噪聲對地震數據的影響。圖 11 顯示不同噪聲條件下的反演結果。表 2 為不同噪聲條件下所得反演結果的定量評價。結合圖 11 和表 2,可以看出三種含噪聲反演結果與理想情況下的無噪聲反演結果具有極高的相似性,表明了本文反演方法具有較好的抗噪能力。
圖9 波阻抗反演結果(左)及其與真實波阻抗的相對差值(右)

表2 20 道地震波阻抗加噪反演性能統計

4. 4 不同標簽數據分布情況反演分析
在實際生產中由于多種因素的影響,比如地質條件、勘探成本和技術限制等,井資料的分布往往是不均勻的。將模型中 10 道標簽數據設置以下三種不同的分布:均勻分布和兩種隨機分布,分布情況如下圖 12 紅線所示。圖 12a 中標簽為均勻分布,圖 12c、圖 12e 中標簽為隨機分布,區別在于圖 12c 取到透鏡體且中間復雜斷層區域標簽較多;圖 12e 未取到透鏡體且中間復雜斷層區域標簽較少。對三種不同標簽分布情況進行波阻抗反演,反演結果如圖 12 和表 3所示,可以看出當復雜地質構造上標簽數據較多時,整體的反演結果越好,且三種不同的標簽分布情況都能夠反演出較為真實的波阻抗剖面,表明了本文方法在均勻和非均勻標簽分布情況下都有較好反演結果。
圖10 第1000 道地震記錄無噪聲和加入25、15、5 dB 噪聲效果對比

圖11 不同噪聲情況下波阻抗反演結果及其與真實波阻抗的相對差值

表3 10 道不同分布情況地震波阻抗反演性能統計

圖12 10 道不同標簽數據分布波阻抗反演結果(左)及其與真實波阻抗的相對差值(右)

5 實際數據應用
為了進一步驗證本文方法在實際數據應用中的可行性,將本文的方法應用于某工區實際資料。工區中共有 13 口井,所選測線(圖 13a)穿過 2 口井(W1、W2),包含 150 道檢波器,道號從 1750 到1900,縱向時間長度為 100ms 、采樣間隔為 1ms 。本次將 W3 設定為測試井,其余 12 口井作為訓練井,訓練井用作網絡標簽訓練預測模型,而測試井不參與模型的訓練,用來評估訓練好的模型性能。
首先對數據進行預處理。
(1)對井數據、地震數據做標準化處理。
(2)井震標定,構建時深關系;再從井旁地震道提取子波(圖 14)。然后對井數據進行增廣,并利用提取子波進行地震記錄的合成獲得大量具有相似特征趨勢的標簽數據訓練反演模塊中的網絡模型,訓練周期為 100,每個周期的批訓練量為 10。用訓練好的模型進行標簽的篩選,符合條件的偽標簽加入網絡訓練集進行網絡訓練。
最后,用訓練好的網絡模型對地震數據進行預測,得到反演結果(圖 13c)。圖 13 展示了實際地震數據剖面、無增廣的波阻抗反演剖面以及本文方法的波阻抗反演剖面效果對比。圖 15 為井 W3 處無增廣的反演波阻抗與有增廣的反演波阻抗以及驗證井波阻抗對比。無增廣反演波阻抗與 W3 井波阻抗的 MSE、PCC 和 R2 分 別 為 0. 3420、0. 8290 和0.6580 。有增廣的反演波阻抗與 W3 井波阻抗的MSE、PCC 和 R2 分別為 0.0610.0.9694 和 0. 9388。
從上述反演結果可知,與無增廣反演方法相比,本文反演方法預測的阻抗與真實的測井阻抗匹配度較高,且在無標記數據上仍能取得較高反演精度。

圖13 實際地震數據剖面(a)與無增廣的波阻抗反演剖面(b)、本文方法的波阻抗反演剖面(c)效果對比
圖14 提取地震子波

圖15 驗證井W3 處的無增廣以及增廣反演波阻抗與驗證井的波阻抗的對比

6 結束語
本文借鑒數據增廣的方法并結合偽標簽生成方法,提出了一種基于數據增廣和偽標簽生成的半監督地震波阻抗反演新方法。對少量有標簽數據進行數據增廣并篩選出高質量偽標簽后進行增廣,生成了大量用于反演網絡訓練的數據,通過 TCN 在時序數據建模上的優勢進行地震波阻抗反演。
通過多組 Marmousi 模型對比試驗,可以看出本文提出的方法只需 20 道波阻抗數據,就可以預測較高精度的反演結果,且具有較好的抗噪能力。減少到 10 道波阻抗數據且具有不同的分布情況依舊能得到較為真實的波阻抗剖面結果。
實測數據的反演結果表明,本文方法能貼合實際應用。實現了少量標簽數據條件下的波阻抗反演,且具有較高反演精度和穩定性,為少量標簽數據條件下的地震波阻抗反演提出了一種可靠的新方法。
參 考 文 獻
[1] 張向林, 陶果, 劉新茹. 油氣地球物理勘探技術進展 [J]. 地球物理學進展, 2006, 21(1): 143?151. ZHANG Xianglin, TAO Guo, LIU Xinru. Progress in oil geophysical exploration[J]. Progress in Geophy sics, 2006, 21(1): 143?151.
[2] 熊翥. 地層、巖性油氣藏地震勘探方法與技術[J]. 石 油地球物理勘探, 2012, 47(1): 1?18. XIONG Zhu. Seismic exploration for strati ? lithologic reservoirs[J]. Oil Geophysical Prospecting, 2012, 47(1): 1?18.
[ 3 ] PAN J, LI J, WANG H, et al. Research progress and trend of seismic prediction technology for deep and ultra ? deep carbonate reservoirs[J]. China Petroleum Exploration, 2020, 25(3): 156?166.
[4] RAY A K, CHOPRA S. Building more robust low frequency models for seismic impedance inversion[J]. First Break, 2016, 34(5): 47?52.
[5] 張永剛. 地震波阻抗反演技術的現狀和發展[J]. 石油 物探, 2002, 41(4): 385?390. ZHANG Yonggang. The present and future of wave impedance inversion technique[J]. Geophysical Pros? pecting for Petroleum, 2002, 41(4): 385?390.
[6] LI M, LI Y, WU N, et al. Desert seismic random noise reduction framework based on improved PSO SVM[J]. Acta Geodaetica et Geophysica, 2020, 55(1): 101?117.
[7] 譚鋒奇, 李洪奇, 許長福, 等. 基于聚類分析方法的 礫巖油藏儲層類型劃分[J]. 地球物理學進展, 2012, 27(1): 246?254. TAN Fengqi, LI Hongqi, XU Changfu, et al. Reser? voir classification of conglomerate reservoir based on clustering analysis method[J]. Progress in Geophysics, 2012, 27(1): 246?254.
[8] CALDERON ? MACIAS C, SEN M K. Geophysical interpretation by artificial neural systems: A feasibility study[C]. SEG Technical Program Expanded Ab? stracts, 1993: 254?257.
[9] LECUN Y, BENGIO Y, HINTON G. Deep learning [J]. Nature, 2015, 521(7553): 436?444.
[10] 盧宏濤, 張秦川 . 深度卷積神經網絡在計算機視覺 中的應用研究綜述[J]. 數據采集與處理, 2016, 31(1): 1?17. LU Hongtao, ZHANG Qinchuan. Applications of deep convolutional neural network in computer vision [J]. Journal of Data Acquisition and Processing, 2016, 31(1): 1?17.
[11] 侯一民, 周慧瓊, 王政一. 深度學習在語音識別中的 研 究 進 展 綜 述 [J]. 計 算 機 應 用 研 究 , 2017, 34(8): 2241?2246. HOU Yimin, ZHOU Huiqiong, WANG Zhengyi. Overview of speech recognition based on deep learning [J]. Application Research of Computers, 2017, 34(8): 2241?2246.
[12] 奚雪峰, 周國棟 . 面向自然語言處理的深度學習研 究[J]. 自動化學報, 2016, 42(10): 1445?1465. XI Xuefeng, ZHOU Guodong. A survey on deep learning for natural language processing[J]. Acta Auto? matica Sinica, 2016, 42(10): 1445?1465.
[13] XIONG W, JI X, MA Y, et al. Seismic fault detec? tion with convolutional neural network[J]. Geophysics, 2018, 83(5): O97?O103.
[14] WANG Y Q, WANG Q, LU W K, et al. Seismic impedance inversion based on cycle ? consistent genera? tive adversarial network[J]. Petroleum Science, 2022, 19(1): 147?161.
[15] 李海山, 楊午陽, 伍新明, 等. 基于深度學習的相對 地質時間體估計方法[J]. 石油地球物理勘探, 2023, 58(2): 277?284. LI Haishan, YANG Wuyang, WU Xinming, et al. Relative geological time volume estimation method based on deep learning[J]. Oil Geophysical Prospec ? ting, 2023, 58(2): 277?284.
[16] 翟曉巖, 高剛, 李勇根, 等. 融合注意力機制的二維 卷積神經網絡測井曲線重構方法[J]. 石油地球物理 勘探, 2023, 58(5): 1031?1041. ZHAI Xiaoyan, GAO Gang, LI Yonggen, et al. Re? construction method of logging curves by 2D convolu? tional neural network integrating attention mechanism [J]. Oil Geophysical Prospecting, 2023, 58(5): 1031? 1041.
[17] 趙明, 趙巖, 沈東皞, 等. 應用自適應注意力機制U? net 的地震數據高分辨處理[J]. 石油地球物理勘探, 2024, 59(4): 675?683. ZHAO Ming, ZHAO Yan, SHEN Donghao, et al. High ?resolution processing of seismic data using adap? tive attention mechanism U ? net[J]. Oil Geophysical Prospecting, 2024, 59(4): 675?683.
[18] 戴永壽, 孫家釗, 李泓浩, 等 . 一種改進 STGCN 的 深地時空域地震子波提取方法[J]. 石油物探, 2024, 63(6): 1111?1125,1137. DAI Yongshou, SUN Jiazhao, LI Honghao, et al. An improved STGCN method for extracting deep ? zone seismic wavelet in spatiotemporal domain[J]. Geophysical Prospecting for Petroleum, 2024, 63(6): 1111?1125,1137.
[19] 陳堯, 于四偉, 林榮智. 基于擴散概率模型的非均一 地震數據插值方法[J]. 煤田地質與勘探, 2024, 52(8): 177?186. CHEN Yao, YU Siwei, LIN Rongzhi. A non ? uni? form interpolation method for seismic data based on a diffusion probabilistic model[J]. Coal Geology amp; Ex? ploration, 2024, 52(8): 177?186.
[20] DAS V, POLLACK A, WOLLNER U, et al. Con? volutional neural network for seismic impedance inver? sion[J]. Geophysics, 2019, 84(6): R869?R880.
[21] ALFARRAJ M, ALREGIB G. Petrophysical pro ? perty estimation from seismic data using recurrent neu? ral networks[C]. SEG Technical Program Expanded Abstracts, 2018: 2141?2146.
[22] WU B, MENG D, WANG L, et al. Seismic impe ? dance inversion using fully convolutional residual net? work and transfer learning[J]. IEEE Geoscience and Remote Sensing Letters, 2020, 17(12): 2140?2144.
[23] WANG Y, ZONG J, WANG L, et al. Physics ? driven cycle network for seismic impedance inversion using conditional generative adversarial networks[J]. Journal of Geophysics and Engineering, 2023, 20(6): 1337?1347.
[24] MUSTAFA A, ALFARRAJ M, ALREGIB G. Esti? mation of acoustic impedance from seismic data using temporal convolutional network[C]. SEG Technical Program Expanded Abstracts, 2019, 38: 2554?2558.
[25] 劉雅芬, 鄭藝峰, 江鈴燚, 等. 深度半監督學習中偽 標簽方法綜述[J]. 計算機科學與探索, 2022, 16(6): 1279?1290. LIU Yafen, ZHENG Yifeng, JIANG Lingyi, et al. Survey on pseudo ? labeling methods in deep semi ? su? pervised learning[J]. Journal of Frontiers of Computer Science and Technology, 2022, 16(6): 1279?1290.
[26] 王宸章, 王彥飛, 白治經. 基于偽標簽方法的頁巖孔 隙語義分割網絡[J]. CT 理論與應用研究, 2025, 34(1): 89?98. WANG Chenzhang, WANG Yanfei, BAI Zhijing. Shale ? pore semantic segmentation network based on pseudo ? labeling[J]. Computerized Tomography Theory and Applications, 2025, 34(1): 89?98.
[27] WU H, PRASAD S. Semi ? supervised deep learning using pseudo labels for hyperspectral image classifica? tion[J]. IEEE Transactions on Image Processing, 2017, 27(3): 1259?1270.
[28] IGLESIAS G, TALAVERA E, GONZáLEZ ? PRIETO á, et al. Data augmentation techniques in time series domain: A survey and taxonomy[J]. Neural Computing and Applications, 2023, 35(14): 10123 ? 10145.
[29] SHORTEN C, KHOSHGOFTAAR T M. A survey on image data augmentation for deep learning[J]. Jour? nal of Big Data, 2019, 6(1): 1?48.
[30] 王水濤, 張思佳, 孫旭菲, 等. 融合偽標簽生成與數 據增強的多標簽文本分類[J/OL]. 哈爾濱理工大學 學報, 1?11 [2024?11?11]. WANG Shuitao, ZHANG Sijia, SUN Xufei, et al. Multi ? label text classification by fusing pseudo ? label generation and data augmentation[J/OL]. Journal of Harbin University of Science and Technology, 1 ? 11 [2024?11?11].
[31] 伊小蝶, 吳幫玉, 孟德林, 等. 數據增廣和主動學習 在波阻抗反演中的應用[J]. 石油地球物理勘探, 2021, 56(4): 707?715. YI Xiaodie, WU Bangyu, MENG Delin, et al. Appli? cation of data augmentation and active learning to seis? mic wave impedance inversion[J]. Oil Geophysical Prospecting, 2021, 56(4): 707?715.
[32] MCKINLEY S, LEVINE M. Cubic spline interpola? tion[J]. College of the Redwoods, 1998, 45(1): 1049? 1060.
[33] WANG Y. Frequencies of the Ricker wavelet[J]. Geophysics, 2015, 80(2): A31?A37.
[34] LEA C, VIDAL R, REITER A, et al. Temporal convolutional networks: A unified approach to action segmentation[C]. Computer Vision?ECCV 2016 Work? shops, 2016: 47?54.
[35] SHELHAMER E, LONG J, DARRELL T. Fully convolutional networks for semantic segmentation[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2017, 39(4): 640?651.
[36] SRIVASTAVA N, HINTON G, KRIZHEVSKY A, et al. Dropout: A simple way to prevent neural net? works from overfitting[J]. The Journal of Machine Learning Research, 2014, 15(1): 1929?1958.
[37] NAIR V, HINTON G E. Rectified linear units im ? prove restricted Boltzmann machines[C]. Proceedings of the 27th International Conference on Machine Learning, 2010: 807?814.
[38] PLEVRIS V, SOLORZANO G, BAKAS N P, et al. Investigation of performance metrics in regression analysis and machine learning ?based prediction models [C]. 8th European Congress on Computational Me ? thods in Applied Sciences and Engineering, 2022, 13: 1?40.
(本文編輯:石雙虎)
作 者 簡 介
程程 碩士研究生,2000 年生;2022 年獲武漢城市學院軟件工程專業學士學位;現在攻讀地質工程專業碩士學位,主要從事深度學習和儲層反演方面的學習和研究。
