李克文 蘇兆鑫 王興謀 朱劍兵
1(中國石油大學(華東)計算機與通信工程學院 山東 青島 266580) 2(中國石化勝利油田分公司 山東 東營 257022)
隨著我國油氣勘探技術的不斷提升,中、淺層大型背斜等構造油氣藏的勘探數量逐漸減少,原油產量逐漸降低,勘探向更深、更隱蔽的儲層發展。儲層預測對油氣勘探工作顯得愈加重要。
深度學習作為近年來興起的一類機器學習算法,已經在儲層預測與巖性識別等工作上有了一定的應用。楊柳青等[1]使用卷積神經網絡[2]建立測井參數與孔隙度之間的非線性映射關系。安鵬等[3]使用自然伽馬(GR)等測井數據作為深層網絡的輸入進行巖性預測,取得了較好效果。項云飛等[4]結合多元線性回歸與神經網絡建立了儲層參數預測模型,得到了比單模型更好的效果。然而現有方法大多使用測井參數作為輸入數據,得出的模型無法在未打井的區域使用。
地震屬性是地震勘探中得到的地震波數據,在一定程度上包含了對地下構造的響應,并且具有較高橫向分辨率。地震屬性種類高達百種。特征維度高但樣本量稀少的數據容易產生“維數災難”與“過擬合”問題。隨著維度增加,還有可能造成學習性能的下降[5-6],特征選擇是解決這一問題的有效手段。特征選擇主要是尋找信息最豐富的特征來構造特征子集,從而在較低的維數上保持原始數據的固有結構[7-8],并不改變變量的原始表示,而只是選擇其中的最優或次優的一個子集,保留了變量的原始意義。現有的特征選擇方法一般分為過濾式、包裹式和嵌入式。神經網絡也已經被應用于特征選擇領域[9-12]。使用稀疏誘導正則化技術結合神經網絡,在網絡訓練過程中進行特征選擇已經有了諸多研究。基于L1范數懲罰的最小絕對收縮選擇算子(Lasso)方法是中常見的稀疏性特征選擇方法。在此之上,L1/2與Group Lasso等更多改進的正則方法也被用于特征選擇[1,4,12]。
本文提出使用平滑的L1/2正則項結合神經網絡的特征選擇方法,進一步將輸入層權值與ReLU函數結合構建特征選擇層,加入到神經網絡模型中,實現網絡訓練過程中輸入層的稀疏化,進而實現特征的自動剔除與選擇。使用此方法進行多種地震屬性的特征選擇,并構建基于DenseNet與SENet的儲層預測模型提取并組織東營埕島某區塊的地震屬性數據,通過與常規機器學習方法對比,驗證了深度學習模型與特征選擇層的有效性。


圖1 單隱層的全連接BP網絡

(1)
以文獻[13]提出的方法為例,將Lasso懲罰項集成到網絡的輸入層中,損失函數變為:

(2)

(3)
(4)
除了Lasso正則懲罰項,L2正則項更加光滑但不具有稀疏性,L1/2是近年來較為流行的一種正則項方法,具有更好的稀疏性和剪枝能力,但其非凸性、非光滑性使神經網絡訓練過程易于出現數值振蕩現象[14]。將L1/2正則項加在輸入層上時,懲罰項變為:
(5)
由于帶有L1/2正則項的誤差函數在原點處不可微,所以當權重向量接近原點時,使用平滑的函數代替L1/2正則懲罰,其平滑函數表達式為:
(6)
式中:α為一個小的常數。此時損失函數變為:

(7)
使用此方法訓練神經網絡模型,當模型精度不在提升時,提取每一個輸入節點對應的連接權值的L1范數wn=(wn1,wn2,…,wnm),組成與輸入層大小一致的向量W=(wnm)N×M=(w1,w2,…,wN),此向量則是經過正則項懲罰的神經網絡訓練后得到的每一個輸入特征對應的稀疏權值。
將此向量與輸入層相乘,起到了對輸入特征的縮放效果,接著在后面繼續加上ReLU[15]激活函數,構成特征選擇層。ReLU函數對特征集合進行截斷,偏置b為特征選擇的閾值。考慮到輸入特征權重已經變化,故重新訓練神經網絡,網絡在優化w和b的同時,起到了對輸入特征自適應選擇的效果。工作過程如圖2所示。

圖2 ReLU函數對特征集合的截斷過程
使用此方法進行特征選擇可根據網絡模型進行適配,在模型的訓練過程中自動進行特征的剔除,簡化網絡結構,是一種對神經網絡通用的方法。
不同地震屬性之間數值差異巨大,首先對地震數據進行歸一化處理,在模型首端加入特征選擇層進行輸入層的稀疏化,而后基于DenseNet[16]的連接思想與SENet[17]的通道關聯思想構建網絡模型。
ResNet(Residual Neural Network)使用恒等連接的思想大大加深了網絡的深度,并且極大地緩解了網絡加深帶來的退化問題[18]。這種短路連接的思想影響了許多網絡模型,也成為加深網絡的常用手段。DenseNet則將這種連接應用到了整個塊結構上,將所有層直接相互連接,對于每一層,它前面所有層的特征圖都當作輸入,而其本身的特征圖作為所有后面層的輸入,確保網絡中各層之間的最大信息流。這種結構可以緩解梯度消失問題,加強特征在整個網絡的傳播,并加強了特征重用。DenseNet的結構如圖3所示。

圖3 DenseNet塊結構
SENet(Squeeze-and-Excitation Networks)可以顯式地建模通道之間的相互依賴關系,自適應地重新校準通道方向的特征響應[17]。它的主要操作有兩個:擠壓(Squeeze)和激活(Excitation),Squeeze將每個二維的特征通道變成一個實數,這個實數某種程度上具有全局的感受野,它表征著在特征通道上響應的全局分布。而Excitation類似于LSTM網絡中的門控機制,為特征通道生成權重,顯式地建模特征通道間的相關性。最后通過scale操作使用得到的權重對原特征圖進行縮放。SENet主要結構如圖4所示[17]。

圖4 SENet主要結構
2.2.1Squeeze操作
為了挖掘通道之間依賴關系,利用一個全局平均池化操作來生成通道級別的統計數據。Squeeze操作的計算式表示為:
(8)
式中:uc表示輸入特征圖的一道,H與W為特征圖的維度;zc∈Rc表示Squeeze操作后得到的該道的統計數據。
2.2.2Excitation操作
Excitation的目的是構建通道統計數據之間的依賴關系,為了限制模型復雜性使用了兩個具有減速比r的全連接層,然后使用ReLU激活函數得到通道級別的權重。Excitation操作計算式為:
s=Fex(z,W)=σ(g(z,W))=σ(W1δ(W2z))
(9)

(10)
模型使用原始振幅、平方根振幅、瞬時相位和瞬時頻率等49個疊后地震屬性,組成大小為7×7的輸入層,加上與此尺度對應的特征選擇層。模型的中間部分為堆疊的Dense_SE_block結構,如圖5所示,每個卷積層使用3×3大小的卷積核,并使用Squeeze與Excitation操作融合通道間特征,使用elu[19]激活函數,在卷積層與激活函數之間加BatchNormalization層,可有效地防止梯度消失。以每五個特征圖為單位,堆疊DenseNet結構,特征圖之間兩兩相連,每一個特征圖接收之前的特征,同時也向后面所有的特征層傳播,使的每一個特征在網絡中得到最的保留,網絡靠前的特征也可以被靠后的部分使用到。
網絡使用特征選擇層后接若干個Dense_SE_block疊加的形式,Dense_SE_block個數根據模型性能進行調整,最后加三個全連接層與Sigmoid層進行砂巖、泥巖二分類。使用adam算法進行網絡訓練,整個流程如圖6所示。

圖6 儲層預測模型訓練過程
以東營埕島區塊作為研究對象,提取SEGY地震數據體、測井巖性數據、時深轉換數據以及層位信息等。使用原始振幅、平方根振幅、瞬時相位、瞬時頻率等49個疊后地震屬性作為網絡輸入,以及對應的經過時深轉換匹配后的井上巖性數據作為標記。共得到45 450個樣本數據,以6 ∶2 ∶2的比例劃分訓練集、驗證集與預測集。
3.1.1地震屬性處理
根據地震數據采集時的地理坐標位置以及inline和cdp的范圍,計算segy文件中每一道數據所在位置,雙程旅行時范圍為1 025,inline范圍為627至2 267,cdp范圍為1 189至1 852。由于每一種屬性數值范圍差別巨大,所以對數據進行歸一化處理,其計算公式為:
(11)
3.1.2巖性標記處理


表1 巖性列表
神經網絡模型使用8個Dense_SE_block塊與特征選擇層構成的網絡,對比方法分別為沒有特征選擇層的網絡以及常規機器學習算法,包括決策樹算法、KNN算法、XgBoost算法。網絡模型取測試集準確率最高時的結果,其他方法采用十折交叉驗證結果。各方法的準確率、查準率、查全率如表2與表3所示。

表2 各方法訓練集效果(%)

表3 各方法預測集效果(%)
由表2和表3可見,本文提出的Dense_SE_net卷積神經網絡模型在預測集準確率、查準率均高于常規機器學習算法,并且使用特征選擇的神經網絡模型比不帶特征選擇層的模型具有更高的預測集準確率,同時訓練集準確率幾乎相當,證明了特征選擇對于模型性能的提升,并有一定程度抑制過擬合的作用。FS_Dense_SE_net模型的預測集準確率可達到72.95%,在所有預測結果為砂巖的樣本中,有66.83%的樣本預測正確,所有真實砂巖樣本中有55.95%預測正確。
使用FS_Dense_SE_net模型對井CB11、CB111進行巖性預測,結果分別如圖7至圖10所示,左圖為預測結果,右圖為真實情況,縱坐標為雙程旅行時,黑色部分為砂巖,其余部分為泥巖。在砂巖密集的井CB11與砂巖稀疏的井CB111均取得了較好結果。

圖9 CB111預測情況 圖10 CB111真實情況
使用FS_Dense_SE_net模型進行地下縱向切片巖性預測,取主測線inline為1 328,共深度道集CDP為1 189到1 852的數據進行砂巖標記成像,結果如圖11所示。

圖11 inline=1 328巖性預測結果
本文提出了一種使用正則懲罰進行網絡稀疏化的特征選擇方法,以及一種結合此方法的使用DenseNet與SENet結構的儲層預測模型。使用平滑改進的L1/2正則對網絡輸入層的權值進行稀疏化,當模型不再收斂時得到輸入層每個節點對應的連接權值的范數,以此作為每個輸入特征的權重。使用ReLU函數在進一步的訓練中對部分低權值特征進行截斷,進而實現網絡訓練過程中的自動特征選擇。結合此方法,提出了基于DenseNet短連接與SENet通道連接思想的神經網絡儲層預測模型。使用勝利油田埕北某工區的地震屬性數據與巖性數據進行模型的訓練與驗證,驗證了深度學習模型相比傳統機器學習算法在該問題的優越性與本文提出的特征選擇方法的有效性。