何 旭 李忠偉 劉 昕 張 濤
(①中國石油大學(華東)計算機與通信工程學院,山東青島 266580; ②山東科技大學地質學院,山東青島266590)
測井數據是銜接巖心與地震資料的中間尺度信息,也是認識井點地質信息的主要途徑。從20世紀50年代提出測井相[1]的概念以來,如何準確而快速地識別測井相成為油藏地質研究的一項重要內容。早期測井相研究主要通過對比、分析測井曲線形態與錄井資料,確定沉積相或地層層序,是一種費時、費力的全人工分析模式[2]。隨著計算機技術尤其是人工智能的發展,使精準、快速、自動識別測井相成為可能,判別分析法、數理統計法、聚類分析法、模糊識別、曲線擬合、支持向量機和神經網絡等方法逐漸用于測井相識別與分析[3]。
Lim等[4]使用主成分分析和分層聚類分析方法定量分析測井曲線,取得了較好的效果; Sang等[5]應用非參數回歸結合多變量統計分析(主成分分析和判別分析)方法識別測井相并預測滲透率; Lim等[6]針對數據模糊問題,提出模糊邏輯和神經網絡結合方法,描述了測井相與儲層性質之間的非線性關系,并能夠預測孔隙度或滲透率; Tang等[7]利用概率神經網絡(PNN)方法分析測井相以精確地預測測井數據,模型預測精度達70%; 汪忠德等[8]提取測井資料中的對應特征建立標準模式樣本并使用反向傳播(BP)神經網絡分析建模。但是,上述由機器學習算法定量識別測井相的模型也存在許多不足:首先,特征提取繁瑣,需要將數據歸一化等操作,不同的歸一化方法對模型訓練結果也有影響,而且在識別測井相時還要調整數據維度;其次,泛化能力不足,由這種定量分析方法訓練得到的模型只適用于某地區或具相同沉積環境的地區。
近年來,隨著人工智能的發展,在圖像識別方面,許多深度學習模型表現出優異的性能,對某些數據集的處理水平已經超越人類[9-15]。從圖像角度識別測井相正是模仿人類基于測井曲線形態分類識別的工作流程,使用深度神經網絡模型可獲得較高的分類精度,這種使用曲線形態作為特征的模型泛化能力較強,廣泛用于識別不同沉積環境。
本文選用東海F氣田的砂質辮狀河三角洲的測井數據,基于測井曲線形態,選取自然伽馬(GR)數據作為訓練數據構建深度卷積神經網絡,并首次用于測井相識別,結合沉積微相與測井相對應表識別沉積微相。結果表明,本文提出的卷積神經網絡模型可有效識別測井相,在分類精度和模型泛化能力上優于其他算法。
自20世紀80年代提出卷積神經網絡(Convolutional Neural Network,CNN)并在手寫數字識別中取得了優異成果[16-17]。CNN的結構主要由輸入層、卷積層、池化層(也稱下采樣層)、全連接層和輸出層構成,卷積層與池化層相鄰構建,根據實際需要可以設置多個。
卷積層可視為由多個特征映射(Feature Map)組成,多個神經元組成特征映射,每個神經元通過卷積核(Kernel)與上層特征映射的一部分神經元相連。其中卷積核為一個隨機初始化的權值矩陣,其作用是與上一層計算得到的特征映射進行如下卷積操作
式中:n×n為卷積核大小;xi為區域內第i個像素點的輸入值;wi為對應的權值矩陣元素值;b為計算后加入的偏置;y為卷積運算結果。
卷積運算使用卷積核操作整個特征映射,可使權值共享,大大減少了網絡參數,這也是CNN的一大優勢。卷積結束使用激勵函數將y歸一化,作為下一層的輸入
x=f(y)
式中:f(·)是為激勵函數,有多種形式,在實際實驗中可以根據情況自行選擇;x是為激勵函數的輸出,也是下一層網絡的輸入值。
池化層也由多個特征映射組成,其特征映射與上一層是一一對應的[18]。以最大池化為例
yi=max{x1,x2,…,xn×n}
式中:x為池化區域的每個點的值;yi為從n×n個點中選取的最大值,也是池化操作的輸出。
池化操作降低了特征映射的分辨率,從而具有平移、旋轉不變形的特征[18],并且減少了神經元個數,從而降低了模型的復雜度,提高了泛化能力。
由于沉積旋回具有級次性,對測井相的探討必須建立在一個確定的尺度或地層單元上,本文采用多尺度小波變換劃分沉積單元,在此基礎上再識別多尺度測井相。小波變換是通過改進傅里葉變換得到的變換方法,通過信號的伸縮、平移在局部分析時間或空間頻率,并且能以不同尺度細化。由于小波變換具有優異的時頻局部化特點,被廣泛用于信號去噪。如,能夠抑制高頻噪聲,從而保護有用突變和尖峰信息。本文利用小波變換進行濾波,以保持測井曲線的突變段,在去除噪聲的同時不會丟失曲線的有效信息。
采用小波變換去噪分為兩個過程,即:首先對原始信號進行小波分解,然后再重構分解的信號。小波變換使用的函數各有不同,常用的小波函數有Harr、Daubechies、Symlets、Morlet、Gauss等。在選定一個母小波作為小波基時,將母小波經過尺度變化和位移得到一簇小波,該簇小波能夠表達一個信號,而得到一簇小波的過程就是多尺度小波變換過程。選用合適的小波函數和尺度處理測井曲線,可使測井曲線在整體趨勢上保持不變,但在細節上有所不同。
GR測井是對地層放射性的探測,其曲線變化可反映不同時間尺度的沉積環境變化,從而指示測井相和沉積相變化。經過分解后,GR曲線的地質意義發生變化,曲線本身已經不再反映泥質含量等與地層放射性密切相關的地質特征,GR曲線的垂向變化趨勢以及變化界面有效地指示沉積級次,從而劃分不同級次地層單元。
識別測井相的前提是準確劃分識別單元。陸相沉積類型復雜,在同一個地質時間單元內不同平面位置的地層可能存在較大的厚度差異,如何劃分、識別單元是一個難題;地下的沉積結構復雜多變,導致同一種沉積微相的測井相存在差異,對經驗豐富的解釋人員識別難度不大,但是對于計算機自動識別是嚴峻的挑戰。本文采用多尺度小波變換合理劃分識別單元,提出了深度CNN模型自動識別測井相的方法(圖1)。

圖1 深度CNN模型自動識別測井相基本框架
本文選用東海凹陷F氣田的砂質辮狀河三角洲沉積環境的測井數據作為研究對象。因為不同沉積環境的物源和水動力等條件存在差異,使測井曲線形態、特征不同,所以在實際測井解釋時,基于區塊的沉積環境劃分測井曲線形態很重要。GR響應能夠區分泥巖和砂巖,可反映垂向序列中砂巖和泥巖的相對含量,還可反映沉積環境、沉積韻律和沉積速率等地質特征,具有良好的指示性[19-20],其測井曲線形態可反映沉積相類型。
不同沉積環境的水動力和物源條件差異造成沉積特征差異,導致GR曲線形態差異。GR曲線形態主要有箱形、鐘形、漏斗形、齒形及其復合形態,復合形態是前幾種形態的組合。箱形反映了水動力條件穩定的快速堆積或者環境穩定的沉積;鐘形反映了水流能量逐漸減弱或物源供應逐漸減少的沉積環境;漏斗形與鐘形正好相反,反映了水動力變強或物源供應逐漸增多的沉積環境[19]。
本文選用四種GR曲線形態作為特征,將數值轉變為圖像形式。由于形態標定存在人為誤差,從不同井段的測井數據中選取無歧義的形態特征人工截取和標定(圖2),首先對圖像做標準化、添加噪聲、旋轉和轉灰度等處理,再對數據增強與擴充,最終建立訓練和測試數據集,共計4000余張圖片。

圖2 訓練數據集樣例
GR曲線是與深度有關的一串具有特定形態的數據,針對其具有特定形態這一特性,本文基于基本CNN結構,提出了基于CNN的測井相分類模型,主體結構如圖3所示。具體構建策略及解釋如下。
(1)輸入圖像像素為227×227,在第1層使用64個11×11的卷積核對輸入圖像做卷積運算,隨后使用激活函數ReLU激活每個點。ReLU函數為
f(x)=max(0,x)
式中F(x)是經過激活函數得到的新數值,其中x為該點數值。
激活函數有多種,一般使用飽和非線性函數,如Sigmoid或Tanh函數等(圖4),ReLU是不飽和非線性函數(圖5)。與Sigmoid和Tanh相比,ReLU在梯度下降時更容易求得一階導數,不易出現梯度消失或爆炸,還能加快收斂速度[21],所以本文選用ReLU作為激活函數。
(2)將經過一層卷積之后得到的特征映射作為池化層的輸入,第2層使用192個5×5的池化核對其進行池化操作。常用的池化方法有最大池化和平均池化,即分別取池化核部分中的最大值和所有值的平均值。本文針對所建數據集的特性,即整個圖片大部分為空白部分,真正有價值的特征區域占比很小,因此選用最大池化操作,充分利用其適用于分離稀疏特征的特點。

圖3 基于深度CNN的測井相分類模型主體結構

圖4 激活函數Sigmoid和Tanh

圖5 激活函數ReLU
(3)第3層和第5層為卷積層,分別使用384個和256個3×3的卷積核,隨后再用ReLU做激活處理;第4層使用256個3×3的池化核對特征映射進行最大池化處理;第6層將上述256個特征映射變換成長度為4096的特征向量;第7層對第6層的結果再進行一次全連接操作,同樣得到長度為4096的特征向量。
(4)本文在網絡中加入了Dropout、局部響應歸一化(Local Response Normalization,LRN)和L2正則化等策略。Dropout的原理是以一定概率隨機抑制神經元,使一部分神經元在訓練階段處于休眠狀態,不參加前向傳播和反向回饋過程,降低了網絡之間的連接性,從而提高了模型的魯棒性;LRN的作用是對局部神經元建立競爭機制,增強響應強烈的神經元效果,從而抑制反饋較小的神經元;L2范數是所有向量模的平方和的平方根,在CNN的目標函數中加入L2范數,在最小化過程中,會使L2范數也最小,而其中的參數為訓練時得到的卷積核的權值矩陣,這樣在最小化過程中權值矩陣中所有元素都更加趨近于0,最終使模型參數接近0,致使模型的泛化能力更強且計算速度更快。
在識別實際測井數據時,需要分割一段深度序列數據,并轉換為圖像形式由模型識別。由于GR的數據范圍為0~200(API),本文首先以120為閾值,找出大于120的極值點,將數據分割一次;接著以100為閾值,找出前述分割段之間大于100的極值,對數據進行二次分割;再以85為閾值,找出前述分割段之間大于85的極值,對數據進行三次分割;最后將這些數據段轉換成二維灰度圖像形式。
本文提出一種多尺度測井相單元劃分方法,經過分析對比實驗,選用Daubechies小波基對測井數據進行不同尺度的小波變換,使測井數據具有不同細節特征。本文選用Daubechies小波基作為小波基函數的原因為:本文的思想是將一維數據轉換為二維圖像進行識別,選用合適階數和分解層數的Daubechies小波可以保持曲線的整體趨勢,并且不會在識別大尺度測井相時造成不良影響;Daubechies小波支持尺度變換,可根據實際數據特征和識別精度自由變換尺度;Daubechies小波具有良好的正則性,使信號重構過程較為光滑。Daubechies小波基簡寫為dbN,N為小波的階數,N越大表示小波濾波器越長。db小波還能進行多層分解,分解層數越多表示信號分解次數越多。由不同階數和不同層數db小波的分解發現,選用db6小波4層分解和db4小波4層分解能有效地對本文數據進行降噪和濾波處理,同時不破壞GR曲線的主體形態與增減趨勢。圖6為原始數據與經過小波變換去噪、平滑處理數據。由圖可見:db6小波4層分解進一步擴大了尺度; db4小波4層分解使測井曲線在大體形態不變的情況下,過濾了同一深度范圍內GR曲線的細節,只保留了主要趨勢,從而合理地劃分、識別單元。

圖6 原始數據與經過小波變換去噪、平滑
為了驗證深度CNN測井相識別模型的有效性,對構建的測井相數據集進行實驗,并對比與傳統的分類算法(BP神經網絡、支持向量機(Support Vector Machine,SVM)和傳統CNN(不添加Dropout、LRU和L2正則化))的實驗結果(表1),證明深度CNN模型在測井相分類中性能更好。在訓練達到2000代時,傳統CNN模型已經出現過擬合情況,深度CNN模型達到最高準確率,表明模型具有良好的泛化能力。經過數據分割操作,使用本文提出的測井相識別方法識別某一段GR數據(圖7),可以看出,db6小波4層分解(圖7a)識別的測井相類型多于db4小波4層分解(圖7b),這是因為前者僅僅使用了降噪處理,處理數據基本與原始數據無異,后者使用濾波處理使對應同一深度段內識別的測井相與前者有差異,但兩者在大范圍內保持一致。
測井曲線形態從多個方面反映沉積特征,不同的測井曲線形態通常對應不同的沉積相。根據“沃爾索相律”可知,只有在橫向上成因相似或者相鄰發育的沉積相,才能在垂向上依次疊覆相鄰。根據具體的沉積環境,可以由特定測井曲線形態判別沉積微相。本文選用砂質辮狀河三角洲的GR數據,利用測井相判別沉積相。砂質辮狀河三角洲前緣的沉積微相主要為水下分流河道、分流間灣和河口壩(表2)。

表1 不同模型分類性能

圖7 模型識別結果(3212.7~3316.0m井段)

表2 沉積微相與測井曲線形態對應表
利用測井曲線形態與沉積微相的對應關系(表2),通過分析得到目標井段的沉積微相。圖8為A井部分模型分析與實際結果對比。由圖可見: 基于深度CNN的測井相識別模型與BP神經網絡、SVM算法識別結果差異較大; 對比沉積微相分析結果與取心分析結果表明,基于深度CNN的測井相識別模型具有較高的準確率和泛化能力,但是還會出現誤判,尤其是對于齒形與漏斗形、鐘形之間的識別,這是由于有些曲線對應的深度距離較小,存在歧義,使基于深度CNN的測井相識別模型不能準確地識別。

圖8 A井部分模型分析與實際結果對比(3966.6~4120.0m井段)
本文基于人工智能技術,提出了基于卷積神經網絡的多尺度測井相識別方法,利用L2范數、Dropout和LRN有效地限制了模型的復雜程度,提高了模型泛化能力,獲得了優于其他算法的97.87%的模型分類準確率,利用Daubechies小波劃分不同尺度的測井相單元,可便捷、高效地自動識別測井曲線形態。由于文中方法選用二維測井相圖像數據進行分類,無關具體數值,即結合研究區的沉積環境背景即可分析測井相,因此比經典方法的泛化能力更強。對比沉積微相與取心分析結果表明,文中方法具有較高的準確率和泛化能力。
尚需指出,卷積神經網絡模型作為有監督學習,受訓練數據影響很大,難以得到令人滿意的結果。因此,擴充數據集、區分相似數據是未來的研究方向。