閆星宇 顧漢明* 羅紅梅 閆有平
(①中國地質大學(武漢)地球物理與空間信息學院,湖北武漢430074; ②地球內部多尺度成像湖北省重點實驗室,湖北武漢430074;③中國石化勝利油田分公司勘探開發研究院,山東東營257015; ④中石化工程地球物理有限公司華北分公司,河南鄭州 450000)
地震相可以理解為沉積相在地震資料上反射特征的總和,為分析地質條件和預測油氣藏提供了參考。早期的地震相分析通常需要解釋人員根據專業知識與地區經驗,以人的視覺為基礎,通過地震波運動學幾何特征參數進行地震相識別[1-2]; 或是根據客觀的地震屬性[3],按一定的程序對地震相單元進行識別和作圖。這些傳統的地震相識別方法通常需要大量的人工操作,并且結果不可避免地受到一些主觀因素的影響。因此,有必要研究一種快速有效的地震相分類方法,減少地震資料解釋人員的人工操作。
近年來,深度學習技術在計算機視覺等領域取得了重大進展,基于地震資料解釋與計算機視覺間的相似性,許多學者使用能夠自動提取有用特征的卷積神經網絡(CNN)進行地震相的分類及預測。段玉順等[4]運用人工神經網絡分析技術對地震道波形及其反映的地質特征進行自動識別和分類; Jesper[5]使用VGG16網絡模型識別地震相; Zhao[6]使用編碼—解碼模型對小塊數據進行地震相分類;Lei等[7]使用了一種基于循環神經網絡的地震波形分類方法,對地震相進行分類; Qi等[8]將地震屬性與機器學習技術相結合,從而達到地震相預測的目的。這些用于地震相識別的CNN架構大多是在卷積層之后附加全連接層,只能進行圖像級別的地震相分類及預測,或是選擇局部窗口遍歷地震圖像上的每個像素以進行預測,精度有限且消耗大量的計算時間。因此,用于解決語義分割問題的全卷積神經網絡(FCN)開始被應用于地震資料智能解釋之中。
FCN模型全部采用卷積層結構。Wu等[9]、Shi等[10]首先將帶有跳躍連接結構的U-Net模型分別應用于斷層識別和鹽丘識別,結果表明基于圖像分割技術的U-Net模型對于疊后地震數據的目標檢測具有良好的效果。之后,Alaudah等[11]提出用一種弱監督學習方法預測地震相,可以大幅度地減少人工制作標簽數據的耗時,但其識別精度遠低于主流的強監督學習。Mukhopadhyay等[12]使用了基于貝葉斯SegNet模型的深度學習方法,能夠在識別地震相的同時評判預測結果的不確定性,但貝葉斯深度學習方法會消耗大量的計算時間,不適用于大型數據。Zhang等[13]使用了在圖像分割領域較先進的DeepLab v3+模型,對F3工區進行地震相識別并取得了良好的效果,但該網絡模型結構復雜,參數較多,更勝任具有大量訓練數據的復雜圖像分割任務,相較一些輕量級網絡模型而言泛化性較差。
上述圖像分割技術所用框架均基于FCN模型,在識別地震相時,雖然可以有效地提取地震相的邊緣、紋理等絕對特征,但忽略了存在于圖像中相鄰像素之間的約束關系,無法有效地處理場景之間的關系和全局信息。不同于識別鹽丘、斷層這類在地震剖面上與背景圍巖具有明顯差異的二分類目標,圖像分割技術在地震相識別中存在以下問題: ①地震相識別需要分類的種類較多,且不同地震相之間可能會存在相似的地震波場特征,僅根據視覺紋理特征難以區分; ②地震相分布遵循沉積規律,在縱向上具有一定的空間分布特征,判別地震相時,需要參考其所在空間位置,而上述網絡模型缺乏這種獲取空間先驗信息的能力; ③地震相的邊界往往是不同沉積層的交界,也是巖石礦物質逐漸轉變的過渡帶,模型對地震相邊界的識別結果具有較高的不確定性,這一方面會影響模型對邊界識別的效果,另一方面,現有地震相識別技術缺乏一個關于預測結果不確定性的評價體系。基于以上問題,本文提出一套適用于地震相識別和預測評價的深度學習方法。
本文對U-Net模型進行了改進,在網絡末端加入一種金字塔池化模塊(Pyramid Pooling Module,PPM),該模塊由多種不同尺度的卷積核組成,可以提取不同等級的特征信息,使模型能夠并行考慮多個接收域下的目標特征,獲取包含不同尺度、不同子區域間關系的分層信息,從而更綜合地考慮地震剖面各個深度上的全局空間信息。同時,對目標函數進行了改進,在交叉熵函數(用于評價每個像素點分類準確性)基礎上,添加了用于評價圖像分割效果的Dice指數,該指數衡量預測樣本與真實樣本之間的重疊程度。將兩部分函數通過加權組合在一起,一并更新梯度,既能保證地震相分類的正確性又能保證少數類地震相邊界刻畫的準確性。最后,針對現有深度學習技術缺乏對模型預測結果的不確定性分析的情形,本文提出用“預測信息熵”這一概念進行評估與可視化展現。
地震相的空間分布存在一定的規律,所以地震剖面上空間分布的先驗信息,對于地震相劃分起著至關重要的作用。傳統的卷積神經網絡因其結構所限,信息流動局限在當前像素周圍的局部區域中,對于獲取空間位置這種大范圍的上、下文信息和表達能力有限。為了彌補先驗信息的不足,本文選擇了一種適用于地震相分類識別的深度學習網絡模型——U-Net模型,該模型特有的跳躍結構能夠融合淺層與深層信息,在處理疊后地震數據目標識別問題時具有優秀的表現[9-10],且網絡結構相對簡單,參數較少,不易導致過擬合。因此,本次試驗選擇U-Net模型為基礎模型,并在末端加入一種能融合多尺度特征的PPM模塊[14],其具體結構如圖1所示。

圖1 用于地震相分類識別的全卷積神經網絡模型
圖1中每個立方體展示了輸入地震剖面在經過各層后輸出的特征圖的維度及尺寸。該網絡模型以U-Net模型[5]為框架,分為編碼和解碼兩部分。編碼部分每層包含卷積核尺寸為3×3的兩個卷積層以及池化核尺寸為2×2的一個最大池化層,輸入地震剖面在經過編碼部分每層的計算后,圖像尺寸逐層減半,通道數逐層翻倍直至1024; 解碼部分每層包含核尺寸為3×3的兩個卷積層及核尺寸為2×2的一個上采樣層,可將特征圖的尺寸還原到原始大小,并將通道數從1024依次壓縮到64。在深度神經網絡中,淺層網絡輸出的特征圖分辨率高,保留有更多細節信息;深層網絡學習輸出的特征則更加抽象,保留了更多語義信息。U-Net模型在解碼部分將網絡中具有相同尺寸的特征圖通過跳躍結構(藍色箭頭)進行連接,從而改善上采樣過程中信息不足的問題。
輸入地震剖面在經過U-Net模型的編碼—解碼過程后,提取出較為精確的地震相紋理特征。在深度神經網絡中,接收域的大小可以在一定程度上體現模型使用的上、下文信息量[14]。但U-Net等大多數網絡模型只能提取單一接收域大小的目標特征,這使網絡結構無法充分獲取重要的上、下文信息。因此,希望改進后的網絡能并行考慮多個接收域的目標特征,獲取包含不同尺度、不同子區域間關系的分層全局信息。
為了解決上述問題,本文在U-Net模型中添加了PPM模塊,即將之前提取的特征圖分別經過不同尺寸的平均池化層,輸出尺寸為1×1、2×2、3×3、6×6四個等級的特征圖,其中最粗糙的1×1平均池化是全局尺度的池化,其余層次的池化層會將特征圖劃分為不同子區域,并分別帶有不同程度的語義信息和邊緣精度信息,最終結合起來可展現較完整的空間信息。為了保證全局特征的權重,四個級別的特征圖經由1×1的卷積核將通道數分別降為原來的1/4,再分別通過上采樣獲得未池化前的尺寸,與未經過PPM模塊的特征圖合并在一起。在經過最終的卷積層后,輸出每一像素點上對應的地震相分類結果。
模型中所有的上采樣過程均采用雙線性插值。改進后的網絡模型在保證U-Net模型分類精度的基礎上,通過PPM模塊提取不同等級的特征信息,聚合了不同區域的上、下文信息,提高了模型獲取全局信息的能力。
在神經網絡的訓練中,能夠評估網絡性能的函數被稱為目標函數或損失函數。本文深度學習模型所處理的問題可以被看成一個逐像素點的地震圖像多分類任務。傳統的多分類問題一般使用多元交叉熵損失函數[15],但該損失函數是逐像素計算,不考慮鄰域的標簽,對于在數據中占比較少的地震相分割效果較差。因此,本文所用的目標函數在傳統多元交叉熵損失函數的基礎上加入了Dice指數損失函數[16],分別用于評價模型對每一像素點的分類效果與整體圖像分割效果。多元交叉熵(LCE)損失函數表達式為
(1)
式中:C為地震相的總類數;N為輸入地震剖面上所包含的像素點總數;yc,n為標簽數據,即實際地震剖面上第n個像素點是否為第c類地震相,若是則為1,不是則為0;zc,n為神經網絡最終輸出的結果,其物理意義可以理解為該點被預測為第c類地震相的可能性;pc,n是對zc,n進行softmax函數歸一化后的結果,使其值分布于0到1之間,更加符合概率的意義。
由式(1)可見,交叉熵損失函數將每一個像素點都視作獨立的存在,分別計算每個像素點的交叉熵并求和,這使該損失函數不能把握全局的信息,導致分割出來的地震相形狀與真實值差異較大,邊界分割效果較差。尤其被用于不均衡數據集的預測時,為了使交叉熵函數更容易達到最小值,模型會傾向于把最大的權重分給數量最多的類別,最終導致模型忽略占比較小的地震相特征。在實際地震剖面上,占比較小的地震相往往是鹽丘等異常體,數量雖少但尤為重要。因此,本文引入可以評價整體分割效果的Dice損失函數解決上述問題。Dice指數是一種集合相似度度量函數,可以體現兩個區域輪廓的相似程度,取值范圍為[0,1],表達式為
(2)
式中:A∩B為A和B之間的交集; |A|和|B|分別為A和B的元素的個數。用于地震相預測時,Dice損失函數可以寫作如下形式
(3)
式中ε為平滑值,本次研究取值為1,在防止分母為0的同時也可以防止模型的過擬合。
Dice損失函數通過計算分類概率圖和真實分割圖中所有像素點的誤差,最大程度地衡量兩者相似性,使預測結果與標簽盡可能重合。一方面減小不均衡數據對模型訓練的影響,另一方面有助于分割出來的地震相邊界變得相對清晰,且形狀與真實值相似,增強地震相邊界的分割效果。最終的目標函數Lloss為式(1)與式(3)的線性加權組合,即
Lloss=LCE+eLDice
(4)
式中e為Dice損失函數的權重。
實驗訓練數據選用北海F3工區公開數據。該工區位于荷蘭北部,發育大型河控三角洲體系。主測線從100 到700,共600條剖面,701道。從地震剖面上可以識別一些地震反射結構: 空白反射、雜亂反射、平行—亞平行反射、疊瓦狀反射等。測井資料顯示空白反射結構由巖性均一的砂巖或泥巖構成; 雜亂反射結構表示滑塌沉積; 斜坡沉積底部的疊瓦狀反射結構顯示為砂質濁積巖[17]。如圖2所示,參考F3工區測井資料對三維地震數據體進行人工地震相解釋,以此作為訓練數據的標簽,主要根據巖性差異對地震相進行分類。將工區數據體中的300到700號剖面作為訓練集; 100到299號剖面作為測試集,用于評估模型的預測效果。

圖2 F3工區訓練數據
現有的深度學習方法會對訓練數據進行翻轉、鏡像復制等數據增廣操作,以增加樣本的數量和多樣性,但這種方法應用于地震相數據時會破壞地震相原有的形態與空間分布規律。一方面,隨著地層深度的增加地震波會逐漸衰減,導致主頻降低;另一方面,一些本該出現在深層的地震相在經翻轉后會出現在淺層,從而違背地質沉積規律。因此,沿三維數據體的主測線、聯絡測線、SW-NE、NW-SE四個方向劃分出二維地震剖面,再在每一條地震剖面上選取尺寸為256×256大小的窗口,通過選取不同的重疊步長滑動截取所需的訓練數據,在保證遵循地震相空間分布規律的基礎上增加樣本的多樣性。為了加快目標函數收斂,對訓練數據中所有地震數據的振幅值進行標準化處理,使其值域在-1到1之間。本文在訓練集中共截取了3005組數據,標簽中共包含6類地震相,各類地震相出現概率歸一化后的分布情況如圖3所示。

圖3 訓練數據各地震相出現概率分布直方圖
由于各個地震相標簽的數值之間不存在連續性關系,所以在訓練前需將標簽數據轉化為獨熱編碼,以增強其稀疏性。對于地震剖面上第n個像素點,其獨熱編碼標簽yn可以用一個由0、1組成,大小為1×C的向量表示,即yn=[y1,n,…,yc,n,…,yC,n],若該點實際地震相為c,則對應yc,n的值為1,其余的值為 0。各類地震相標簽與對應的獨熱編碼如表1所示。

表1 地震相標簽與對應的獨熱編碼
為了對比評價改進前、后網絡模型與目標函數的效果,設計了一系列對比試驗。首先設置一組常規U-Net模型作為對照,為了保證對照模型的網絡層數與所含參數量級相同,常規U-Net網絡僅將改進后網絡的PPM部分替換為相同數量的卷積層。將訓練集中的地震數據和對應的地震相標簽分別成對輸入至兩組深度網絡模型中,進行正向傳播與反向傳播,計算網絡的損失函數值,更新網絡的可調整參數,并通過迭代訓練令損失函數值越來越小。當損失函數值降低到較小值并且基本不再變化時,說明該模型已經達到收斂。本次訓練采用Adam優化算法[18],學習率設置為1×10-4。改進目標函數中需要人工調試的參數只有Dice項的權重e,這里分別取0(即目標函數中不含Dice指數項)、0.01、0.05、0.10,損失函數值隨迭代次數的變化曲線對比如圖4所示。
從圖4可以看出,當迭代達到1300次后,各組模型的損失函數值均已收斂。且Dice指數項權重e大于0.05時,損失函數曲線振蕩越發劇烈,這是因為隨著e值的增大,目標函數中的Dice項逐漸主導收斂過程。式(3)對正向傳播的結果p的梯度可表示為2y2/(p+y)2,在某些情況下由于p過小或過大,計算得到的梯度值會產生劇烈波動,導致訓練不穩定,從而使訓練中的損失函數值產生震蕩。
對于輸入模型中進行地震相分類預測的地震剖面,深度神經網絡會對每個像素點計算出一個概率分布pn=[p1,n,…,pc,n,…,pC,n],分別對應n點為某類地震相的概率,從中選擇概率pc,n最大的那一類判斷為該點的預測地震相c。將訓練好的各組模型作用于測試集數據進行地震相預測,并將預測地震相分類結果與真實值比較,以評價模型效果。為了更加客觀、全面地評價不同參數及結構的各組模型在測試集數據上的表現,采用了準確率(PA)、類準確率(CA)、平均交并比(mIOU)三項指標進行評價。PA表示整個測試數據集中被正確分類的像素點與總像素點比值,用于評估模型整體預測效果,表達式為
(5)
式中:Yc表示在地震剖面上屬于第c類地震相的像素點集合;Pc表示被網絡模型預測為第c類地震相的像素點集合; 運算符|·|表示集合中的元素總數。

圖4 損失函數值隨迭代次數變化曲線
CAc表示第c類地震相在整個數據集中的預測準確率,用于評估模型對每一類地震相的預測效果
(6)
準確率指標是基于單獨的像素點計算分類的正確率,在評價圖像分割問題時,無法判斷全局的分割效果[12]。因此,本次研究通過計算mIOU指標來評估模型的表現。mIOU與Dice指數的作用相似,均用于衡量兩個集合的重疊程度
(7)
對于不同參數、結構的各組模型在測試集數據上的預測結果,分別用以上指標進行計算,其結果統計如表2所示。

表2 不同參數、結構網絡模型對地震相預測結果統計表
表2統計結果表明,加入PPM模塊后,網絡模型對于地震相預測準確率明顯高于常規U-Net模型;且無論是在常規網絡模型還是改進模型上,訓練時采用帶有Dice指數項的目標函數,預測效果均有一定提升,各項評價指標表明預測結果優于單一的交叉熵損失函數。在常規U-Net模型中,當目標函數中e取0.10時,模型對地震相分類預測的效果最好,準確率為91.61%,平均交并比為64.51%;在含有PPM模塊的網絡模型中,當目標函數中e取0.05時,模型的預測效果最好,準確率為94.74%,平均交并比為73.92%。另外,從統計結果可以看出,深度網絡模型在預測第5、第6類地震相時效果較差,而對于第1、第3類地震相有著較高的預測精度。其原因在于該工區訓練數據屬于典型的不均衡分類[19],訓練集中歸屬于第5、第6類地震相的像素點數量遠遠少于第1類和第3類(圖3)。在多元交叉熵損失函數的最優化過程中,網絡模型會更傾向于學習這些樣本數量較多的地震相特征。因此,網絡模型對于樣本數量較少的第5、第6類地震相的預測類準確率較低。而在目標函數中添加Dice指數項后,這些少數類地震相的預測準確率較之前有明顯的提高,配合帶有PPM模塊的網絡模型,其類準確率均達到了80%以上,且模型預測結果的平均交并比也有了一定提升。在測試集數據中選取Inline280剖面為例,改進前、后的模型及目標函數對該剖面預測結果如圖5所示。
常規U-Net模型對于地震相分類預測存在較多問題,如圖5c所示,剖面底部的地震相被錯誤劃分為第3類、第4類等一些存在于其他深度的地震相。這一方面是由于訓練集中這些地震相的樣本數量較少,因數據不均衡而導致的學習效果較差,另一方面則是因為模型缺乏依據上、下文推斷的能力,造成一些具有相似的弱振幅特征的地震相被錯誤地預測為第5類地震相。右下角的第6類地震相屬于鹽丘構造,數量較少但往往受到地震解釋人員的關注,在被準確識別的同時也需要準確刻畫其邊界。但傳統的交叉熵損失函數只能評估模型對于單個像素點的預測準確性,卻無法衡量地震相的分割形狀是否與實際接近,從而導致圖5c中鹽丘邊界刻畫效果較差。在U-Net模型的目標函數中添加e=0.10的Dice指數項后,模型對于鹽丘形狀有了較為準確的預測(圖5d),雖然預測結果仍存在部分地震相的錯誤分類,但對于鹽丘邊界的預測效果提升顯著。加入PPM模塊后的U-Net模型對于該剖面的地震相分類表現出良好的效果(圖5e),由于PPM模塊提升了模型獲取全局信息的能力,預測結果中基本不存在地震相在深度上的錯誤分布,但對于鹽丘邊界的預測效果依然不理想。在使用含有Dice指數項的改進目標函數后(e=0.05),預測的鹽丘形狀已十分接近真實值(圖5f),說明改進后的網絡模型與目標函數更適合于地震相的分類及預測。

圖5 Inline280剖面預測結果
不確定性評估對于人工神經網絡這類可解釋性較差的模型來說是十分重要的。對模型預測結果的不確定性分析有助于了解模型對于預測結果的“自信”程度。對于斷層識別等二分類問題,可以直接輸出一個二維的概率特征圖,并通過選定閾值調整想要的預測結果[10]。而地震相分類預測屬于多分類問題,網絡模型輸出結果是一個三維數組,對于每類地震相的預測概率難以可視化展現。另一方面,由于式(1)中softmax函數的性質,模型在訓練中為了盡可能地最小化目標函數,會盲目增大或減小模型輸出的結果zc,n,導致模型對于預測結果過于“自信”,使預測概率pc,n無法真實地展現模型對于預測結果的不確定性。
圖6為改進后模型對地震相預測結果分布。圖中,80%以上的預測結果概率pc,n分布在0.01以下和0.98以上,也就是說模型認為剖面上各像素點被預測為某類地震相的概率幾乎為100%。這樣的結果顯然過于“自信”,因而無法關注到那些在模型預測過程中模棱兩可的像素點,也使解釋人員無法對地震相分類預測模型結果的可靠性進行評估。為此,本文引入信息論中的信息熵[20]的概念,并提出運用預測信息熵對模型預測結果的不確定性進行評估。在信息論中,信息熵用于度量信息中隨機變量的確定性。在用于地震相預測模型中,地震剖面上第n個像素點處的預測信息熵En可表示為

圖6 改進后模型對地震相預測結果分布
(8)
預測信息熵越高,表示預測結果pc,n的概率分布越混亂,不確定性越高;反之則表示預測結果不確定性越低,可靠性越高。根據信息熵這一評價標準,可以對地震相預測結果的不確定性進行可視化,方便地震解釋人員對于模型不太確定的地方進行人工核實及修正。計算圖5e、圖5f兩組模型預測結果的信息熵,并與預測誤差進行對比,結果如圖7所示。

圖7 模型預測誤差與預測結果信息熵分布圖
從圖7a、圖7b可以進一步看出改進后模型對地震相預測結果具有較高的精度,除不同地震相交界處以外,幾乎不存在預測錯誤,且在使用含Dice指數項的目標函數后,模型對于剖面右下角鹽丘邊界處預測錯誤的像素點更少,結果更為準確。從圖7c、圖7d可以看出,地震相交界處預測信息熵較高,其值基本在0.7以上,且該處同樣存在較多的預測誤差。這是由于地震相的邊界往往是地質沉積過程中沉積層交界的區域,邊界附近的巖石巖性與物質成分是逐漸過渡變化的,因此,在地震相分類預測中,這些交界部分的預測準確率較低。將預測誤差與預測信息熵進行對比,發現模型預測錯誤的像素點具有較高的信息熵,即該處模型預測結果的可靠性較低,如此便能較好地評估模型預測結果的不確定性。在使用改進網絡模型對該剖面進行地震相分類預測的結果中,當某處En低于0.8時,表示模型對該處預測結果較為“自信”; 當En高于0.8時,就可認為該處預測不準確,需要解釋人員進行核實與修正。
地震剖面上全局空間分布的先驗信息對于地震相劃分有著非常重要的作用,而現有基于深度學習方法的地震相識別模型缺乏獲取空間先驗信息的能力,且缺乏一個對于模型預測結果的不確定性進行評估的指標。針對這些問題,采用在U-Net模型中加入PPM模塊,使模型能夠獲取多個接收域下的特征,從而學習到地震剖面上包含不同尺度、不同子區域間關系的分層全局信息。使用一種綜合交叉熵與Dice指數的目標函數改善不均衡數據中少數類地震相邊界刻畫問題。提出用預測信息熵分析模型的不確定性。將該方法應用于F3工區海上地震數據地震相預測,實驗結果表明:
(1)加入PPM模塊后,網絡模型對該工區地震相識別準確率有了明顯提高; 使用融合了Dice指數的新目標函數后,對于少數類地震相預測結果有了一定提升,可使地震相邊界刻畫獲得更為良好的效果。
(2)預測信息熵這一指標能較好地評價地震相預測模型的不確定性,對預測結果的可靠性進行可視化展現。預測信息熵越低,模型對該處預測結果的不確定性越低,表明預測結果越可靠。在實際地震資料解釋中,解釋人員可以通過選定預測信息熵的閾值對模型預測結果進行修正。
本文的深度網絡模型采用Facebook公司的Pytorch平臺搭建,使用的所有訓練數據與代碼開源在https://github.com/yxycug/Seismic-Facies-clas-sification。