999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于混合網絡U-SegNet的地震初至自動拾取

2020-12-08 10:43:04陳德武楊午陽魏新建李海山常德寬
石油地球物理勘探 2020年6期
關鍵詞:模型

陳德武 楊午陽 魏新建 李海山 常德寬 李 冬

(中國石油勘探開發研究院西北分院,甘肅蘭州 730020)

0 引言

在地震勘探中,初至拾取要求盡可能準確地確定地震道中初至出現的時刻[1],是靜校正、層析成像等處理的前提,初至拾取精度在很大程度上影響后續處理精度[2]。近年來,隨著“兩寬一高”地震采集技術的普及,炮、檢密度越來越大,采集數據達到PB數量級,并且地表向復雜山地、巨厚黃土塬等延伸,導致采集資料信噪比較低,初至不明顯。如果采用人工拾取方式,工作量大,拾取效率低,容易引入系統的人為誤差[3-4]。如何快速、精確地拾取海量低信噪比數據的初至,是亟需解決的一個關鍵問題。

過去幾十年,業界提出了許多初至拾取方法,目前使用較多的是基于地震信號瞬時特征的方法[5],有能量比法、相關法、圖像處理法、分形維法、神經網絡法等。能量比法[6-7]就是計算初至上、下時窗的能量比,該方法簡單、計算效率高,但對于低信噪比數據拾取精度較低。由于能量比法選取了初至附近的兩個時窗,很難確定真正的起跳時間[8-9]。相關法[4,10]雖然初至拾取精度較高,但相鄰道互相關計算的復雜度較高,對于鄰近道為干擾道或空道的情況無能為力。圖像處理法[11-12]將地震記錄轉化為灰度圖,使用邊緣檢測法檢測初至位置,并基于邊緣追蹤技術追蹤初至波。該方法需要將地震記錄轉化為圖像,拾取初至后又要將初至位置映射到地震記錄,不易大規模應用。分形維法[13-14]通過分析分形維數隨時間的變化自動拾取初至,只能適用于信噪比較高、初至起跳明顯且初至振幅與初至前、后的振幅有較大差異的地震記錄,計算的穩定性和可靠性不高。傳統的神經網絡法[2,15-16]由于網絡層數有限,也不易提取相鄰道的空間特征信息,拾取精度不高。

近年來,以深度學習為代表的人工智能技術在計算機視覺、自然語言處理、語音識別等領域廣泛使用。深度學習通過構建具有多個隱藏層的網絡模型和海量數據挖掘數據深層特征[17],從而更好地發現數據的有效特征表示。人們也將深度學習技術應用于初至拾取中,取得了一些研究進展。Yuan等[18]利用卷積連接方式的優勢,首次將卷積神經網絡(一種卷積連接和全連接方式的組合網絡結構)應用于地震初至拾取。使用滑動窗方式提取時空振幅制作標簽,規避了屬性提取、屬性選擇,也極大減小了數據預處理工作量。由于仍采用全連接網絡進行分類,且標簽只有初至和非初至,因此網絡結構不宜太深,在面對復雜地表或復雜問題時可能精度有限。劉佳楠等[19]提出了基于全卷積神經網絡拾取地震初至的方法,但該方法的訓練樣本尺寸較大,訓練時占用的內存空間和計算資源較多,使用手工標注訓練數據的標簽,消耗了大量人力。丁建群等[20]提出基于U-Net網絡的地震初至拾取方法,但該方法的神經網絡模型基于圖像訓練,無法大規模應用。王君等[21]、帥威等[22]和浦義濤等[23]基于深度殘差網絡拾取地震初至及其軟件開發,由于采用152層的深度殘差網絡,且對原始地震數據做線性動校正和反線性動校正處理,訓練和應用效率較低。

為了克服上述方法的缺點,本文首先提出了一種快速制作初至拾取訓練數據集的方法,并研發了相應的軟件模塊,然后提出一種基于U-Net和SegNet混合網絡的地震初至自動拾取方法,最后用實際數據進行了測試。

1 基本原理

初至拾取的本質是要確定地震道上純噪聲和噪聲與地震疊加信號之間的分界時刻[24],非常適合用圖像分割算法確定該時刻,即初至位置。在深度學習中,常用的圖像分割網絡結構基于全卷積網絡(FCN)的改進型(U-Net和SegNet),將它們應用于地震初至拾取就是實現從地震數據到初至起跳分界時刻端到端的映射。

U-Net是一個基于卷積神經網絡的圖像分割網絡,因其在遙感圖像及醫學領域的良好應用效果,獲得了廣泛的研究和應用[20]。該網絡結構呈U型對稱(圖1)[25],在編碼器和解碼器對稱的層提供跳躍連接,可以使解碼過程拼接編碼過程對稱層的特征向量,避免了解碼器直接在高級特征圖中進行監督和計算損失函數值,而是結合低層特征圖中的特征,使最終特征圖中既包含高層特征,也包含很多低層特征,以實現不同尺度下的特征融合,從而提高網絡模型圖像分割精度。然而,由于上采樣過程是反卷積操作,U-Net需要學習更多的參數,訓練相對較慢[26]。

SegNet被設計成一個用于像素級語義分割的核心分割引擎[27],解決端到端的二分類和多分類問題(圖2)。SegNet的核心在于其上采樣的方法,編SegNet由一個編碼器網絡、一個相應的解碼器網絡以及一個逐像素分類層組成[27]。編碼器網絡從原始圖像分層學習視覺特征,解碼器網絡逐步將編碼特征上采樣映射到像素級分類輸出的概率矩陣[29]碼器網絡池化時記錄最大值的位置,解碼器網絡反池化時將輸入值直接賦給記錄位置,其他位置值置零,這樣不會損失圖元的輪廓細節,更利于圖像分割。由于SegNet將池化索引傳遞給上采樣層,需要更少的參數,訓練更快[28]。

圖2 SegNet結構圖

本文提出了一種U-Net和SegNet混合網絡結構,命名為U-SegNet。U-SegNet以SegNet結構為基礎,通過在解碼器網絡反卷積層之前融合跳躍連接信息,提供編碼器網絡的多尺度信息,以獲得更好的性能,并且其上采樣操作將U-Net中的反卷積改為反池化,池化索引被傳遞到上采樣層,網絡模型收斂更快。因此,U-SegNet網絡結構更利于分割背景噪聲區域和含噪信號區域,從而提高初至拾取精度。基于U-SegNet網絡結構的初至拾取,可用輸入炮集樣本S與最終初至上、下范圍分割概率矩陣M之間的一個非線性映射表示為

M=USNs(S,m)

(1)

式中USNs(·)表示U-SegNet網絡結構,m為USNs(·)的權重或偏置參數。

2 方法流程

基于U-SegNet的初至自動拾取流程包括制作訓練數據集、設計網絡模型、訓練網絡模型、測試網絡模型和實際資料應用。

2.1 制作訓練數據集

為了克服以往神經網絡初至拾取方法中人工標注標簽耗時、費力的缺點,本文提出并編程實現了一系列在單炮記錄和標簽數據顯示中自動聯動或單獨拾取訓練樣本及標簽的方法,包括手動拾取、定位拾取、自動拾取。自動拾取方式又分為沿直線固定步長拾取(圖3)、沿曲線固定步長拾取(圖4)和矩形固定步長采樣拾取(圖5),并形成了訓練數據集制作軟件SeismicNetV1.0。為了方便后續網絡模型的測試和應用,該軟件將每個樣本和標簽以全局唯一標識符命名,在指定的磁盤目錄下保存為占用存儲空間較小的二進制文件以及JPG格式圖片文件,并且將它們的文件名、文件路徑、道方向長度、時間方向采樣點數、中心點的道序號和時間等信息存儲到數據庫。

圖3 沿直線固定步長拾取訓練數據

圖4 沿曲線固定步長拾取訓練數據

圖5 矩形固定步長采樣拾取訓練數據

訓練及測試數據來自四川三維工區A,該區地表條件復雜,低降速帶巖性變化較大,很多排列的遠炮檢距道初至不明顯。制作訓練數據集過程如下。

(1)使用某商業軟件拾取炮集數據的初至,人工修正未能拾取或拾取精度不高的初至,導出文本格式的初至文件。

(2)根據初至文件中的初至標注SEG-Y標簽文件,標簽文件道數和采樣點數與炮集數據文件相同,其中初至時間以上樣點值寫為0,初至及以下樣點值寫為1。

(3)利用原始炮集數據和加噪炮集數據分別制作訓練數據集,并將其合并為最終的訓練數據集,具體為:

1)將原始炮集數據文件、標簽文件導入SeismicNet軟件中,設置樣本大小為80×160(80道、160個采樣點),以矩形固定步長采樣方式在不同單炮最小至最大初至范圍內拾取10000個樣本及對應標簽,保存為10000對二進制文件。

2)首先對原始炮集數據使用

(2)

添加噪聲。式中:Ar為原始炮集數據采樣點振幅;An為加噪炮集數據采樣點振幅;Amax為以當前道為中心道的99道數據的最大振幅;Amin為以當前道為中心道的99道數據的最小振幅。然后利用拾取原始炮集訓練數據的方式,從加噪炮集數據文件與標簽數據文件中以矩形固定步長采樣方式拾取5000對加噪訓練樣本及其標簽,保存為5000對二進制文件(圖6)。

圖6 由加噪炮集數據中拾取訓練數據

3)合并兩種數據源制作的訓練數據集作為最終的訓練數據集,訓練數據集中初至樣本占該區炮集數據初至的29%。

采用矩形固定步長采樣方式拾取的樣本千差萬別,包含面波和各種隨機噪聲; 沿理論初至曲線拾取的樣本只體現初至附近的特征。因此前者拾取的訓練數據集泛化能力更強,并且制作的訓練數據集具有以下優點: ①拾取訓練樣本大小為80×160,較前人采用的256×4096訓練樣本[19]的網絡模型訓練和應用效率更高; ②直接在原始炮集數據中拾取訓練樣本,無需對原始炮集進行各種預處理,如線性動校正、自動增益控制、高斯濾波等,制作訓練數據集和測試應用較前人方法[20-21]更高效。

2.2 設計網絡模型

本文結合U-Net和SegNet網絡結構,搭建了U-SegNet_5layer(圖7)和U-SegNet_4layer(圖8)網絡結構。U-SegNet_5layer網絡結構的編碼器部分(左邊)和解碼器部分(右邊)都包含5層。U-SegNet_4layer的網絡結構與U-SegNet_5layer相似,但比后者少了最底部一層。

圖7 U-SegNet_5layer網絡結構

圖8 U-SegNet_4layer網絡結構

編碼器部分每一層首先對輸入原始樣本或特征圖進行2~3次卷積+批標準化+Relu激活操作,然后對特征圖進行最大池化操作,實現下采樣。第一層到第二層之間最大池化核大小為1×2,使特征圖的尺寸由80×160變為80×80,其余的最大池化核大小均為2×2,道方向和樣點方向都減半,到最后一層特征圖大小變為10×10。每次最大池化操作都保存最大值的位置。解碼器部分每一層首先對輸入的特征圖進行反最大池化操作,實現上采樣。反最大池化過程中讀取編碼器部分對稱層所保存的最大值位置,將對應的位置賦值,其他位置值置0;然后將反最大池化結果和編碼器部分對稱層的最后輸出拼接;最后進行2~3次反卷積+批標準化+Relu激活操作。最終解碼器的輸出特征圖大小為80×160,個數為32,對其進行卷積核大小為1×1、核數為1的卷積和Sigmoid激活處理最終網絡輸出一張大小為80×160的、以0~1概率表示的分割結果圖。Sigmoid激活函數為

(3)

式中:pv,n為第v個樣本、第n個采樣點的概率值;xv,n為第v個樣本、第n個采樣點通過U-SegNet解碼器的輸出值。

2.3 訓練網絡模型

訓練和測試應用網絡模型的軟、硬件環境為: Windows 10操作系統PC機(12核Intel酷睿i7-8700 CPU,主頻為3.2GHz,內存為8GB),深度學習平臺為Tensorflow 1.14.0。

將制作的訓練數據集以98∶1∶1的比例劃分為訓練集、驗證集和測試集,對應的樣本數分別為14700、150和150。訓練過程使用小批量梯度下降法,在保證不發生內存溢出的情況下,盡可能大地設置批次大小,可以有效地覆蓋訓練集和測試集損失函數的尖銳極小值,從而避免損失函數極小值導致的較差泛化[30]。在訓練中批次大小設置為60,每輪迭代245次,并用驗證集驗證1次。

由于網絡模型分割的背景噪聲區域和初至及以下區域,在標簽數據中分別用0和1表示,所以損失函數采用二元交叉熵函數(Binary Cross-Entropy)并將其最小化,該損失函數具有信息論解釋基礎、良好的數理表現和優越的性質[31]。某個訓練樣本的二元交叉熵損失函數為[26]

(4)

《數據庫維護與編程》是計算機科學與技術、軟件工程等計算機類專業的核心課程之一,實踐性和操作性都很強。數據庫技術是管理信息系統、辦公自動化系統、決策支持系統等各類信息系統的核心部分,是進行科學研究和決策管理的重要技術手段[1]。所以,熟練掌握數據庫維護與編程技術,對計算機類專業的學生尤為重要。

對于一個包含n個訓練樣本的批次,損失函數為[26]

(5)

網絡模型訓練的梯度下降優化算法采用適應性矩估計(Adaptive Moment Estimation,Adam),該算法是擴展后的隨機梯度下降算法,結合了自適應梯度算法(Adaptive Gradient Algorithm,AdaGrad)和均方根傳播算法(Root Mean Square Prop,RMSProp)的優點[28]。首先計算梯度的一階矩估計和二階矩估計,然后為各個參數設置不同的不相關的自適應學習率[32],即

mt=β1mt-1+(1-β1)gt

(6)

(7)

(8)

(9)

訓練過程中可以對某個樣本在網絡結構中某單元的輸出進行可視化顯示,可以看到不同卷積核提取輸入的不同特征。圖9為某個樣本及其在U-SegNet_5layer編碼器網絡第二層的第二個卷積層輸出的64張特征圖。

圖9 某個樣本(左)及其在U-SegNet_5layer編碼器部分第二層的第二個卷積層輸出的64張特征圖(右)

提前停止(Early Stopping)法可以在網絡模型達到最佳狀態時自動停止訓練,是一種能夠避免網絡發生欠擬合或過擬合的方法[32]。訓練過程中設置了提前終止條件,當訓練集的損失函數值在三輪迭代內出現上升即停止訓練,并且訓練過程中只保存當前最好的模型參數。U-SegNet_5layer迭代32輪即停止訓練過程,保存了第29輪的模型參數,最終訓練集準確率為99.52%,驗證集準確率為99.44%;U-SegNet_4layer迭代了48輪停止訓練過程,保存了第45輪的模型參數,最終訓練集準確率為99.37%,驗證集準確率為99.32%。圖10為U-SegNet_5layer和U-SegNet_4layer訓練過程的損失函數值曲線和準確率曲線。由圖可見,兩個網絡模型在很少的迭代次數內完成訓練,說明訓練效率都很高,并且U-SegNet_5layer訓練和驗證的準確率略高于U-SegNet_4layer。表1為U-SegNet、U-Net、SegNet訓練準確率,其中UNet_5layer使用的標簽數據初至位置樣點值寫1,初至以上和以下樣點值寫0。由表可見,U-SegNet的訓練準確率高于U-Net和SegNet。

表1 U-SegNet、U-Net、SegNet訓練準確率

圖10 U-SegNet_5layer和U-SegNet_4layer訓練

2.4 測試網絡模型

由于U-SegNet_5layer訓練和驗證的準確率略高于U-SegNet_4layer,故選擇U-SegNet_5layer進行測試和應用。

測試數據輸入到網絡模型中的輸出只是初至上、下范圍分割結果圖,還需要從這些分割結果圖中確定具體的初至位置。分割結果圖實際上是預測為初至以上范圍或初至及以下范圍的概率矩陣。在分割結果圖中如果某個采樣點確定為初至以上范圍,則概率值近于0,如果某個采樣點確定為初至以下范圍,則概率值近于1,初至附近上、下幾個采樣點的概率值為0~1。本文從上往下遍歷分割結果概率矩陣的每一道,將第一個概率值大于0.5的采樣點確定為該道的初至。但某些樣本存在很多不包含初至的道,如圖11中第3個和第4個樣本,這些道的初至位置不能由這些樣本確定,而由它們上方或下方相鄰的樣本確定。圖12為由10張分割結果圖確定的初至位置。

圖11 四個測試樣本(上)及其使用U-SegNet_5layer輸出的初至分割結果(下)

圖12 由10張分割結果圖確定的初至位置

確定每張分割結果圖的初至位置之后,需要將分割結果圖的每一個道序號映射為炮集中的道序號,每一道初至位置映射為炮集中的具體初至時間,映射過程分為三步:

(1)根據文件名從數據庫中查詢出某個測試樣本的道方向長度、時間方向采樣點數、中心點的道序號和時間。

(2)根據以上信息和分割結果圖中的初至位置,由

(10)

(11)

計算出每一道在炮集中對應的道序號和初至時間。式中:I為炮集中的道序號;i為分割結果圖中的道序號;IC為樣本中心點在炮集中的道序號;C為樣本道方向長度;T為某一道在炮集中的初至時間;s為某道在分割結果圖中的采樣點序號;R為采樣率;TC為樣本中心點在炮集中的初至時間;H為樣本時間方向采樣點數。

(3)剔除可能存在的重復道及其初至。

圖13為某商業軟件拾取的初至在炮集中的顯示。由圖可見,排列右邊遠炮檢距道信噪比很低,初至不明顯,該軟件未能拾取這些道的初至,并且第三個排列右邊拾取的初至存在向下跳變,拾取精度不高。圖14為在炮集數據中拾取的測試樣本,圖15為U-SegNet_5layer拾取的測試樣本初至在炮集中的顯示。由圖15可見,U-SegNet_5layer精確拾取了圖13的遠炮檢距道的初至,且不存在初至跳變問題。

本文將U-SegNet_5layer用于青海M區戈壁灘實際地震資料,測試其泛化性能。由于U-SegNet_5layer是由復雜山地地表的低信噪比數據訓練而成,將其應用到信噪比相對較高的M區資料,初至拾取效果很好(圖16)。

圖13 某商業軟件拾取的初至在炮集中的顯示

圖14 在炮集數據中拾取的測試樣本

2.5 實際資料應用

在制作訓練數據集過程中,選取連續250炮的887500道實際數據測試U-SegNet_5layer在大數據量炮集中的初至拾取效果。

目前幾乎所有的深度學習初至拾取方法在測試應用網絡模型時輸入的樣本包含炮集數據所有采樣點,但在實際初至拾取過程中不需要輸入初至以上背景噪聲和初至以下深層的大部分樣本,可節省大量的計算資源。為了減少輸入到網絡模型中的數據量,提高大數據量炮集初至拾取效率,本文采用SeismicNet軟件的沿曲線自動拾取方式,在250炮數據中沿理論初至曲線以30道為步長拾取80×160大小的樣本(圖17),這樣輸入到網絡中的數據量約為輸入炮集所有采樣點的1/10,應用效率提高了10倍。

圖17 沿理論初至曲線拾取的應用數據樣本紅色曲線為理論初至曲線

在與訓練網絡模型相同的軟、硬件環境下,U-SegNet_5layer拾取250炮實際數據用時285s,每秒拾取3114道數據,拾取效率約為某商業軟件的2.2倍。

本文將網絡模型的初至拾取率定義為單炮中網絡模型成功拾取初至的道數占單炮總道數的比例。圖18和圖19分別為某商業軟件和U-SegNet_5layer拾取250炮數據初至的拾取率曲線。由圖可見: 該商業軟件單炮初至拾取率最高為99.7%,最低為80.8%,平均值為92.5%(圖18);U-SegNet_5layer單炮初至拾取率最高為99.9%,最低為96.1%,平均值為98.4%(圖19)。將U-SegNet_5layer拾取250炮初至的拾取率投影到衛星遙感影像中(圖20)可見:炮點分布的西北方向靠近公路和村莊,干擾較大,初至拾取率較低; 炮點分布的東南方向靠近村莊、機場和工廠,初至拾取率更低;炮點分布的中心位置距干擾源較遠,初至拾取率最高。

圖18 某商業軟件拾取250炮數據初至的拾取率曲線

圖19 U-SegNet_5layer拾取250炮數據初至的拾取率曲線

3 結論

本文提出的基于混合網絡U-SegNet的地震初至自動拾取方法克服了傳統方法和近年提出的基于深度學習的方法在初至拾取效率、精度、穩定性和實用性等方面的缺點,表現為:

(1)實現了矩形固定步長采樣方式和沿理論初至曲線自動拾取訓練數據集的功能,不僅省去了繁瑣的訓練數據預處理過程,極大地提高了制作訓練數據集的效率,而且縮小了樣本尺寸,減少了輸入網絡模型中的數據量,提高了網絡模型訓練、測試和應用效率。

(2)設計的混合網絡結構U-SegNet結合了U-Net可以融合不同尺度特征和SegNet可以很好地保留圖元輪廓信息的優點,更精確地分割初至以上純背景噪聲部分和初至及以下部分,使初至拾取更準確。

(3)將訓練的網絡模型用于實際數據測試時,提出了一種將炮集數據快速轉換到初至時間的方法。應用結果表明,該方法初至拾取率和效率均高于某商業軟件,易于工業化生產,具有良好的發展前景。

猜你喜歡
模型
一半模型
一種去中心化的域名服務本地化模型
適用于BDS-3 PPP的隨機模型
提煉模型 突破難點
函數模型及應用
p150Glued在帕金森病模型中的表達及分布
函數模型及應用
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 欧美一区二区自偷自拍视频| 亚洲第一视频免费在线| 四虎精品国产永久在线观看| 就去吻亚洲精品国产欧美| 五月婷婷激情四射| 18禁黄无遮挡免费动漫网站| 色综合婷婷| 99久久精品免费看国产免费软件| 久996视频精品免费观看| 亚洲国产高清精品线久久| 国产精品人成在线播放| 成年人久久黄色网站| 久久免费成人| 国产成a人片在线播放| 国产精品吹潮在线观看中文| 中文无码精品A∨在线观看不卡| 黄色国产在线| 国内丰满少妇猛烈精品播| 国产99视频在线| 亚洲男女在线| 国产成人精品第一区二区| 亚洲性日韩精品一区二区| 色香蕉影院| 色哟哟国产精品一区二区| 在线国产你懂的| 久久天天躁夜夜躁狠狠| a级毛片免费网站| 欧美国产日韩另类| 在线视频亚洲色图| 国产国模一区二区三区四区| 91偷拍一区| 欧美在线国产| 国产人人射| 99热国产在线精品99| 亚洲人成人无码www| 国内精品视频| 女人18毛片水真多国产| 免费在线一区| 成人在线第一页| 97在线碰| 婷婷在线网站| 精品少妇人妻av无码久久| 小说区 亚洲 自拍 另类| 久久综合色播五月男人的天堂| 综合五月天网| 狠狠色成人综合首页| 97se亚洲综合在线天天| 欧美亚洲国产精品久久蜜芽| 亚洲精品国产成人7777| 视频二区国产精品职场同事| 欧美特级AAAAAA视频免费观看| 精品国产自| 色噜噜中文网| 国产欧美专区在线观看| 1024国产在线| 欧美日韩精品一区二区视频| 九九免费观看全部免费视频| 97超级碰碰碰碰精品| 四虎成人免费毛片| 伊人久久大香线蕉aⅴ色| h视频在线播放| 啪啪啪亚洲无码| 精品亚洲麻豆1区2区3区| 精品国产www| 日本精品视频一区二区 | 91香蕉视频下载网站| 国产精品偷伦在线观看| 亚洲成人在线网| 欧美日韩国产精品va| 最新国产高清在线| 国内精品小视频福利网址| 青青操视频在线| www.99精品视频在线播放| 欧美中文一区| 免费高清毛片| 99re热精品视频国产免费| 欧洲亚洲欧美国产日本高清| 高清不卡一区二区三区香蕉| 999精品视频在线| 日本不卡在线播放| 91黄视频在线观看| 91麻豆精品视频|