999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

利用條件生成對抗網絡建立曲流河地質模型

2024-02-26 10:03:12胡勇高小洋何文祥李順利朱建斌司錦陸雨詩
沉積學報 2024年1期
關鍵詞:模型

胡勇,高小洋,何文祥,李順利,朱建斌,司錦,陸雨詩

1.油氣地球化學與環境湖北省重點實驗室(長江大學,資源與環境學院),武漢 430100

2.中國地質大學(北京)能源學院,北京 100089

3.長慶油田分公司第一采油廠,陜西延安 716000

0 引言

儲層地質模型是油藏描述的核心,也是連接油藏地質與石油工程的橋梁,準確表征砂體形態及分布,建立相應的儲層地質模型具有重要的理論和現實意義[1-8]。曲流河砂體是重要的陸相碎屑巖儲層類型,目前用于曲流河的建模方法主要有基于目標、基于過程和多點地質統計學三種方法[9-16]。基于目標的模擬方法雖然能較好地再現河道的形態,但難以準確刻畫點壩[9],為此,多位學者開展了點壩建模算法的探索性研究,主要有基于點壩空間形態的矢量靜態模擬[17],基于廢棄河道與點壩位置關系的模擬[18],還有基于沉積過程算法(Alluvsim)的應用性研究成果[19-21],上述成果都沒有涉及條件化方面的研究。其中,基于沉積過程的建模方法(Alluvsim)能夠模擬曲流河的側向遷移形成點壩,主要通過對曲流河中線進行隨機游走實現河道的側向遷移、垂向加積、分汊改道和決口等過程,并用幾何形態參數對曲流河中線上所有的節點賦值,建立每期曲流河的三維模型,最終實現曲流河模擬,可以比較真實精細地刻畫河道及點壩的幾何形態[10]。條件化是基于目標和基于過程的建模方法待解決的另一個難題,即建立的模型不能很好地滿足井點條件[14,20,22],難以滿足實際工作需要;多點地質統計學由于訓練圖像平穩性問題多存在模擬不完全的現象,如模擬的河道易出現中斷[23-29]。可見,傳統建模方法難以做到既有效描述點壩與河流形態,又滿足井點條件,因此需要開展更深層次的研究。

近年來,隨著人工智能技術的快速發展,深度學習技術在圖像識別、圖像生成等領域取得了突破性的進展[30-32],其中圖像的識別與生成是應用相對較廣的一項技術[33-36]。圖像生成主要利用生成對抗網絡(Generative Adversarial Networks,GAN)來進行,通過分析多幅圖像,感知幾何特征,進而模仿并生成相關圖像,該算法自2014 年Goodfellowet al.[37]提出以來,在地質研究上被廣泛應用于生成各種復雜圖像,例如:巖石薄片圖像生成、數字巖心重構等[38-41]。這些人工智能生成的圖像細節豐富、逼真,為模擬復雜多變的曲流河帶來了可能。已有學者在人工智能曲流河建模方面做了一些探索性的工作:如利用生成對抗網絡生成無條件化的二維[42]和三維曲流河圖像[43];為了解決條件化的難題,一些學者提出了多種解決方案:主要有條件化井數據[44-45]、分層訓練[46]、樣本參數化[47]等方法,成功生成了條件化的三維曲流河模型,但這些模型沒有考慮點壩砂體,也沒有采用實際數據對模型進行驗證。期望克服以上不足,實現以下目標:建立一個既能滿足井點條件,又具有一定預測效果的三維曲流河與點壩模型。

以鄂爾多斯盆地某氣田為研究對象,采用條件生成對抗網絡算法進行曲流河建模。為了較好地模擬點壩砂體,采用Alluvsim 算法建立多個(200)能夠反映研究區曲流河彎曲形態以及點壩砂體的模型,通過卷積神經網絡對200 個模型進行深度學習獲取特征矩陣,在此基礎上,結合實際井點數據利用條件生成對抗網絡來生成曲流河模型,從而實現模擬結果既能很好地刻畫點壩及曲流河彎曲形態,又能很好地滿足井點條件。同時,詳細討論了影響模擬結果的關鍵因素,將模擬結果與多點地質統計學建模結果對比分析,并進行了模型的抽稀井檢驗。

1 生成對抗網絡原理

生成對抗網絡是一種基于深度學習的生成模型,由Goodfellowet al.[37]在2014 年提出,是近年來復雜分布上無監督學習最具前景的方法之一,主要應用于圖像生成領域。與傳統深度學習算法不同,它主要根據生成器與判別器之間的“博弈”對生成結果不斷優化。在這個“博弈”過程中,生成器的目標是建立模型,判別器的目標是判別模型的真偽。為了在“博弈”過程中取得成功,生成器必須學習建立能夠反映地質特征的模型,而判別器則會通過不斷地判別模型的真偽來提高判別能力,通過不斷地建立與判別,直到判別器無法識別生成模型的真偽,這時生成器就可以建立可靠合理的模型。

假設用于訓練的模型數據為x,模型數據的分布為Pdata(x),隨機變量z的分布為Pz(z),在理想情況下G(z)的分布應該盡可能地接近Pdata(x)。根據交叉熵損失,可以構造損失函數:

式中:EX~Pdata(x)[·]與EZ~PZ(Z)[·]指數學期望,EX~Pdata(x)是在訓練數據x 中取得的樣本,EZ~PZ(Z)是從隨機變量z 中取得的樣本。其中G(z)代表生成器G 生成的模型,D(x)代表判別器D判斷模型是否真實的概率;D(G(z))是判別器D判斷G(z)是否真實的概率。

通過GAN網絡訓練得到的模型可以隨機生成河道砂體模型,但是與基于目標的模擬方法一樣難以條件化,所以需要在這一過程中加入一定的約束條件,使生成器能夠生成滿足井點條件的模型。

為了解決這一問題,有學者在GAN 的基礎上提出了CGAN(Conditional Generative Adversarial Networks)模型[48],在訓練與生成過程中加入約束條件y,即在公式1中加入條件y(井點數據):

式中:D(x|y)為判別器輸出的模型x是否是條件y所對應模型的概率;G(z|y)為隨機向量z在該條件y下生成的模型。

在訓練過程中,需要在給定條件下將生成的模型與實際的模型做對比,所以在訓練時需要輸入成對的訓練集。利用公式(2)建立了新的損失函數:

式中:y表示條件數據,x為訓練數據,z為輸入G網絡的隨機向量,G(z|y)為G網絡根據條件數據和隨機向量生成的目標模型,D(y,G(z|y))是D 網絡判斷G 生成的模型在y條件下是否真實的概率。

數據集異常值、網絡參數以及損失函數的設定不當通常會影響模型訓練的效果,過擬合是在模型訓練過程中最常出現的現象,在本次訓練過程中也遇到了這種現象,很多學者提出了各種方法來解決這一問題[49-52],其中利用正則化懲罰項是最常見的手段,本研究采用L2 正則化懲罰項來解決這一問題,即:

式中:w為網絡中所用到的權重參數,λ是控制L2(G)比例的超參數,本研究設定為0.001。L2可以加快模型收斂并提高模型的精度。因最終目標是形成一個生成滿足井點條件河道模型的生成網絡,最終的目標函數為:

式中:輸入模型x(訓練集)與條件y(條件集),判別網絡提取訓練集與條件集的特征矩陣,并通過兩個全連接層得到訓練模型的真實概率;生成網絡中的Encoder(編碼器)將條件y 進行下采樣提取條件特征,結合隨機噪音數據輸入到Decoder(解碼器)中生成滿足條件y的模型;將生成的模型輸入判別網絡得到模型是否真實的概率,并與訓練數據的概率進行對比;將對比結果反饋給生成對抗網絡并進行參數優化,通過多次迭代使損失函數G*趨于穩定時就可以得到能生成滿足研究區條件曲流河模型的生成網絡(公式5)。

2 基于生成對抗網絡的建模方法

與傳統建模方法不同,基于生成對抗網絡的建模是模擬人腦的思維過程,它需要對同類型的模型不斷學習、模仿,從而提高建模(模仿)水平,最終能夠建立(模仿)一個形態特征與學習數據一致、與實際鉆井吻合的模型。

在上述建模實現過程中主要有以下四個步驟(其中②、③、④是交叉迭代進行的),圖1為建模過程流程圖。

圖1 基于生成對抗網絡的曲流河建模流程圖Fig.1 Flow chart of meandering river modeling based on the generated countermeasure network

1)準備用于深度學習的模型——訓練數據的建立方法

CGAN理論的核心在于對數據開展深度學習,這就需要采用合適的方法建立一定數量的能夠反映研究區砂體空間形態特征的地質模型。

點壩是曲流河沉積單元中最重要的儲集砂體,也是研究區的重點研究對象,因此建立的模型不僅要很好地再現曲流河的彎曲形態,還要能夠在成因上反映點壩砂體的空間形態。

盡管基于目標的建模方法能較好刻畫河流彎曲形態,但難以刻畫點壩[9],多點地質統計學則難以刻畫連續形態的河道[23-29]。基于以上不足,Pyrczet al.[10]在2009 年提出了基于沉積過程的建模方法(Alluvsim),Alluvsim能夠模擬河道的側向遷移,從而較好地在河道的凹岸加積形成點壩,國內多位學者開展了利用Alluvsim 算法模擬點壩砂體的研究[18-21]。因而Alluvsim建立的模型符合研究區砂體特征,是本文建立數據集所采用的方法。

Alluvsim的主要輸入參數為河道平均厚度、河道寬厚比、河道彎曲度、模擬河道的條數。設定好這些初始參數,即可開展Alluvsim 隨機模擬,得到多個曲流河砂體模型,用于下一步的深度學習。

2)對①的模型進行深度學習——數據集的訓練方法

人工智能是模仿人腦學習的過程,在建立河道模型之前必須先對模型進行學習,因此特征的提取尤為重要。研究區模型的厚度為30 m,為了保證模型的精度,垂向能達到每個網格0.5 m 的精度(多數開發階段地質建模所采用的精度),同時便于計算機計算,網格數量設置為2的倍數,垂向網格設置為64個。橫向尺寸考慮到滿足模型的精度和計算機的數據處理能力,設置為256,最終訓練模型的網格大小為256×256×64(共419 萬個網格),第一層卷積核定義為3×3×64的矩陣。

特征提取主要通過卷積神經網絡來進行,采用PatchGAN結構[53],對于三維地質模型,需將一個模型分解為N×N 個部分,每部分通過多個卷積層,得到N×N×1 的判別層,其中每個元素代表對應的真偽判定結果,整個輸入的真偽判定結果是N×N 個元素的均值,經過Isolaet al.[53]的研究,將N設為70模型生成效果最好,本文也采用這一參數。

通過大量的卷積核對上一層的模型進行卷積運算,在①的模型中提取出了大量的特征矩陣。在特征提取過程中,需要將每層模型的值(每個網格單元)與卷積核進行線性運算(y=w×x+b,w 為卷積核的參數,b 為偏置項)。由于池化層對上一層的輸出信息有一定的“舍棄”,會丟失一定的信息,但并不能保證所舍棄的信息是否有用,故在研究中用卷積層來代替池化層,保證神經網絡可以獲取更多的信息。在訓練時會通過梯度下降法不斷優化w和b,因而每一個卷積層輸出的特征都是原始模型在該隱空間上的映射,而提取到的特征矩陣會在訓練過程中隨著優化而不斷變化。在上述特征提取步驟中,為了使生成的模型滿足給定的井點條件,需要將訓練模型與條件模型在相同維度上進行拼接,即河道模型與條件模型的大小為256×256×64,拼接之后的模型大小則為256×512×64(圖2)。

圖2 訓練模型與條件模型拼接示意圖Fig.2 Schematic diagram of training and conditional model splicing

3)在深度學習的基礎上開始模仿①的模型進行建模——生成網絡的建立方法

模型的生成(建立)則是②的逆過程,目前應用較廣的是采用U-Net 結構[53]來生成模型,它主要是通過對特征矩陣進行相同層數的反卷積運算實現。在反卷積過程中,模型的生成(生成網絡來實現)與對比(判別網絡來實現)以及模型的訓練(深度學習)在運算過程中是交叉運行的。

CGAN模型主體為判別網絡與生成網絡,判別網絡主要對模型進行特征提取,并判斷模型的真實性;生成網絡主要采用U-Net網絡結構,生成網絡需要將條件模型進行卷積操作(Encoder 過程)生成特征向量,然后對特征向量進行反卷積(Decoder 過程)生成對應的三維模型。

在U-Net 結構中,Encoder(編碼器)為一個深度卷積神經網絡,將條件數據通過多層卷積運算進行下采樣,提取井點數據信息。在研究中將Encoder過程設定為6 個卷積層,卷積核計算步幅設定為2,卷積核個數由淺入深分別設定為32,64,128,256,512與1 024個,最終得到一個4×4×1 024的矩陣,通過兩個全連接層將該矩陣輸出為一個100 個數據的一維向量,然后再建立一個100個數據的服從正態分布的一維隨機數組,將兩個數組拼接為一個200個數據的一維數組,得到一個隨機向量;Decoder(解碼器)為反卷積過程,通過結合Encoder過程所采集到的各層信息以及與Encoder過程相同層數的反卷積層運算,即Encoder 的逆過程,生成一個模型。判別所生成模型在條件數據下的真實性,然后輸出損失函數的變化曲線,當該曲線隨訓練的進行趨于穩定時,CGAN 模型就已經訓練完成。將每個模型的權重、損失量等信息反饋給生成網絡與判別網絡,根據反饋信息調整參數,使生成網絡生成的每一個模型越來越接近訓練數據。

4)對③所建立的模型與①的模型進行對比——判別網絡的建立方法

訓練模型中真實模型的概率:將②中訓練模型所提取到的特征值,通過兩個全連接層網絡輸出一個模型是否為真實的概率值(模型的真實與否,在訓練模型中需預先標定)。

生成模型是否真實的概率:將③中所建立的模型提取特征矩陣后,同樣通過兩個全連接層輸出概率值。

生成模型的對比:將“生成模型是否真實的概率”與“訓練模型中真實模型的概率”進行對比,從而得到生成模型是否真實的結果。

3 建模實例研究

3.1 工區概況

研究區位于蘇里格氣田南部地區(圖3a),伊陜斜坡西部中段,坡降非常平緩,為3~5 m/km,地層傾角不足1°。上古生界石盒子組盒8 段是本區的主力含氣層段,該段砂體分布穩定,含氣性好,具有較大的勘探和開發潛力。盒8段平均孔隙度較低,集中在5%~8%,屬于低孔儲層。圖3b為長慶油田內部沉積相研究成果,建模工區位于圖3b中西側,前人研究成果顯示建模工區內分布有兩條曲流河,工區面積為25 km2,鉆井較少共有10口井,研究目的層為盒8上1段,前人研究成果顯示鄰區盒8上段均為曲流河沉積環境[54-58],本區巖心與測井顯示為曲流河河道的沉積特征(圖4,5)。

圖3 研究工區概況(a)研究區位置圖;(b)研究區沉積相(長慶油田內部成果)Fig.3 Overview of the study area

圖4 研究區A6 井曲流河沉積特征(a)1 498.65 m,上部為灰色粗—中砂巖,槽狀交錯層理,下部部見沖刷面、滯留泥礫;(b)1 492.32 m,灰色粗—中砂巖,厚層狀,可見多組高角度板狀交錯層理;(c)1 484.83 m,淺灰綠色細砂巖,厚層狀,可見多組中—低角度板狀交錯層理;(d)曲流河沉積剖面與垂向沉積序列圖Fig.4 Sedimentary characteristics of meandering river in well A6 in the study area(a) 1 498.65 m,the upper part is gray coarse medium sandstone with trough cross bedding,and the lower part is the scouring surface and retained mud gravel;(b) 1 492.32 m,bray coarse medium sandstone with thick layer,with multiple groups of high angle plate cross bedding visible;(c) 1 484.83 m,light gray green fine sandstone with thick layer,with multiple groups of medium low angle plate cross bedding visible

圖4a巖心上部為灰色粗砂巖,槽狀交錯層理,反映河道沉積特征;下部見沖刷面,滯留礫巖,反映了河床底部的沖刷沉積特征。圖4b巖心為淺灰綠色細砂巖,厚層狀,可見多組高角度板狀交錯層理,反映了層理角度較大的點壩底部側向加積的沉積特征。圖4c巖心位于點壩側積體頂部,相對圖4b的巖心層理角度變小,粒度變細。河道在側向遷移的過程中,每一期側移層底部為河床滯留沉積,滯留沉積之上為槽狀交錯層理,側向遷移形成的點壩主體則是板狀交錯層理,A6 井屬于沉積序列中的點壩主體(圖4d)。

自然伽馬(GR)測井曲線的形態整體顯示出正旋回的沉積特征(圖5),其中A5整體砂巖厚度較大,GR整體值偏低,為點壩沉積特征;A1~A4正旋回現象較明顯,下部GR值低,上部GR值高,反映了河道側積過程中河道與點壩的復合沉積,A1-A4井整體下部低GR曲線段為點壩沉積,上部高GR曲線段為河道沉積。

圖5 層GR 曲線沉積特征(以正旋回沉積為主)Fig.5 Sedimentary characteristics of the gamma ray (GR) curve from (primarily positive cycle sedimentation)

3.2 建模輸入參數

1)Alluvsim模型的建立

因研究受國家自然科學基金項目資助,屬于探索性研究,為了明確方法的可行性以及能夠較好地體現研究效果,選取了面積和地層厚度相對較小的工區來開展研究(不考慮河漫沉積,以模擬滿足井點條件的點壩和河道為主),工區內沉積體也相對簡單,分布有2 條曲流河(圖3b)。研究的訓練模型數據集利用Pyrczet al.[10]公開發表的Alluvsim源代碼建立,該源代碼采用Fortran 語言編譯,利用Petrel 建模軟件對成果進行三維顯示。基于Alluvsim 算法建立了200個河道砂體等概率模型(圖6),模型的網格尺寸為5 km×5 km×30 m。Alluvsim 算法是基于河道沉積過程的算法,只需輸入河道相關參數即可得到對應的模型,根據圖3b前人沉積相研究成果,統計得到河道彎曲度為1.4,河道的平均寬度為500 m,根據測井曲線統計得到河道的平均厚度為12 m,河道寬厚比設置為45,模擬河道條數為2。圖6的模擬結果中黃色為河道,藍色為點壩,灰色為泛濫平原沉積(泥巖為主),模擬出的河道在剖面上呈正透鏡狀,河道改道彎曲的區域則是點壩砂體,較好地體現了河道及點壩的沉積特征。

圖6 訓練用模型(顯示了16 個)Fig.6 Models used for training (16 shown)

Alluvsim在建立河道模型過程中,通過將河道在空間上進行平移以滿足井數據。因初始構建的河道模型未考慮任何井點數據,在河道平移的過程中,常出現難以滿足所有井點的現象,從而造成模型條件化程度低、不收斂,甚至崩潰。基于此,研究采用條件生成對抗網絡(CGAN)的建模思路來解決條件化的難題。生成對抗網絡(GAN)是在隨機噪音的基礎上生成模型,而CGAN 所采用的隨機噪音模型中則包含了井點數據作為初始數據,因而生成的模型能與井點數據吻合較好。若在對200 個模型訓練時均采用實際井點數據作為條件數據,那么在生成模型時,一旦實際建模時井點數據發生了變化(如新增加鉆井),可能造成生成的模型條件化效果不高,也即該訓練模型僅適用于工區目前的井點分布情況。一旦建模時井點分布發生變化,則需要根據實際井點數據重新訓練,會耗費大量機時。為了應對不同的井點分布情況,需要隨機設定井位分布,即讓模型訓練時能考慮足夠多的可能性,這樣訓練完畢的模型適用性也更廣。這也是深度學習的主要特點,需要足夠多的隨機樣本(訓練模型、條件模型)進行學習,增強模型的生成能力。

根據圖5的模型隨機設定了相應的井點條件(圖7),即基于訓練模型集中的每個模型(200 個),隨機設定一些虛擬井,每口井有著與模型對應位置的微相特征,其中泛濫平原作為背景相輸入,條件相為河道與點壩。該條件模型同樣為三維模型,垂向上分為64 個網格單元層,每一網格層的條件與建立的三維河道砂體模型的每一網格層模型一一對應。為了確保建立模型時能夠滿足實際井點條件,訓練時的條件井數應大于實際井數,因而在圖7中訓練用的井數大于10(隨機設定井數為11、12、13)。圖8為工區實際井點數據,本次參與模擬的井共10口,作為生成該河道砂體模型的條件數據。其中鉆遇以河道為主的井4 口,鉆遇以點壩為主的井2 口,鉆遇以泛濫平原泥巖為主的井4 口。基于以上數據開展了深度學習,期望所建立的河道模型能夠再現砂體的復雜形態,并較好地滿足井點條件。

圖7 條件數據(顯示了16 個)Fig.7 Condition data (16 shown)

圖8 研究區井點數據(a)井點位置平面圖;(b)井點數據三維圖Fig.8 Well point data in the study area

3.3 建模結果

CGAN網絡的訓練利用Mirzaet al.[48]公開發表的源代碼進行二次開發并建立,該源代碼采用Python語言編譯,利用Petrel 建模軟件對成果進行三維顯示。

在數據集的訓練過程中,理論上訓練次數越多,提取的特征矩陣也會越多,從而保證生成模型的質量。研究將圖6 與圖7 作為“數據對”訓練100次,以圖7 作為條件數據,建立了該工區的三維河道模型。

為了展示模型中河道的垂向變化,圖9為該模型第1、15、30、40個網格層的二維模型。模擬結果再現了彎曲的河道,也基本體現了河道與點壩的形態及相互關系。圖9a~d顯示了河道在垂向上由河道頂部到底部的變化特征,由于河道形態呈正透鏡狀,從頂到底河道整體的寬度應逐漸變窄。

圖9 訓練100 次時各網格層的模型Fig.9 Model of each grid layer after training 100 times

在圖9中,圖b與圖a對應較好,可以展示點壩及河道垂向上的變化;圖c左側標注區的點壩與圖a、b、d沒有對應關系,右側標注區與圖a、b對應較差,圖c北部河道與點壩的形狀和規模也不符合河道的垂向變化特征;與圖a、b、c 相比,圖d 標注區的河道彎曲度較小,導致河道形狀及點壩個數與圖a、b、c在垂向上對應關系較差。

上述分析說明該模型在每一個網格層模擬效果較好,垂向上也可以展示河道的變化特征,但模型在三維空間上存在河道形狀、點壩個數不對應的現象,不能體現河道的沉積成因及變化規律。

4 討論

為了明確影響模型結果的關鍵因素,并提高模型的精度,從以下幾方面開展了討論。

4.1 輸入參數

由于CGAN模型輸入參數較多,鑒于CGAN目前應用較廣,為相對較成熟的算法,一一測試不僅耗費大量機時,還占用大量篇幅,故研究中的各個參數均為經驗取值,因最終的建模結果能夠滿足研究的需求,沒有對輸入參數做進一步的測試,表1 為研究過程中CGAN的主要參數及意義。

4.2 訓練次數

本次測試在訓練集模型數量為200的前提下,分別通過訓練10 次、50 次、100 次以及200 次建立四個生成器,將圖7的條件數據分別輸入四個生成器中生成四個模型,與圖9一樣,輸出第1、15、30、40網格層的二維模型來展示模型特征。由于河道形態在垂向上是變化的,在頂面規模最大、底面最小,因而圖10~12的結果中,最上面的網格層(第1層,河道頂面)與井點吻合很好;由于鉆井并不總是位于河道最厚處,隨著網格層向河道底部移動,會出現一些偏差,主要集中在河道底部的第40 個網格層。整體上,隨著訓練次數的增加,生成的模型與井點吻合度越來越高(圖10~12)。

當訓練10 次時(圖10),單層模型河道形態基本展現出來,但部分區域模擬不完整,河道存在中斷的現象;點壩基本在河道彎曲處生成,形態還需要進一步優化。垂向上也能體現河道及點壩的變化,即由頂到底河道寬度逐漸變窄,點壩規模逐漸變小,但某些部位與上下層的對應關系較差(標注區的河道彎曲度及點壩的位置、大小)。

當訓練50 次時(圖11),單層模型河道形態變好,河道的形態也更為連續,局部還有斷開的現象。模型中部模擬較好,南北兩側模擬較差,細節刻畫還不夠精確;點壩模擬則較為完整,但圖11a 下部、圖11c 上部等某些部位與河道之間的對應關系較差。垂向上與圖10 相比更能體現河道及點壩的垂向變化,但某些河道的幾何形態上下層不一致(標注區)。

圖11 訓練50 次時各網格層的模型圖(a)第1層;(b)第15層;(c)第30層;(d)第40層Fig.11 Model of each grid layer after training 50 times

當訓練100 次時(圖9),河道的連續性,點壩與河道的關系模擬較為合理,除垂向各層之間河道及點壩的幾何形狀、大小及對應關系還有待完善,模型基本滿足曲流河沉積特征。

當訓練200 次時(圖12),各單層模型模擬較為完全,河道連續,點壩的形狀、大小與位置正確,河道與點壩的對應關系也較好。垂向上各單層體現出河道及點壩的變化,即從頂到底河道寬度及點壩大小逐漸變小,圖9~11 中上下層不對應的情況也得到了很好的解決。將得到的曲流河砂體三維模型數據輸入Petrel 軟件中得到該工區的地質模型可視化圖(圖13)。

圖12 訓練200 次時各層的模型圖(a)第1層;(b)第15層;(c)第30層;(d)第40層Fig.12 Model of each layer after training 200 times

圖13 工區三維河道地質模型Fig.13 Three-dimensional (3D) river geological model of the study area

上述測試說明更多的訓練次數會帶來更好的模擬結果,但相應的計算時間會成倍增加,為了確定最優化的訓練次數,在訓練過程中統計了G*損失函數的值。圖14顯示損失函數隨著訓練次數的增加逐漸降低,并逐漸收斂于0.7,當訓練次數為160時,損失函數的值保持穩定,說明更多的訓練次數不能帶來更好的模擬效果,因此本工區最合適的訓練次數為160。

圖14 G*損失函數變化曲線圖Fig.14 Variation of G* loss function

4.3 數據集的影響

深度學習的基礎是訓練數據集,為了確定最優化的數據集數量,本次研究分別使用10、50、100、200個模型數量來進行訓練,將圖8條件數據分別輸入生成器得到4 個模型,同樣輸出每個模型的第1、15、30、40網格層二維模型進行對比。

上述的10、50、100、200 個模型均由Alluvsim 建立,這些模型主要用于深度學習,理論上來說用于學習的模型數量越多,最后生成的模型越真實(如同學習畫,臨摹的數量越多,畫出成品的概率越高),但模型數量并不是越多越好,模型數量越多意味著更多的運算時間,需要找到適合工區的最優化學習模型的數量。

以下4 次測試均為模型訓練本研究區最優化的訓練次數(160次)。

當訓練10 個模型時,如圖15 所示,生成的模型沒有展現曲流河的形態,僅在井點數據周圍生成了一些數據,河道不僅連續性差且看不出河道與點壩的關系,模擬的效果非常差。

圖15 訓練10 個數據集時各層的模型圖(a)第1層;(b)第15層;(c)第30層;(d)第40層Fig.15 Model of each layer for 10 training datasets

當訓練50 個模型時,生成的曲流河各層模型如圖16所示。平面上,各層的河道基本連續了起來,部分區域存在斷開和模擬不完全的現象;垂向上,有點壩大小及河道寬度逐漸降低的趨勢,但各層模型點壩與河道的幾何形態對應關系較差。

圖16 訓練50 個數據集時各層的模型圖(a)第1層;(b)第15層;(c)第30層;(d)第40層Fig.16 Model of each layer for 50 training datasets

當訓練100個模型時,所生成的曲流河各層模型如圖17所示。平面上,各層模型河道基本連續,河道還存在斷開的現象,一些點壩模擬效果較差,點壩與河道的對應關系較差;垂向上,基本可以體現出點壩大小與河道寬度逐漸減小的趨勢,但是部分區域點壩與河道的幾何形態在垂向上難以對應,由于訓練數據集的增加,模擬結果與圖16 相比得到了一定的改善。

圖17 訓練100 個數據集時各層的模型圖(a)第1層;(b)第15層;(c)第30層;(d)第40層Fig.17 Model of each layer for 100 training datasets

當訓練200個模型時,所生成的曲流河各層模型如圖12、13 所示。平面和垂向上模型模擬得較為完整,說明形成的生成對抗網絡模型捕捉了足夠多的曲流河沉積特征,通過200次的訓練所建立的生成器能生成細節足夠豐富,點壩與河道較為完整的曲流河砂體三維儲層模型。

人工智能深度學習需要對數據樣本進行大量的矩陣運算,GPU(顯卡)因為其處理矩陣計算的高效性被廣泛運用到深度學習,本研究在訓練過程中采用英偉達的GeForce GTX 1660 型號GPU,該GPU 有1 408個流處理器單元,訓練的模型大小為256×256×64,根據本文討論的參數,訓練200個模型、訓練200次所花費的時間為4 h。

4.4 與傳統建模方法的對比

為了體現本研究所建模型方法的適用性,與傳統建模方法進行了對比。其中基于目標的模擬目前難以很好地刻畫點壩,另外目前河道建模條件化所采用的方法為先模擬河道,再對河道進行平移或旋轉等來滿足井點條件,在這個過程中通常會出現河道形態扭曲和不能滿足所有井點的現象,造成基于目標的建模方法難以應用于實際工作中。

圖13顯示本文所采用的方法與序貫指示模擬方法類似,為基于已知數據進行河道模擬,從而能完全滿足井點條件,進一步通過深度學習再現河道和點壩的形態。與基于目標的方法相比,本文所采用的方法不僅能很好地模擬河道和點壩的形態,也能很好地條件化,即生成的模型與井點數據是完全吻合的(圖8、圖18a)。

圖18 人工智能生成模型與多點地質統計學模擬結果對比(a)人工智能生成模型;(b)多點地質統計學模擬結果Fig.18 Comparison between artificial intelligence generation model and multipoint geostatistical simulation results

多點地質統計學可以模擬復雜儲層形態及其相互關系,為此,本研究僅將CGAN 模擬結果與多點地質統計學的模擬結果進行對比分析,在多點地質統計學模擬中所采用的訓練圖像為圖18a的成果。

通過對比圖18 的模擬結果可知,因采用圖18a作為訓練圖像,圖18b的多點地質統計學模擬的結果首先能滿足井點條件,其次較好地反映了點壩與河道之間的關系,這是多點地質統計學的優勢;但同時圖18b 對河道的連續性模擬得并不好,存在多處中斷,多位學者的研究也證實了這點[23-29],并且模擬結果中出現了大約4條主河道,而訓練圖像中僅給出了2 條河道,并不能很好地再現圖18a 中的沉積特征。對比結果表明與傳統建模方法相比,本文所采用的方法能較好地再現河道模型地質體的空間特征。

同時圖18a的模擬結果也較好地體現了圖3b中的河道沉積特征,主要分布有2 條河道,河道彎曲的區域分布有點壩,河道與點壩的規模與前人的研究成果也相符合,且實現了河道儲層的三維化,能在此基礎上開展更為精細的描述(本研究中未考慮河漫沉積)。

4.5 模型的驗證

為了檢驗所建立的模型是否能夠準確表征砂體的特征,通常采用抽稀井檢驗、油藏數值模擬檢驗等方法。油藏數值模擬適用于開發中的油氣田,故而本研究區主要采用抽稀井檢驗的方法。因模型的主要目的是刻畫點壩砂體,為了檢驗模型的預測精度,依據實際井鉆遇砂體情況,將圖8中的A5井去掉,將剩下的A1~A4、A6~A10 作為條件數據輸入到CGAN網絡,建立了基于9口井的河道模型,以檢驗A5井處的點壩預測效果。

圖19 為模擬結果,可以發現整體結果與圖18a差異不大。右側河道區域由于沒有對井數進行改變,模擬結果保持不變;左側河道在模擬過程中參與計算的為A3、A4兩口井,整體形態與分布變化不大,變化的區域主要體現在A3 與A4 兩口井之間的河道區域,與圖18a相比較,由于條件數據更少(圖18a為3 口井,圖19 為2 口井),對模擬結果的約束也就越少,因而模擬的河道形態更為均勻、協調(河道寬度變化較小,主要體現在河道的波峰波谷位置),A5 井區的點壩也得到了很好的預測,與井點吻合較好。

圖19 模型抽稀井驗證(A5 為抽稀井)Fig.19 Verification of model dilution well (A5)

為了更清晰地明確河道的演化,選取了3條過井剖面(圖18a)。可以很清晰地顯示河道內部沉積特征,整體上與測井曲線吻合較好,其中點壩以砂為主,對應測井曲線低GR部分;河道以細粒沉積為主,對應測井曲線的上部高GR 值(圖20)。也說明了本文所采取的研究方法能有效進行河道沉積砂體的模擬,利用圖19 的三維地質模型可以開展進一步的有利儲層研究。

圖20 過井剖面圖Fig.20 Cross-sections

5 結論與展望

針對傳統的建模方法難以有效模擬曲流河砂體,本文利用基于人工智能深度學習的條件生成對抗網絡(CGAN),克服了其他建模方法的條件化困難、不易恢復點壩砂體等難題,在河道人工智能三維建模方面進行了深入研究。

本研究通過Alluvsim 算法建立了200 個反映目標區河流沉積特征的三維模型,通過大量的卷積運算提取河道模型訓練數據集的特征矩陣,利用條件生成對抗網絡(CGAN)建立了可以生成河道砂體三維模型的生成網絡,通過反卷積操作來生成所需的河道模型,所建立的模型可以很好地克服傳統建模方法的不足。在模擬地質體形態方面,由于模擬結果是在對大量Alluvsim 模型(包含點壩與曲流河)深度學習基礎上利用條件生成對抗網絡所生成的,模擬的曲流河與點壩形態特征與訓練數據(Alluvsim模型)保持一致,這也是生成網絡的優勢;在條件化方面,因在生成過程中加入了條件數據的約束,生成網絡模擬的結果除了能與Alluvsim模型保持一致,還會滿足實際井點數據,打破了長久以來傳統曲流河建模方法條件化困難的局面,從而使得建立的曲流河模型能與實際更有效地結合。

研究表明,訓練時所用的學習數據越多,模型在深度學習的過程中所提取的信息也越多,在模型生成階段根據條件數據所建立的模型也越可靠。而在給定訓練數據集的前提下,該算法對模型訓練的次數愈多,所獲得的模型特征數據庫愈大,所包含的模型細節也愈豐富,生成的模型也愈反映輸入模型的形態特征。

雖然本文的研究取得了一定的效果,目前國內應用Alluvsim 算法研究曲流河建模的主要是高校多年研究建模算法的科研工作者,主要采用研究源代碼的方式,如何降低建立訓練模型的門檻,可能是曲流河人工智能建模今后要考慮的方向。

另外三角洲沉積砂體規模大,是近年致密油氣勘探的重要領域,與曲流河相比,三角洲沉積受河湖交互影響,砂體的空間分布更為復雜,難以較好地隨機模擬三角洲及內部砂體的形態及分布。現階段能反映各微相三維特征的三角洲訓練模型多為手動修改完成,這對需要大量訓練數據的人工智能建模研究來說是巨大的工作量,利用多點地質統計學采用人機互動的方式建立三角洲訓練模型是一個較為可行的策略,作者正在這方面開展積極的探索研究。

相信隨著計算機軟硬件技術的快速發展,能更好地拓寬人工智能地質建模的應用領域,為今后智能化油氣田的勘探和開發添磚加瓦。

猜你喜歡
模型
一半模型
一種去中心化的域名服務本地化模型
適用于BDS-3 PPP的隨機模型
提煉模型 突破難點
函數模型及應用
p150Glued在帕金森病模型中的表達及分布
函數模型及應用
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 欧美成人精品一区二区| 妇女自拍偷自拍亚洲精品| 国产精品亚洲一区二区三区z| 欧美亚洲综合免费精品高清在线观看| 日本人真淫视频一区二区三区| 国产伦片中文免费观看| 中文无码日韩精品| 国产精品99一区不卡| 免费人欧美成又黄又爽的视频| 免费 国产 无码久久久| 亚洲成a人片在线观看88| 99爱视频精品免视看| 亚洲经典在线中文字幕| 欧美啪啪精品| 国产真实二区一区在线亚洲| 色悠久久久| 日韩a级毛片| 99爱在线| 久久性视频| 欧美国产成人在线| 日本道中文字幕久久一区| 国产99精品视频| 国产精品永久久久久| 激情影院内射美女| 中文无码伦av中文字幕| 9啪在线视频| 免费又爽又刺激高潮网址 | 99热这里只有精品国产99| 99激情网| 亚洲国产日韩欧美在线| 中文成人在线视频| 4虎影视国产在线观看精品| 亚洲视频a| 激情爆乳一区二区| 四虎亚洲国产成人久久精品| www欧美在线观看| 欧美日韩一区二区三区在线视频| 福利视频99| 人人爽人人爽人人片| 天堂在线www网亚洲| 国产99视频精品免费观看9e| 精品国产免费观看一区| 内射人妻无码色AV天堂| 日本成人一区| 久无码久无码av无码| 5555国产在线观看| 天天躁夜夜躁狠狠躁图片| 久久网综合| 国产永久在线视频| 久久毛片网| 亚洲日韩在线满18点击进入| 国产精品亚洲欧美日韩久久| 1024你懂的国产精品| 亚洲开心婷婷中文字幕| 国产农村精品一级毛片视频| 久久久久久久久久国产精品| 国产乱子伦精品视频| 成人国产三级在线播放| 国产香蕉在线视频| 最近最新中文字幕在线第一页| 99ri精品视频在线观看播放| 露脸一二三区国语对白| 国产一区二区三区视频| 91在线精品麻豆欧美在线| 一本大道香蕉久中文在线播放 | 97视频精品全国免费观看| 亚洲水蜜桃久久综合网站| 久久久亚洲国产美女国产盗摄| 91热爆在线| 日韩高清欧美| 中国黄色一级视频| 亚洲热线99精品视频| 国产原创自拍不卡第一页| 欧美精品综合视频一区二区| 亚洲色婷婷一区二区| 免费在线视频a| 亚洲一级毛片免费观看| 亚洲香蕉久久| 精品一区二区三区视频免费观看| 欧美在线一二区| 久久精品这里只有精99品| 久久先锋资源|