宋隨宏 ,史燕青 ,侯加根 *
1 中國石油大學(北京)地球科學學院,北京 102249
2 中國石油大學(北京)人工智能學院,北京 102249
3 鵬城實驗室, 深圳 518055
4 中國石油大學(北京)油氣資源與探測國家重點實驗室,北京 102249
儲層地質建模本質上是一個融合井筒、地震和地質模式等多類地質信息對地下儲層的空間分布進行精細預測的過程,是油氣儲量評價、鉆井設計和油氣田開采方案調整的關鍵。儲層離散相(包括但不限于沉積相)建模是儲層屬性建模的基礎,本文所提及的儲層建模特指離散相地質建模。
長期以來,諸多地質統計學方法被應用于各類儲層的地質建模[1],包括基于變差函數的方法[2-3]、基于目標的方法[4-6]和仿沉積過程的方法[7-8]。其中,基于變差函數的方法雖然可以較好地吻合井筒、地震等條件數據,但無法刻畫地質體的復雜幾何形態;而基于目標的和仿沉積過程的方法雖然可以很好地復現地質體的地質模式(如幾何形態和沉積相接觸關系等),但在融合井點等條件數據上存在較大的不足[9]。
近年來,基于多點地質統計學的建模思路被提出并廣泛應用,如SNESIM方法[10]、SIMPAT方法[11]、FILTERSIM方法[12]、HYPPS方法[13]和直接采樣方法(Direct Sampling)[14]。基于多點地質統計學的建模方法通過掃描訓練圖像獲取地質空間內的多點統計數據,以此作為地質模式信息,生成的地質模型可在忠實于井點和概率體條件數據的基礎上一定程度地復現地質體的模式特征。但是,由于其對于地質模式的表達僅限于訓練圖像小范圍內的多點統計信息,缺乏對更大范圍地質模式特征的完整抽象和總結,當井點數據稠密或地質體結構較為復雜時,基于多點地質統計學的方法建模效果并不理想,如出現河道相儲層斷斷續續的現象。
如何讓構建的地質模型既能完整有效地復現地質模式特征又能很好地吻合各類條件數據,是地質建模的核心問題,其中對空間地質模式特征的復現是最大的難點。人工智能(深度學習)中的生成對抗網絡框架(GANs)[15]與卷積神經網絡(CNN)[16]相結合,可以很好地抽象并復現物體完整的空間模式特征,即生成非常逼真的虛擬物體(如人臉圖片),在圖像生成[17-20]、云層空間形態預測[21]、巖石微觀模型重建[22]等領域有著成功的應用。近幾年,多位學者將此方法應用于儲層地質建模,在生成對抗網絡框架下去訓練得到由卷積神經網絡構成的地質模型模擬器,讓其學習地質體完整的空間模式特征,并生成吻合該模式特征的地質模型[23-32];這類方法被稱為基于生成對抗網絡的地質建模方法。劉彥鋒等[33]已就該方法的特點、應用和未來發展方向做了概述。根據有無條件約束,基于生成對抗網絡的地質建模方法可具體分為無條件約束和有條件約束兩種情況,本文深入討論每種情況的核心思想、應用效果以及未來研究應用的展望。
將原始生成對抗網絡直接應用于地質建模,便可形成無條件約束的地質建模方法。生成對抗網絡的訓練過程可分為傳統訓練過程和漸進增長的訓練過程,與之相對應,無條件約束建模方法也可分為傳統生成對抗網絡地質建模方法和漸進增長的生成對抗網絡地質建模方法。下文依次簡要介紹生成對抗網絡框架、傳統生成對抗網絡地質建模方法和漸進增長的生成對抗網絡地質建模方法。
生成對抗網絡(GANs)是深度學習中的一種訓練神經網絡的框架,由Goodfellow[15]提出。其根本目的是:訓練神經網絡從觀測樣本中學習到樣本的一般模式知識(如人臉的模式),并據此生成與該模式吻合的虛擬樣本(如逼真的人臉圖片)。目前已有多個生成對抗網絡變種框架[17-19,34-36]。
生成對抗網絡主要包含生成器神經網絡、判別器神經網絡和損失函數。生成器將低維隨機數組生成為虛擬樣本,判別器則將真實或虛擬樣本轉化為一個代表輸入樣本真假程度的數值,稱為逼真度,損失函數則為真假樣本對應的逼真度間的某種距離。生成器和判別器的神經網絡結構可以是全連接神經網絡、卷積神經網絡(CNN)或循序神經網絡(RNN)[37]。針對圖片或地質模型等具有空間結構的樣本數據形式,一般采用卷積神經網絡作為生成器和判別器[25-26,34,38]。基于真假樣本逼真度間不同的距離計算方式,多類損失函數已被提出[39-41],其中基于梯度懲罰的Wasserstein損失函數(Wasserstein loss with gradient penalty)[41]取得了很好地應用效果。
對于生成對抗網絡的訓練可分為傳統訓練過程和漸進增長的訓練過程[17]。傳統過程中,把生成器和判別器神經網絡分別當作不可拆分的整體,依次循環訓練判別器和生成器,來分別增大和減小損失函數。該過程中,生成器不斷學習真實樣本中的模式知識,進而生成與真實樣本極為相像的虛擬樣本。而樣本的模式特征具有尺度性,大尺度模式特征控制或影響著小尺度模式特征。但是傳統訓練過程沒有考慮模式的尺度性,而讓生成器完全自主地學習所有尺度的模式知識;生成器有可能先學習小尺度模式特征后學習大尺度模式特征,限制了生成器的學習效率和最終生成效果。
Karras[17]提出了漸進增長的生成對抗網絡訓練方法(progressive growing of GANs)。該方法中,生成器中的神經網絡被逐層加以訓練,來依次從大到小地學習不同尺度的模式特征;比如第一層神經網絡學習大尺度模式特征,第二層神經網絡學習中尺度模式特征。該方法考慮了不同尺度模式特征之間的控制和依附關系,極大地提升了生成對抗網絡的訓練效率和最終生成效果,在訓練時間、穩定性和生成效果等方面遠超傳統訓練方法[17]。
傳統生成對抗網絡地質建模方法主要強調應用傳統過程去訓練生成對抗網絡。Song[30]之前的生成對抗網絡建模方法[23-29]均采用傳統訓練過程。下文依次介紹傳統生成對抗網絡地質建模方法的核心思想及典型應用。在地質建模中,生成對抗網絡的生成器和判別器均采用卷積神經網絡結構。
1.2.1核心思想
圖1以暗河溶洞二維(水平切面)地質模型作為樣本的情況為例,直觀展示了傳統生成對抗網絡地質建模的核心思想。給定諸多吻合暗河溶洞地質模式的原型模型作為訓練數據(真實樣本),這些訓練地質模型在對應的高維空間中具有特定的分布范圍。此處的“高維”特指表征地質模型所有可能性的維度空間,比如,一個100×100×100的河道與非河道兩相地質模型的維度則為2100×100×100。生成器神經網絡的根本目的就是從這些訓練地質模型中學習到暗河溶洞的地質模式知識,并應用該知識生成具有相同模式特征的地質模型。

圖1 生成對抗網絡地質模型生成器(模擬器)訓練過程示意圖Fig. 1 Schematic diagram of training process of the geomodel generator based on Generative Adversarial Networks
首先,在未經訓練時,生成器G0尚未學習到任何地質模式知識,其由隨機向量生成的虛擬地質模型S0非常雜亂,不顯現任何地質模式特征。隨后,判別器首次得到訓練(D1),將虛擬的地質模型S0與真實的訓練地質模型集分割開來。然后,生成器得到訓練(G1),通過學習訓練地質模型集中的部分模式知識,來生成具有一定模式特征的地質模型S1,以讓此時的判別器D1無法區分虛擬地質模型S1和訓練地質模型集。隨后,判別器再次得到訓練(D2)來將新的虛擬地質模型S1與訓練地質模型集分割開。而后,生成器再次得到訓練(G2),通過學習更多的地質模式知識,來生成更為真實的地質模型S2。通過對判別器和生成器的循環訓練,生成器逐漸學習到越來越多的地質模式知識,并最終生成與訓練地質模型極為相像的虛擬地質模型,以至于判別器再也無法將虛擬的地質模型與真實的訓練地質模型區分開來。
最終的生成器(GN)便學習到了訓練模型集中暗河溶洞發育的全部地質模式知識,可將任意低維向量生成為吻合暗河溶洞地質模式的、逼真的地質模型。該生成器則可作為地質模型的模擬器在無條件約束的地質建模實際中加以應用。為了便于地質領域研究人員的理解,本文將生成器統稱為地質模型模擬器。生成對抗網絡本質上是通過對判別器和模擬器“博弈式”的交替優化,來將訓練地質模型集中的地質模式知識遷移到模擬器神經網絡中來,以定量參數的形式保存下來。
1.2.2應用效果分析
Laloy[25]最早將生成對抗網絡應用于地質建模,將一個大型訓練圖像經過若干次切割而形成諸多小型訓練地質模型,應用傳統生成對抗網絡訓練方法得到模擬器卷積神經網絡;訓練完成的模擬器可將任意隨機向量生成為與訓練地質模型非常相像的地質模型,如圖2所示。Zhang[26]應用基于目標的方法構建了大量的訓練地質模型,去訓練模擬器;而后將模擬器應用于無條件約束的三維地質建模,如圖3所示。Nesvold[27]通過對地表衛星照片的處理來獲取河道相水平切片二維訓練地質模型集,去訓練模擬器,進而進行無條件約束的隨機模擬。在這些研究中,模擬器產生的地質模型均與訓練地質模型非常相像,即生成的地質模型與訓練地質模型具有相同的地質模式特征,表明模擬器學習到了完整的地質模式知識。

圖2 河道相二維訓練地質模型與模擬器生成的地質模型實現示例[25]Fig. 2 Examples of 2D training facies models of channel reservoirs and the corresponding generator-produced facies models[25]

圖3 河道相三維訓練地質模型與模擬器生成的地質模型實現示例[26]Fig. 3 Examples of 3D training facies models of channel reservoirs and the corresponding generator-produced facies models[26]
Song[30]首次將生成對抗網絡漸進增長的訓練過程與地質建模相結合,形成了漸進增長的生成對抗網絡地質建模方法,并將其與傳統方法進行了應用對比分析。下文簡述了該方法的思想步驟及應用分析。
1.3.1核心思想
該方法包括訓練地質模型多精度粗化和漸進增長的模擬器訓練兩個步驟;前者是為了獲得能夠代表不同尺度地質模式特征的訓練地質模型集,后者則是讓模擬器從這些訓練地質模型集中依次學習到不同尺度的地質模式知識。比如,針對圖4所示的模擬器和判別器結構(原始訓練地質模型和模擬器最終生成的地質模型均為64×64的暗河溶洞水平切片二維模型),首先將原始訓練地質模型粗化到32×32、16×16、8×8和4×4不同精度,精度越低的訓練地質模型代表的模式尺度越大;然后從左到右依次激活模擬器和判別器中的卷積神經網絡層,即卷積1、卷積2、…,同時應用從低到高不同精度的訓練地質模型去訓練當時的模擬器和判別器,來讓模擬器依次學習從大到小不同尺度的地質模式知識;訓練完成后,把模擬器中的所有卷積層當作一個整體在實際建模中加以應用,生成64×64的暗河溶洞二維地質模型。

圖4 漸進增長生成對抗網絡地質建模方法示意圖Fig. 4 Schematic diagram of the geomodelling approach based on progressive growing of GANs
1.3.2應用效果分析
Song[30]將漸進增長生成對抗網絡地質建模方法應用于河道及暗河溶洞儲層水平切片二維地質建模,并與傳統生成對抗網絡地質建模方法進行了對比。圖5展示了漸進增長的訓練過程中模擬器依次生成的河道儲層地質模型;可以看出,隨著模擬器中越來越多的卷積層被激活和訓練,模擬器學到越來越精細的地質模式特征,而生成越來越逼真的地質模型(從第1列到第5列),最終生成的地質模型(第5列)與訓練地質模型(最后兩列)極為相似。

圖5 漸進增長訓練過程中模擬器生成的河道儲層地質模型與訓練地質模型對比[30]Fig. 5 Comparison between the generated channel reservoirs during progressively training of the generator and the corresponding training facies models[30]
圖6把漸進增長生成對抗網絡地質建模方法產生的地質模型、傳統生成對抗網絡地質建模方法產生的地質模型與訓練地質模型進行了對比,可以看到兩種方法產生的地質模型都與訓練地質模型極為相像,且都具有很強的多樣性,表明兩種方法中的模擬器都學習到了訓練地質模型中完整的地質模式知識。但漸進增長的建模方法中訓練模擬器所需的時間(6.03 h)僅是傳統方法所需時間(15.4 h)的39.2%,證明漸進增長方法在訓練時間上的明顯優勢。在模擬效果上,Song[30]應用基于Wasserstein距離的多尺度標量圖法定量評價了兩種建模方法產生的地質模型與訓練地質模型的分布關系。如圖7所示,每個樣點代表40個地質模型,可以看到,相比于傳統建模方法,漸進增長方法產生的地質模型分布更接近訓練地質模型分布,表明漸進增長方法產生的地質模型的地質模式與訓練地質模型更吻合。

圖6 漸進增長與傳統生成對抗網絡地質建模方法生成地質模型的對比[30]Fig. 6 Comparison of the simulated reservoir geomodels between the progressive GANs training and the conventional GANs training approaches[30]

圖7 傳統和漸進增長生成對抗網絡地質建模方法所得的地質模型與訓練地質模型之間關系的分布圖[30]Fig. 7 The relationship map among facies models generated from the conventional and progressive geomodeling methods and the training facies models[30]
有條件約束的地質建模方法是在無條件約束方法的基礎上發展而來的,本文把目前學術界關于有條件約束地質建模方法的研究成果歸結為兩大類:基于模擬器輸入向量搜尋的條件化方法和模擬器直接條件化的地質建模方法。學術界對于前者的研究和應用較多[24-29],后者則是為了解決前者存在的一般性缺陷,由Song[31-32]最新提出。
2.1.1核心思想
在無條件約束的建模方法中,訓練得到的模擬器可將任意低維向量生成為吻合特定地質模式的地質模型。這些地質模型分布在對應高維空間中的一個特定區域內,該區域內的每一個地質模型都與輸入的低維向量一一對應,如圖8所示。針對任意給定的條件數據(如井點數據),在地質模型區域內必然存在一個小型區域(記為區域1),該區域內的所有地質模型均與該條件數據吻合。同時,在低維輸入向量空間中也必然存在一個對應的區域(記為區域2),該區域內的向量值可通過模擬器生成為區域1中的地質模型。條件約束地質建模的目的則是找出區域1中的地質模型。由于地質模型的維度遠大于輸入向量的維度,所以通常會去搜尋區域2中的向量值,然后通過模擬器將這些向量生成為區域1中的地質模型。
目前,在學術界存在兩大類方法來尋找區域2中的向量值,一類是向量優化的方法,還有一類是神經網絡映射的方法。在第一類方法中,首先構建一個目標函數,如式(1),該目標函數反映了模擬器生成的地質模型與給定條件數據之間的差距;然后通過優化該目標函數中輸入的低維向量z來最小化目標函數。常用的兩種優化方法包括馬爾科夫鏈蒙特卡洛方法(MCMC)[25,27,29]和梯度下降的方法[24,26]。每次優化只能尋找到一個位于區域2中的輸入向量,通過模擬器可計算得到一個與條件數據吻合的地質模型(位于區域1內)。不確定性地質建模需要得到多個地質模型實現,因而需要進行多次優化,每次選擇不同的初始值來獲得多個合適的輸入向量,這些向量通過模擬器則可生成多個與條件數據一致的地質模型。

式中,O為目標函數,Dist為某種距離,G為訓練好的模擬器卷積神經網絡,z為輸入的低維向量,cond為給定的條件數據,M為地質模型到條件數據的映射方程,比如針對井筒產量條件數據,M即為儲層滲流的正演方程,而針對井點條件數據,M則為對地質模型G(z)進行井點抽樣的算子。
考慮到多次優化速度較慢且操作繁瑣,Chan[28]提出了神經網絡映射的方法。具體來說,針對給定的條件數據,訓練一個額外的小型神經網絡,將一個已知區域(如0至1的區域)映射到區域2上,如圖8。此時,該已知區域內的任意數值都可通過這個額外的神經網絡轉化成區域2內的輸入向量,進而通過模擬器生成與條件數據一致的地質模型(位于區域1內)。這樣,便可同時獲得大量模型實現。

圖8 基于模擬器輸入向量搜尋的條件化方法示意圖Fig. 8 Schematic diagram of conditioning approach based on searching of the input latent vector of the trained generator
2.1.2應用效果分析
圖9為Zhang[26]應用梯度下降方法產生的井筒數據約束的三維河道儲層地質模型實現,模型實現與井點數據完全吻合[26]。圖10為Mosser[29]應用馬爾科夫鏈蒙特卡洛方法得到的井筒和地震數據共同約束的河道儲層縱切片二維地質模型;其中,地質模型與井筒數據完全吻合,由地質模型正演而來的合成地震記錄也與地震觀測條件數據完全一致。Zhang[26]還通過實例證實了生成對抗網絡方法相比于多點地質統計學建模方法在地質模式復現上的優越性。

圖9 基于梯度下降方法產生的與給定井點條件數據一致的多個三維河道儲層地質模型實現[26]Fig. 9 Multiple 3D channel reservoir geomodels conditioned to given well data produced by gradient descent approach[26]

圖10 (a)和(b)為井筒解釋和地震觀測條件數據,(c)為井筒和地震數據約束的地質模型,(d)為由地質模型正演而來的合成地震記錄[29]Fig. 10 (a) and (b) are the observed well interpretation and partial seismic conditioning data, (c) is a produced geomodel conditioned to the given well and seismic data, (d) is the seismic data synthesized from the geomodel in (c) using forward modelling[29]
基于模擬器輸入向量搜尋的條件化方法最大的問題就是:每次針對一個新的井區或新的條件數據時,需要重新去尋找合適的向量值,而尋找的過程比較繁瑣耗時、且需要較大的算力。因而,Song[31-32]在漸進增長生成對抗網絡地質建模的基礎上提出了模擬器直接條件化的地質建模方法(GANSim)。
2.2.1核心思想
模擬器直接條件化的地質建模方法(GANSim)的提出主要受“地質專家手繪沉積相圖”這一過程的啟發:給定特定條件數據(如井點數據),地質專家可以直接畫出既吻合地質模式又與給定條件數據一致的沉積相圖,而無需專門的條件化操作;這是因為地質專家的大腦中除了保存地質模式知識以外,還有條件數據與地質模型之間關系的知識(即條件數據對地質模型約束規則的知識)。與地質專家相類比,在無條件約束情況下訓練所得的模擬器只學習到了地質模式知識,還欠缺條件數據與地質模型之間關系的知識。那么,能否讓模擬器在學習地質模式知識的同時還學習到這種關系知識呢?這樣,當把任意實際地質條件數據輸入到模擬器中時,模擬器便可以像地質專家一樣,直接生成吻合輸入條件數據和特定地質模式的地質模型,而無需對模擬器的輸入向量進行繁瑣的搜尋操作。這便是模擬器直接條件化地質建模的核心思想。
具體來說,如圖11所示,首先設計條件數據輸入模擬器的接口結構,把條件數據和低維隨機向量一起輸入到模擬器中;然后定義專門的條件損失函數,生成對抗網絡原損失函數促使模擬器學習地質模式知識(進行無條件約束的地質建模),而條件損失函數則促使模擬器學習條件數據與生成地質模型之間關系的知識。最終訓練得到的模擬器便可將任意條件數據直接生成為同時吻合地質模式知識和輸入條件的地質模型。

圖11 模擬器直接條件化的地質建模方法示意圖[31]Fig. 11 Schematic diagram of the direct conditioning approach based on GANs (GANSim)[31]
Song[31-32]和宋隨宏[42]分別就條件類型為全局特征變量(如相比例、河道彎曲度、河道寬度)、離散井點數據和地球物理解釋的概率體數據的情況,形成了這幾類條件數據單獨約束以及聯合約束的模擬器直接條件化地質建模方法。
2.2.2應用效果分析
Song[31-32]將模擬器直接條件化的地質建模方法應用于河道寬度和彎曲度、泥巖相比例、井點以及概率圖多類條件約束的河流相水平切片二維地質建模,取得了非常好的效果。比如在圖12(a)中,將泥巖比例、井點數據、河道堤岸復合體概率圖和低維隨機向量共同輸入到訓練好的模擬器中,生成的地質模型與所有條件數據和對應地質模式都非常吻合,當輸入的隨機向量發生任意變化時,模擬器則可生成不同的地質模型實現(圖12(a)中地質模型的每一列對應一個不同的輸入向量)。在圖12(b)中,保持輸入的井點數據和概率圖不發生變化(與圖12(a)中一致),只改變輸入的泥巖比例數值,生成的地質模型也相應地發生改變,即從左到右地質模型中的河道數量逐漸減少。

圖12 泥巖比例、井點數據和概率圖共同約束的河流相水平切片二維地質模型[32]Fig. 12 2D GANSim-produced 2D channel reservoirs conditioned to mud proportion, well data, and probability maps[32]
宋隨宏[42]將該方法應用于塔河油田奧陶系暗河溶洞儲集體的不確定性三維地質建模。基于2萬多個訓練數據(64×64×64),應用4塊GPU(NVIDIA Tesla V100-PCIE-32GB)耗時25個小時訓練得到針對塔河暗河溶洞儲層的三維地質模型(64×64×64)模擬器。如圖13所示,將塔河油田TK6112井區的井筒解釋、地震所得溶洞概率體和一個低維隨機向量一起輸入到訓練好的模擬器中,任意改變隨機向量的數值大小則可產生不同的三維地質模型實現。這些實現與輸入的井筒解釋數據吻合率為100%,與概率體數據也非常吻合;生成的暗河溶洞在形態、走向等方面也與研究區的地質認識非常一致,如廳堂洞的發育、階梯狀的形態以及NNE、NNW和近EW的溶洞段走向。

圖13 塔河油田TK6112井區井筒和地震概率體數據共同約束的暗河溶洞儲集體三維地質建模(儲層大小為800 m×800 m×64 m,網格數為64×64×64)[42]Fig. 13 GANSim-produced 3D geomodels of the underground river karst cave reservoir in TK6112 well block of Tahe Oilfield conditioned to well data and seismic probability maps (the size of the reservoir is 800 m×800 m×64 m and the cell number of each geomodel is 64×64×64)[42]
Song[43]進一步改進該方法形成GANSim-3D框架,來讓模擬器直接產生任意尺寸的三維地質模型,其核心在于保證模擬器中只包含卷積神經網絡層(剔除全連接層)。如圖14所示,訓練所得的模擬器則可針對任意大小的實際儲層,將井筒解釋和地震概率體數據生成為多個對應的三維地質模型實現。同樣,這些實現既吻合實際地質模式特征也與輸入的條件數據一致,地震概率體中的噪聲被有效地壓制,模擬速度也非常快:一個網格為336×256×96的三維地質模型只需0.988 s來產生。

圖14 塔河油田某大型區塊井筒和地震概率體數據共同約束的三維地質建模(儲層大小為4200 m×3200 m×96 m,網格數為336×256×96)[43]Fig. 14 GANSim-produced 3D geomodels of the underground river karst cave reservoir in a large block of Tahe Oilfield conditioned to well data and seismic probability maps (the size of the reservoir is 4200 m×3200 m×96 m and the cell number of each geomodel is 336×256×96)[43]
相比于基于模擬器輸入向量搜尋的條件化方法,模擬器直接條件化的地質建模方法在操作的簡便性和耗時上具有明顯的優勢;其缺點在于目前還無法實現地震及生產動態等間接條件數據的直接約束,而基于模擬器輸入向量搜尋的條件化方法卻可以實現這些數據的約束。當然,兩種方法也可以結合使用,在模擬器實現井點等數據直接條件化的基礎上,應用輸入向量搜尋的方法實現間接條件數據的約束。
(1)生成對抗網絡地質建模方法可以很好地復現地質體的空間模式特征,其模擬效果優于多點地質統計學建模方法。
(2)無條件約束時,漸進增長生成對抗網絡地質建模方法在地質模型模擬器訓練時間和模擬效果上都優于傳統生成對抗網絡地質建模方法。
(3)模擬器直接條件化的建模方法在操作便捷性和建模速度上遠優于基于模擬器輸入向量搜尋的條件化方法,已形成了全局變量(如河道彎曲度、相比例)、井點和概率體約束的模擬器直接條件化地質建模方法;但目前,前者無法實現地震及生產數據等間接條件數據的約束,而后者可以實現。
(1)模擬器直接條件化的地質建模方法(GANSim和GANSim-3D)是一個開放的方法體系,可通過進一步深入研究,將地質力學、原始地震、生產動態以及原始沉積水動力等間接數據融合進來作為條件數據,實現對地質建模全方位多角度的綜合約束,以最大限度地降低儲層預測的不確定性。
(2)生成對抗網絡地質建模方法雖然在訓練模擬器時需要構建大量的訓練地質模型并且需要在多塊高端GPU上訓練較長的時間(如圖13的例子中應用4塊Tesla V100 GPU耗時25小時),但是這些工作都只需完成一次即可,而訓練所得的模擬器卻可以在任何相似地質模式區進行無數次應用。考慮到GPU的市場價格,石油公司、科研單位或個人有能力進行生成對抗網絡地質建模方法的大規模研究和應用。
(3)從工業落地應用的角度來看,有如下兩個問題需要重點關注:一個是如何獲得大量能夠代表真實地下儲層的訓練數據(訓練地質模型)?基于過程的方法能捕捉地質體不同尺度的細節,但對于很多地質過程的認識尚不清楚,且運算速度過慢需要消耗大量運算資源;針對具體儲層特征,研究專門的基于目標或基于仿過程的模擬方法或是解決訓練數據問題的重要思路。另一個問題是自然界的儲層類型非常多樣,是否要構建針對每種儲層類型的地質模型模擬器,而又該如何劃分儲層類型?筆者的一個不成熟的想法是:能否構建一個針對全球各種儲層類型、放之四海而皆準的大型地質模型模擬器,那么在未來工程師只須將目標區塊的條件數據和儲層類型等基礎數據上傳云端,便可在幾秒內傳回大量可能的地質模型實現和不確定性分析結果。目前,人類已經在語言等領域構建了諸多千百億參數的人工智能“大模型”(如GPT-3、鵬城-百度·文心等),獲得了極為出色的效果,此處所提的“模擬器大模型”或是地學領域一個重要、可實現、具有巨大應用和商業潛力的努力方向。
(4)從地質知識的角度來看,模擬器實際上是把抽象的地質模式知識(和條件對地質模型的約束規則知識)以定量參數(即神經網絡參數)的形式保存下來,形成可靈活操縱和應用的數字化知識。這些數字化知識除了直接應用于本文所述的地質建模以外,或許還可通過神經網絡遷移學習等方式應用于其它實踐,并為“地學知識數字化”相關課題的研究提供重要的借鑒和實踐意義。