999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

測井資料人工智能處理解釋的現狀及展望

2021-10-28 03:30:18王華張雨順
測井技術 2021年4期
關鍵詞:方法

王華,張雨順

(電子科技大學資源與環境學院,四川成都611731)

0 引 言

地球物理測井是在井筒開鉆同時或開鉆后,利用特定的儀器測量井下地層的物理、化學性質、地層結構及井身幾何特性,以了解井中及井周地層情況的一門學科。該學科的理論基礎為地質學、物理學和數學,涵蓋電子信息技術、傳感器技術、特定場景儀器的研發以及數據的高效傳輸和處理解釋等。它既是識別地下流體性質、儲集層巖性及物性的有效途徑,也是石油工程技術人員解決相關問題的必要資料來源。早在1876年,中國四川自貢地區就利用濕泥巴纏裹的木棒測量鹽鹵水層的深度和出水量。現代地球物理測井則起源于人們對石油資源探測的需求,物理學家于1927年將地面電阻率探礦裝置用于定性識別井中油水層。1942年,Archie的實驗及分析結果將現代地球物理測井從定性推動到定量化的階段,基于此結果建立起來的巖石物理體積模型為后續出現的各種測井方法的應用提供了理論依據。經過近一個世紀的發展,地球物理測井已經成為石油科學的十大主干學科之一,也逐漸從油田勘探開發拓展到了深地、深海、地下工程、生態監測等領域。面對越來越復雜的應用場景,測井領域研究往往是方法研究先行,在電子信息技術的發展下不斷發展新儀器。測井也從早期模擬記錄時代過渡到數字磁帶、數控測井時代,直到近20年的成像測井時代。新的儀器、采集方式、數據處理方法不斷涌現,使得我們能獲取豐富的井下信息來定量評價地層巖性、物性、含油性等。

測井資料處理解釋長期面臨的一個問題是需要解釋專家具有豐富的區域地質經驗。即便如此,不同專家的解釋結果還存在很大的差異,尤其是非常規油氣藏等復雜巖性的測井解釋。在電子信息技術的高速發展下,采用新的、高效的觀測方式和技術(如分布式光纖技術),服務公司得以快速實時地采集越來越多的測井數據。海量的數據隨時間增加呈指數增多,加劇了人工測井解釋的壓力,同時油田公司和服務公司普遍存在用人緊張的問題。如何在新形勢下高效開展地球物理測井資料解釋成為了一大難題。

互聯網時代下,大數據、機器學習(Machine Learning,ML)及人工智能(Artificial Intelligence,AI)正逐漸成為各個行業的熱門詞匯。自2016年起,幾乎所有石油行業相關會議都專門開展了機器學習或人工智能與行業結合的主題探討會。許多勘探領域的學術期刊也專門為應用于地球科學、石油工程領域的機器學習及大數據專題提供了專刊及主題會議[1]。各大國際石油公司和服務公司也在調整發展戰略,將數據作為寶貴資源,在數據科學、人工智能領域持續發力,如斯倫貝謝公司就已著手建設自己的智能化測井處理解釋平臺[2]。作為勘探和開發領域中重要的組成部分,地球物理測井相關從業人員也在逐漸探尋人工智能、機器學習技術與自身研究領域的高效融合。

基于以上挑戰與機遇,本文首先介紹人工智能、機器學習間的關系,總結歸納若干類較為典型的測井資料智能處理研究,并對測井資料智能解釋的未來提出思考及展望。

1 人工智能在測井資料處理解釋應用的適用性分析

人工智能是指利用特定算法獲取信息后,執行具有人類特征任務的能力,如識別物體、聲音及從環境中學習以解決其他問題。人工智能的關鍵在于自動化方法的設計,即設計出一種學習算法,使計算機能夠在沒有人類干預或幫助的情況下自動獲取知識。機器學習方法的不斷優化,促進了人工智能領域相關技術的發展。機器學習是計算機科學子領域及統計學研究的領域之一,旨在針對給定數據設計及訓練出具有拆分、排序、轉換等能力的特殊算法[3]。根據學習任務的特點,可分為監督學習(Supervised Learning)、無監督學習(Unsupervised Learning)和半監督學習(Semi-Supervised Learning)。

訓練數據樣本包含了輸入向量以及對應目標向量的機器學習任務被稱為監督學習。根據學習目標的不同,可分為分類與回歸這2類任務:分類任務用于為每個輸入向量分配離散標簽;回歸任務則用于輸出1個或多個連續變量,以表征輸入變量與目標變量之間的統計關系。諸如支持向量機(Support Vector Machine,SVM)[4]、人工神經網絡(Artificial Neural Network,ANN)[5]、決策樹(Decision Tree)、隨機森林(Random Forest)[6]等經典監督學習方法,正逐步被應用到測井解釋作業中。

訓練數據僅由1組輸入向量組成、不含對應目標標簽的機器學習任務稱為無監督學習。根據學習目標不同,無監督學習任務可分為聚類(Clustering)、密度估計(Density Estimation)與數據可視化(Visualization)等。聚類任務的目標是將樣本整體劃分為若干個由相似對象組成的類簇;密度估計用于確定輸入數據在空間中的分布;數據可視化主要利用降維方法,將數據從高維空間投影到二維/三維空間,供從業人員直觀可視。常用無監督方法包括K-Means聚類[7]、DBSCAN(Density-Based Spatial Clustering of Applications with Noise)聚類[8]、主成分分析(Principal Component Analysis,PCA)[9]等。

為了最大限度提高機器學習任務模式識別能力,可構建具有一定深度的模型,獲取數據更深層次的特征或表征,以提升算法在處理更大數據量、更高維度的數據集時的準確度和可靠性。這些具有層次結構更為復雜的機器學習方法被稱為深度學習(Deep Learning,DL)[10],包括卷積神經網絡(Convolution Neural Network,CNN)[11]、堆棧自編碼網絡(Stacked Auto-Encoder Network)[12]、深度置信網絡(Deep Belief Nets)[13]等。

還有1類模式識別任務利用少量標簽數據和大量未標簽的數據實現,此類任務即半監督學習。研究表明,少量標簽有助于顯著提升聚類效果[14-15],結合無監督學習降維方法的半監督分類任務則可在標簽不足的情況下提升監督學習分類效果[16]。

通常而言,地球物理領域所獲取到的數據是海量的,數據分析人員可根據數據及待求任務的特點,應用或自定義最佳機器學習算法(見圖1)[17]。

圖1 多種機器學習算法使從業人員得以按需選擇(圖片重制自Bergen等[17])

整體而言,目前的地球物理測井領域的數據量呈現了大容量、多尺度、高維、多噪聲等特點。同時,基于物理或經驗模型的數值模擬任務也為測井領域帶來了大量的待處理數據及海量的計算任務:如Prioul等[18]基于物理模型正演了井外各向異性介質(裂縫)對井壁電阻率成像、聲波測井、垂直地震剖面等的響應情況,助力實際誘發裂縫方向研究;Wang等[19-21]則利用三維有限差分研究了套管偏心、不同膠結情況、方位竄槽等情況下的單極子和偶極子聲場特征,有助于利用聲波測井資料解釋套管井的固井質量。基于物理模型驅動的處理解釋的實例不勝枚舉,其核心在于探索以領域知識為基礎的變量間的可靠關系,所提供的假設及函數對應的映射均來自用戶的有限定義,不同變量和潛在物理知識間的重要關系難免存在遺漏。以測井解釋為例,一個剛學完測井解釋課程的學生和一個有多年豐富地質經驗積累的測井解釋資深專家給出的結果可能會完全不同。這是因為常規定量解釋手段往往基于巖石物理體積模型建立近似的線性方程組來優化求解。這種做法在巖性簡單的常規地層應用問題不大,但在復雜巖性地層中,測井響應與物性參數呈非線性關系,需要結合當地的地質情況進行相應的調整。同樣,以聲波全波形測井資料應用為例,復雜環境下波形多變,需要經驗豐富的專家來識別。此外,基于數值模擬的方法存在耗時久、運算量大等問題。因此,從業人員已經開始探索更為高效可靠的解決方式:采用基于人工智能、機器學習的測井資料智能處理方法。

同圖2(a)提到的模型驅動方法相比,基于數據驅動的機器學習方法[見圖2(b)]通過探索數據本身內存在的更大函數空間(見圖3)[10],以新的視角挖掘數據內潛在的知識,將數據與目標(或稱為標簽)相聯系,以非線性方式,從高維空間中發現變量間關系[22-24]。隨著計算成本和運行時間的減少,內存、網絡深度和可用數據樣本的不斷增加,Scikit-Learn[25]、Tensorflow[26]等易于實現的機器學習算法庫的開源使用,傳統機器學習算法及更多新算法可以在學術和商業環境中方便各行業的人們使用。

圖2 地球物理測井領域的2種數據分析工作流

圖3 人工智能適合于地球物理測井領域的原因(圖片重制自Bergen等[17])

2 測井資料智能解釋現狀

從測井資料中識別儲層的巖性及沉積相是地下儲層建模及地下資源開發的關鍵。巖性及沉積相分析的常見方法有測井曲線解釋、巖心分析等。常規測井曲線[27]是記錄井眼巖石物理性質最直接也最基本的方法,包括電法測井、核測井、聲波測井等。鉆井液對電阻率測井曲線的侵入效應受孔隙尺寸、孔喉尺寸、迂曲度和Maxwell-Wagner極化的影響,這些影響與孔隙尺寸分布相關;中子測井對地層中流體含氫量敏感,而氫原子含量又與地層平均孔隙度高度相關;伽馬射線用于測量地層中的自然輻射,同砂巖、石灰巖相比,含有黏土的巖石能夠釋放出更多的伽馬射線,可用于計算泥質含量;密度測井可直接顯示井下流體和礦物體積濃度關系。巖心分析[28]則可獲得關于礦物學、化學成分、物理特性(孔隙度、滲透率)等信息。

早期研究中,根據2種不同的測井曲線繪制交會圖,運用判別分析或簡單基于截斷值的分析方法即可得到巖相及孔隙度分類信息[29]。而隨著測井技術的不斷發展、面臨的測量環境更加復雜,有必要在實際工程中進行更為細致的巖相劃分,對地下介質性質分析的精度要求也逐漸提高。常規測井曲線間隱藏著復雜的關系,雖然不同曲線可以感知不同的物理現象和地層性質,但某些測井曲線的組合往往相互關聯,簡單的線性判別分析方法難以滿足需求。雖然巖心分析可以精確獲取整個工區地下介質的多種物理參數信息,但耗時較多。受人工智能監督學習領域發展的啟發,大量研究以測井曲線等序列數據及對應的巖相解釋結果或敏感參數作為算法模型輸入,訓練機器學習算法,以建立已有數據和待求參數間的映射關系,借此實現測井資料的近實時解釋。由于老油田積累的一些巖心分析結果和專家的解釋結果有利于建立穩定的機器學習模型,這些穩定模型將有望應用于新的測井資料,并取得非常好的效果。基于此,筆者匯總了人工智能在測井資料智能解釋中的應用,并對智能方法未來的發展道路提出了一些展望。

2.1 常規測井資料模式識別任務

手寫數字體的識別,即通過訓練算法學習手寫數字體圖片和各數字標簽之間的映射關系,是機器學習中經典的學習案例之一。這些算法能夠綜合考慮數字的各種特點,完成分類任務。利用測井曲線進行巖相智能分類類似于手寫數字體識別。對同一地層,不同的測井曲線提供了不同的屬性信息,且曲線之間相互補充,綜合使用可以更好地區分井下介質的巖相類型。通過構建輸入測井曲線和標簽(專家解釋或巖心分析得到的巖相結果)之間完備的數據集,訓練監督學習模型用于巖相分類,能夠為還未經專家解釋的地區進行巖相分類。該類研究在近年來較為熱門,在2007年Dubois等[30]利用了7種分類器研究了測井曲線巖相分類問題,包括利用貝葉斯準則方法的經典分類法(即二維或三維交會圖)和3種非參數方法(模糊邏輯方法、K-最近鄰、BP神經網絡)。結果表明,基于判別分析的經典線性分類方法(如交會圖)[31]在某些應用場景會存在分類不充分的問題。非參數方法中,BP神經網絡具有強大非線性映射能力,可以很好地實現測井曲線的巖相分類任務。相關數據集由Hall[31]加以整理,供從業人員進行方法測試和復現。Ouadfeul等[32]采用自組織映射(Self-Organized Maps,SOM)與多層感知機(Multilayer Perceptron,MLP),以及將傳統信號分析與神經網絡結合的方法,驗證了神經網絡在巖相自動分割任務中的有效性,并獲得了優于傳統方法的結果。基于決策樹的多種分類器也被用于巖相分類研究,如隨機森林[33]、梯度提升樹[34]、XGBoost提升樹[35]等。Ao等[36]結合Mean-shift算法與隨機森林算法,從原型相似度的角度進行巖性識別,取得了優于直接采用決策樹等算法的效果。Jaikla等[22]提出FaciesNet,用于捕獲地質信息、疊加模式的巖相及地質相關性,模型將卷積自編碼器(Convolutional Autoencoder,CAE)與雙向遞歸神經網絡(Bi-directional Recurrent Neural Networks,BRNNs)相結合,用于預測測井曲線資料中具有地質意義的巖相,實現了儲層相與非儲層相的分割。Feng[37]將ANN與隱馬爾科夫模型(Hidden Markov Models,HMM)方法結合,以儲層研究巖相的概率分布,結合統計學及地質學的角度實現分類過程,取得了優于其他分類方法的性能。此外,疊前地震資料等地震數據也可以被從業人員存儲為與測井曲線類似的序列數據,部分研究通過利用疊前地震資料等地震數據,實現了在更大空間尺度上的巖相識別:Hami-Eddine等[38]利用地震數據作為巖相預測的傳遞手段,結合測井曲線數據的巖相識別結果,訓練神經網絡從地震數據中尋找可用于巖性分布和不確定性預測的模式。

類似測井曲線的儲層及沉積相分類任務,從常規固井測井資料中獲得的水泥膠結質量評價信息也可作為監督學習目標,實現固井質量自動評價。相關研究[39-41]按水平好壞劃分出若干表征固井質量的類別相(如膠結質量好、一般、較差等)。整個工作流程以測井數據作為輸入向量,以質量類別相作為目標向量,訓練得到能夠自動輸出盲井的固井質量評價結果的監督學習模型。具體的,Reolon等[40]結合MRGC(Multi-Resolution Graph-based Clustering)聚類手段與貝葉斯框架,實現了井下水泥膠結相、水力間隔相的分類,并給出了分類相概率及不確定性。Viggen等[41]則設計特征工程方法,采用領域知識從測井資料中提取特征,獲得了更好的分類效果。相關方法雖然還不能完全替代人工解釋,但足以作為人工解釋過程中的重要輔助資料,極大提升固井質量解釋效率。

綜上所述,相較于傳統信號處理方法,基于機器學習方法,建立非線性映射的處理方法,對巖相識別任務準確度有極大的提升。同時,更先進的算法,以及針對特定任務的網絡結構設計,還能夠更好地實現諸如儲層相與非儲層相的分割、固井質量評價等衍生任務。

2.2 常規測井資料參數反演任務

與分類任務類似,機器學習的回歸算法也被廣泛應用于測井資料解釋中。該類方法主要是通過建立已有測井曲線資料與地層參數之間的樣本數據集合,訓練機器學習算法的回歸模型,從而實現工區目標參數的反演。如Meshalkin等[42]利用回歸算法反演測井資料中巖石熱導率。他們比較了K-means、ANN、高斯過程(Gaussian Process)、隨機森林、自適應提升算法(Ada Boost)、梯度提升算法(Gradient Boosting)、極端隨機樹(Extra Trees)等監督學習算法的反演結果,在不依靠額外參數的情況下直接預測不同深度的巖石熱導率。Gasior等[43]則利用密度、聲波、中子、伽馬、井徑及電阻率等測井資料,采用多元回歸和神經網絡方法建立數學模型,實現了連續導熱值系數的反演,與實驗數據具有較好的一致性。Li等[44]提出一種基于深度CNN評價隨鉆電阻率測井的地層幾何參數的流程,將目標檢測領域中的智能方法(You Only Look Once,YOLO)應用于隨鉆電阻率測井地質導向任務中,以數值模擬的隨鉆測井資料作為輸入,實現了地層電阻率的反演。Kisra等[45]通過搭建CNN,以原始聲波測井資料作為輸入,實現了地層縱波和橫波慢度的近實時反演。Li等[46]采用井下磁共振測井數據,選擇長短時間記憶網絡(Long-short Term Memory,LSTM)、變分自編碼器(Variational Autoencoders,VAEs)模型用于合成核磁共振T2譜分布數據,實現對含油氣頁巖儲層的充液孔隙大小分布的量化。Shahriari等[47]通過訓練深度神經網絡,實現了對井眼測量數據的實時反演,并利用LSTM實現了數據降維。該實時反演方法有望應用于隨鉆測井(Logging While Drilling,LWD)技術,提升井下測量信息的實時傳輸效率。Garcia等[48]結合ANN與無監督學習方法,對缺省的光電因子參數進行了反演重建,并基于重建資料,采用無監督神經網絡方法改進了巖相分類效果,并量化了巖石物理性質分配的不確定性。可見,不論是經典機器學習算法還是深度學習算法,在測井曲線解釋任務上均有較好表現。然而,現有研究[42]也表明,忽略數據集本身特點而盲目選用先進算法,不一定會改善測井曲線的解釋效果。因此,近來研究大都選用多種方法,通過對比擇優更好地實現測井曲線參數反演。

3 測井資料智能解釋思考及展望

前文主要闡述了測井領域中應用較為系統及廣泛的人工智能應用。顯然,人工智能在測井領域中的應用遠不止所列出的方面。然而,這些應用由于起步時間較短,還未形成較為完善的工作流程。筆者將簡述已有的基于測井資料的創新解釋流程,這些方法還未大量見諸于地球物理測井領域,但對于測井行業的未來有一定的指導性意義,可供相關從業人員借鑒。

3.1 基于機器學習的智能正演過程探索

相比于常規測井曲線或成像測井等,陣列聲波測井則是另一種高分辨率測井方法,可用于求解地下介質參數及表征儲層特征。陣列聲波測井數據量豐富,為消除冗余信息,一般需要從陣列波形中提取某些敏感特征(如頻散曲線),再將提取的特征與基于假定模型的數值模擬的特征對比,通過最小化觀測數據和合成數據間差異的Misfit函數,不斷更新正演模型并最終得到同實測數據對應的相關模型參數。這其中存在3個問題。

(1)陣列波形中敏感特征的提取。目前針對復雜井孔模型陣列波形敏感特征的提取研究一直是聲波測井領域的重要議題之一,也是聲波測井資料應用的難點之一。

(2)大量的正演模擬。井孔聲學的正演模擬一直是聲波測井研究中較為困難的一環。雖然隨著科研人員計算機知識的豐富,正演模擬已經不再遙不可及,但復雜井孔環境的數值模擬仍需要一定的技巧。同時,盡管并行計算等高性能手段能夠在一定程度上加快計算速度,但大量的正演模擬仍需要較多的計算時間,使得現場應用受限。此外,目前的正演過程采用的是基于物理驅動的模型,可能會忽略變量之間的隱含關系。

(3)快速準確的反演。目前反演方法大多為全局優化非線性方法,如模擬退火算法[49]等已被應用到了偶極聲波測井反演地層各向異性研究中[50-51]。但反演過程仍存在耗時的問題,難以達到現場應用的實時性要求。

為了滿足現場應用的實時性需求,從全波資料中挖掘更多的有用信息,目前的一種可能思路是利用機器學習方法來縮短以上過程(見圖4),以盡可能地利用全波資料同時達到實時解釋的效果。在地震資料處理領域,已有研究[52]將模型參數作為網絡學習目標,訓練深度神經網絡,直接預測了輸入實際數據對應的模型參數資料。但對于測井領域,由于井下環境的復雜性,根據少量井下介質表征參數(如井徑、單一地層縱橫波速度等)建立的數值模擬模型因缺乏對實際環境的周密考慮,且由于復雜環境下的有限元、有限差分等數值模擬建模計算量大,難以滿足實際生產過程中反演過程的準確性和時效性。諸多現狀表明,直接建立效果良好的智能反演算法任重道遠。

圖4 同基于物理驅動的數值模擬模型相結合的機器學習全波形反演流程展望

目前有學者對此開展了一些工作。如2019年,Giannakis等[53]探尋了基于機器學習的快速正演方法。他們通過訓練特殊的深度神經網絡,近實時地獲得了與數值模擬正演結果匹配良好的機器學習正演結果,極大節省了探地雷達正演的計算成本。這也為地球物理測井領域帶來啟發:借助機器學習強大的非線性擬合能力,以較為完備的模型參數向量集作為輸入,通過將模型正演結果作為目標輸出,以替代耗時費力的數值模擬正演過程。相關方法已經見諸于套管井頻散曲線正演應用中:斯倫貝謝公司道爾研究中心的科研人員在其智能化處理平臺上掛接了智能化的井外地層徑向速度成像方法[2],針對實際數據處理過程中多層柱體模型頻散曲線求取病態問題而引起的計算速度慢的問題,利用神經網絡方法替代頻散曲線正演解算器,實現了頻散曲線快速正演。隨著正演過程的不斷完善和提速,在不久的將來,機器學習模型可以貫穿于整個全波形聲波測井資料的反演過程,為智能反演速度帶來數量級提升,從而滿足現場應用的實時性要求。

3.2 結合常規測井資料及成像測井資料的模式識別任務

結合智能解釋方法,常規測井曲線從數學及統計學層面反映了儲層巖石物理性質和沉積相信息。高分辨率井下成像儀器能夠真實地從視覺角度觀察到豐富的地質信息。成像測井資料經圖像處理方法,如Hough變換[54]、結合灰度直方圖的閾值分割Otsu算法[55]、邊緣檢測濾波[56]、形態學濾波[57-58]等,可實現裂縫、斷層識別。發展至今,成像測井領域積累了大量高分辨率井下圖像數據,隨深度學習在圖像分割領域的不斷發展,深度學習方法在基于圖像的模式識別任務中表現出比傳統方法更好的性能[59]。這些方法最早在勘探地震資料上加以應用,如Wu等[60]提出FaultSeg3D網絡,該網絡結合醫學影像分割領域中應用廣泛的U-Net網絡,利用大量合成數據訓練網絡,實現了對三維工區的斷層檢測,引領了一波基于深度學習的地震數據斷層檢測浪潮。對于成像測井領域,成像資料一方面缺少大量可靠且質量統一的標簽數據集;另一方面,受測量盲區的影響,成像資料中存在寬尺度條帶的缺失,給算法的特征提取帶來一定干擾。因此,相關研究還不夠成熟。已有研究中,Cruz等[61]提出了基于深度學習進行斷層與裂縫識別的工作流程,通過Hough變換發現可能的斷層及裂縫,并利用深度學習確定其是否為斷層及裂縫;Dias等[62]則建立了快速區域卷積神經網絡(Fast Region Convolutional Neural Networks,Fast-RCNN)自動從模擬的井眼聲波測井圖像中拾取裂縫與斷層,并給出所拾取的目標的置信度。

裂縫、斷層在成像測井圖像中直觀而明顯,因此,業界人員通常從成像測井資料中獲取井下裂縫、斷層等圖像信息。常規圖像處理手段對井眼圖像進行分析具有簡單易行的優勢,但算法對于圖像失真、圖像噪聲高度敏感,具有不穩定的特點。結合機器學習的裂縫、斷層自動拾取手段又因標簽數據的缺乏,難以用于實際工程數據分析研究。近年來,在機器學習方法的幫助下,利用成像測井圖像資料估算孔隙度、滲透率,甚至實現地層解釋的任務逐漸涌現,并取得了很好的效果。這些方法很好地利用了成像測井資料分辨率高的優勢,并提升了井下參數在空間上的精確度。Valentin等[24]將不同測深處的井眼圖像數據轉換為紋理信息,以此保留測深周圍井壁處觀察到的地質構造信息,并基于堆棧自編碼器構建深度編碼-解碼模型,利用井眼圖像數據對地層滲透率和孔隙度進行了有效估計,在測試數據集精度達到了96%;Al-Obaidi等[63]將井眼成像測井數據中提取的基于圖像的巖石結構相關的特征與常規測井資料及常規巖心分析數據相結合,實現了巖相及巖石類別的檢測;Gonzalez等[64]采用圖像分析方法將電成像測井資料提取為基于圖像特征的巖石結構參數變化曲線,結合常規測井曲線信息,利用無監督聚類方法進行巖相分類,為常規測井曲線進行逐層聯合反演,并借此估計孔隙度、流體飽和度及總有機碳含量。

這些創新解釋方法表明,隨著人工智能及地球物理測井領域的不斷發展,從業人員有望基于機器學習強大的非線性映射能力,吸納更多來自新測井手段的有用信息,以跳出對測井資料的固有認識,獲得比現有智能巖相分類、參數反演等更為可靠的預測結果。同時,還可以通過不確定性分析,為地球物理測井分類或回歸任務的精度和可靠性進行評價,并通過影響因素評價分析不同輸入資料的重要性,更系統地解釋測井手段蘊含的深層次信息。

3.3 開源數據集、標簽數據擴充及無監督方法結合

為訓練出用于測井數據智能解釋的魯棒性強、泛化性好的算法,需要可靠的標簽數據集。計算機視覺、圖像處理領域作為機器學習發展的先導領域已經證明:不斷涌現出的性能優良的新模型離不開高質量數據集的幫助[59]。但是,在地球物理測井這樣一個垂直領域,由于測井儀器研發的成本昂貴、采集數據的成本較高,通常難以獲取足量且高質量的、適用于機器學習任務的標簽數據集。因此,對于地球物理測井領域,開發及編譯大量高質量具有代表性的標簽數據集,有利于數據驅動的機器學習方法研究,并有望促進計算機視覺等其他機器學習應用領域的算法改進。Hall[31]曾于2016年在The Leading Edge地球物理教程系列中,為地球物理從業人員展示了簡單的基于機器學習的巖相分類應用(文中用到的分類器為SVM)的工作流程。通過將相關數據集開源,吸引了大量人員探索巖相分類機器學習方法[34-35],并付諸于實際應用[36],取得了優于傳統方法的效果。

挪威Equinor公司[65]于2018年公開了其在北海Volve油田測量的數據,包含了來自挪威大陸架Volve油田從2008到2016年投產期間的約40 000個文件,用以支持學術機構、學生和研究人員進行能源創新智能研究。過去,測井數據格式紛繁復雜,學術界即便拿到數據,也難以實現數據解編,而隨著該數據集中常用的測井數據格式DLIS的編輯、讀取方式公開[66],多位學者基于此數據集進行了相關的研究,取得了可觀的研究成果,如2.1節提到的挪威科技大學的Viggen等[39-41]以及Reolon等[40]的研究。美國科羅拉多礦業學院的Ghaithi等[67]則利用人工神經網絡預測了Volve油田的橫波測井資料。

雖然行業逐漸意識到標簽數據集對創新智能解釋應用帶來的極大幫助,然而,受限于現有數據集,需多次訓練[24]或設計復雜的訓練過程[53]以保證網絡性能。簡單分類器難以在測試集上得到優良的分類精度,而先進算法因樣本數量有限難以獲得顯著的效果提升[68]。同時,監督學習算法只能為測試集數據分配訓練集中存在的標簽類別。以巖相分類應用為例:訓練數據僅包含砂巖、頁巖及碳酸鹽巖的巖相標簽,輸入模型的測試數據將只能被預測為這些巖相標簽。對于實際工區數據,若測試數據確實存在新的巖相,已有模型將無法正確為這些巖相樣本做出正確預測。因此,如何設計新方法,以降低對完備數據集的需求程度,有極大的研究意義。

機器學習的發展使得數據分析人員可以根據數據特點選擇最合適的處理方法。經典聚類算法(如K-Means)在計算給定的含有多個數據樣本的低維度樣本集時,能夠很快地將它們劃分為K個分區。在成像測井領域,Yamada等[69]結合圖像分割技術與無監督方法,通過計算井眼圖像各個深度的邊界似然值,并用聚類算法為相似邊界進行聚類以構造標簽參考區域。但該方法對于成像資料分辨率及成像質量要求較高,一般工區難以實現。聚類方法也可以根據常規測井資料內不同深度的相似特征自動將不同深度歸為相同的簇[23],但歸類后各深度的地質意義仍需要資深的測井解釋人員來分析。在這些應用中,不同測量深度所對應的不同測井曲線值被視為代表該測深巖相特征的向量。聚類算法為不同測深的特征向量聚類,以類比真實的巖相分類,取得了一定效果。當數據維度增大,利用經典算法進行聚類分析將十分耗時,聚類效果也會受到影響。隨著深度學習卷積層為深度學習算法帶來的飛躍式發展[11],這一問題得到了一定改善。同樣以手寫數字體識別為例,可以利用CAE獲取手寫數字體的深度表征,并將其用于聚類分析,以降低聚類方法的時耗,顯著提升聚類效果[70],該方法以新角度改善了標簽不足的問題。相關思路已經見諸于地球物理領域,如Qian等[71]通過設計CAE對疊前地震數據進行特征提取,并為所提取特征執行聚類分配,實現了地震相識別。Wen等[72]在Qian的基礎上設計了多種損失函數,得到更好的重構效果,在一定程度上改善了聚類效果,但并未將聚類損失納入網絡訓練中。Nalepa等[73]將三維卷積自編碼器架構用于遙感高光譜圖像的特征學習,并將嵌入式特征用于聚類,這種聚類是在網絡訓練過程中進行的,即在損失函數中加入了加權聚類損失,同時考慮嵌入式特征層設計對算法性能的影響,實現了對無標簽數據的分割。Duan等[74]同樣將編碼器提取的深度表征與聚類分配之間的散度作為聯合損失,以提升編碼器表征提取能力,獲得更佳的聚類效果。

隨著深度聚類方法在勘探地震領域取得成功,這些方法也有望從新的角度幫助測井從業人員對數據集進行解釋,以改善測井資料智能解釋中普遍存在的數據集不足等問題。例如,針對成像測井資料,可設計具有一定深度的表征學習網絡(如深度卷積自編碼器),用于提取成像測井資料的嵌入式特征(見圖5)。選擇合適的聚類方法對嵌入式特征執行聚類分配,可改善成像測井資料分類任務精度,幫助實現高質量儲層模型建立及精細的儲層解釋。如Lima等[75]率先做出相關嘗試,并給出了相應的聚類簇中各個成像資料所蘊含的巖相信息解釋,節省了人工解釋時間。相關方法或許仍難以完全替代巖心分析、專家解釋,但可作為人工解釋或完備數據集制作等工作的先導研究,極大節省從業人員在數據預處理、數據集準備過程中耗費的時間和精力,更好地推動智能方法在測井領域的應用。目前筆者的課題組在這個方向已經取得了初步的成果。

圖5 用于成像測井資料的深度聚類方法示意圖(圖片重制自Lima等[75])

4 總 結

通過介紹人工智能、機器學習相關概念及其分類,將基于物理模型的傳統建模方法和基于機器學習手段的智能方法進行對比,簡述了人工智能方法對于地球物理測井領域數據分析任務的適用性。用這些方法探索更大的函數空間,以非線性方式從高維空間中發現變量間的關系。并從2類發展較為系統的常規測井資料智能解釋領域(常規測井資料巖相分類和參數反演)列舉了這些智能算法的工作流程。最后,筆者從3個方面為測井資料智能解釋的未來發展提出了思考及展望。

(1)借助大量理論模型正演資料,機器學習方法或能作為數值模擬方法的替代模型。

(2)開發適用于更多來自新手段的測井資料的機器學習智能解釋工作流,可為傳統智能巖相分類及參數反演等任務帶來更好的效果。

(3)如何高效擴充開源數據集或結合無監督手段提升智能算法表現,值得從業人員思考。

除了上述3點思考和展望外,還有不少新進展:如基于計算機視覺的成像測井裂縫識別及數字巖心圖像重構;基于人工智能技術的測井儀器(基于集成電路技術發展定制化的測井芯片);基于邊緣計算、深度學習的測井資料壓縮(實現更快的數據傳輸);構建測井云平臺,利用大數據技術將機器學習方法應用于海量測井數據的快速解釋等。

相信,隨著從業人員的不斷探索,人工智能、機器學習方法同地球物理測井領域將實現更為緊密的結合,帶來更多的進展與突破。

猜你喜歡
方法
中醫特有的急救方法
中老年保健(2021年9期)2021-08-24 03:52:04
高中數學教學改革的方法
河北畫報(2021年2期)2021-05-25 02:07:46
化學反應多變幻 “虛擬”方法幫大忙
變快的方法
兒童繪本(2020年5期)2020-04-07 17:46:30
學習方法
可能是方法不對
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
最有效的簡單方法
山東青年(2016年1期)2016-02-28 14:25:23
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
賺錢方法
主站蜘蛛池模板: 免费高清毛片| 美女高潮全身流白浆福利区| 国产在线一二三区| 亚洲成人黄色在线| 久久久久青草线综合超碰| 综合五月天网| 五月婷婷伊人网| 全午夜免费一级毛片| 蜜桃视频一区二区| 五月天久久婷婷| 色综合久久88| 人妻丰满熟妇啪啪| 激情乱人伦| 深夜福利视频一区二区| 免费国产福利| 小13箩利洗澡无码视频免费网站| 亚洲AⅤ无码国产精品| 伊人国产无码高清视频| 久久77777| 日本欧美视频在线观看| 97无码免费人妻超级碰碰碰| 国产jizz| 国产精品手机在线观看你懂的| 日本少妇又色又爽又高潮| 亚洲一欧洲中文字幕在线| 人人91人人澡人人妻人人爽| 国产在线小视频| 人妻无码AⅤ中文字| 97se亚洲| 久久国语对白| 国产人成网线在线播放va| 亚洲日本一本dvd高清| 精品1区2区3区| 欧美三级日韩三级| 久久亚洲美女精品国产精品| 亚洲欧美色中文字幕| 无码高清专区| 97国产在线播放| 亚洲欧美另类久久久精品播放的| 亚洲国产成熟视频在线多多| 婷婷午夜天| 亚洲区第一页| 91黄视频在线观看| 播五月综合| 国产欧美性爱网| 国产福利一区二区在线观看| 欧美在线天堂| 强乱中文字幕在线播放不卡| 日韩亚洲综合在线| 尤物亚洲最大AV无码网站| 精品亚洲麻豆1区2区3区| 国产va在线观看| 福利在线不卡一区| 日本日韩欧美| 日韩少妇激情一区二区| 亚洲一区二区约美女探花| 2021天堂在线亚洲精品专区| 亚洲男人在线天堂| 亚洲无线一二三四区男男| 毛片在线看网站| 亚洲精品视频网| 人妻无码AⅤ中文字| 青草精品视频| 日韩成人免费网站| 亚洲综合中文字幕国产精品欧美| 野花国产精品入口| 精品精品国产高清A毛片| 久久精品aⅴ无码中文字幕| 国产免费网址| 日韩性网站| 国产成人精品在线1区| 98精品全国免费观看视频| 亚洲综合第一区| 亚洲女同一区二区| 高h视频在线| 国产真实自在自线免费精品| 色偷偷av男人的天堂不卡| 色婷婷亚洲综合五月| 波多野结衣一区二区三区AV| 狠狠色丁香婷婷综合| 中文字幕首页系列人妻| 国产丝袜第一页|