李建國 張衛東 劉冠男
摘 要:深度學習也被稱為深度神經網絡,是機器學習的最新研究結果,在2006年Geoffrey Hinton提出訓練深度神經網絡的方法以后,其在語音和圖像處理的領域迅速發展,并取得了很好的成績。由于深度學習優良的特征提取性質,所以在這里把深度學習用在地球物理測井巖性的識別中,對四川西部川科1井的巖性進行識別。
關鍵詞:深度學習;測井;巖性識別;儲層預測
引言
儲層預測是尋找油氣資源,評估油氣儲量基礎的工作之一。由于井下地質構造的復雜性和測井參數分布的模糊性,傳統的巖性識別方法往往識別精度有限,很多時候對人的經驗要求比較高。前人應用神經網絡在測井巖性識別上做了大量的研究,取得了很好的結果,但是前人的研究中主要是使用BP神經網絡對巖性預測,盧新衛,金章東對勝利油田某測井巖性用BP神經網絡進行識別[1],以及范訓禮等用BP網絡對塔里木油田TZ4測井的巖性進行了自動識別[2],侯俊勝、王穎利用BP網絡對煤氣層測井資料進行了定量解釋識別[3],識別準確率不是很高。BP神經網絡有一個致命的缺點就是容易陷入局部最小值,特別是隨著神經網絡層數的增加,其陷入局部最小值的可能性大大增加,相對而言深度學習就可以很好的克服這個缺點,取得很好的結果。
1 深度學習發展
在Geoffrey Hinton 2006年提出深度學習[4]之后的短短數年里,深度學習就以其強大的對數據內部結構的表征能力贏得了國際學術界的廣泛重視,各個互聯網巨頭如:百度,google,騰訊,紛紛成立深度學習的研究實驗室,美國國防高級研究計劃局也于2009年成立了深度學習項目組。微軟公司已經成功地將深度學習方法應用于自己的語音識別系統當中,它能夠將單詞錯誤率相較之前的最優方法降低約30%。 因此,深度學習被認為是繼1997年的隱馬爾科夫(Hidden Markov Model, HMM)模型之后,語音識別領域的又一次重大突破[5]。
2 深度學習理論簡介
到目前為止深度學習主要有三種方法:卷積神經網絡,限制玻爾茲曼機,自動編碼機,在這里我們主要使用的是受限玻爾茲曼機(RBM)。
RBM是第一個由統計力學推導出來的多層學習機,機器的命名認可了神經網絡的自身動力學行為和RBM原始關于統計熱力學工作形式上的等價性。基本上說,RBM可以對給定數據集的固有概率的分布進行建模,這樣在諸如模式完備和模式分類的任務中所使用的條件分布就可以推導出來了。在對比散度出現以前我們一般用MCMC求解,但是那樣的話其學習過程是慢得難以忍受,所以在這以前其根本沒有任何實用價值,直到Hinton發明對比散度以后其才得以飛速發展,特別是在語音和圖像上取得了很大的成功。
3 能量模型作用
在RBM中使用了能量模型,其原因有幾個:
(1)RBM網絡是一種無監督學習的方法,無監督學習的目的是最大可能的擬合輸入數據,所以學習RBM網絡的目的是讓RBM網絡最大可能地擬合輸入數據。
(2)在馬爾科夫隨機場(MRF)中能量模型主要扮演著兩個作用:全局解的度量(目標函數),和能量最小時的解(各種變量對應的配置)為目標解。換句話說,使用能量模型使得學習一個數據的分布變得容易可行了。能否把最優解嵌入到能量函數中至關重要,決定著我們具體問題求解的好壞。統計模式識別主要工作之一就是捕獲變量之間的相關性,同樣能量模型也要捕獲變量之間的相關性,變量之間的相關程度決定了能量的高低。把變量的相關關系用圖表示出來,并引入概率測度方式就構成了概率圖模型的能量模型。RBM作為一種概率圖模型,引入了概率就可以使用采樣技術求解,在對比散度算法中采樣部分扮演著模擬求解梯度的角色。能量模型需要一個定義能量函數,RBM的能量函數的定義如下:
這個能量函數的意思就是,每個可視節點和隱藏節點之間的連接結構都有一個能量,通俗來說就是可視節點的每一組取值和隱藏節點的每一組取值都有一個能量。
4 公式推導
在這里我們的能量函數不是以前的二項分布的能量函數了,而是具有高斯分布的能量函數了,如下所示:
寫成向量的形式如下:
因為在這里我們的V是高斯分布,其是連續分布的不是二項分布的,所以
經過很多步化簡可以得到以下結果
由以上公式可以推導出:
所以可視節點是由u=bi+?撞jwi,jhj?滓i為均值,?滓i為方差的高斯分布。
5 研究結果
本次研究以川西地區川科1井來驗證巖性的識別結果,川科1井是開拓四川盆地海相勘探新領域具有重要戰略意義的科學探索井。選擇了聲波測井(AC),井徑1(CAL1), 井徑2(CAL2),密度(DEN),自然伽瑪(GR),5條測井曲線作為研究對象,選取有巖芯資料的樣本45個,作為深度學習的輸入樣本,在這45個樣。
文章中我們以30個作為訓練的樣本,15個作為測試的樣本在這個神經網絡中通過不同的參數對深度學習的影響,選擇最優的參數,最后得出結果,當層數為5層時,每層的節點個數為10個時所得到的結果最好。個別樣本測試結果的誤差較大,其余的與期望輸出值完全一致,巖性識別正確率高達90%以上。
6 結束語
在通過大量的測試發現深度學習可以得到很好的結果,相對于的傳統BP網絡其克服了收斂慢和發散的問題,也體現了其特征提取的優越性。但是由于深度學習神經網絡參數初始化的隨機性,有時候相同的測試參數可能得到不同的測試結果,所以深度學習訓練有一定的困難性。
研究表明采用深度學習來進行測井巖性識別,方法簡單易操作,且識別準確率相當高。這為測井資料地質解釋提供了一個全新的方法,對于探尋和鑒別含油氣地層的精確性,在油氣資源開發領域非常具有實用意義。
參考文獻
[1]盧新衛,金章東.前饋神經網絡的巖性識別方法[J].石油與天然氣地質,1999,3.
[2]范訓禮,戴航,張新家,等.神經網絡在巖性識別中的應用[J].測井技術,1999,1.
[3]侯俊勝,王穎.神經網絡方法在煤氣層測井資料解釋中的應用[J].地質與勘探,1999,5.
[4]Hinton,G.E.Osindero,S.and Teh,Y.A fast learning algorithm for deep belief nets[J].Neural Computation,2006,18:1527-1554.
[5]曾黃麟,虞厥邦,曾謙.基于主成分分析的特征簡化[J].四川輕化工學院學報,1999,12(1).
作者簡介:李建國(1987-),男,成都理工大學地球物理學院在讀碩士研究生,地球探測與信息技術,主要研究方向為深度學習在地球物理方面的應用。