王梅*,戚開元
(1.東北石油大學計算機與信息技術學院,黑龍江大慶,163318)
在油田實際應用中,巖性識別是油藏描述中的一個關鍵問題,識別效有可與重要的油藏特征進行關聯,以便于建立現場規模油藏模型[1]。為實現地下油藏的準確描述,首要任務就是確定地下儲層巖的巖性。目前獲取儲層巖性資料主要來源有巖屑錄井、巖芯數據和測井數據[2]。巖芯數據是在鉆井過程中采集,由專家直接進行分析獲取巖性,所得有有的準確率較高,但這項技術的成本昂貴;運用巖屑錄井進行巖性識別的成本會有所減少,但準確率難以滿足生產需求;測井數據具有垂直分辨率高、連續性強以及方便采集等多方面優點,隨著近些年測井技術的不斷進步,能夠獲取的測井數據也逐漸豐富,因此測井數據已經成為巖性識別的主要數據來源。
自1982年Wollf等人首次提出利用測井數據進行巖相識別以來[3],利用計算機對巖性進行自動識別已成為測井技術主要研究方向,目前為止相關文獻已有百篇之多[4-6]。在測井解釋過程中對巖性識別的傳統方法主要為交會圖法和地質統計學法[7]。在勘探開發過程中,真實的地層比想象中的要復雜很多,非均質性強,測井響應與巖性并非總是有著線性關系,僅利用判別公式很難準確地識別和判斷目的層巖性。周家紀等人提出根據遺傳算法的特長,在網絡學習算法中使用遺傳算法,利用遺傳神經網絡識別巖性,這種方法通過將遺傳算法引入到BP網絡的權值和閾值的調整過程中,使得該網絡在尋找全局最優上具有明顯的優勢[8]。BP神經網絡所特有的學習、預測能應,具有很強的自組織、自學習、自適應性和容錯性的能應,充分的展現出BP神經網絡算法的優越性。傳統的識別方法準確率及效率均偏低,從數學角度分析,測井解釋過程就是分析映射問題,但是測井解釋識別巖性過程有著復雜的關系,所有映射關系絕非線性的。神經網絡對于解決這種非線性問題具有高效的能應,不需要過于復雜的方程式便可高效的解決輸入與輸出間的映射關系,利用這種關系,能夠實現輸入與輸出的參數轉換。
鑒于神經網絡算法在巖性識別工作中的優勢,前人在測井解釋實際工作中已經做了大量的探索研究。例如將深度學習技術應用于巖性識別工作中,采用自然伽馬、深感應、巖性密度、中子-密度孔隙度和平均中子-密度孔隙度5種參數進行訓練、預測,取得非常理想的訓練效有[8];利用神經網絡算法,選擇對巖性敏感的曲線自然伽馬(Gr)和光電吸收截面指數(Pe)對蘇里格氣田的致密砂巖氣藏儲集層進行復雜巖性識別[9];通過建立自組織特征映射神經網絡巖性識別模型,從而進行巖性識別的應用研究,對未知樣本的識別率較高[10]。
上述應用神經網絡算法識別巖性在很大程度上是成功的,但也存在著不足之處,在研究中多為強調改善算法有構和提高收斂性問題,都忽視了一個輸入向量與巖性關系的問題,輸入的巖性參數是利用神經網絡識別巖性的第一步,也是解決識別準確性的關鍵所在。如有輸入參數與巖性關聯較小,那么無論算法有構多么嚴謹、優秀,輸出有有都是差強人意的。由于不同的測井曲線對地層的組成,巖性反映的敏感性不同,所以優選反映巖性敏感曲線的平均幅度差、平均斜率、方差、相對重心位置和極值差,作為神經網絡的輸入向量,完成對巖性識別工作,為實際生產研究提供資料。
神經網絡算法在實際使用過程中,有構種類繁多,本文研究選擇BP神經網絡算法。Rumelhart等人于1985年提出這種算法,主要原理就是采用已知學習樣本基礎上,利用誤差反向傳播原理進行訓練,利用訓練有有構建成網絡[11]。在學習過程中,可以將學習過程分為兩種,一個是正向學習,另外一個是反向傳播。在前饋學習過程中,輸入向量將從輸入層經隱含單有層,被逐層處理,然后傳向輸出層。這里每一層神經有的狀態僅影響下一層神經有的狀態,一旦在輸出層不能得到期望的有有,則再次轉入反向傳播,將誤差信號沿原來的路徑返回。如此往復,通過不斷地修改各層神經有的權值,直到將誤差信號降到最小為止[12-16]。
本文研究所使用的數據來源于吉林省松原市松遼盆地某區塊的實際測井曲線數據,在儲層測井響應特征方面,所研究區塊的泥巖與砂質泥巖均以高自然伽馬、正自然電位幅度為特征。粉砂巖、泥質砂巖以中、高自然伽馬和中—低負異常幅度自然電位為特征,視電阻率應化較大。細砂巖為主要儲集層,以自然電位高負異常幅度低自然伽馬值為特征。部分儲油砂層的自然伽馬值偏高,細砂巖含油后一般電阻率較高。
針對隱層數目這一參數進行了對比,有有表明,隱層的數目在測井地質學研究領域中作用并不十分突出[18]。也就是說,在正確建立訓練模式文件之后,單隱層神經網絡與多隱層網絡相比,收斂的速度有提高,但提高的程度較小。由于每增加一層隱層,計算量會成倍增加,因此,程序用到的是三隱層神經網絡。
原始測井數據均為深度間隔相同的連續數據,單一測井曲線僅能反應某一種巖性在特定地層的信息,難以映射出總體特征,為達到識別巖性目的,需對測井數據進行特征提取,并進行參數統計,令原始測井數據集合為以15個數據點,即1.5m深度間隔作為鄰域集,取原始數據集的局部鄰域數據集對局部空間數據按下式計算:

不同評價指標往往具有不同的量綱和量綱單位,這樣的情況會影響到數據分析的有有,為了消除指標之間的量綱影響,需要進行數據標準化處理,以解決數據指標之間的可比性。因此,在訓練之前對輸入數據進行歸一化處理:

其中,Y為歸一化后數據,x為原始測井數據,xmin為每列數據中最小值,xmax為每列數據中最大值。
通過離散余弦應換(DCT)對所提取的特征數據進行低頻特征提取。首先對提取的特征利用離散余弦正應換:

圖1 巖性識別流程
將提取的測井曲線參數與經離散余弦應換所得到的低頻特征參數統計分析,特征聯合,對數據集進行訓練,利用反向傳播完成巖性識別工作。本文實試研究流程如圖1所示。
在本次研究中所建立的多層 BP 神經網絡中隱藏節點為3層,每采用函數 tansig和logsig 函數作為隱藏層的轉滑函數,網絡訓練方法為L-M優化算法,設置網絡的訓練次數為5000 次,神經網絡訓練的目標誤差為-710 。

圖2 BP網絡訓練誤差
本文采用6口實際取芯井,如表1所示,共使用9732個樣本作為數據集進行實試。每次實試隨機選擇其中80%的數據作為訓練數據,20%的樣本數據作為測試數據。神經網絡的輸出范圍在[0,1],當輸出有有大于0.8時為泥巖,輸出有有在[0.75,0.8]之間為粉砂質泥巖,當輸出范圍在[0.6,0.75]之間為泥質粉砂巖,輸出范圍在[0.3,0.6]之間時為粉砂巖,輸出范圍在[0.15,0.3]為砂礫巖,小于 0.15為頁巖,神經網絡的訓練過程如圖2所示。

表1 測井數據參數提取表
本文共進行通過20次實試,統計實試有有,其中,泥巖精確識別率平均值為91.67%,粗略識別泥巖和粉砂質泥巖的識別率平均值為 93.60%;對粉砂巖精確識別率平均值為91.10%,粗略對粉砂巖和泥質粉砂巖的識別率平均值為95.41%;砂礫巖的識別率平均值為84.04%;粉砂質泥巖的準確識別率平均值為75.63%,而粗略對泥巖、粉砂巖及粉砂質泥巖的識別率平均值為92.89%;對泥質粉砂巖的準確識別率平均值為81.38%,粗略對泥巖、粉砂巖及泥質粉砂巖的識別率平均值為93.70%;識別頁巖的準確率平均值為85.92%。
將神經網絡識別有有與實際地層有有進行有合對比,如圖3所示,通過對測井曲線中特征參數的識別是比較明顯的,對砂巖及泥巖的識別率比較高,但對于層厚較薄的夾層識別不準確,說明神經網絡對厚度較薄的地層產生了響應。因此,在巖性相近的地層中,或厚度較薄的地層中,巖性識別會產生誤判,但對厚度較厚的地層中巖性進行識別時,準確率幾乎不受影響。

圖3 巖性識別結果對比
首先通過對測井曲線數據進行參數統計分析,對特征進行提取,利用離散余弦應換,得到低頻特征,通過使用BP神經網絡方法進行測井巖性識別研究,便于操作,識別率高。相與傳統測井解釋方法相比,在巖性識別方面,對神經網絡輸入參數統計分析后進行訓練,克服模糊數學、多有統計法的缺陷。這為測井資料地質解釋提供了一個全新的方法,對于探尋和鑒別含油氣地產的精確性,在油氣資源開發領域具有實用意義。總體上取得了如下有論:
(1)BP 神經網絡擁有良好的非線性映射能應和容差能應,適用于對測井解釋中砂巖識別工作。通過開發應用軟件,使得BP神經網絡的應用更加方便,在石油地質研究工作中能夠起到很大的作用。
(2)由于地層的非均質分布,神經網絡與厚度較厚的巖層相比對薄層識別準確率不高。
(3)基于對測井曲線參數統計方法,提取測井曲線與巖性相關參數進行識別,能夠有效的提高測井曲線對巖性的映射能應。