杜宇 潘遙
(1、中國地質大學(武漢)工程學院,湖北 武漢430074 2、中南財經政法大學財政稅務學院,湖北 武漢430073)
巖石可鉆性指的是巖石抵抗鉆鑿破碎的能力, 是探礦鉆井工程不可或缺的一個指標,具有重要的價值意義。對于巖石可鉆性的評價方法也受到學者越來越多的關注。目前對于巖石可鉆性的研究方法主要有三類: 微鉆實驗法、Dc 指數法和利用測井參數預測法[4]。其中前兩種方法都為鉆后評價法,脫離了巖心所處的真實的高溫高壓環境,鉆取的巖心不具有代表性等缺點。利用測井資料評價法既能較好的反應地層實際的環境, 又能全面的反應一個地區(某口井)的可鉆性性質,還具有經濟環保等優點。在可鉆性預測模型研究里,有一種通過利用測井資料建立神經網絡模型來對巖石可鉆性進行預測的方法, 這樣既能反應巖石地層巖石實時鉆進環境, 又能更加方便快捷的建立可鉆性與巖石所處環境的之間的聯系。
人工神經網絡是一種運算模型,它在解決非線性、多參數的擬合問題有較好的效果。而BP 神經網絡作為常見的神經網絡,它常被研究者用于地層可鉆性的預測研究中。夏宏泉等人基于BP 神經網絡利用測井資料建立巖石可鉆性預測模型,為鉆頭選型提供了較好的依據[3]。沙林秀等人提出基于自適應雙鏈量子遺傳算法優化BP 神經網絡結構的巖石可鉆性提取建模方法[10]。周啟成等人把測井數據作為輸入參數, 可鉆性極值作為輸出參數,利用BP 神經網絡建立涪陵頁巖氣區塊輸入參數與輸出參數之間的映射關系[8]。董青青等人提出了基于粒子群算法優化的BP 神經網絡巖層可鉆性預測模型,具有較高的精度[7]。
BP 網絡模型具有良好的自適應性、自學習性和極強的非線性逼近、容錯能力等優點。但是在用于網絡的初始權值和閾值都是隨機生成的,就可能會導致結果陷入局部最優。因此本文提出一種基于遺傳算法優化的BP 神經網絡巖石可鉆性預測模型,以地層的測井資料作為網絡的輸入參數, 地層可鉆性級值作為輸出建立BP 神經網絡,然后利用遺傳算法BP 神經網絡的初始權值和閾值進行優化,提高了模型的收斂速度和預測精度。
遺傳算法(Genetic Algorithms,GA)在1962 年由美國人提出,它是通過模擬遺傳學的機理和達爾文生物進化論而形成的一種并行隨機搜索最優化方法。與自然界中“優勝略汰,適者生存”的生物進化原理相似, 遺傳算法就是將需要優化的參數進行編碼成染色體并入種群群體中,選擇合適的適應度函數,對種群中的個體進行選擇、交叉和變異操作,保留適應度值好的個體,適應度差的個體被淘汰。這樣反復循環操作,直至滿足所需要的條件。
首先先對參數進行編碼, 將需要優化的參數編碼含有N 個個體的種群X={X1,X2,…,Xn},其中Xi是種群個體的基因值也即是需要的參數值。然后就是確定一個適應度函數為種群大小,來評價參數優化后的,預測精度。

BP(Back Propagation)神經網絡是用誤差逆向傳播算法(Error Back Propagation)進行訓練的,是一種多層前饋神經網絡。結構主要包括三個部分,輸入層、輸出層和若干個隱含層,處于同一層的神經元是相互獨立的,它們之間沒有信息傳遞,不同層之間的神經元則是通過神經網絡網絡參數(權值和閾值)相互連接。基本BP 算法包括信息前向傳播過程和誤差反向傳播過程。正向傳播時, 輸入信號由輸入層向前傳遞到隱含層再到輸出層得到輸出信號,得到的輸出信號與期望輸出不符,則計算它們之間的誤差,轉入誤差的反向傳播過程。誤差反向傳播則是將得到的誤差反向作用于各層神經元的網絡參數。如此循環反復學習訓練,直到實際輸出與期望輸出達到要求的精度為止,訓練即告停止。
遺傳算法優化BP 神經網絡模型分為3 個部分, 分別為BP神經網絡結構確定、GA 優化權值與閾值和BP 神經網絡預測。由文獻[3~5]可知影響巖層的可鉆性級別的因素主要包括聲波時差Δt、地層密度ρ、電阻率Rt以及泥質質量分數Vsh等。我們將與地層可鉆性密切相關的參數(聲波時差、地層密度、泥質質量分數、電阻率)作為網絡的輸入量,以地層可鉆性級別Kd作為網絡的輸出,建立巖石可鉆性預測模型如圖1 所示。

圖1 可鉆性預測模型
BP(Back Propagation)神經網絡是一種采用誤差反向傳播算法(Error Back Propagation)的前饋神經網絡模型,實質上就是求誤差最小問題, 通過模式順傳播和誤差傳播反復進行網絡記憶訓練直到收斂。我們可以采用均誤差MSE(Mean Squared Error)來作為網絡的擬合函數:

式中:Fi表示神經網絡的預測值(i=1,2, …,n);Yi表示目標值(期望結果)。
基于GA 優化的BP 神經網絡是對初始值和閾值進行優化得到的預測模型。我們利用文獻[3]數據中的地層參數,作為BP神經網絡的輸入數據和輸出數據,然后使用MATLAB 軟件先構建不同節點數的BP 神經網絡,采用默認初始值各模擬5000 次,計算得到每個神經網絡的誤差MSN,如圖2 所示。從圖中可以看出在隱含層為7 時樣本誤差MSE 值最小,并且誤差比較穩定,所以選擇7 個節點最優,因此BP 神經網絡結構為n-7-1,n 為輸入層節點數(對應地層的各個參數),7 為隱含層個數,輸出層個數為1(表示可鉆性級值)。

圖2 不同隱含層的對應的MSE 值
基于遺傳算法和BP 神經網絡理論,在MATLAB 中實現基于GA 優化的BP 神經網絡巖石可鉆性預測模型。遺傳算法中的參數設置: 種群規模設為100, 進化次數設為200 次, 交叉概率為0.4,變異概率為0.2。進化次數在50 次左右適應度就已接近平緩了,為了保守起見將進化代數設置為200。模型的網絡結構一共有有4 個輸入參數、1 個輸出參數, 所以設置的BP 神經網絡結構為4-7-1,即輸入層有4 個節點,隱含層7 個節點,輸出層1 個節點,網絡結構中共有4×7+7×1=35 個權值,7+1=8 個閾值。可以確定遺傳算法個體的編碼長度為35+8=43。
將優化好的初始權值和閾值對所建好的模型進行訓練,并將文獻中的后10 組數據進行回判預測,再將文獻[1]中預測數據進行對比分析,得到回判結果,將所得結果繪制成曲線如圖3 所示。由圖3 可看出基于GA 優化的BP 神經網絡對地層可鉆性的預測誤差不超過1%,比未經優化的BP 神經網絡擬合效果更好,而且誤差波動較小。

圖3 三種預測地層可鉆性模型的曲線對比
4.1 通過預測值對比結果分析可以看出,GA-BP 的相對誤差的平均值為0.17,BP 的相對誤差的平均值為3.26。GA-BP 模型預測精度比BP 模型要高,克服了BP 網絡容易陷入極小值的缺點,為可鉆性級值預測提供了一種高精度的模型。
4.2 利用已鉆的測井資料建立訓練模型,然后利用未鉆區域的測井資料輸入模型中即可預測未鉆區域的可鉆性級值, 為地層巖石可鉆性評價提供了一種新的方案,具有適用性廣的特點。