張立剛,苗振華,黃小剛,袁勝斌
(1.東北石油大學 石油工程學院,大慶 163318;2.中法渤海地質服務有限公司,天津 300457)
我國油氣資源豐富,但隨著勘探和開采力度的不斷加大,淺部地層和較容易開采的油氣資源日益減少,正逐步向深層和非常規方向發展[1-2]。隨著開采難度的增加,容易出現鉆井周期長、成本高、風險大等問題。因此,如何精準有效地預測出機械鉆速對提高鉆井效率有著重要意義[3-4]。
機械鉆速預測受研究區塊地理環境的多重影響,不同學者所建立的機械鉆速預測模型存在些許差異[5],但隨著大數據和機器學習等計算機技術的發展,機械鉆速預測模型精度在不斷提升,為現場高效施工提供了有利的參考依據[6-7]。文獻[8]通過可鉆性系數、鉆壓、轉速、井深和洗井液沖洗量5 個參數,建立了機械鉆速的多元回歸預測模型,鉆速平均相對誤差為7.66%。文獻[9]利用BP 神經網絡,考慮鉆井液密度、鉆壓、轉速、水利參數和鉆井液等指標實現井下機械鉆速預測,驗證了神經網絡預測機械鉆速的可靠性。文獻[10]分別建立了基于決策樹、隨機森林、全連接神經網絡和支持向量機的機械鉆速預測模型,結果表明支持向量機的鉆速預測模型精度最高。不難看出其他學者在機械鉆速預測方法上已經做了許多工作,但是在鉆速模型建立過程中多基于單一智能算法實現,且缺乏對訓練數據進行充分預處理的過程,造成出現預測誤差大、模型穩定性差和容易陷入局部最優等問題。
因此本文考慮一種基于MEA-BP 的混合算法來實現機械鉆速預測,利用思維進化算法對傳統的BP神經網絡進行優化處理,可以有效避免神經網絡陷入局部最優。同時對訓練數據進行多重預處理操作,降低數據冗余度,進一步提高機械鉆速預測精度。
BP(back propagation)神經網絡算法又被稱為誤差反向傳播算法,其具有較高的靈活性,在信號處理、模式識別和智能控制等領域被廣泛使用[11]。BP神經網絡拓撲結構如圖1所示,其中X1~Xn為輸入參數值,Y1~Ym為預測結果值,Wij和Wjk為神經網絡的權值,網絡一般由輸入層、隱含層和輸出層三部分構成。

圖1 BP 神經網絡拓撲結構圖Fig.1 BP neural network topology diagram
神經網絡中的學習算法由正向傳播和反向傳播兩部分組成,正向傳播獲得輸入數據的真實輸出值,而反向傳播則根據真實輸出值和期望輸出值之間的誤差來修正連接權值,通過不斷修正來減小誤差,最終實現更好的目標效果。
思維進化算法(mind evolutionary algorithm,MEA)受遺傳算法(genetic algorithm,GA)的啟發進一步演化而來,與遺傳算法有著許多相似的特征,保留了遺傳算法中的一些概念,其主要由種群、個體、環境和公告板組成[12]。并提出了“趨同”和“異化”的思想,代替了遺傳算法中“交叉”與“變異”思想。根據得分函數來判斷種群趨同、異化操作是否完成,若完成則輸出最優個體,用來訓練BP 神經網絡模型[13]。
傳統BP 神經網絡主要依賴誤差函數對初始權值和閾值進行調整,容易出現穩定性差、陷入局部最優等問題。大量學者研究表明,通過思維進化算法對BP 神經網絡進行優化處理,可以有效避免網絡陷入局部最優,提高預測精度[14]。具體的MEA-BP算法流程如圖2所示,其實現過程大致如下:

圖2 MEA-BP 流程Fig.2 MEA-BP flow chart
(1)數據預處理,確定網絡訓練數據樣本,并設定BP 神經網絡的拓撲結構;
(2)思維進化算法參數設定,定義迭代次數、種群大小、優勝子種群和臨時子種群大小等參數;
(3)產生初始種群,并計算各種群得分,得分函數為


(4)執行趨同和異化操作,通過不斷迭代,更新優勝種群和最優得分;
(5)判斷是否滿足輸出條件,若滿足則輸出最優權值和閾值,否則繼續執行上述步驟(4)的操作;
(6)將最優權值和閾值賦給BP 神經網絡模型,進行迭代訓練,最終輸出預測結果。
在實際鉆井過程中,機械鉆速受到機械參數和鉆井液參數的共同影響。本文基于井場實鉆數據,綜合考慮了機械參數和鉆井液參數對鉆速的影響。選取深度、鉆壓、轉速、扭矩、泵壓、排量、鉆頭尺寸、鉆井液密度8 個參數,為了降低數據的冗余性,通過小波降噪、標準化處理、灰色關聯度分析等方法,篩選出和鉆速相關性較高的參數,用來預測機械鉆速。
2.1.1 小波降噪
鉆井數據采集是一個較為復雜的過程,采集到的數據可能會受到工程、環境、人為等多因素的干擾,造成數據出現異?,F象。為了消除鉆井數據中異常干擾,選擇小波閾值降噪方法,該方法通過小波分解、閾值處理和小波重構等流程實現降噪目的[15]。
在小波降噪過程中選擇合理的閾值處理方式至關重要,本次選擇硬閾值方式,該方式可以較好地保留原信號,且均方誤差較小,其公式如下:

利用硬閾值方法降噪處理后的部分數據如圖3所示,通過降噪前后數據對比,可以發現降噪前后數據趨勢仍保持一致,并沒有改變原始數據特征,并且降噪后的數據相較于原始數據變得更加平滑,消除了一些尖峰狀異常數據。

圖3 小波降噪前后數據對比圖Fig.3 Comparison of data before and after wavelet noise reduction
2.1.2 標準化處理
對小波降噪后的鉆井參數進行標準化處理,由于選取的參數在數值分布上和量綱上并不統一,在模型建立過程中難免會受到相應的影響,因此進行標準化處理,消除不同參數之間量綱和量級上的差異。選擇min-max 方法來實現,見公式(4),處理后的數據分布在0 和1 之間。

式中:X 為樣本值;Xmin為樣本最小值;Xmax為樣本最大值。
2.1.3 灰色關聯度分析
為了提高模型計算速度、降低數據冗余度,通過相關性分析優選出和機械鉆速相關性較高的參數。但鉆井參數之間關系較復雜,傳統的一元多元分析難以刻畫各參數之間的關系,因此引入灰色關聯度分析方法。通過計算各參數和機械鉆速之間的灰色關聯度,篩選出灰色關聯度較高的參數作為模型輸入參數。灰色關聯度計算公式如下:
式中:ξi(k)為灰色關聯系數;x0(k)為參考序列;xi(k)為比較序列;ρ 為分辨系數,一般取0.5;γi為灰色關聯度。
計算出不同鉆井參數與鉆速的灰色關聯度值,將計算結果繪制成柱狀圖(圖4),由圖4可知鉆壓、轉速、泵壓、排量、密度這5 個參數與鉆速的灰色關聯度較高,說明這些參數和鉆速的相關性更好,因此最終優選出這5 個參數作為鉆速預測模型的輸入數據,從而實現降低數據冗余的效果。

圖4 各參數與鉆速的灰色關聯度值Fig.4 Gray correlation value of each parameter and ROP
MEA-BP 機械鉆速預測模型的建立大致分為4個步驟,鉆速預測模型原理框圖如圖5所示。步驟1為數據預處理,基于井場實測的鉆井數據進行小波降噪處理,消除異常尖峰數據,同時對降噪后的數據進行標準化處理,再利用灰色關聯度分析方法,把降噪后的數據與機械鉆速進行灰色關聯度分析,篩選出與機械鉆速關聯度較高的參數作為BP 神經網絡的輸入數據;步驟2 和3 為預測模型的建立,在步驟2 中對BP 神經網絡和思維進化算法進行初始化處理,思維進化算法進行趨同、異化操作不斷更新權值和閾值;步驟3 為神經網絡的訓練過程,輸入優選的5 個參數,經訓練后輸出預測的機械鉆速;步驟4 為模型評價與輸出,在訓練迭代過程中,若輸出結果與目標結果誤差較大則調整參數重復執行上述步驟,反之輸出預測結果。

圖5 MEA-BP 鉆速預測模型原理框圖Fig.5 MEA-BP ROP prediction model principle block diagram
模型數據基于現場某實鉆井X1井,該井為直井,實鉆井深達到4276 m,且機械鉆速波動較大。目的層為前古近系花崗巖和恩平組砂巖,目的層平均機械鉆速為9.3 m/h。將上述MEA-BP 模型應用在該井,對機械鉆速進行預測,同時與BP 和GA-BP 模型預測結果進行對比分析。
通過數據預處理,確定網絡輸入為鉆壓、轉速、泵壓、排量和密度5 個參數,輸出為機械鉆速1 個參數,故神經網絡輸入輸出結構為5-1 模式,隱含層單元個數根據經驗公式確定,本次模型選擇10個,故網絡結構為5-10-1 模式。MEA-BP 模型迭代次數設為100,種群大小為200,優勝種群和臨時種群個數分別為5。
基于X1井數據,對MEA-BP 進行初始化設定后,MEA 算法執行其特有的趨同和異化操作,通過不斷地迭代處理選擇合適的權值和閾值,從而提高機械鉆速的預測精度。MEA 異化后的趨同過程如圖6所示。

圖6 異化后子種群趨同過程Fig.6 Subpopulation convergence process after alienation
根據圖6可知,此時圖6(a)中5 個子種群的得分不再發生改變,并且得分均高于圖6(b)中的臨時子種群得分,此時說明趨同和異化操作已全部完成,輸出最優權值和閾值。BP 神經網絡根據輸出的權值和閾值進行模型訓練,輸出預測的機械鉆速結果。

圖6 熒光材料濃度對探頭一致性的影響Fig.6 Influence of content of phosphor powder to probe consistency
為了驗證MEA-BP 模型預測效果,將其預測結果與目前常用的遺傳算法優化的BP 神經網絡(GABP)和未優化的BP 神經網絡的預測結果進行對比,這3 種不同模型的機械鉆速預測結果如圖7所示。通過該圖可知,3 種算法模型都有效地預測出了機械鉆速,且與實際機械鉆速趨勢大致相同,但每個方法預測的結果與實際鉆速都存在著些許誤差。

圖7 不同模型鉆速預測結果Fig.7 ROP prediction results of different models
針對不同模型預測的機械鉆速,計算了其與實際機械鉆速的誤差百分比,并將誤差百分比繪制成折線圖,如圖8所示。同時選取了均方誤差(MSE)和決定系數(R2)作為模型的評價指標,具體的評價指標見表1。

圖8 不同模型誤差對比Fig.8 Error comparison of different models

表1 評價指標Tab.1 Evaluation indicators
由圖8中的3 種機械鉆速預測模型對比可知,未經優化的BP 神經網絡模型預測值與實際值誤差波動最大,而GA-BP 模型預測誤差相較于BP 神經網絡預測結果有一定提升,MEA-BP 模型預測的誤差波動最小、效果最好,通過誤差比較可知MEA-BP模型預測的機械鉆速精度最高。由表1可知,MEABP 模型的均方誤差(MSE)為0.060,小于另外2 個模型的均方誤差值,并且MEA-BP 模型的決定系數(R2)為0.936,相較于另外2 個模型更接近于1。因此通過思維進化算法優化后的BP 神經網絡鉆速預測模型,有著更高的精度和更好的擬合度。
針對機械鉆速預測問題,在傳統的BP 神經網絡模型上采用思維進化算法進行優化處理,選擇更合理的權值和閾值,進一步提高了神經網絡的運算速度和泛化能力。
在模型構建過程中,考慮到影響機械鉆速的變量多且具有較強的非線性特點。因此對數據進行了預處理,包括小波降噪、標準化處理、灰色關聯度分析等操作,預處理后的數據與機械鉆速的相關性更高且數據冗余更低,有利于提高模型預測精度。
通過對比BP、GA-BP 和MEA-BP 3 組不同模型預測的結果,發現BP 神經網絡預測的結果誤差波動較大,預測精度低于優化后的2 組模型,而基于MEA-BP 預測的效果最好。