朱碩 宋先知,2 李根生,2 祝兆鵬 姚學喆
1. 中國石油大學(北京);2. 中國石油大學(北京)油氣資源與探測國家重點實驗室
現代鉆井技術發展,大位移井、水平井等復雜結構井應用于現場,大斜度井段、長水平段導致鉆柱摩阻扭矩急劇增加,鉆井效率低、卡鉆風險大。
目前,摩阻扭矩模型主要是給定井底鉆壓、井底扭矩以及摩阻系數作為初始條件,代入摩阻扭矩模型計算地面大鉤載荷與轉盤扭矩,并與實際測量值對比,用以推斷井眼是否清潔、是否存在嚴重狗腿角度、是否有卡鉆風險等。使用過程中,井底鉆壓扭矩多為現場估算值,摩阻系數在0.2~0.4之間憑經驗選取,導致分析結果精度有限[1-2]。Lesage等[3]利用軟桿模型,結合地面鉤載、轉盤扭矩與鉆頭鉆壓、扭矩來反演摩阻系數,用于識別鉆井異常情況,其中井底鉆壓扭矩通過井下測量短節鉆后獲取,無法做到數據的實時傳輸。Chiranth等[4]利用多層感知器、隨機森林等方法對井底扭矩進行實時預測和分類,并應用于優化鉆井程序,實時獲取井底數據,但未與摩阻扭矩機理模型結合。黃文君等[5]建立了考慮管柱接頭效應的摩阻扭矩模型,可更準確地模擬帶接頭鉆柱在井眼中的復雜力學行為。Courteille等[6]研制一種鉆井專家系統,可處理鉆具摩阻和起下鉆阻卡問題,但只適用于鉆后的卡鉆事故分析。朱丹等[7]深入分析卡鉆機理,建立基于BP神經網絡的卡鉆預測模型,但卡鉆樣本數量較少,模型泛化能力不足。劉建明等[8]根據井下測量短節測量得到的井下工程參數,包括鉆壓、扭矩、振動等8種參數,將特征參數作為輸入參數并利用PCARA算法建立卡鉆智能預測模型。
人工智能的快速發展令其與傳統產業的結合成為可能。在石油工程領域,機器學習方法被廣泛應用在井眼軌道優化[9]、導向智能決策[10]、地層特征識別[11]、巖性識別[12]、產量預測[13]、油田開發優化[14]等方面。
筆者分別選用BP神經網絡[15]與長短期記憶神經網絡[16],構建BP-LSTM雙輸入網絡架構,建立井底鉆壓扭矩實時計算模型,結合摩阻扭矩模型,實時反演摩阻系數,形成鉆柱摩阻扭矩實時智能分析方法,準確分析鉆柱受力情況,最后將該方法應用于現場一起卡鉆事故進行實例分析。
首先對鉆井現場數據進行數據預處理,包括數據整理與清洗、特征選擇與數據歸一化,最終建立可用于神經網絡訓練的綜合錄井參數數據集。針對鉆井過程中產生的時序性數據與非時序性數據的特征,優選BP、LSTM共2種神經網絡,并設計了BPLSTM并聯結構的雙輸入神經網絡模型,采用正交試驗法設計實驗方案,利用錄井參數數據集對BP、LSTM、BP-LSTM共3種神經網絡進行模型訓練與測試,以均方根誤差、平均相對誤差與模型復雜度3個模型評價指標對3類網絡模型進行優選。
1.1.1 錄井數據整理與清洗
錄井數據主要包括:井斜數據表、工程參數表、鉆井液性能表、鉆頭記錄表、巖屑描述記錄表等,各數據表的采樣頻率與數據類型如表1所示。

表1 數據采樣頻率與數據類型Table 1 Data sampling frequency and data type
(1)統一采樣頻率。如表1所示,需要將井斜、鉆井液性能、鉆頭記錄、巖屑描述記錄數據的采樣頻率轉換成每1 m采樣。井斜數據需要利用合適的方法對井眼軌跡數據進行插值,將其轉變為每1 m采1個點。經過調研,采用3次樣條曲線插值法對井眼軌跡數據進行插值。目前鉆井液性能在線測量系統尚未普及,現場鉆井液性能參數的測量仍主要是由鉆井液錄井工程師隔一定時間進行測量,因此其采樣頻率多為幾十米測1個值,由于鉆井液性能不會發生較大變化,因此認為該井段內每米處的鉆井液性能參數均為該測量值大小。類似的,鉆頭和巖屑描述記錄數據均為每隔一段時間記錄,在某一井段內每米處的數據均為該測量值的大小。
(2)數據提取與處理。統一各類數據的采樣頻率后,由于各數據類型不一致,需要針對特定的數據類型建立相應的數據提取與處理方法。井斜、工程參數均為數值型數據,統一采樣頻率1 m后,可利用Python中的Pandas模塊直接讀取,便于后續的數據拼接操作。鉆井液性能數據,包括漏斗黏度(s)、塑性黏度(mPa · s)、動切力(Pa)、鉆井液體系等41種參數。鉆井液體系數據為文本型,其余參數均為數值型,通過現場數據分析,發現鉆井液體系種類較多。通過文獻調研,對鉆井液體系進行粗分類為水基、油基、氣基3類大體系。水基包含不分散、分散、聚合物、低固相、鈣處理、飽和鹽水鉆井液等,氣基包括空氣與泡沫鉆井液。
鉆頭記錄數據主要包括鉆頭尺寸、鉆頭型號、入井新度(%)、出井新度(%)、鉆壓(kN)、轉速(r/min)、鉆頭水眼、鉆具組合信息等。在某一井段內每米處的鉆頭數據均以測量的第1個數據點為準。其中,鉆頭類型數據是以文本的形式存儲在鉆具組合信息中,按照實際鉆頭類型提取信息,如PDC鉆頭。
巖屑描述記錄中包含層位、井段、巖性及含油氣水描述等信息,在巖性與含油氣水描述信息中,包含巖屑形狀、最大粒徑、最小粒徑、平均粒徑、分選性、磨圓度等數值型和文本型信息。
(3)數據拼接。經過統一采樣頻率、數據提取與處理,按照井深為索引將井斜、工程參數、鉆井液性能、鉆頭記錄、巖屑描述記錄等數據進行拼接,批量化處理了3個區塊,共計108口井數據,每口井有98個特征,形成綜合錄井參數數據集。
1.1.2 特征選擇
在鉆井過程中井底鉆壓扭矩與諸多因素有關,通過對物理問題的分析,選取以下參數作為輸入參數,其中時序參數有16個:鉆壓、井底扭矩、井深、井斜、方位角、轉盤扭矩、轉盤轉速、立管壓力、入口流量、出口流量、出口密度、總池體積、大鉤載荷、鉆井液密度、鉆井液漏斗黏度、鉆井液塑性黏度。非時序參數有3個:鉆井液體系、鉆具組合、鉆頭類型。研究中利用BP神經網絡刻畫鉆井液體系、鉆具組合、鉆頭類型與井底鉆壓、井底扭矩間的復雜非線性映射關系,利用LSTM網絡挖掘可量化參數與井底鉆壓扭矩之間的關系。
1.1.3 數據歸一化
(1)時序參數的歸一化。數據歸一化,可消除不同變量量綱的影響,避免過大的數值在訓練過程中引發問題,可加快梯度下降算法中求最優解的速度。考慮到鉆井工程參數很少有極端的極大極小值以及鉆井設備能力的限制,參數的最大、最小值可以事先設定或統計分析得到,因此采用極大極小歸一化方法對綜合錄井數據、測斜數據進行歸一化。

式中,為第i個變量歸一化后的結果;xi為原始第i個變量;min(xi)為原始第i個變量的最小值;max(xi)為原始第i個變量的最大值。
(2)類別參數的One-hot編碼。將鉆井液體系劃分為水基、油基、氣基鉆井液,鉆頭類型劃分為PDC、牙輪,鉆具組合劃分為鐘擺、滿眼、塔式鉆具組合,并采用One-hot方法數字化。
1.1.4 評價指標選取
選取均方根誤差ermse、平均相對誤差e、模型復雜度作為神經網絡模型的評價指標。模型復雜度即為網絡所需訓練的參數量,即神經網絡權重和偏置的總個數。

式中,ytrue為目標真實值;ypre為目標預測值;n為樣本數量。
為使3種網絡模型具有一定的可比性,需要保證輸入數據一致,綜合3類網絡的結構特點,采用前5個時間點的數據樣本作為輸入。
1.2.1 神經網絡優選
針對鉆井數據的時序性與非時序性數據的特點,優選適應性的神經網絡。簡單BP網絡神經元計算公式為

簡單循環神經網絡隱藏層神經元計算公式為

式中,ht為當前的輸出;f為激活函數;wh為隱藏層的權重矩陣;xt為當前的輸入;bh為隱藏層的偏置向量;ht?1為上一時刻的輸出。
BP神經網絡是一個靜態網絡,信息的傳遞是單向的,網絡的輸出只依賴于當前的輸入,可以逼近任意復雜函數,但不會根據先前信息對之后的信息進行推斷,不具備記憶能力。
LSTM網絡通過使用自反饋的神經元,使得一個隱藏層神經元的信息可以傳遞到下一個隱藏層神經元,具有一定的記憶能力,在處理序列性問題方面優勢明顯。LSTM的神經元設計了輸入門i、遺忘門f、輸出門o、記憶單元C。LSTM依靠這些“門”的結構讓信息有選擇性地影響神經網絡中每個時刻的狀態。“門”結構使用sigmoid作為激活函數的全連接神經網絡,會輸出一個0~1之間的數值,描述當前輸入有多少信息量可以通過這個結構,從而避免產生梯度爆炸或梯度消失問題。
遺忘門

輸入門


輸出門式中,ft、it、ot分別為LSTM中遺忘門、輸入門、輸出門神經元的輸出;σ為sigmoid激活函數;Wf、Wi、Wo分別為LSTM中遺忘門、輸入門、輸出門神經元的權重矩陣;bf、bi、bo分別為LSTM中遺忘門、輸入門、輸出門神經元的偏置向量。
1.2.2 BP網絡結構設計
以BP神經網絡為例,建立井底鉆壓扭矩智能預測模型。將1.1.2部分的16個時序變量與3個非時序變量同時作為BP神經網絡的輸入,3個非時序變量經One-hot轉換后變成8個特征,因此某一時刻的輸入特征共計16+8=24個,而要求輸入數據為前5個時間的數據樣本。因此,最終的輸入特征共計120個,即1個輸入樣本為1個一維向量。
1.2.3 LSTM網絡結構設計
以單層的LSTM神經網絡為例,建立井底鉆壓扭矩智能預測模型。LSTM網絡的某一時刻的輸入特征共計16+8=24個,而要求輸入數據為前5個時間的數據樣本。輸入LSTM網絡的1個數據樣本為1個5×24的矩陣。
1.2.4 BP-LSTM網絡結構設計
如圖1所示,BP神經網絡用以輸入非時序性數據,輸入參數經過One-hot數字化后種類為8個,1個輸入樣本為1個一維向量;LSTM網絡用以輸入時序性數據,選取歷史時間步長為5,LSTM網絡的一個數據樣本為1個5×16的矩陣。

圖1 BP- LSTM雙輸入網絡結構Fig. 1 Structure of BP- LSTM network
采用某區塊的74口井數據,對BP、LSTM與BP-LSTM等3種模型進行對比分析。主要對神經網絡的神經元層數、神經元個數、丟棄率與激活函數進行優化,采用正交試驗法L9(34)設計實驗參數,利用52口井的訓練集進行網絡模型的訓練,22口井的測試集進行模型的測試,每個模型均訓練120次。經模型訓練與測試后,每種神經網絡可分別得到預測井底鉆壓的9個模型和預測井底扭矩的9個模型。綜合相對誤差、均方根誤差、模型復雜度3個指標對井底鉆壓、井底扭矩計算模型進行優選。正交實驗方案見表2。

表2 BP-LSTM網絡模型試驗表Table 2 Experiment table of BP-LSTM network model
為對比網絡模型性能的優劣,在構建BPLSTM網絡模型時,BP-LSTM雙輸入網絡中的BP、LSTM網絡的層數、神經元個數、激活函數應與單獨的BP、LSTM網絡模型設置的網絡層數、神經元個數、激活函數一致,以此來驗證通過對BP與LSTM兩者進行并聯進而提高了最終的網絡模型性能,而不是由于其他因素的改變提高了網絡性能。因此直接將BP、LSTM兩類網絡的正交試驗方案合并,即為BP-LSTM網絡的訓練試驗表。
BP、LSTM與BP-LSTM網絡模型的均方根誤差ermse、平均相對誤差e、模型復雜度如表3所示。

表3 BP、LSTM、BP-LSTM等3類模型的測試結果Table 3 Test results of BP, LSTM and BP-LSTM model
井底鉆壓預測BP模型中,雖然第6個BP模型的相對誤差為11.1%,是9個模型中最低的,但其模型復雜度達到了11 969,而第2個BP模型的相對誤差為14.4%,模型復雜度僅為3 905,為降低模型復雜度,防止過擬合,故選擇第2個模型作為BP的最優模型。同理,選擇第3個模型作為LSTM的最優模型,選擇第2個模型作為BP-LSTM的最優模型。BP-LSTM從相對誤差及復雜度2個指標上均優于BP、LSTM模型,說明通過對BP、LSTM網絡進行并聯,可提升模型預測精度,降低模型的復雜度。井底扭矩預測最優的網絡模型為第2個BPLSTM模型,平均相對誤差為12.8%,ermse為2.8 kN · m。
綜合以上對比分析,驗證了針對不同數據類型設計的BP-LSTM雙輸入網絡架構的合理性與可靠性,所建立的BP-LSTM網絡能夠根據不同的數據類型進行適應性的學習,能夠最大程度學習數據的內在規律,進而提高模型的預測精度。
最優模型的井底鉆壓扭矩預測結果見圖2和圖3。鉆壓的均方根誤差為23.8 kN,平均相對誤差為13.0%,井底扭矩的均方根誤差為2.8 kN · m,平均相對誤差為12.8%。通過利用神經網絡實現了井底鉆壓與扭矩的實時預測,同時為鉆柱摩阻系數的實時反演奠定了基礎。

圖2 鉆壓預測值與真實值對比Fig. 2 Comparison between predicted WOB and actual value

圖3 扭矩預測值與真實值對比Fig. 3 Comparison between predicted torque and actual value
經典的鉆柱摩阻扭矩模型有軟桿模型與硬桿模型,軟桿模型應用較早,簡單且有一定精度,但未考慮鉆柱剛度,適用于直井、井斜角較小的井型。硬桿模型雖然較復雜,但考慮了鉆柱的剛度,更適用于大位移井、水平井等非直井井型。因此采用其進行鉆柱摩阻系數的實時反演。

鉆柱整體受力微分方程為式中,F為鉆柱軸向壓力,N;s為井深,m;EI為鉆柱抗彎剛度,N · m2;kb為井眼軸線曲率,m?1;q為單位長度鉆柱重力,N/m;α為井斜角,rad;“?”負號代表提拉,正號代表下入;μ1為鉆柱軸向摩阻系數;nt為鉆柱與井壁的接觸力,N/m;M為鉆柱扭矩,N · m;μ2為周向摩阻系數;Db為鉆柱外徑,mm。
井眼曲率kb的計算公式為

鉆柱上的接觸力nt為

利用有限差分數值求解方法,可將鉆柱整體受力模型寫為(以壓力為正)

式中,?為方位角,rad;Fi和Fi+1分別為第i段管柱靠近地面和靠近鉆頭一端的軸向力,N;EIi為第i段管柱的抗彎剛度,N · m2;kbi、kbi+1分別為第i段靠近地面和靠近鉆頭一端的井眼曲率,m?1;Mi和Mi+1分別為第i段管柱靠近地面和靠近鉆頭一端的扭矩,N · m;Δsi為第i段管柱的段長,m。
鉆進時鉆柱的軸向進給速度遠遠小于周向旋轉速度[17]。因此,只需要對周向摩阻系數進行反演,二分法反演計算流程如圖4所示。

圖4 二分法反演摩阻系數計算流程Fig. 4 Calculation flow chart of friction coefficient inversion by dichotomy
首先在0~1之間初始化生成摩阻系數(取鉆井設計推薦的摩阻系數,可減少計算次數),將預測的鉆壓、扭矩帶入到鉆柱整體受力模型中,利用軸向力、扭矩的傳遞方程從鉆頭處逐段計算管柱上端(靠近地面)的軸向力、扭矩,直到計算至地面,得到大鉤載荷、扭矩的計算值,并與地面實測的大鉤載荷、扭矩比較,若計算值與測量值滿足給定的誤差,說明摩阻系數較為準確,循環結束。否則重新初始化新的摩阻系數,再次從鉆頭處逐段計算至地面,比較計算值與測量值的誤差,直到找到準確的摩阻系數,輸出鉆柱摩阻系數、軸向力、扭矩、彎矩等。摩阻扭矩智能實時分析需要井眼軌跡、井身結構、鉆具組合等數據,如表4、表5所示。

表4 某井井身結構Table 4 Casing program

表5 某井5 062~5 900 m鉆具組合信息Table 5 Information of drill tool combination in the interval 5 062-5 900 m of one case well
利用所建立的摩阻扭矩智能實時分析方法分析鉆柱受力情況,如圖5所示。在5 300 m處鉆柱的接觸力、彎矩、周向摩阻和軸向摩阻顯著增加,且扭矩急劇降低,說明在該處存在一定的卡鉆風險。查閱現場日志得到,該位置為造斜點,會導致鉆柱摩阻急劇增加。雖然在實際鉆井中未發生卡鉆事故,但通過現場經驗判斷在造斜過程中極易發生卡鉆事故,說明通過該方法實時監測鉆柱摩阻扭矩可以對卡鉆事故進行預警,防止過大摩阻導致卡鉆事故。

圖5 某井鉆柱受力分析結果Fig. 5 Schematic force of drill string in one case well
利用鉆柱摩阻扭矩實時分析方法,進行鉆柱摩阻系數的實時反演。某定向井在5 724 m處造斜,鉆具組合:?149.2 mm方替+?149.2 mm斜坡鉆桿+?139.70 mm加 重 鉆 桿+NC56×520轉 換 接 頭+?203.2 mm螺旋鉆鋌×+NC56×NC61轉換接頭+?326.00 mm螺 旋 穩 定 器+?229 mm止 回 閥+?203.20 mm無磁鉆鋌+?330 mm螺旋穩定器+631×NC61母轉換接頭+630×631-PowerV+ GT55SPDC鉆頭。5 699~6 110 m井段反演結果見圖6。

圖6 某井5 699~6 110 m 摩阻系數反演結果Fig. 6 Inversion result of friction coefficient in the interval 5 699-6 110 m of one case well
鉆井現場工況復雜,鉆機振動、司鉆人為操控等均會對鉆柱的摩阻扭矩產生影響,進而反映在鉆柱與井壁(套管)間的摩阻系數上。如圖6所示,鉆柱摩阻系數在6 000~6 100 m井段區間雖然有一些波動,但整體呈現逐漸增大的趨勢,數值大部分在0.1~0.4之間,在6 100 m處附近,鉆柱摩阻系數從0.35附近陡增至0.75,說明即將發生卡鉆或已經卡鉆。經過對該井的鉆井日志查證,該井在6 100 m處附近蹩停扭矩,鉆具卡死。分析結果表明,利用鉆柱摩阻系數對卡鉆工況進行預測具有一定的效果,如果在6 000~6 005 m監測到鉆柱摩阻系數逐漸增大的趨勢,此時通過短起下、增大鉆井液排量等操作,可在一定程度上避免此次卡鉆的發生。
(1)針對鉆井數據特點,設計了BP-LSTM雙輸入網絡架構,建立井底鉆壓扭矩實時智能計算模型,實現井底鉆壓扭矩的實時準確計算,井底鉆壓與扭矩的平均相對誤差分別為13.0%與12.8%。
(2)結合摩阻扭矩剛桿模型,實時反演摩阻系數,解決了摩阻系數確定方式的問題,形成鉆柱摩阻扭矩實時分析方法,實現鉆柱受力的準確分析。
(3)鉆柱卡鉆趨勢預測結果表明,通過分析實時摩阻系數隨井深的變化規律,可準確預測卡鉆趨勢,降低鉆井卡鉆風險,保證鉆井安全高效進行。