鄧楊林 李玉梅 張 濤 郭 鶴 石廣遠 陳學勇
(1.北京信息科技大學高動態導航技術北京市重點實驗室 2.現代測控技術教育部重點實驗室 3.中國石油天然氣股份有限公司華北油田公司第三采油廠)
鉆柱振動是限制鉆井性能的頻繁且持久的因素。鉆柱振動可分為軸向振動(垂直)、橫向振動(旋轉)和扭轉振動(黏滑)。據統計,每年40%的鉆井深度會受到鉆井振動的影響[1-3]。例如軸向振動時鉆頭反彈、橫向振動時向前或向后旋轉、扭轉振動時會黏滑。嚴重的黏滑振動可能會導致井下工具的潛在損壞,輕微的黏滑振動會顯著減慢鉆井進度[4]。國內外學者對井下振動的研究越來越多,這對鉆井技術研究具有重要的工程價值。
振動建模和監測是一個復雜的過程,需要理想的條件,但是在實際鉆井過程中,這些理想條件不能適用于不同的BHA(井底鉆具組合)、油藏、地質和地層[5-6]。隨著井下測量工具技術的發展,利用井下鉆井數據,使用數據驅動模型來監測鉆柱變得可取。C.HEGDE等[7]提出了一種利用鉆井作業參數對基于振動的度量進行分類的新方法——黏滑指數(ISS),然后使用機器學習算法對ISS的嚴重程度進行分類。該模型可與ROP優化模型結合使用,在提高ROP的同時控制鉆井振動。T. BAUMGARTNER等[8]建立了一個簡單的動力學模型,研究了旋轉和黏滑振動情況下的高頻加速度測量輸出,并使用基于貝葉斯分類算法,從高頻振動數據中提取和分析特征以進行黏滑振動識別。唐翰文等[9-12]針對近鉆頭黏滑數據時頻域分析,提取主要特征向量,建立了基于優化XGBoost的黏滑振動等級識別分類模型。陳沖等[13]為評估鉆柱黏滑振動的嚴重程度,提出了一種基于因子分析(FA)與支持向量機(SVM)的黏滑振動風險評估方法。受限于高精尖井下隨鉆測量工具以及測量參數的影響,目前關于黏滑振動分析大多數基于地面數據進行。雖然地面測量通常以1~10 Hz的頻率采樣,但是它們通常以0.2~1.0 Hz比較低的速率存儲和傳輸,導致大多數井下功能障礙無法被發現和檢測[14]。
本文針對黏滑振動嚴重等級評估問題,提出了一種DE_AWNB(基于差分演化算法的加權樸素貝葉斯分類算法)改進模型。主要是通過采用新型井下近鉆頭多功能參數高頻測量短節,采集井下振動數據。并將屬性加權樸素貝葉斯法和差分演化算法相結合,在DE-AWNB中,每個屬性都會隨機分配到一個權重,利用DE算法進行權重尋優,迭代得到最優權重組合。通過將高頻振動數據與該算法的結合,可有效解決上述問題。
黏滑是一種旋轉速度周期性變化的扭轉振動。在黏滑嚴重的情況下,鉆頭可能完全停止,然后速度上升到原來的幾倍,然后減速,再停止旋轉。造成黏滑的原因是,管柱的扭轉強度過低,無法克服切削齒與地層、穩定器與井壁之間的摩擦力。在黏滯循環期間,盡管地面輸入恒定的轉速,鉆頭依然會停止旋轉,然后鉆柱向上彎曲,直至施加到足夠的扭轉力來克服摩擦力,從而形成滑移循環[15]。通過在井下使用加速度計測量振動,3個加速度計沿工具中軸線以相互正交的方式安裝,X軸傳感器測量軸向沖擊,Y和Z軸傳感器測量正交方向上的橫向沖擊。黏滑是一種明顯的低頻現象,其周期從1~10 s不等。三軸加速度計測得的加速度會有周期性和間接性波動。
圖1是新疆油田某井段發生嚴重黏滑時實測到的三軸加速度數據。

圖1 嚴重黏滑時轉速、加速度變化曲線Fig.1 ROP and acceleration variation curves at the time of severe stick slip
圖1中g為重力加速度,m/s2。圖1所示黏滑周期約為9 s,在轉速上升時,典型的旋轉模式出現。位置②這個過程為滑脫階段,持續時間約為6 s;且達到一定速度時,波動幅度較低,并在低轉速的滑移循環結束時再次增加。位置①這個過程為黏滯階段,持續時間約為3 s,同時發現三軸加速度帶有同步的周期波動,且通過對比可以發現,黏滑過程中徑向加速度遠高于切向加速度,這種情況在整個黏滑振動中都有發生。圖2顯示的是正常鉆進時的轉速、三軸加速度曲線。與圖1相比較,圖2中的轉速、三軸加速度沒有出現周期性波動,且轉速、三軸加速度的幅值較小。

圖2 正常鉆進時轉速、加速度變化曲線Fig.2 ROP and acceleration variation curves in normal drilling
評價扭轉振動對鉆柱影響的常用指標是黏滑指數(ISS)[15-16],該指數可以使用井下測量工程參數和地面參數計算。
(1)
式中:ωmax、ωmin和ωavg分別為鉆頭最大、最小及平均轉速,r/min。
其中,鉆頭最大、最小轉速可根據實測數據得出,平均轉速為井場提供的地面平均轉盤轉速。在本次試驗中,鉆頭平均轉速取75 r/min。當ISS<1時,表明鉆頭總是向右轉動,而在ISS=1時,達到完全黏滑的條件,鉆頭周期性停止轉動片刻。ISS值越高,鉆頭停止轉動的卡滯時間越長。E.W.ROBNETT等[17]利用轉速的變化來確定黏滑的發生率和嚴重程度,黏滑振動劃分為4個等級,如表1所示。

表1 黏滑振動等級標準Table1 Standards of stick-slip vibration grade
根據上述黏滑振動分級原理,對實測數據進行ISS計算,結果如圖3所示。通過手動標簽之后,就可以通過機器學習算法進行黏滑振動等級評估。

圖3 ISS指標圖Fig.3 ISS indicator chart
樸素貝葉斯算法是一種以貝葉斯算法為基礎,基于概率的分類算法。樸素貝葉斯算法假設各個特征之間相互獨立,即一個特征的取值不會影響另一個特征的取值。假設一個數據集X={x1,x2,…,xn},且每個樣本中都包含n維特征,即x={a1,a2,…,an}。假定有m個種類,分別用C1,C2,…,Cm表示,根據貝葉斯定理,可得到x屬于Cm類別的概率為:
(2)
式中:P(Ci)為屬于類別Ci的概率;Ci為x的所屬類別;P(Ci|x)為在x發生的條件下屬于Ci類別的概率,被稱為后驗概率;P(x)為事件x的先驗概率。
由于各個維度的特征屬性相互獨立,在此條件上,條件概率可以轉化為:
(3)
式中:P(ak|Ci)為類別Ci中包含特征ak的概率。
于是,樸素貝葉斯分類器可表示為:
(4)
式中:P(C)為C類發生的概率;ak為第k個屬性的值。
傳統的樸素貝葉斯分類器的前提是各個特征之間相互獨立,即條件獨立性假設。然而現實中,事件與事件之間或多或少存在一定的關聯性,對屬性之間關聯性強的來說,樸素貝葉斯分類的效果會受到巨大的影響。
屬性加權針對每個屬性對不同類別的影響程度不同,賦予每個屬性不同的權重,改變每個屬性的條件概率,緩解條件獨立假設帶來的影響,以此來提高分類準確率。對于給定的數據x={a1,a2,…,an},可以用下面的公式來預測其類別:
(5)
式中:wi代表類屬性的權重,且權重范圍為[0,1];c為所屬于的類別。
差分演化算法(Differential Evolution Algorithm,DE)是一種基于群體的啟發式搜索優化算法。它的基本思想是通過以群體演化為基礎,經過個體與個體之間的“自然選擇”,經過多次迭代從而形成群體,使群體繁衍出更優的群體,從而收斂到最優解?;静僮髁鞒贪ǎ撼跏蓟⒆儺?、交叉、選擇。
初始化:建立一個初始種群,由NP個個體組成,每個個體都有D維向量可表示解決問題的個體參數,以及一個個體的適應度值。
i=1,2,…,NP;j=1,2,…,D}
(6)
式中:Xi(0)是第i個個體;j表示第j維。
(7)

變異:對新一代的個體進行變異操作,以提高個體的多樣性,從而增強搜索能力,以期達到最優解。
Vi(g+1)=Xr1(g)+F(Xr2(g)-Xr3(g))
(8)
式中:r1、r2和r3是3個隨機數,區間為[1,NP];F稱為縮放因子,是一個常數;g表示第g代。
交叉:根據每個個體的適應度值,選擇出適應度較高的個體,并進行交叉操作,生成新一代個體。
(9)
式中:CR為交叉概率,通過概率的方式隨機產生新的個體。
選擇:從種群中選擇出某些滿足一定條件的個體,從而保證種群能夠向最優解發展。
(10)
本研究選取了一組在新疆富滿油田某井段實鉆作業中記錄的現場數據,測量工具累計工作23 h,采樣頻率為400 Hz。數據集混合不同程度的黏滑振動數據。首先,將井下數據集劃分為相同長度的時間窗口,從每個時間窗口自動提取特征。由圖1可知,黏滑振動的周期約為9 s,所以設置時間窗口為9 s。然后,通過ISS評價指標計算,將其手動分類為正常鉆進、扭轉振動、完全黏滑及極端黏滑4種等級。最終得到的數據集包含了上述300組9 s窗口,每組含有3 600個三軸振動測量數據點。由于黏滑被高頻事件覆蓋,通過移動平均濾波器對數據集進行去噪。對每組時間窗口內的數據進行特征提取,主要操作有:時域分析,提取最大值、最小值、方差、標準差、均值、峰差等15類時域特征;頻域分析,對每一個時間窗口進行快速傅里葉變換(FFT),得到5個頻域特征,包括均方頻率、頻率方差、頻率標準差、均方根頻率、重心頻率;再通過主成分分析(PCA)對特征向量進行降維,以最少的數據維度來充分解釋原數據信息。最終得到各個主成分方差解釋率以及解釋率的變化曲線,如圖4所示。

圖4 主成分方差解釋率以及解釋率的變化Fig.4 Principal component variance contribution rate and changes in contribution rate
表2為方差解釋,主要是看主成分對于解釋變量的貢獻率。一般情況下,方差解釋率越高,說明該主成分越重要,權重占比也越高。由表2可知,前面8個主成分累計解釋率達到了90.849%(一般情況下大于90%即可),說明使用前8個主成分就能夠很好地對黏滑振動等級進行評估。

表2 方差解釋率Table2 Variance interpretation rate
在傳統的貝葉斯算法中,假設每個條件相互獨立、互不影響,認為每個屬性的重要性一樣。在本文中,對傳統的NB(樸素貝葉斯)算法模型進行了優化,根據每個特征的重要性賦予不同的權重,通過差分演化算法去尋找最優權重,如圖5所示。

圖5 DE-AWNB獲取權重結構示意圖Fig.5 Schematic structure of obtaining weight by DE-AWNB
將DE屬性加權應用于NB,得到差分演化算法屬性加權樸素貝葉斯(DE-AWNB)模型,整體工作流程見圖6。

圖6 DE-AWNB整體優化過程Fig.6 Overall optimization process of DE-AWNB
將300組數據集劃分為訓練集和測試集,采用3重交叉驗證方法對數據集進行分類??蓪祿譃?組,每組數據中訓練集與測試集的比例為6∶4。
詳細的DE-AWNB算法過程描述如表3所示。
表4給出了DE-AWNB模型的評價指標:混淆矩陣、TP(真陽性率)、FP(假陽性率)、Precision(精準率)、Recall(召回率)、F-Measure(F1評分)。這些指標基于一個混淆矩陣,當使用分類模型來預測測試數據的類別時,總共有4種可能(假設這2個類別是真和假):分類器預測為真,它實際上是真,為真陽性(TP);分類器預測為真,但實際為假,為假陽性(FP);分類器預測為假,它實際上是假的,為真陰性(TN);分類器預測為假,而它實際上是真的,為假陰性(FN)。由表4可知,模型的精準率在86%以上,召回率在79%以上,F1得分整體高于83%,整體模型的平均準確率達到了92.38%。

表4 DE-AWNB模型的評價指標Table4 Evaluation indicators of DE-AWNB model
通過分析發現,模型識別完全黏滑類別時,效果較差,容易被分類為極端黏滑,這可能是極端黏滑振動引起數據的劇烈波動,進而造成的計算誤差。以上結果表明,該模型具有較高的精確度,可以有效地進行黏滑振動等級識別。
為了證明DE-AWNB模型在黏滑振動等級評估的優越性,本文使用遺傳算法優化屬性加權樸素貝葉斯(GA-AWNB)、樸素貝葉斯算法(NB)、隨機森林(RF)進行對比分析,結果如圖7所示。

圖7 模型評價對比圖Fig.7 Evaluation comparison of models
圖7進一步證明了DE-AWNB模型在收斂時間、整體準確率上優于其他算法。因此,DE-AWNB模型在實際鉆井中更適合用于井下黏滑評估。
(1)通過井下近鉆頭測量參數與地面錄井參數的結合,分析得到了衡量黏滑振動的等級指標ISS,并作為機器學習多分類的標簽。
(2)針對樸素貝葉斯算法獨立條件的局限性,在樸素貝葉斯分類公式中加入了屬性權重,并通過差分演化算法尋找最優權重屬性,提出了一種更高效的差分演化屬性加權樸素貝葉斯(DE-AWNB)改進模型。
(3)將DE-AWNB模型與GA-AWNB、NB、RF模型進行對比,通過模型評價指標,發現DE-AWNB優化模型平均準確率可達92.38%,運算時間可達4.95 s,整體明顯優于其他算法。
(4)將該模型應用于實際鉆井工程,能夠有效提高識別黏滑振動水平,有利于采取及時有效的糾正措施,以提高機械鉆速,延長鉆頭和井下工具的壽命。