成小強,王 林,崔 兵,黃 磊
(中國石油集團西部鉆探克拉瑪依鉆井公司,新疆克拉瑪依 834009)
泥漿泵是石油鉆井平臺用來實現(xiàn)泥漿循環(huán)的重要設(shè)備,其運送的液體一般含有大量泥沙,有高黏度、高壓力且具有一定腐蝕性的特點,因此也是鉆井平臺中最容易發(fā)生故障的設(shè)備之一。隨著石油鉆井的快速發(fā)展,泥漿泵的故障診斷受到越來越多的注意,泥漿泵是否正常運行嚴重影響鉆井平臺正常工作。泥漿泵故障時,輕則發(fā)生非計劃停工、帶來巨大的經(jīng)濟損失,重則導(dǎo)致人員傷亡,因此針對泥漿泵的故障診斷具有重要的現(xiàn)實意義。
模式識別作為最常用的分類方法之一,被廣泛用于機械設(shè)備的故障診斷領(lǐng)域,并取得了良好的效果。已經(jīng)有很多學(xué)者針對泥漿泵故障診斷進行了大量探索,裴峻峰等[1]利用小波包分解提各頻段能量組成特征向量,輸入最小二乘支持向量機中進行故障識別;別峰峰等[2]利用ICEEMDAN 對采集的原始信號進行分解得到若干個IMF(Intrinsic Mode Function,本征模態(tài)函數(shù))分量,計算IMF 分量的奇異譜熵并構(gòu)造特征向量,輸入GNRR(General Regression Neural Network,廣義回歸神經(jīng)網(wǎng)絡(luò))進行訓(xùn)練和模式識別;郭攀等[3]針對泥漿泵的聲音信號采用多重分形趨勢波動分析計算時間序列聲音信號的多重分形譜,并提取故障特征輸入支持向量機進行模式識別。
上述方法雖然在泥漿泵的模式識別中取得了不錯的效果,但都是基于人工特征提取,難以挖掘深層的故障特征,且及其依賴特征提取的效果,適用于小樣本的情況。近年來深度學(xué)習(xí)快速發(fā)展,已經(jīng)在計算機視覺、語音處理、視頻識別等方面研究領(lǐng)域廣泛應(yīng)用。深度學(xué)習(xí)是人工智能的一個子領(lǐng)域,由于其含有多層隱層網(wǎng)絡(luò)和自適應(yīng)的特征提取能力能夠挖掘更深層次的特征,充分利用原始信號的全部信息,因此十分適用于大數(shù)據(jù)背景下機械設(shè)備的狀態(tài)檢測和故障診斷[4]。GANG LI 等[5]將一維信號轉(zhuǎn)變?yōu)橛? 個通道的三維圖像信號,不僅增加了特征信息的可視性,同時降低了噪聲信號對診斷的影響,然后輸入CNN(Convolutional Neural Networks,卷積神經(jīng)網(wǎng)絡(luò))進行故障診斷,提升故障診斷的準確率。
本文提出了一種結(jié)合EEMD(Ensemble Empirical Mode Decomposition,集合經(jīng)驗?zāi)B(tài)分解)和CNN 的分類模型,該模型可以很好地去除信號中噪聲的干擾,并進行特征的自動提取。另外,本文還針對實驗室BW-250泥漿泵采集的數(shù)據(jù)進行故障診斷,大大提高了故障診斷的準確率。
CNN 是一種前向傳播神經(jīng)網(wǎng)絡(luò),它的權(quán)值分享網(wǎng)絡(luò)結(jié)構(gòu)與生物的神經(jīng)網(wǎng)絡(luò)更為相似,這減少了網(wǎng)絡(luò)模型的復(fù)雜度和參數(shù)的數(shù)量。CNN 的結(jié)構(gòu)包括多層神經(jīng)網(wǎng)絡(luò),主要由卷積層、池化層和全連接層,每一層由多個二維平面構(gòu)成,每一個平面由多個獨立的神經(jīng)元構(gòu)成[6]。
(1)卷積層。卷積層由于卷積操作而得名,但是它通常進行的是兩個矩陣之間的互相關(guān)關(guān)系計算。卷積層主要的功能是,通過計算提取輸入圖像數(shù)據(jù)的隱層特征。卷積層有兩個重要的超參數(shù)——padding 和stride,這兩個超參數(shù)影響卷積之后輸出圖像的尺寸大小,padding 操作主要是在輸入圖像的高度和寬度方向填充一些相同的數(shù)值(通常為0);stride 控制每一個卷積核在寬度和高度方向一次移動的距離。這樣在卷積操作之后,可以減少輸入圖像的尺寸。
其中,N 為輸入圖像的原始尺寸,F(xiàn) 為卷積核的大小,p 為padding 操作的大小,s 為卷積核移動步長的大小,O 為卷積后輸出圖像的尺寸。
(2)池化層。池化層是為了減小特征值空間的尺寸,相比于卷積層主要是計算輸入特征圖像和卷積核之間的關(guān)聯(lián)度,池化層主要是保留池化核中元素的最大值或平均值。本文中應(yīng)用的是二維最大池化層。
(3)全連接層。全連接層通常位于整個神經(jīng)網(wǎng)絡(luò)的末端,它的主要作用是將學(xué)習(xí)到的參數(shù)矩陣展平成向量,然后將獲得的向量輸入分類器,實現(xiàn)模式識別。
傅里葉變換(FT)具有分析周期性信號和非周期性信號的能力,但是它不能分析非平穩(wěn)信號。STFT(Short-Time Fourier Transform,短時傅里葉變換)能夠有效確定非平穩(wěn)信號的正弦頻率和相位信息。STFT 分析長的時間序列信號是,通過分解它成為不同長度的更短的信號,并對分解后的信號片段分別進行FT。STFT 的計算式基于FFT(Fast Fourier Transform,快速傅里葉變換)[7]。
其中,x(t)為時域信號,h(t-ω)為窗函數(shù)。
對于STFT 而言,窗函數(shù)的類型和寬度是影響其變換效果的兩個十分重要的因素,選擇合適的窗函數(shù),可以減少頻譜泄漏和譜間干擾;窗的寬度影響著時域和頻域的相對分辨率,窗的寬度越大分辨率越高、時間分辨率越小。
EMD(Empirical Mode Decomposition,經(jīng)驗?zāi)B(tài)分解)是根據(jù)信號本身時間尺度特征的局部特征,自適應(yīng)地將一組復(fù)雜信號分解為頻率由高到低的IMF 分量。
其中,x(t)表示原始地時間序列,imfi(t)表示第i個IMF 分量,rn(t)是殘差項、表示信號的趨勢。
每個IMF 分量必須滿足下列兩個要求:①在數(shù)據(jù)長度上,極值點地數(shù)量和零點地數(shù)量必須相等或者最多差一個;②在任何數(shù)據(jù)點,局部最大值和局部最小值包絡(luò)的平均值必須為零。
EMD 自適應(yīng)地分解原始信號成一系列IMF,并且每一個IMF 包含不同頻帶組成。以這種方式將高頻諧振成分從大幅值諧波中分離出來,噪聲信號分布在整個頻帶,噪聲的能量液分散在多個IMF 分量中。
EEMD 是最常用的EMD 的改進方法,它可以解決EMD 方法中模態(tài)混疊的問題。EEMD 主要的改善是使用均值為0 的白噪聲的優(yōu)勢,通過在分解過程中引入平均分布的白噪聲來掩蓋信號中的噪聲,可以獲得更加準確的上包絡(luò)和下包絡(luò)。同時,對分解結(jié)果進行平均處理,平均處理的次數(shù)越多、分解結(jié)果中含有更少的噪聲[8]。EEMD 的分解過程如下:
(1)在原始的時間序列中添加隨機的正態(tài)分布的白噪聲,σ 是已知的,μ=0,則:
其中,yi(t)是第i 次添加白噪聲后的信號,y(t)是原始信號,ni(t)是白噪聲。
(2)使用EMD 分解添加白噪聲后的時間序列數(shù)據(jù)。
(3)基于不同的白噪聲,重復(fù)步驟(1)和步驟(2),每次添加新的白噪聲,整合分解結(jié)果,對最終的結(jié)果取平均值:
其中,N 表示添加白噪聲的數(shù)量,Cij(t)表示添加第j 次白噪聲后的第i 個IMF 分量。
本文所有數(shù)據(jù)來源于BW-250 型三缸泥漿泵,振動傳感器安裝在閥腔正上方(圖1)。泥漿泵的泵送頻率為25 Hz(即每分鐘泵送67 次),因?qū)嶒炇曳秶邢蓿\行狀態(tài)為中壓。

圖1 BW-250 型泥漿泵傳感器安裝示意
本次實驗共采集到工況電機轉(zhuǎn)頻為25 Hz、中壓負載下,3 種狀態(tài)下數(shù)據(jù)長度為1 310 720 的數(shù)據(jù)各3 組,將每種狀態(tài)下數(shù)據(jù)分為120 段、每段長度為32 768,時間序列信號的時域波形如圖2 所示。

圖2 振動信號時域波形
首先,對每段數(shù)據(jù)進行EEMD 分解,然后采取峭度準則,閾值設(shè)定為20,并將峭度值大于20 的IMF 分量進行重構(gòu)(表1、圖3)。重構(gòu)將原始信號分解為6 個IMF 分量,由于故障信息主要在泥漿泵振動信號的沖擊成分中,因此根據(jù)峭度準則選取大于一定閾值的IMF 分量進行重構(gòu)。峭度公式如式(6)所示。

表1 各種狀態(tài)峭度值

圖3 泥漿泵故障狀態(tài)EEMD 分解重構(gòu)過程示意
其中,μ、σ 分別表示x 的均值和標準差,E(t)表示t 的期望值。
從圖3 可以看出,3 種不同狀態(tài)的數(shù)據(jù)存在差異,但是非專業(yè)人員無法完全判斷波形所對應(yīng)狀態(tài)。因此,運用短時傅里葉變換將EEMD 重構(gòu)后的信號從一維時間序列變?yōu)槎S圖像信息,增強了信號的特征表達能力。
經(jīng)STFT 變換后,正常狀態(tài)、液力端排出閥故障和活塞故障3 種狀態(tài)的時間序列信號如圖4 所示,其中窗類型選擇為漢明窗、寬度為512。

圖4 短時傅里葉變換結(jié)果
最終數(shù)據(jù)共有360 張圖片,其中正常狀態(tài)、閥故障和活塞故障各120 張,訓(xùn)練集與測試集的比值為7:3(表2)。

表2 數(shù)據(jù)集劃分
CNN 模型中,首先要對數(shù)據(jù)集進行處理,將特征圖輸入到卷積網(wǎng)絡(luò)中,卷積層通過邊緣檢測、降噪等卷積運算,增強原始信號的特征。然后將其輸入到池化層沒在不丟失特征的情況下,通過下采樣減少圖片的維數(shù),減少訓(xùn)練時間。
首先對圖片進行預(yù)處理,將圖片大小隨機剪裁為寬度和高度均為224,進行水平翻轉(zhuǎn),然后對其進行歸一化處理,將RGB 三個通道的均值和標準差均設(shè)置為0.5(圖5)。

圖5 EEMD-CNN 模型結(jié)構(gòu)
為了得到最佳的網(wǎng)絡(luò)參數(shù),本文分別從學(xué)習(xí)率、批處理量等進行實驗分析,得到了最佳的參數(shù)組合。學(xué)習(xí)率從[0.000 001,0.01]區(qū)間內(nèi)對CNN 網(wǎng)絡(luò)模型進行訓(xùn)練,批處理量從4、8、16、32、64 中選擇最優(yōu)參數(shù),最終確定參數(shù),學(xué)習(xí)率為0.000 04,批處理量為32。圖6和圖7 分別為網(wǎng)絡(luò)模型訓(xùn)練的損失函數(shù)和準確率曲線。

圖6 訓(xùn)練損失曲線

圖7 驗證集準確率曲線
從圖6 和圖7 可以看出,當(dāng)進行到第150 次迭代時,模型的損失函數(shù)下降到0.3 左右,模型的準確率達到98%左右。
本文針對鉆井配套設(shè)備泥漿泵進行故障診斷,采集實驗室用BW-250 型三缸泥漿泵振動信號,共設(shè)置3種狀態(tài),分別為正常狀態(tài)、泵閥故障狀態(tài)以及活塞故障狀態(tài)。首先采用EEMD 方法對采集到的振動信號進行分解重構(gòu),濾去與振動沖擊無關(guān)的干擾信號,很好地解決了EMD 方法的模態(tài)混疊問題。并通過短時傅里葉變換將重構(gòu)后的振動信號轉(zhuǎn)化為時頻圖,作為CNN 網(wǎng)絡(luò)的輸入特征圖進行故障診斷。結(jié)果表明,基于EEMDCNN 的診斷方法針對泥漿泵故障有很好的診斷效果,故障診斷準確率達到97%左右,將其用于泥漿泵設(shè)備的狀態(tài)檢測,可直觀地看到泥漿泵的運行狀態(tài),有助于解決鉆井現(xiàn)場的實際問題。