王建強
(中國石油大學(華東)石油工業訓練中心,山東 青島 266580)
目前,柱塞泵已成為石油鉆探行業的一個重要設備,該設備的運行控制性能對石油鉆探過程的可靠性存在直接影響。柱塞泵具有結構緊湊、壽命長、容積效率高等優點[1-3]。柱塞泵的典型故障包括滑靴磨損、松靴、配流盤磨損以及斜盤不平衡。由于柱塞泵的故障具有突發性,成因復雜,使用提取特征與分類器結合的傳統方法對柱塞泵的故障診斷變得十分困難,尤其是斜盤不平衡故障更不易發現。對柱塞泵初期故障如何實現快速預警以及準確判斷故障信號,這是避免因故障問題造成經濟損失的重要問題[4-6]。
深度學習與機器學習算法已被應用于故障診斷領域[7-8]??赏ㄟ^深度學習提取得到特征信息,根據故障數據完成深度學習過程并實現故障的診斷功能。相對傳統形式的機器學習算法,可以采用深度學習網絡實現學習與識別過程的高效結合,由此滿足特征參數提取、訓練以及對準確率進行控制的要求,顯著提升模型診斷能力[9-11]。進行信號處理時,可以利用對稱點模式(symmetrized dot patterns, SDP)圖像顯示模式使不同信號間的差異性表示成圖像形式,再對轉換得到的圖像進行深度學習,由此達到自適應提取SDP圖像信息的效果,克服人工特征提取方式存在的缺陷[12-13]。
斜盤時域信號內存在振動信號的各項特征數據,當直接對這些數據開展深度學習時并不能獲得理想的識別精度。為優化深度學習模型診斷性能,本文構建了以SDP圖像和卷積神經網絡(convolutional neual networks, CNN)相結合的方式來實現斜盤的故障診斷功能。利用SDP方法分析故障信號,對包含故障信息的時域信號進行轉換得到SDP圖像,根據圖像差異性判斷不同的故障類型;再把SDP圖像參數輸入CNN中進行處理,由此完成識別SDP圖像的功能,從而判斷出故障類型。
采用SDP模式進行圖像處理是把信號轉換成圖像的過程。與其他信號圖形轉換方法相比,該方法轉化計算過程較簡單。可以把時域信號以SDP圖像形式表示,不必對信號實施濾波與降噪,采集得到信號中的有用信息[14]。
對時域信號進行歸一化,得到對應極坐標系的SDP圖像,將其表示成式(1)的形式。
(1)
式中:i是采樣過程中時域信號包含第i個離散點,用SDP計算時間點i的幅值xi和時間點i+a的幅值xi+a,并把結果轉換成極坐標的形式,根據時域信號的xi參數轉化得到SDP圖像的半徑尺寸;θl是極坐標系初始角度;xmax與xmin依次表示時域信號xi的最大與最小值??梢园褧r間滯后系數a以及時域信號各點都映射到極坐標系內。
SDP方法可以利用極坐標系表示時域信號,得到具有信號變化特征的圖像。與其他時域信號轉化成圖像的方式相比,采用SDP圖像可以獲得更優抗噪聲性能。
利用SDP圖像表示信號時,能夠同時表達不同組的信號。本文對包含不同頻率的故障信號進行模擬測試,同時對比了各頻率信號被轉換成SDP圖像時的差別,對各位置處形成的模擬信號分析,重點探討了圖像和信號頻率的相互變化規律[15]。
測試時,總共設置了4種頻率成分的正弦信號,將其轉換成SDP圖像的形式,可以同步把多組信號轉化成SDP圖像。圖1為仿真信號波形圖。

圖1 仿真信號波形圖
當逐漸提高頻率成分時,各組信號被轉化成SDP圖像之后,對應的圖像曲率也存在明顯區別,由此可以推斷將信號轉化成SDP圖像時實際可表達信號也具有較大差異性。
機械故障綜合模擬測試臺是SQI企業設計的一種測試臺,實驗裝置見圖2。組成信號采集系統的部分包含加速度探測器、計算機與DEWE信號采集儀。

圖2 實驗裝置圖
斜盤不平衡即斜盤中心與軸中心不重合,在斜盤運轉過程中會出現較大徑向沖擊,原理示意及模擬照片見圖3。在添加不平衡螺釘后,在轉盤上形成不平衡區域。

圖3 斜盤不平衡故障原理及模擬照片
進行斜盤不平衡故障模擬時,控制測試臺轉速為600 r/min,以1 260 Hz頻率進行采樣。各類故障分別采集得到500個樣本,從中選擇400組進行訓練,再以剩余100組作為測試對象,各組數據分別采樣1 024點,本次故障測試共包含2 000個數據。
利用深度學習CNN提取故障信號SDP圖像特征并完成學習過程,根據SDP圖像類型判別結果來達到分辨振動狀態的效果。圖4給出了本文設計的故障診斷流程。

圖4 基于SDP圖像和CNN的故障診斷流程
構建卷積神經網絡CNN模型后,再對故障信號轉化得到的SDP圖像實施分類,當設置不同的神經網絡參數時,診斷模型識別精度也會發生明顯變化。對故障信號進行SDP分析,通過信息融合的方法將其轉化成圖像,再把轉化得到的圖像輸入CNN診斷模型。
分別設置了1 600個訓練數據域400個測試數據,設定輸入圖像的像素為128×128。對各訓練樣本開展一次訓練后得到對應的迭代次數,根據模型結構測試時,結合實際經驗控制訓練次數為20次,將尺寸設定在32,第一卷積層中總共包含32個卷積核,網絡學習率為0.1。
CNN-16網絡包含了5層卷積層與池化層,可以通過對網絡進行加深處理來提升運算性能。各網絡結構故障的識別準確率結果見圖5。根據圖5可知,故障識別結果受到實際網絡結構的直接影響。對各網絡結構測試后,再結合故障識別與網絡訓練效率的情況,利用4層卷積層網絡構建故障診斷模型。

圖5 不同網絡結構的故障診斷結果
圖6顯示了在不同尺寸下進行故障識別得到的準確率。根據圖6可知,尺寸從8提高至32時,模型識別準確率隨尺寸表現為快速升高的趨勢。尺寸為32的條件下,此模型可以達到88.1%的最高準確率。進行本次測試時,尺寸為32時達到了最高識別準確率,根據時間損耗以32作為最終尺寸。

圖6 識別準確率隨尺寸的變化曲線
圖7顯示了識別準確率隨第一層卷積核數量變化結果。根據圖7可知,當第一層的卷積核數為8、16、32與64時,通過模型計算得到的識別準確率存在差異性。根據模型訓練時間、穩定性及其在故障識別方面的準確率,以第一層卷積核數量32作為深度學習模型卷積層。

圖7 識別準確率隨第一層卷積核數量的變化
圖8顯示了識別準確率隨深度模型學習率的變化結果。根據圖8曲線可知,識別準確率隨學習率的增加表現出先增加后減小的變化規律,在學習率為0.1時達到最大值。因此確定深度學習以學習率0.1為參數。

圖8 識別準確率隨深度模型學習率的變化趨勢
以尺寸batchsize32、迭代次數為20、學習率為0.1并且第一層卷積核數32的參數作為模型參數;以隨機方式從故障數據庫內選出100組樣本進行測試,總共為400組。再以剩余1 600組數據對模型進行訓練。CNN也對計算結果存在顯著影響,通過比較各參數可知,設定CNN學習率為0.1,每次輸入32個樣本進行訓練,總共迭代20次,其中,在第一卷積層內包含的卷積核數量為32,同時輸入像素為128×128的圖像。表1是對不同故障程度轉子進行識別的結果。

表1 不同故障程度轉子識別準確率
在上述參數下,以模型對故障進行識別得到的4種故障準確率均值為87.4%,故障程度3達到了最小的準確率。這是因為:相比較不對中和翹曲故障,轉子高速運轉時不平衡故障會引起高頻振動,致使發生失穩的概率增加。
為了進一步證明,采用頻域分析對振動信號進行譜圖分析,加速度傳感器振動信號耦合故障頻域譜圖見圖9。

圖9 耦合故障頻域譜圖
分析圖9可知,頻域譜圖信號表現為不平衡特點,在軸向方向表現為不對中的故障特性。通過對時域信號特征提取可有效地提高耦合故障類別的判斷準確率。
1)以尺寸batchsize32、卷積層為4、學習率為0.1并且第一層卷積核數32的參數作為模型參數是最優的。
2)控制輸入圖片尺寸為128×128的條件下,模型識別的準確率為87.4%,由此達到對各程度故障進行分類的效果。通過對時域信號特征提取可有效地提高耦合故障類別的判斷準確率。