



關鍵詞: 油井電參數 故障診斷 深度殘差收縮網絡 卷積神經網絡 軟閾值化
石油是能源結構中不可或缺的一部分[1],但隨著石油的不斷深入開采,抽油機井的故障率也越來越高,因此,準確掌握抽油機工作狀況,正確診斷抽油機故障類型,對提高經濟效益和保證石油供應具有重要意義[2]。傳統的示功圖采集方法需要停機進行,不僅影響生產,而且極易損壞設備。而電參數相較于施工圖而言,有著易于采集、直觀準確、成本低廉等優點。一部分的油田在數字化改造中,給油井安裝了具備通信功能的示功圖傳感器,但是這種類型傳感器不僅安裝成本偏高,并且設備維護困難,進而油田需要為此付出高昂的管理費用,增加油田的運行成本。因此,油井電參數和智能診斷方法[3]的結合便應運而生。
智能診斷方法的優勢在于可以使用機器學習或神經網絡來代替人類識別和診斷,利用機器代替人類完成復雜的思考過程。發展智能化的故障診斷方法早已成為了當下故障診斷研究的發展主流,并且在油井故障診斷這一研究領域中,國內外學者已經取得了大量的成果。隨著技術的快速發展,對于有桿泵運行工況診斷的研究也與日俱增。目前,在油井的相關的智能診斷技術,一般為專家系統、模糊理論、人工神經網絡[4]、支持向量機[5]等。
1 深度殘差收縮網絡模型
1.1 建議方法的體系結構
文章提出了基于深度殘差收縮網絡(DRSN)的油井故障診斷模型。并將該模型對應的步驟分為3 步,具體敘述如下。
首先,將原始數據按照一定尺寸矩陣化,構成油井時間序列的GAF 圖像樣本集。從這些數據集中進行數據預處理,將數據中的一些無用數據或者含有噪聲的噪聲數據進行處理。其次,在DRSN 模型中,包含著殘差塊、軟化閾值、池化層、全連接層和輸出層。其中殘差塊用于防止模型出現退化問題,軟化閾值用于樣本降噪處理。最后,使用上述兩個階段的方法,對長時程的數據進行故障檢測。
1.2 深度學習算法理論
一般數據樣本的故障診斷都是以故障發生時的數據進行診斷,這就導致了故障診斷時可能會因為采集數據的時間太短導致故障診斷的準確性低。為此,文章提出了基于長時程的故障診斷。此診斷方法將軟化閾值和殘差項與CNN結合,生成深度殘差收縮網絡模型。
在該模型中,CNN 模型前向傳播各層的公式如下[6]:
1.3 深度殘差收縮網絡
隨著卷積神經網絡深度不斷增加,就有可能會出現網絡模型退化的問題。為了解決模型問題,本文提出了基于深度殘差收縮網絡(DRSN)的油井故障診斷。DRSN 是處理含噪聲數據的神經網絡模型,本模型可以借由卷積層網絡結構以及殘差項的恒等映射原理對模型的損失進行反向傳播,再借由軟閾值化對采集到的數據進行降噪處理,這樣不僅能夠得到噪聲小的數據,還能得到更優的模型,提高整體模型的準確率和模型性能。圖1 是DRSN 的網絡模型。
2 實例分析
文章構建了基于深度殘差收縮網絡的油井故障診斷模型,此模型是將CNN 與殘差項以及軟閾值化進行整合得到的。將殘差項添加到模型中的這種方式極大程度地降低了模型的訓練難度。而軟閾值化和注意力機制通過數據集的噪聲進行設置,使模型具有了降噪能力,大大提高了模型的準確率。
在圖2 中,簡單地演示了基于DRSN 的故障診斷流程。首先,采集油井時間序列的油井電參數數據來構成數據樣本。其次,將數據樣本矩陣化構成GAF 圖像,通過將GAF 圖像分為訓練集和測試集,其中將訓練集用于對深度殘差收縮網絡的訓練,就能夠得到用于診斷油井故障的模型。最后,將測試集輸入到故障診斷模型中,就可以得到模型的故障診斷結果。
2.1 基于多故障長時間序列樣本的油井故障診斷
2.1.1 故障樣本預處理
文章提出了選用電參數進行故障診斷。電參數的采集方便快捷、直觀準確。相比于分析示功圖進行故障診斷,基于電參數的故障診斷更加方便準確。在處理這些數據時,可以將采集到的數據進行矩陣化,按照采集到的時間順序記性時間序列化,構成時間序列數據樣本。
將收集的數據轉化為GAF 圖像,而為了能夠確保所需要描述的格拉姆角場轉換的方法能夠保證同時保留至少兩個角度所給到的信息,將獲得的極坐標角度值通過計算任意兩個的和或差的余弦值,并從數據中的左上角向右下角進行編碼,就能夠得到格拉姆角場矩陣(GAF Metric),這就被稱為格拉姆和場(GASF)和格拉姆差場(GADF),上面所描述的格拉姆角場編碼轉化方法如下公式所示:
為了將油井電參數轉化為易于該網絡模型處理的數據樣式,經過上式的數據處理,將油井電參數矩陣化為如下圖300×300 的GAF 圖像樣本所示。將采集到的數據通過上式生成GAF 圖像,再以300 個數據生成該圖像,構成樣本集。
2.1.2 模型的構建與訓練
文章針對時間序列進行故障診斷,將數據樣本分為訓練集和測試集,并通過多次設置參數,將深度殘差網絡模型分為輸入層、卷積層和輸出層。借由設置神經網絡的參數,獲得相對應的網絡模型。根據圖4 可知,當epoch 在25 時,模型的準確率基本上接近最高。
通過對比深度殘差收縮網絡與CNN 模型以及GoogLeNet 模型,在訓練過程中準確率變化具體見圖5。模型的訓練準確率可以達到99.3%,其他兩種模型的準確率為99.01% 和98.9%。并可以得出DRSN 模型比其他模型準確率上升更快且準確率更高。
2.2 基于長時程的油井故障診斷
在上述的樣本預處理和模型搭建的基礎上,將深度殘差收縮網絡用于油井電參數的故障診斷中。將模型參數設置好后,模型的準確率達到了99.3%。通過實驗表明:經過一定的數據預處理,并通過深度殘差收縮網絡就能準確地判別特征指標相對應的故障類別,進而實現基于油井電參數的精準化故障診斷。
2.3 對比實驗
為了進一步驗證模型在時間序列分析的優越性,接下來選用不同的模型在相同的數據下,開展模型準確率的對比。選用不同的網絡模型包括GoolgeNet、RNN、CNN、DRSN。經過反復的試驗后,得到不同網絡模型的參數,并對其進行相應的設置,使其達到最好的性能,得到的平均準確率數值如表1 所示。
3 結語
針對油井的工作性質,提出了基于時間序列分析的油井電參數數據故障診斷方法。首先對油井電參數進行分析,介紹了油井電參數的優勢;然后針對時間序列數進行故障診斷,對時間序列數據進行分析,通過其時序特性研究其周期性質和趨勢性性質,對比傳統的故障診斷方法,能夠提高故障診斷的準確率,在時間序列數據分析中有著明顯的優勢。通過一些方法將數據轉換成網絡模型所需要的數據類型,將這些數據輸入到模型中去。對DRSN 選取最優的參數,將設置好參數后,測試分析模型的性能,并對不同類型的網絡模型進行測試,而DRSN 具有最好的準確率和效率。因而基于電參時序分析的油井故障診斷應用中有較好的表現和較高的經濟效益。