趙敏 王云輝 王華 付兵 金峰 (長慶油田第五采油廠)
數字化技術的快速發展,不僅給人們的日常生活帶來了方便,也使得很多領域實現了智能化發展,油田巡檢就是其中之一。在傳統的油田管理中,會設置人工巡檢,以此保證油田的正常運行,但這種巡檢方式需要耗費大量的人力物力,且巡檢數據不易保存,無法及時發現油田存在的隱患。通過油田無人值守站來對油田的運行進行巡檢,其不僅能夠實時掌握油田及周邊環境的情況,而且能夠及時解決突發情況。然而,無人值守站也會因受到外界因素的影響在運行過程中出現異常,因此需要對其進行異常辨識。
不少研究學者針對異常辨識方法展開了研究,并提出了自己的想法。一是首先采集低壓臺區線損數據,并對采集的數據進行預處理,剔除外界因素對數據的干擾。然后在考慮分布光伏的前提下,提取線損數據的特征,并對其進行分類,從而實現對狀態異常辨識,但該方法的辨識時間過長[1]。二是通過對風機運行狀態的監測和分析,提取其中的異常狀態數據,并融合分形特征,構建相應的異常辨識模型,從而實現對風機異常運行狀態的辨識,但該方法辨識的結果不準確[2]。三是對配電站的備自投動作狀態進行捕捉,并提取其中的數據特征,在網損平衡異動分析的作用下,構建相應的狀態辨識模型,從而實現對其動作狀態的辨識,但該方法的應用成本較高[3]。
在上述研究的基礎上,設計了基于特征標記的油田無人值守站運行異常辨識方法。通過采集油田無人值守站的運行狀態數據并對數據進行預處理,提取出其中的異常運行狀態數據,并對異常狀態特征進行標記處理,從而實現對無人值守站異常運行狀態的辨識。設計的方法能夠及時發現無人值守站運行過程中存在的問題,并制定相應的解決措施,保證無人值守站的穩定運行[4-5]。
為實現對無人值守站運行狀態異常的辨識,需要采集一段時間內的無人值守站運行數據。一般來說,數據采集時長為6 個月。在采集無人值守站的運行狀態數據后,考慮到無人值守站在運行過程中受到周圍環境的影響,采集的數據中存在大量不良數據,導致數據質量整體較差,無法準確表征無人值守站正常運行和異常運行之間的差異[6]。因此,需要對采集的數據進行預處理。該設計數據預處理的過程分為兩部分,一是數據清洗,二是數據降噪處理。其中數據清洗是將采集的數據進行簡化處理,去除其中的重復數據,并將剩余的數據轉換成標準化數據,以便用于后續分析[7]。
在數據清洗過程中,首先將采集的數據按照數據清洗的規則進行相關處理。若符合要求,則直接輸出處理后的數據[8]。若不符合要求,則需要判斷數據中是否存在重復值、缺失值和無效值。若存在,則刪除數據中的重復值;若不存在,則直接對數據進行下一步處理。在上述過程的基礎上,再對數據的一致性進行判斷。若不符合要求,則需要對數據進行歸一化計算,保證數據的一致性,再輸出處理后的數據。通過上述處理,完成對數據的清洗[9]。然后,對數據進行降噪處理。在降噪處理的過程中,首先得到含有噪聲的數據模型,以此為基礎,對數據進行分解,將其中的噪聲進行分離處理,再將數據按照既定的規則進行重構,從而得到去除噪聲后的平滑數據。具體降噪過程:
式中:S(x)為含有噪聲的一階數據模型;x為數據采集點;m(x)為真實的數據;δ為設定的噪聲閾值;e(x)為噪聲函數;f(x)為噪聲處理的結果;C為需要進行降噪處理的數據數量,個;Wf(a,b)為降噪函數;ψ(·) 為降噪后的重構函數;a、b分別表示為降噪處理的各項參數。
在上述過程中,分別對采集的數據進行了數據清洗和降噪處理,提高了數據的質量,為后續運行狀態數據的特征提取及標記奠定了基礎[10]。
在對無人值守站的異常數據進行特征提取時,因其在運行過程中不同設備和儀器的運行參量及剩余壽命不同,且不同設備之間的相關性也存在一定的差異,因此需要直接提取異常數據的特征量,以此對無人值守站異常運行狀態進行分析。選取數據的統計均值、方差和均方根值作為異常數據的特征量。其中,數據的統計均值能夠直接反映無人值守站的異常運行情況,方差能夠展示異常運行狀態出現時的波動情況,均方根值能夠反映異常運行狀態對無人值守站的影響。異常數據特征量的具體計算過程:
式中:S為異常數據的均值;n為異常數據數量,個;ri為異常數據特征值;pri為該異常數據出現的可能性;M為異常數據的方差;rˉ為異常數據的真實數值;R為異常數據的均方根值。
通過公式(2)提取出異常數據的特征量,對異常狀態特征標記。特征標記是指通過對數據中的特征進行標記,以表示其在某種條件或環境下的狀態或屬性。這種標記可以是數字、符號、顏色等形式,用于輔助分析和判斷。在無人值守站運行狀態異常辨識中,特征標記的創新點如下:
1) 直觀可視化,通過對關鍵特征進行標記,可以直觀地展示數據的狀態。例如,將正常運行狀態標記為綠色,異常運行狀態標記為紅色,以便快速辨識異常情況。
2) 提高準確性,通過對關鍵特征進行標記,可以突出特征的重要性,幫助辨識算法更加關注和利用有用的特征信息,這有助于提高無人值守站運行狀態異常辨識的準確性。
3) 加強關聯性分析,通過對特征進行標記,可以更好地捕捉不同特征之間的關聯關系。例如,將相似特征標記為同一類別,便于進行相關性分析和模式辨識,進一步深入了解異常產生的原因和機制。
4)簡化特征選擇,在無人值守站的異常辨識中,可能存在大量的特征待選。通過特征標記,可以對特征進行分類和歸類,從而簡化特征選擇的過程。這有助于減少特征空間的維度,并且更集中地關注與異常相關的特征。
在對異常數據進行標記時,需要將所有的數據特征都集中在同一個特征空間中。在該特征空間中,利用數據的時域性,劃分出對應的時域平面。在該時域平面內,由于時域能量的不同,異常數據的特征會集中在不同的時域平面上,從而實現異常狀態特征標記。異常狀態特征標記過程見圖1。利用時域能量去檢測異常狀態數據,并將檢測到的異常狀態數據進行標記,為后續的異常辨識奠定基礎。

圖1 異常狀態特征標記過程Fig.1 Process of abnormal state characteristic marking
在上述設計的基礎上,進行對無人值守站運行狀態異常的辨識。利用提取的異常數據特征,再結合特征標記的結果,構建相應的運行狀態異常辨識模型。油田無人值守站運行異常辨識模型見圖2。

圖2 油田無人值守站運行異常辨識模型Fig.2 Abnormal identification model of unattended station operation in oilfield
首先對輸入的無人值守站運行數據進行預處理,并對預處理后的狀態數據進行特征提取。然后提取出其中的異常數據特征,通過計算對應的異常辨識參數,實現對無人值守站運行狀態異常的辨識。在上述過程中,異常辨識參數的計算過程:
式中:W為構建的運行狀態異常辨識模型;f(i)為異常數據判別函數;Ki為異常辨識模型中的特征變量;t為時間變量;d為辨識模型中的異常辨識參數;Gi為外界的干擾參數。
通過公式(3),計算出數據的異常辨識參數。當該異常辨識參數達到設定閾值時,則說明無人值守站當前的運行狀態出現異常,需要進行及時處理。由此,完成對無人值守站異常運行狀態的辨識。至此,基于特征標記的油田無人值守站運行異常辨識方法的設計完成。
為驗證設計的異常狀態特征標記的辨識方法在實際應用中的效果,進行實驗測試。實驗中,以某油田無人值守站為實驗對象,進行相關實驗測試。
對某油田無人值守站進行數據采集,采集時間為6 個月,采樣點為6 000 個,采集的無人值守站運行數據見圖3。

圖3 某油田無人值守站運行數據采集結果Fig.3 Data collection results of unattended station operation in an oilfield
以圖3 采集的運行狀態數據作為基礎,為提高采集數據的質量,對其進行預處理。預處理后的無人值守站運行數據見圖4。

圖4 預處理后的無人值守站運行數據Fig.4 Operating data of unattended station after appointment processing
采集的數據經過預處理后,數據的質量得到了提高,能夠用于后續實驗。此外,為提高實驗結果的可靠性,設置了相應的對照實驗。其中,基于特征標記的油田無人值守站運行異常辨識方法為方法1,基于多源數據重構的油田無人值守站運行異常辨識方法為方法2,基于卷積神經網絡的油田無人值守站運行異常辨識方法為方法3。
為驗證三種方法在實際應用中的效果,以三種方法的辨識準確率為評價指標,對比三種方法的性能。實驗中,利用三種方法對某油田10 座無人值守站的運行狀態進行辨識,統計其辨識結果。辨識結果見表1。

表1 辨識結果Tab.1 Identification results
根據表1 可知,方法1 的辨識準確率最高。因此,基于特征標記的油田無人值守站運行異常辨識方法在實際應用中效果最好,能夠準確辨識無人值守站在運異常,能夠確保無人值守站的穩定運行。
1)為了提高辨識準確度,對數據進行清洗和降噪處理。這一步驟在異常辨識中起到了關鍵作用,提高了異常數據特征的提取效果。
2)采取均值、方差和均方根值等統計量作為異常數據的特征,并對異常狀態特征進行了標記處理。這種方法不僅充分利用了數據的統計特性,還提高了辨識模型的可解釋性和準確度。
3)通過測試,實驗結果表明,所設計方法具有很高的辨識準確率,辨識準確率平均值為93.77%,這一結果表明該方法在辨識油田無人值守站運行異常方面具有較好的效果,可在實際應用中得到廣泛應用。
通過對研究成果的應用及時發現運行異常,并采取相應的措施進行處理,從而降低運維成本和風險,提高生產效率和安全性。而其缺陷在于僅對油田中的數個無人值守站進行實驗測試,導致實驗結果存在單一性,在之后的研究中將采集更多的樣本進行相關實驗,以此最大程度上保證辨識精度。