朱建華 梁棟 李芳 翟海文



摘?要:為了提高變壓器狀態檢測實時性和精準性,本文采用聚類算法,引入滑動窗口技術,設計了狀態檢測模型。該模型以異常多元數據點相鄰時間段內出現異常數據點數量統計結果作為判斷依據,判斷設備運行是否發生異常。測試結果表明,本檢測模型可以準確檢測異常數據,有助于變壓器運行狀態監管工作的開展。
關鍵詞:聚類算法;異常檢測;滑動窗口
變壓器作業狀態在線評估作為提高輸變電設備管理的參考依據,隨著狀態檢測技術水平的提升逐漸得到完善[1]。目前,主要針對單一系統設備運行信息進行檢測,根據設備運行參數標準設定閾值,觀察采集到的信號是否超出此范圍,從而判斷變壓器健康狀態[2-3]。由于變壓器運行狀態數據信息量較大,加大了異常檢測難度,目前尚未形成較為完善的狀態檢測評價模型。
一、變壓器狀態評價模型的構建
(一)滑動窗口在候選異常數據集創建中的應用
(5)按照以上步驟篩選數據,從大量數據中篩選出異常數據,標記并列入異常數據集,形成集合D。
(二)k-means聚類算法在異常數據檢測中的應用
聚類分析指的是在不知情情況下劃分類型,采用相似度作為量化標準,對變壓器運行狀態進行評估[5]。此評估過程是通過計算各個類之間的相似度,根據相似度排名情況,分析設備運行數據變化特點。本文選取k-means聚類算法作為數據變化分析工具,按照最小相似度原則展開數據分析,通過簡化數據之間的關系,以減少數據分析工作量。
假設集合U數據點數量為N,空間維度為M,將此集合拆分為k個子集,形成k-聚類,每個聚類中均含有1個簇,計算N個聚類簇平均值,通過構建聚類目標函數,來判斷聚類質量。判斷公式如下:
本文構建異常數據檢測模型時,選取CH4、C2H2體積分數、環境溫度、油溫、負荷作為集合維度指標,向k-means聚類中心輸入570組歷史數據,得到聚類簇數量為k。假設閾值為P,k聚類簇中心與以上5個維度指標數據點之間的距離存在大于P的情況,則認為此數組不在簇內。所以,利用本模型檢測異常數據時,可以通過觀察各個維度數據點與簇中心之間距離大小進行判斷,得出設備狀態異常檢測結果。
二、變壓器狀態異常檢測實施步驟
(一)數據預處理
考慮到變壓器運行狀態數據屬性不通過,需要按照不同標準進行檢測判斷,容易出現閾值較小被忽略情況,所以需要對數據采取特征標準預處理,以此提高數據魯棒性[6]。此項處理工作主要涉及到平均絕對偏差、特征值屬性值的計算,計算方法如下:
(二)狀態異常檢測實施步驟
待設備運行數據屬性值經過預處理以后,按照以下步驟對設備狀態進行檢測。
第一步:采用k-聚類數據劃分方法,將歷史數據劃分為多個聚類簇,確定各個聚類簇中心;
第二步:從大量在線監測數據中篩選異常數據。該處理環節是將數據劃分為多個時間序列,滑動時間窗口,從序列中篩選異常數據,標記異常數據的同時,將異常數據列入集合D;
第三步:按照聚類簇判斷標準,根據包含關系,對集合中的數據點進行判斷,如果數據點不包含于聚類簇集合,則認為此數據為狀態異常數據點;
第四步:以前三步輸出的判斷結果為依據,觀察異常數據點相鄰時刻下的數據點所屬情況,獲得多元時間序列數據異常判斷結果。
三、測試分析
為了檢驗上述狀態異常檢測模型可靠性,本文以某輸變電工程變壓器為例,選取2020-04的570組數據作為檢測對象,包括乙炔體積分數、負荷、環境溫度、甲烷體積分數、頂層油溫,將這5個維度正常作業狀態下的歷史數據輸入異常檢測模型中,對設備運行狀態進行檢測,通過觀察檢測結果,得出檢驗結果。本次測試時間長達23.3個小時,時間為2020-04-12 12:00:00至2020-04-13 8:00:00,以5min為樣本數據采集時間間隔,獲取280個數據樣本。利用公式(3)、公式(4)、公式(5)對數據進行預處理,以3個已知簇類中心作為最大距離計算參考點,檢測異常數據,結果如下:
(1)G1=0.67,G2=0.78,G3=0.76時,檢測成功率為87.9%,誤檢出率10.7%;(2)G1=0.70,G2=0.78,G3=0.77時,檢測成功率為89.1%,誤檢出率7.8%;(3)G1=0.71,G2=0.78,G3=0.75時,檢測成功率為95.4%,誤檢出率2.6%;(4)G1=0.71,G2=0.78,G3=0.78時,檢測成功率為95.4%,誤檢出率1.9%;(5)G1=0.71,G2=0.78,G3=0.76時,檢測成功率為97.2%,誤檢出率1.9%。
當閾值G=(0.71,0.78,0.78)時,距離逐漸穩定下來。由此看來,本文設計的模型能夠檢測變壓器運行狀態異常數據,達到某一狀態后逐漸穩定。為了進一步驗證檢驗模型性能,本次測試分別對候選異常數據集時間間隔和實時待測數據集時間間隔數據分別特點進行統計分析,結果如下:
檢測時間間隔T范圍0~280,按照數據類型不同,將檢測結果時間間隔劃分為3部分分別是100~110、50或者200、240~280。
當時間間隔范圍為100~110時,異常數據點分布特點為小片連續。由此看來,此時間段內,設備運行出現了異常狀況,需要對設備健康狀態進行進一步探究。
當時間間隔為50或者200時,數據點不包含于聚類簇,這兩個時刻相鄰數據均為正常數據。由此看來,T=50或者T=200時,設備運行數據出現了噪聲,很有可能是傳感器作業遭受干擾造成的,可以忽略不計。
當時間間隔范圍為240~280時,異常數據點不包含于數據簇內。由此看來,變壓器設備在此時間段內出現了故障,并且很有可能持續一段時間內均出現設備異常情況。
基于上述統計分析,本設計方案可以實時反映變壓器運行狀態,準確檢測異常數據。
四、總結
本文圍繞變壓器狀態異常檢測問題展開研究分析,選取聚類算法和滑動窗口作為研究工具,構建狀態異常檢測模型。該模型按照設定的時間間隔,分別對在線監測數據進行檢測,通過觀察異常多元數據點相鄰時間段內出現異常數據點數量,判斷設備運行狀態。測試結果表明,該模型不僅可以準確檢測異常數據點,還滿足數據檢測實時性要求。
參考文獻:
[1]榮智海,齊波,張鵬,等.基于油中溶解氣體CANOPY高維模型的變壓器異常狀態快速識別方法[J].中國電機工程學報,2018,38(13):3987-3996.
[2]辛建波,康琛,翁新林,等.基于聚類和時間序列分析的變壓器狀態評價方法[J].電力系統保護與控制,2019,47(3):64-70.
[3]李敏,陳果,沈大千,等.基于改進凝聚層次聚類算法的變壓器繞組及鐵心故障診斷研究[J].高壓電器,2018,54(1):236-242.
[4]劉慶珍,張曉燕,蔡金錠.基于降維技術與K-MEANS聚類的油紙絕緣狀態綜合灰評估[J].電力系統保護與控制,2019,47(8):68-76.
[5]蔡金錠,祝順才.基于灰色聚類-集合賦權法的變壓器油紙絕緣狀態評估[J].高電壓技術,2018,44(3):765-771.
[6]郭鵬,王兆光.基于高斯過程回歸和雙滑動窗口殘差處理的風電機組主軸狀態監測[J].電力自動化設備,2018,38(6):34-40.
作者簡介:朱建華(1979—),男,漢族,陜西渭南人,本科,工程師,主要從事變壓器組部件、變壓器二次設計及管理工作。