張遠來 尹積金 張國印 晏斐
油浸式變壓器[1]是電力系統中廣泛使用的核心設備,采購成本高,技術復雜,運維難度大,而油溫是影響油浸式變壓器[2]壽命的主要因素之一。長期較高的油溫將會引起變壓器的設備異常甚至故障,并大大減少設備的使用年限。變壓器油溫過高的主要原因包括變壓器承載的負荷過高、出現短路、相關絕緣部件損壞以及冷卻部件故障等問題。目前針對變壓器油溫異常的診斷方法主要包括:(1)采用溫度計對變壓器的頂層油溫進行測量,基于變壓器熱傳導的過程構建熱路模型[3],并且據此進行異常油溫判定;(2)采用外部紅外成像技術對變壓器整體進行測量[4],建立多維度油溫異常計算模型;(3)采用專用的油色譜分析儀儀器,測量和計算油中各類氣體成分的含量,進而根據油色譜[5]的變化進行油溫異常判斷分析。
上述采用溫度計、紅外成像技術、油色譜分析儀的變壓器油溫異常診斷方法具有重要的研究借鑒價值,但是存在著實施成本高,推廣普適性差,異常診斷實時性不夠等不足,如何更加準確、低廉、實時地進行變壓器油溫異常診斷仍然是一個難題。機器學習是大數據時代下日趨成熟的數據挖掘技術,其在工業領域得到了較為廣泛的應用。本文在機器學習中無監督學習[6-7]算法的基礎上,提出了一種基于無監督機器學習模型的油浸式變壓器油溫異常狀態診斷方法,實驗表明其具有優于傳統方法的效果。
目前,針對油浸式變壓器油溫的數據處理、異常識別和預測預警,主流方法包括基于簡單熱傳遞物理模型計算技術、基于變壓器油氣體成分指標分析技術和基于頂層油溫變化分析技術三大類技術路線,其主要特點如下。
基于簡單熱傳遞物理模型的油溫數據計算。李世光建立了變壓器油溫傳導的修正熱路模型,計算變壓器的頂層油溫及其繞組熱點溫度,由于使用簡單熱傳遞物理模型代替復雜模型,所需參數較少,模型更精確,所以計算精度和計算速度相對導則GB/T1094.7-2008提供的計算公式,都有明顯提升[4]。魏本剛基于變壓器繞組的主要發熱原因以及變壓器油的粘滯程度,構造了多維的修正參數模型,相對IEEE/ANSIC57.115標準的溫升指數模型,能夠更為準確地對變壓器頂層油溫的熱點溫度進行計算[3]。陳偉根通過Kalman濾波構造頂層油溫狀態方程,并構建測量方程,提出了一種變壓器熱路模型的油溫動態微分方程,建立了頂層油溫實時最優估計模型,實時地預測變壓器頂層油溫[8]。結合油浸式變壓器頂層油溫現場實測數據對比分析Kalman濾波模型及IEEE導則推薦模型預測結果,表明Kalman濾波模型具備更高的精度。
熱路模型計算技術對參數的完備性要求較高,同時針對不同運行工況下的變壓器熱路模型相差也較大,預測的精度與參數的準確性息息相關。
基于變壓器油色譜異常探測的油溫預警方法。杜雙育、周多軍等人根據變壓器油色譜氣體指標進行了分析,并基于DL/T722-2000的三比值與四比值法則,進行變壓器異常的診斷,基于油色譜主要成分算法或者通過MCD穩健統計多元分析去除相關干擾異常值后,能夠有效提高變壓器異常診斷的準確率[5,9]。
基于油色譜異常探測技術,監測周期較長(一般3小時以上),監測指標多,流程復雜,不同類型的變壓器指標參數判斷規則都有所不同,設備的價格也比較昂貴。
基于頂層油溫異常探測的油溫預警方法。王永強根據日頂層油溫最大值,綜合考慮了變壓器相關檢修等工況造成的影響,提出了一種基于峰值半物理的短期頂層油溫預測模型[10]。其次,取變壓器頂層油溫的預測數據與實際數據進行對比,以發現變壓器是否存在異常,進而判斷可能存在的相關異常隱患信息。陳錦銘提出了一種基于變壓器頂層油溫變化的異常狀態模型,采用等頻離散化、箱形圖分析變壓器油溫變化的異常狀態及概率分布,以發現變壓器是否存在異常,進而判斷可能存在的相關異常隱患信息[4]。上述文獻所采用的技術方法沒有充分運用數據價值,其適用性較差,針對不同廠商型號、不同電壓等級的變壓器可能存在診斷不穩定的問題;又或者模型過于簡單,評判原則單一,精度不高。
如表1所示,基于無監督假設檢驗大數據挖掘技術的油溫預警方法的預測的泛化能力強,相對其他的方法具有較低的操作復雜性,在大數據的支持下,具有很強的可推廣性,預測準確性也能達到很好的效果。上述對比顯示大數據挖掘技術比傳統技術更具備發展潛力。

表1 變壓器油溫異常分析技術對比表

圖1 油溫異常探測算法流程圖
本文提出的油溫異常探測算法流程如圖2所示。其算法思想是首先利用無監督聚類算法對工況數據進行聚類,發現隱藏在樣本中的不同的工況分類。然后,通過統計學方法分析每種工況聚類下不同油溫的一個分布情況,最后基于給定的閾值對每個聚類中小概論樣本油溫標注為異常。而標注異常后的歷史數據作為系列數據集合,基于決策森林機器學習算法[11-13]得到變壓器油溫異常的判斷規則。其中主要工況指標如下表2油溫異常工況屬性特征表所示。

圖2 基于假設檢驗的油溫異常閾值求解流程圖

表2 油溫異常工況屬性特征表

表3 過濾粒度與查準查全率表
算法1名稱:油溫異常標注算法
算法輸入:標注異常樣本數據,聚類k值,異常閾值γ。
算法輸出:油溫異常決策規則知識集。
步驟1:對歷史數據值進行噪點數據、缺失數據辨別,并進行刪除和補齊。按照10℃間隔對每個變壓器的油溫記錄進行離散化處理,例如10℃-20℃作為取值t1,20℃-30℃作為取值t2,以此類推。
最后,將實時變壓器工況輸入決策分類器,基于變壓器油溫異常診斷模型,結合變壓器實時工況信息進行實時診斷計算,符合正常規則的情況輸出為正常油溫,符合異常規則的輸出為異常油溫。
算法輸出:最優過濾閾值。
步驟1:實施算法1中步驟4,5,和6。
步驟2:將油溫異常測試數據集輸入決策分類器,根據油溫異常分類決策規則與變壓器工況進行實時匹配。
步驟3:將測試數據集中符合正常規則的情況輸出為正常油溫,符合異常規則的輸出為異常油溫。
步驟4:統計本分類器對測試數據集預測的查準率,查全率。
步驟5:如果步驟4獲得的查準率,查全率不能達到預期目標則并且返還步驟1。
步驟6:如果步驟4獲得的查準率,查全率達到預期目標則輸出當前最優值。
實驗采用上海A站4號主變2014年12月-2017年1月數據來驗證基于無監督機器學習模型的油浸式變壓器油溫異常狀態診斷方法的有效性,數據集的詳細描述如表2所示。實驗平臺的操作系統為Ubuntu16.04LTS,機器配置為英特爾酷睿i3-2350M處理器(2.3GHz),3.8G運行內存,Python3.5開發環境進行實驗。
本項目實驗通過基于無監督機器學習模型的油浸式變壓器油溫異常狀態診斷算法1對上述數據進行變壓器油溫異常辨識。并以異常識別的準確度為評價指標與基于變壓器油色譜氣體指標變化的油溫異常診斷方法作對比分析。
實際生產中,一般會綜合考慮準確率與查全率兩類指標,綜合評價指標通過對準確率和查全率設定不同的權重得到。本實驗中,通過對準確率和查全率的均衡加權求和來綜合評價算法。
本文實驗以上述2015年標注后的油溫數據作為訓練數據集來訓練決策森林模型,訓練結果獲得的決策規則被應用于判斷2016年的主變設備的油溫異常情況。通過算法2對評價指標準確率,查全率和準確率+查全率的結果反饋,選擇最優過濾閾值 的粒度參數。實驗結果表詳見下表。
下圖3和4為應用上述實驗獲得的決策規則對2016年3月和2016年7月的油溫異常的標注的實驗效果圖。

圖3 2016年3月標注圖
圖3和圖4為變壓器運行工況變化率及油溫診斷的主要情況,兩幅圖的上部圖所示是變壓器設備油溫等工況變化情況,其中變壓器所處外部環境溫度標記為紅色線,變壓器A相的電流副值標記為藍色線,變壓器A相的繞組溫度標記為綠色線。兩幅圖的下部圖所示是變壓器異常診斷情況,其中變壓器所處外部環境溫度標記為紅色線,變壓器A相的電流副值標記為藍色線,變壓器A相的繞組溫度標記為綠色線,藍色折線圖為變壓器油溫的整體變化趨勢情況,紅色圓點為算法診斷出的異常信息。

圖4 2016年7月標注圖
由上圖異常油溫標注圖可以看出主變設備的異常油溫得到比較好的標注。將本項目實際結果與運行過程中人為記錄的異常缺陷報告進行比對,變壓器油溫異常標注的準確率為90%,異常標注查全率為89%。采用變壓器油色譜氣體指標變化的油溫異常診斷方法變壓器油溫異常標注的準確率為86%。因此本算法的識別準確率優于基于變壓器油色譜氣體指標變化的油溫異常診斷方法。
變壓器頂層油溫是檢測變壓器運行狀態的一項重要指標。本文在研究經典油溫異常檢測技術現狀的基礎上,對油溫異常檢測數據進行了數學建模并且提出了一種基于無監督機器學習模型的油浸式變壓器油溫異常狀態診斷方法。該方法的核心思想是通過無監督學習方法對各個工況油溫統計學意義上異常進行標識,而對于油溫異常的標識閾值則參用了假設檢驗的方法實現了最優化。實驗結果表明,通過上述方法對于某站變壓器的異常油溫標識實測達到了優于傳統方法的效果。總體來說,基于無監督假設檢驗的新型變壓器油溫異常診斷方法充分挖掘了運用數據價值,具有較高的社會、經濟效益,具有較好的推廣前景。從適用性上來說更為通用,只需要基于不同變壓器數據進行訓練修正;從成本上來說更加低廉,不需要使用價格高昂的硬件診斷設備;從精準度來說更加精準,基于實測效果證明該模型實現了最優化模型,診斷準確度也得到提升。