楊志勇 單杰 卜冠南 張建學 萬福
(1. 國電南京自動化股份有限公司 2. 福建工程學院福建省大數據挖掘與應用技術重點實驗室3. 重慶大學輸配電裝備及系統安全與新技術國家重點實驗室)
油中溶解氣體分析(Dissolved Gas Analysis, DGA)是診斷油浸式高壓電力設備故障的重要手段[1]。色譜技術是目前檢查電力變壓器油中溶解氣體有效的方法之一,在線色譜技術是實現油浸式電力變壓器在線實時監測的關鍵技術[2]。
電力變壓器油色譜在線監測技術的特點:沒有人工操作,系統自動完成油樣采集、油氣分離、多組分氣體逐一分離、色譜峰辨識及定性定量分析、故障診斷等功能。其中色譜峰辨識指的是辨識色譜信號(頻域圖或時域圖)中的色譜峰。定性分析就是鑒別分離出來的色譜峰所代表的物質(部分文獻中變壓器色譜峰辨識包含定性分析,本文為了方便敘述準確將兩個概念完全劃分開)。主要任務是從電力變壓器在線色譜分析過程中采集到的有干擾的色譜信號中提取特定組分氣體譜峰的位置,包括特定組分峰的起始點、峰的頂點、峰的結束點等[3]。
在分離峰中,每個峰都是獨立且可識別,與鄰近的其他峰沒有重疊峰部分。分離峰成正態分布。圖1中峰1和峰2是完全分離的峰。在處理分離峰的過程中,將每個峰的所在曲線部分當成只與一個峰有關的曲線處理。
兩個及兩個以上相鄰近的峰部分重疊在一起,并不能完全分開。第一個峰的尾峰還未完全回到基線,第二個峰就呈上升趨勢,兩個色譜峰峰形發生重疊。圖2中峰1和峰2是局部重疊的混合峰。局部重疊混合峰可以分為兩種:少部分重疊峰和多部分重疊峰。如果峰的拐點沒有存在于重疊的部分當中,稱之為少部分重疊峰。如果峰的拐點存在于重疊的部分中,稱之為多部分重疊峰。
完全重疊混合峰很嚴重或兩峰面積差異過大時,兩峰之間無谷點存在。
(1)肩峰
肩峰分為前肩峰和后肩峰兩種。一般主峰的面積包含了肩峰的面積。
前肩峰峰形是在一個大峰的上升沿上未形成的峰,不存在峰谷(下降沿),該類型峰特點是沒有峰的下降部分,如圖3所示。
后肩峰峰形是在一個大峰的下降沿上未形成的峰,不存在峰頂(上升沿),該類型峰的特點是沒有上升部分,如圖4所示。
前肩峰與后肩峰是較為特殊的重疊峰,其所對應的二階導數與多部分重疊峰相同,故利用二階導數法時,難以辨識。
(2)拖尾峰
小峰騎在大峰的下降沿上,并且小峰的峰高和大峰相比較小,此種小峰稱為拖尾峰,如圖5峰2。拖尾峰與后肩峰相區別:拖尾峰有上升部分,后肩峰沒有上升部分。拖尾峰可以重疊。 拖尾峰可以看作主峰與尾峰的峰高比例相差較大的局部重疊峰。其外形與后肩峰有相似之處,較為難辨識[4]。
(1)基于時間窗和導數法的色譜峰辨識
時間窗法主要是通過變壓器中氣體組分的保留時間范圍內來尋找極值來確定峰位置。導數法對原始色譜通過求導數來獲得一系列的極值確定多個峰位置(峰辨識),再利用成分保留時間在多個峰位置中確定組分峰位置(峰定性)。嚴格意義上二者在原理方面區別不大,實際的應用過程中,導數法更為精確。目前,大多數的變壓器在線監測廠商都采用導數法來判斷峰位置。導數法最早由繆華建[5]等人提出,將一種一階和二階導數之間方法應用到色譜峰檢測上,它能夠排除基線漂移的影響,具有抗噪聲干擾能力,能判別重疊峰,還能獲得色譜峰上各拐點的位置。王崇杰[6]等人通過指數函數法、閾值法、極值法來確定色譜的峰位。但隨著裝置的長時間運行,色譜峰會出現不可避免的漂移,若漂移范圍超過窗口區間則出現無法識峰或識峰錯誤的故障。這是該類方法在設備運行上的局限,無法通過改進方法而避免。故隨后文獻[7-9]對其的各種改進這里不再贅述。
(2)模糊數學法的色譜峰辨識
袁鵬等人將模糊技術引入電力變壓器色譜峰定性領域[10]。首先根據峰辨識算法獲得一系列的峰位置(例如導數法的前半部分),然后利用模糊數學技術來確定這一系列的峰到底是哪個組分。胡勁松[11]等人利用模糊數學把要定性的色譜峰位置作為模糊矢量,把各個組分作為模糊集元素,峰位相對于成分的隸屬度函數用成分的絕對保留實際來構造,2個相鄰成分的絕對保留時間中點的隸屬度值設為50%,若某個峰位置相對于某個組分隸屬度函數大于50%,則代表那個組分峰。該方法的劣勢在于仍沒有擺脫保留時間,那么依舊會出現峰漂移現象,但是相比較時間窗和導數法來說,其峰漂移的影響會大大降低。用了該方法之后,峰位置在很大的漂移范圍內都可以識別出來,這是該方法的優勢。但是關于隸屬函數的構造是根據經驗選取,具有很大的主觀性,容易導致峰辨識誤判。
(3)模式匹配法的色譜峰辨識
胡勁松等人將模式匹配技術引入電力變壓器色譜峰辨識領域[12-13]。首先通過構造一個匹配的高斯波,沿著色譜數據滑動求高斯波與色譜數據段的相似性來查找峰位,相似度大于設定閾值的數據段存在色譜峰位,該數據色譜峰位的位置對應滑動到該處的高斯波峰位。該方法主要在以下兩點需格外注意:①匹配高斯波的構造是否合理。②閾值和相關系數的設定是否準確。為了解決這一問題,曹建等人[14]將灰色關聯度分析技術應用到色譜峰辨識算法當中,通過統計平均及數據擬合的方法確定最優高斯波函數的參數以及各項閾值。其次該方法的劣勢在于隨著裝置的長時間運行,峰的高度、寬度和面積都會發生變化,嚴重的情況下會出現拖尾峰,此時模式匹配會出現不準確的情況。總的來說,該方法比較時間窗和導數法來說有相當大的改進,識峰錯誤大大降低。目前該方法已經在寧波理工監測設備有限公司的電力變壓器色譜在線監測裝置上運行多年,效果良好。
(4)多參數權重分析法的色譜峰辨識
張煒等人提出了多參數權重比分析方法來進行色譜峰辨識[15]。該方法通過計算得出峰偏移實際,峰型的半峰寬、峰型與標準峰的相似度以及峰高等特征參數,并進行歸一化處理。同時該方法會設置各個特征參數的權重比系數,通過綜合判斷真假色譜峰。該方法關鍵在于歸一化處理的方法選擇以及權重比系數的設定,若方法不合理,權重系數不準確都會導致辨識結果的錯誤。這就需要通過大量數據的反復試驗,反復比較,構造合理的歸一化處理方法,選擇合理的權重系數。
(5)基于機器學習的色譜峰辨識
隨著機器學習,深度學習的智能技術的快速發展,將其中的典型算法應用到色譜峰辨識當中不失為一種新思路。王巍[16]等人將BP神經網絡技術引入電力變壓器色譜峰辨識和定性領域。該方法首先建立了結構為2-8-2型、學習算法為GDX的BP神經網絡、然后利用該網絡得到的預測值,結合峰辨識的回溯前推法和峰定性窗口區間閾值法,實現油中溶解氣體在線色譜峰的準確辨識和定性。廖建平、李志軍[3]等人基于C4.5決策樹算法的閾值自適應來進行色譜峰定性,該算法將“峰高”,“峰寬”,“峰面積”和“峰中點位置”作為色譜峰辨識的特征屬性,利用決策樹對于根結點的選取時會采用二分法對連續屬性離散化處理,得到特征屬性的自適應閾值,達到數據正確分類的效果,有效峰定性準確,可有效避免因峰位的前后移動、峰形的擴展收縮導致對氣體色譜峰的誤判和漏判現象。
從實際工程應用的角度來看,可以將色譜峰辨識方法分為三大類。第一類是工業界普遍采用的傳統法(時間窗和導數法);第二類是近10年來部分公司自我研發的新方法;第三類是近年來隨著機器學習發展的智能算法。三類方法比較如下表所示。

表 主流方法比較
本文重點回顧了近20年來國內對于變壓器色譜峰辨識的研究現狀。主要從變壓器色譜峰類型及辨識難點,色譜峰辨識方法等方面對國內取得的研究進行了總結。然而,在這一領域仍存在需要進行深入探索的問題:
1)在工程應用方面,隨著應用要求不斷提高,傳統方法逐步被新方法以及智能算法替代。
2)隨著機器學習,深度學習等技術的發展,智能算法必將是未來發展的趨勢。