高國磊,李英娜,王 昕,段效琛,李 川
(1. 昆明理工大學 信息與自動化學院,云南 昆明 650500;2. 云南電網有限責任公司 電力科學研究院,云南 昆明 650000;3. 中國南方電網公司 電能計量重點實驗室,云南 昆明 650217)
基于KPCA和LS-SVM的變壓器故障診斷研究
高國磊1,李英娜1,王 昕2,3,段效琛1,李 川1
(1. 昆明理工大學 信息與自動化學院,云南 昆明 650500;2. 云南電網有限責任公司 電力科學研究院,云南 昆明 650000;3. 中國南方電網公司 電能計量重點實驗室,云南 昆明 650217)
電力變壓器故障機理復雜,具有不確定性,難以進行準確的狀態評估,提出核主成分分析和最小二乘支持向量機結合的變壓器診斷方法。首先對樣本數據進行非線性映射到高維空間,對映射后的特征向量進行信號重構,其次利用特征空間信號重構的最小誤差準則對數據進行離群判斷,找出異常特征樣本并剔除,最后將核主元分析方法提取特征的數據輸入最小二乘支持向量機中分類,識別數據是否存在故障及故障的類型。結果證明本方法的可行性和有效性。
變壓器;故障診斷;核主成分分析;最小支持二乘向量機
隨著國民經濟的高速增長,我國電力工業進入到一個穩定持續發展的新時期。為適應大負荷供電的需要,變壓器的安全運行是電力系統穩定運行的有效保證。目前基于油中溶解氣體分析技術(Dissolved Gases Analysis,DGA)是變壓器內部潛伏性故障檢測和診斷的有效手段之一[1]。針對變壓器的故障診斷方法主要是分析油中溶解氣體的含量占比,來達到對故障分類的目的。油中溶解氣體含有五種特征氣體,不同氣體含量影響變壓器故障判斷,并且不同氣體之間存在非線性耦合關系。故障診斷中,而應用在油浸式電力變壓器的故障診斷中會因為非線性特征的存在導致提取精度下降。本文通過改進的核主成分分析(Kernel Principal Component Analysis,KPCA)剔除異常離群值,引入最小二乘支持向量機(Least Squares Support Vector Machine,LSSVM)對變壓器故障進行分類并且識別故障類型[2-3]。
KPCA在對數據進行特征提取的過程中,未考慮部分異常數據對提取過程的影響。為了剔除部分異常數據,保證經過KPCA特征提取后數據進入分類器能夠輸出較好的分類結果,引入特征空間信號重構的最小誤差準則方法找出異常數據,降低異常數據對結果的影響[4-5]。
假設故障樣本數據為X={x1,x2,…,xN},設y=WTx,則有u=Wy作為原樣本數據x的重構信號,即e=x-u,則樣本數據的誤差重構函數如式1所示:

由于誤差重構函數優化的目的是在樣本數據降維后盡可能降低信號損失,誤差重構函數J(W)最小則意味著W等同于樣本輸入數據X的PCA子空間,即為X的主成分。因此,對誤差函數的重構可以用來判斷隨機樣本數據是否為離群值[6]。
在此輸入空間,給定閾值 ε>0,用以判斷識別空間異常值,如式2所示:

樣本數據集在經過KPCA非線性映射到高維空間后的數據集采用特征空間信號重構的最小誤差準則判斷是否出現異常值。高維空間數據集Φ(x)帶入式3:

式3中,非線性函數Φ(xi)形式是未知的,不能直接進行誤差重構[8]。將式 3平方展開并引入核函數 K(xi,xj)=Φ(xi) · Φ(xj)結果如式 4 所示:

由此,改進的KPCA方法通過核函數求出重構誤差大小并判斷離群值。
最小二乘支持向量機是對經典支持向量機的擴展和改進,具體表現為算法中的約束條件,將條件中的不等式變換為改進的等式,以及樣本訓練集中經驗損失計算方法的改進,降低了計算的復雜度、減少了運算量、縮短了解決問題的時間,提高了算法的收斂速度和精度。同時,解決了在很多優化問題中存在的局部極值難以達到全局最優的問題[8-9]。
LS-SVM 算法核心就是采用核函數的方法對樣本空間進行數學上的投影,因此,選擇合適的核函數直接影響了LS-SVM算法的優劣[10]。高斯徑向基核函數:

式5中:x是輸入向量,x′是第i個RBF函數的中心,這里x和x′有相同的維數;σ是常數,表示RBF函數圍繞中心點的寬度。高斯徑向基核函數具有將原始空間映射為無窮維空間的特點,從而使它成為目前應用最多的核函數[11]。
3.1 數據預處理
選取 H2、CH4、C2H6、C2H4、C2H2這 5 種特征氣體為特征向量,將氣體在油中的濃度作為故障診斷模型的樣本集。LS-SVM 適用于小樣本學習,收集滿足上述條件的變壓器內部故障類型對應的 DGA分析數據樣本共計165組作為本文實驗的樣本數據,其中包括一種變壓器正常狀態和六種變壓器故障類型。收集來的樣本選取形式和容量相同,運行環境也相似,這樣為故障診斷的準確性提供了保障。
利用改進的KPCA特征提取方法,剔除這165組故障樣本數據中的異常數據,發現該故障樣本中第155組高溫過熱故障數據是異常數據,有四個特征變量的值出現異常。由于變壓器油中特征氣體的濃度含量的數量級差異性很大,直接將特征氣體含量作為模型的輸入會導致診斷結果不準確。經過歸一化處理之后,數據樣本分布在[0,1]空間內,作為模型的輸入特征向量[12]。
3.2 故障分類類別的確定
變壓器內部故障類型主要有過熱型和放電型,本文的 DGA數據包括變壓器的正常狀態和其他 6種變壓器的故障類型:正常(ZC)、低溫過熱(TL)、中溫過熱(TM)、高溫過熱(TH)、局部放電(PD)、低能放電(LD)和高能放電(HD)。對LS-SVM中7種狀態類型進行編碼,如表1所示。

表1 診斷模型分類類別編碼Tab.1 Encode of diagnostic model classification categories
3.3 基于改進KPCA的LS-SVM方法具體步驟
基于改進的KPCA和LS-SVM的變壓器故障診斷模型的步驟如下:
(1)將原始樣本集分為兩類,一部分樣本作為訓練樣本集,另一部分作為測試樣本集;
(2)將兩類樣本集中的氣體含量的數據分別進行預處理,使用提出的改進KPCA特征提取方法剔除樣本中的異常數據;
(3)選定合適的最小二乘支持向量機的核函數;
(4)將訓練數據進行歸一化處理后采用一對一多分類分類器進行訓練;
(5)重復步驟(4)直至模型滿足精度要求,就可以得到LS-SVM模型;
(6)最后用測試樣本集驗證診斷準確性。
選取55組測試樣本集中,低溫、中溫、高溫過熱的樣本分別有5組、8組和13組;局部、低能、高能放電的樣本分別有6組、7組和11組,正常狀態的測試樣本有5組。
由于變壓器故障數據的分散性較大,為了計算方便,能夠讓診斷結果的精度更高,首先將每組數據中各個氣體的濃度含量轉化成各個氣體含量占總氣體含量的百分比,110組訓練樣本集中部分訓練樣本參數如表2所示。

表2 部分訓練樣本參數Tab.2 Partial training sample parameter
利用改進的KPCA和LS-SVM算法模型對上述已經轉換為氣體比重的110組數據樣本以及7種典型的變壓器狀態進行分析,改進的 KPCA和 LSSVM算法計算得到的核函數參數σ以及懲罰系數C分別為:σ2=1.1383,C=1.8021。LS-SVM模型的分類效果如圖1所示。

圖1 故障樣本分類效果圖Fig.1 Classification results of fault samples
測試集樣本進行模型準確率驗證時得到的分類正確率如表3所示。

表3 測試集樣本分類正確率Tab.3 Classification accuracy of test set sample
根據分類結果顯示,改進的 KPCA和 LSSVM模型得到的故障類型有 11組與實際樣本中的故障類型不同,如表4所示。
故障樣本中只剔除掉一個異常樣本數據,若異常數據較多,而在做故障分類之前沒有將他們剔除掉,必定對變壓器故障診斷的精度影響很大。綜述,本章提出的改進的KPCA特征提取方法有效地剔除了故障樣本數據中的異常數據,使得變壓器故障診斷準確率有明顯提高,證明了該方法在變壓器LSSVM模型故障診斷中的有效性。

表4 故障樣本錯誤分類(μL/L)Tab.4 Misclassification of fault samples (μL/L)
本文利用對KPCA非線性映射后得到的特征空間進行空間信號重構的最小誤差準則判定,利用核函數來計算重構誤差,避免未知形式的非線性映射函數無法計算的問題。利用該準則剔除異常離群值,減小離群值對KPCA特征提取的影響。在變壓器故障診斷中,將經過 KPCA處理后的特征樣本輸入LSSVM,變壓器故障診斷的正確率為83.14%,比未使用KPCA處理的LSSVM模型故障診斷的正確率高出2.14%,診斷結果證明本章方法的有效性。
[1] 國家電網公司運維檢修部.變壓器類設備典型故障案例匯編: 2006-2010年[M].北京: 中國電力出版社, 2012.
[2] 張帆. 變壓器油中氣體分析輔助診斷方法[J]. 電力安全技術, 2013, 15(5): 47-50.
[3] 胡士. 數據挖掘技術在電力設備狀態檢修中的應用研究[D]. 華北電力大學(北京). 2007.
[4] Gao W, Bai C, Liu T. A Dynamic Integrated Fault Diagnosis Method for Power Transformers[J]. The scientific world journal,2015, 2015: 459268.
[5] 張慶磊. 基于油中氣體分析和局部放電檢測的變壓器故障診斷技術研究[D]. 南京理工大學. 2014.
[6] Alamuru V. Hybrid diagnosing techniques for analyzing dissolved gases in power transformers[J]. 2015, 7(2): 32-43.
[7] 唐勇波. 改進特征樣本方法的KPCA變壓器故障檢測模型[J]. 計算機工程與應用, 2014, 50(21): 4-7.
[8] 楊廷方, 張航, 黃立濱, 等. 基于改進型主成分分析的電力變壓器潛伏性故障診斷[J]. 電力自動化設備, 2015,35(6): 149-153.
[9] 聶敬云, 李春青, 李威威, 等. 關于遺傳算法優化的最小二乘支持向量機在MBR仿真預測中的研究[J]. 軟件, 2015,36(5): 40-44
[10] Kisi O. Least squares support vector machine for modeling daily reference evapotranspiration[J]. Irrigation Science,2013, 31(4): 611-619.
[11] 王逸萍. 基于最小二乘支持向量機的變壓器故障診斷[J].電工電氣, 2016(6): 24-27.
[12] 吳立帥, 葛玻, 宋書中. 基于粗糙集與支持向量機的變壓器故障診斷[J]. 電源技術, 2014, 38(4): 768-770.
[13] 李育恒. 基于模擬退火優化支持向量機的電力變壓器故障診斷研究[D]. 蘭州交通大學, 2014.
A Fault Diagnosis Method for Transformer Based on Least Squares Support Vector Machine Optimized by Kernel Principal Component Analysis
GAO Guo-lei1, LI Ying-na1, WANG Xin2,3, DUAN Xiao-chen1, LI Chun1
(1. School of Information Engineering and Automation, Kunming University of Science and Technology, Kunming 650500, China;2. Electric Power Research Institute, Yunnan Power Grid Limited Liability Corporation, Kunming 650000, Yunnan, China;3. Key Laboratory of Energy Metering of Southern Power Grid, Kunming 650217, Yunnan Province, China)
Power transformer failure mechanism is complex, with uncertainty, it is difficult to carry out accurate state assessment。A method of transformer diagnosis based on kernel principal component analysis and least squares support vector machine was proposed. Firstly, the sample data were mapped to high-dimensional space, and the reconstructed feature vector was reconstructed. Secondly, the minimum error criterion of the reconstructed feature space signal was used to judge the outliers, to find out the abnormal feature samples and remove them. Finally, the data of the kernel principal component analysis method were input into the least squares support vector machine,and identify whether the data is faulty and the type of fault. The results show that the method is feasible and effective.
: Transformer; Fault diagnosis; Kernel principal component analysis; Squares support vector machine
TM403
A
10.3969/j.issn.1003-6970.2017.10.031
本文著錄格式:高國磊,李英娜,王昕,等. 基于KPCA和LS-SVM的變壓器故障診斷研究[J]. 軟件,2017,38(10):158-161
高國磊(1991-),男,碩士研究生,研究方向:信息檢測與人工智能;李川(1971-),男,博士,教授,博士生導師,研究方向:分布式光纖傳感器技術,測控技術等研究工作;段效琛(1990-),女,碩士研究生,研究方向:信息檢測與人工智能。