黃同愿,劉 輝,向國徽,楊雪姣
(重慶理工大學 計算機科學與工程學院, 重慶 400054)
?
基于SVM的變壓器運行狀態分析與研究
黃同愿,劉 輝,向國徽,楊雪姣
(重慶理工大學 計算機科學與工程學院, 重慶 400054)
變壓器是電力系統的重要組成部分,準確分析變壓器的運行狀態對保證電力系統的穩定性具有重大意義。首先采用主成分分析方法,在眾多變壓器運行參數中找到影響變壓器運行狀態的主要屬性;選取支持向量機來對變壓器運行狀態進行分類預測,運用不同核參數尋優方式優化參數,選取不同的核函數來構建模型。通過實驗對比發現,選擇徑向基核函數并通過網格尋優計算核參數得到的模型運行效果最佳,具有很好的應用前景。
主成分分析;支持向量機;核函數;核參數;變壓器運行狀態
國內外對變壓器運行狀態分析的研究成果較多。李洪超[1]運用SVM對變壓器產生的故障進行了診斷和分析,針對SVM中核函數選擇難的問題提出了混合核函數概念,構造了基于線性核函數和非線性核函數的混合核函數,通過訓練來不斷調整兩者的參數,并通過仿真證明了該方法的有效性,較普通SVM方法對故障的診斷具有更高的準確率。雖然該方法在一定程度上改善了SVM中核函數選擇難的問題,但是引入了新的參數,對參數的調整尋優十分不利。
趙德鑫[2]運用SVM對變壓器故障診斷進行了研究,通過粒子群優化了SVM中的參數,以得到更可靠的模型,并且通過仿真實驗證明該方法對后續的故障診斷具有促進作用。參數的優化雖然能一定程度上提高模型的可靠性,但也是以時間為代價尋找最優參數。
王建璽等[3]在SVM的基礎上融入了遺傳算法。該方法能夠有效防止算法早熟、陷入局部最優的情況,提高診斷準確率,但同樣存在運行時間的問題。
同時,也有一些利用傳統機器學習方法進行的分析,如決策樹、灰色系統理論、自適應粒子群算法、馬爾科夫鏈等。這些傳統的機器學習方法都是基于計算機自主學習的能力,期待得到數據背后的一般性規律,但它們都存在一些缺陷。由于變壓器數據的波動大、非線性、小樣本等特點,使得這些傳統機器學習的算法無法建立誤差小、泛化能力強的模型,從而導致分析效果不理想。支持向量機(support vector machine,SVM)具有極強的泛化能力,同時能處理小樣本、非線性、高維數的問題。而小樣本、非線性、高維數等特點,正是變壓器運行狀態分析的特點,因此利用支持向量機進行變壓器運行狀態的分析是合理的。
為了研究SVM對變壓器運行狀態分析的效果,本文選取變壓器的運行數據進行研究,通過最佳核函數和最優核參數的選擇,構建SVM分析模型,以達到準確分析變壓器運行狀態的目的。
1.1 SVM的原理
支持向量機(SVM)是由Vapnik于1992年提出的一種機器學習方法[4]。
如給定樣本集合為{xi,yi},其中i=1,…,n,且xi∈R,yi∈{+1,-1}
假設有函數f(x)=ω·x+b在固定精度為ε的情況下,求如圖margin的問題可以轉化成求解二次凸優化的問題:
它受約束條件約束,即

(3)
相應的約束條件也發生變化:
(4)

(5)
運用拉格朗日函數及對偶變量有

(6)

再通過KKT條件的運算得:
(7)

綜上所述,有

(8)
1.2 核函數的設定
SVM(支持向量機)運用非線性映射的原理將樣本空間映射到高維甚至無窮維的特征空間(Hilbert 空間),使樣本變得線性可分,就能解決樣本空間中線性不可分的問題。
核函數是構建SVM模型的關鍵,它的主要思想是將數據從低維映射到高維特征空間,這樣就可以把原來的低維數非線性問題轉化成更高維數的線性問題,從而便于求解。且由于高維特征空間通過核函數來定義和表示,所以核函數能決定SVM模型的可靠性,影響最終效果。同時,核函數的學習過程是通過在線性子空間中的計算來解決全局高維數問題,類似于分治的思想,并未增加算法的復雜性。
核函數的選取非常重要,常見的核函數有[5]:
線性函數
(9)
多項式核函數
(10)
徑向基核函數
(11)
多層感知器函數
(12)
1.3 變壓器運行狀態分析的步驟
根據支持向量機的原理以及其他學者研究中的不足之處,確定了以SVM為基礎,通過核函數選擇及核參數尋優,輔以主成分分析方法的綜合性變壓器運行狀態分析模型,可以達到同時兼顧運行時間及模型準確率的目的。具體實現過程為:通過對比線性核函數、多項式核函數、高斯核函數構造出來的模型選取最合適的核函數,再通過網格尋優、遺傳算法、粒子群算法對核函數的參數進行優化,得到最優模型,并通過主成分分析對數據屬性進行篩選,把篩選后的數據作為訓練和測試數據,用以對變壓器的運行狀態進行分析預測,即根據已知變壓器運行數據及運行狀態,對變壓器后續運行狀態的正常與否進行預測。狀態分析過程見圖1。

圖1 變壓器運行狀態分析流程
1.4 特征屬性的選取
特征屬性的選取對分析結果也有巨大的影響,變壓器運行數據中存在強關聯屬性、弱關聯屬性、無關屬性,若隨意選取屬性,無法真實反映變壓器真實運行狀態,訓練出的模型可靠性較差[6-7]。
由于參數之間有一定的聯系,為了模擬這種相似關系,首先需要對數據進行聚類挖掘,搞清楚數據之間的聯系,發掘對變壓器運行狀態影響巨大的主要參數。前一步是定性的分析,為了將參數之間的關系用具體的量化方式表示出來,只能通過引入主成分分析的方式。
根據原始數據源的各種屬性及變壓器的性能特點,對參數定義如下:
三相電流分別為Ia、Ib、Ic,有功功率為P,無功功率為Q,功率因數為Ф。根據不同類型的開關對以上參數進行編號,開關主要有101、301、901幾種類型,則參數可以設定為類似于101開關的101Ia、101Ib、101Ic、101Ua、101Ub、101Uc、P101、Q101、Ф101。

圖2 特征屬性選取
通過聚類分析進行仿真,得到如圖3所示的結果。

圖3 聚類仿真
從圖3可以看出:變壓器的三相電流、電壓與有功功率有較強相關性;有功功率、無功功率及功率因素相關性其次;擋位、溫度獨立成一類,與其他參數相關性最低。
參考本系統前期研究成果,可以得到3個最能反映變壓器運行狀態的主成分,分別為:
y1=(0.269 5)×101Ia+(0.270 4)×101Ib+(0.270 1)×101Ic+…+(-0.239 6)×Φ901
y2=(-0.070 0)×101Ia+(-0.058 9)×101Ib+ (0.071 1)×101Ic+…+(-0.065 3)×Φ901
y3=(-0.018 4)×101Ia+(-0.022 5)× 101Ib+(-0.002 0)×101Ic+…+ (-0.040 4)×Φ901
通過以上的分析可以將原始29個特征屬性簡化為3個,降低復雜度,縮短訓練時間。在進行數據處理時可以根據以上3個表達式將數據縮小為以上3個屬性,在訓練時只需用這些屬性對模型進行訓練,就基本能達到對模型的訓練效果,大大簡化了變壓器狀態分析的復雜度。
2.1 數據的獲取與預處理
實驗采用的原始數據為潼南電網提供的變壓器實際運行數據,主要包括一天內29個參數每隔5min的數值,共計289組,見表1。

表1 變壓器運行數據
根據主成分分析的方式精簡特征屬性,將精簡后的289組數據分為訓練組和測試組,分別對模型進行訓練和測試。數據的歸一化處理是以精簡過后的3種屬性作為輸入數據樣本進行狀態分析,由于各屬性量級不同,要減小這種差異性,就需要將樣本進行歸一化處理[1],遵循的公式為:
(13)
式中,xi為屬性中的第i個樣本數據;xmax和xmin為屬性的最大值和最小值。
數據集歸一化前后如圖4、圖5所示。

圖4 歸一化前二維數據
2.2 不同核函數模型對比與核函數的選取
SVM中核函數的選取對模型的影響巨大,將歸一化后的數據采用線性核函數、多項式核函數[8]、徑向基核函數[9]等不同的核函數進行對比。為了對比不同核函數構造成的模型性能差異,將不同核函數的參數設為一致,比較其在相同參數下的預測變壓器運行狀態結果和真實運行狀態的對比正確率。
表2為不同核函數仿真結果對比,結果表明:徑向基核函數構造的SVM模型具有更好的效果,因此模型的構建可以采用徑向基核函數。
2.3 多種核參數尋優法對比及核參數的選取
通過比較可得:徑向基核函數更加適合進行變壓器運行狀態的分析,所以在進行參數優化的過程中依然選用徑向基核函數。核函數從一定程度上影響了模型的可靠性,在確定以徑向基核函數為基礎來進行模型構建的前提下,對其參數的優化也直接影響整體模型的可靠性。通過使用遺傳算法[10]、粒子群算法[2]、網格尋參這幾種參數尋優方式來選擇最佳懲罰參數c和核參數g,并通過對比來尋找更適合的方式。

表2 不同核函數仿真結果對比
根據對各種尋參方式進行仿真實驗,得到的結果如表3所示。顯然網格尋參方式在最終結果上強于另外兩種方式,故最終采用網格尋參方式對核函數參數進行優化,具體實驗圖像見圖6~9。

表3 不同尋參方法的仿真結果對比

圖6 網格尋參方式優化參數結果(等高線圖)

圖7 網格尋參方式優化參數結果(3D視圖)

圖9 粒子群優化參數結果
2.4 實驗分析
結合實際需求,通過該需求下核函數優劣的對比,核參數尋優的分析,得出運用徑向基核函數結合網格尋參的方式能得到更加可靠的模型[11]。此時,最佳核參數c=2.828 43,g=64,選取2/3的數據建立訓練數據集對模型進行訓練,然后剩余1/3的數據建立測試數據集對模型進行評估。
圖10反映了根據上述模型得到的預測標簽和實際標簽的對比圖,可以直觀地判斷變壓器的運行狀態,為變壓器的穩定工作提供了強有力的保障。

圖10 測試集的實際分類和預測分類圖
針對變壓器運行狀態屬性眾多、數據龐大、造成監測不便的情況,通過支持向量機的應用,提出了先對屬性進行篩選然后根據訓練尋優,最后得到最優模型后預測后續變壓器運行狀態。該方法非常適合變壓器運行狀態分析這種小樣本數據集應用場景。仿真實驗表明:該方式具有可靠、誤差小的特點,能較好地勝任運行狀態分析的需求。
經過對實驗過程和結果的分析可以得到如下結論:
1) 核函數和核參數都會影響最終的實驗結果,根據實際需求選取核函數和核參數,這關系到研究的成敗。
2) 根據數據集的具體情況確定不同的數據處理方式,比如預處理和訓練測試數據集的劃分。
3) 要想提高運行狀態的精準度,必須在數據的采集、核函數的優化、核參數的優化上進一步深入地研究與探索。
[1] 李洪超.基于M-LS-SVM的變壓器故障診斷研究[D].杭州:浙江工商大學,2015.
[2] 趙德鑫.基于PSO-SVM的變壓器故障診斷研究[J].機械工程與自動化,2015,8(4):141-142.
[3] 王建璽,王劉濤.基于改進GA的SVM電力變壓器過熱診斷方法研究[J].計算機測量與控制,2014,22(2):342-344.
[4] 王鵬珍,楊國華,唐浩,等.基于BP網絡的變壓器故障診斷研究[J].機電技術,2014(4):35-39.
[5] 趙鋒.基于支持向量機的變壓器故障診斷[J].中國電業(技術版),2011(11):1-4.
[6] 李贏,舒乃秋.基于模糊聚類和完全二叉樹支持向量機的變壓器故障診斷[J].電工技術學報,2016,31(4):64-70.
[7] 黃同愿,陳芳芳.基于SVM股票價格預測的核函數應用研究[J].重慶理工大學學報(自然科學),2016,30(2):89-94.
[8] 趙捷珍,郭春生.基于GF空間多項式核函數的分類研究[J].杭州電子科技大學學報(自然科學版),2015(3):77-80.
[9] 劉景艷,王福忠,楊占山.基于RBF神經網絡和自適應遺傳算法的變壓器故障診斷[J].武漢大學學報(工學版),2016(1):88-93.
[10]王瓊瑤,何友全,彭小玲.基于改進遺傳算法的支持向量機參數優化方法[J].計算機與現代化,2015(3):33-36.
[11]李育恒,趙峰.支持向量機在變壓器故障診斷中的應用[J].科技創新與應用,2014(16):46-47.
(責任編輯 陳 艷)
Analysis and Research of Transformer Running State Based on SVM
HUANG Tongyuan, LIU Hui, XIANG Guohui, YANG Xuejiao
(College of Computer Science and Engineering, Chongqing University of Technology,Chongqing 400054, China)
Transformer is an important component of power supply system and accurately analyzing the running state of transformer is very important to ensure the stability of power supply system. Firstly, this paper uses principal component analysis method to find out the main attributes from the running parameters that affect the transformer running state mostly, and then chooses Support Vector Machine (SVM) to realize the analysis process according to the characteristics of the transformer operation data. And this paper uses different ways to find the best parameters of kernel function and uses different kernel function to build the classification model. By comparing experiments, it’s found that the model based on RBF kernel function and grid parameter optimization is the best way of transformer running state analysis and has a bright future.
principal component analysis;support vector machine;kernel function; kernel parameters;running state of transformer
2017-01-04
重慶市教委科技項目(KJ1500920);企業委托項目(2016Q05)
黃同愿(1975—),男,湖北人,博士研究生,副教授,主要從事機器學習、智能信息處理等方面研究,E-mail:tyroneh@cqut.edu.cn。
黃同愿,劉輝,向國徽,等.基于SVM的變壓器運行狀態分析與研究[J].重慶理工大學學報(自然科學),2017(7):162-168.
format:HUANG Tongyuan, LIU Hui, XIANG Guohui, et al.Analysis and Research of Transformer Running State Based on SVM[J].Journal of Chongqing University of Technology(Natural Science),2017(7):162-168.
10.3969/j.issn.1674-8425(z).2017.07.026
TP181
A
1674-8425(2017)07-0162-07