王 瑩 盧秀和
(長春工業大學,吉林 長春130012)
電力變壓器是電力系統中非常重要的樞紐電氣設備,其正常運行是電力系統安全運行與穩定的前提,所以準確、有效地進行變壓器故障診斷顯得尤為重要。油溶氣體分析(DGA)技術[1]中改良三比值法是近年來常用的變壓器故障診斷方法,但由于變壓器的多種故障類型與改良三比值法中特征氣體組分含量之間的關系存在一定的模糊性和不確定性,導致改良三比值法在變壓器故障診斷中存在一定的不足[2]。為此需對DGA技術的改良三比值法中有關變壓器故障的多種數據進行研究,而聚類分析法是研究和挖掘數據的主要方法[3]之一,為此分析改良三比值法的特征氣體三對比值之間的數據關系,采用改進K均值聚類法對變壓器進行故障診斷,從而進一步提高電力變壓器故障判斷的精準性。
聚類[4]就是按照不同事物間所具有的某種相異性對事物進行分類和劃分的過程,該過程屬于無監督分類,沒有先驗知識和教師指導,而是通過不同事物間相異程度(可用距離表示)來進行。而聚類分析則是融進了數學方法,對采集到的數據集進行分類的一種分析。聚類算法按照聚類的方式、準則和分類結果的取值方法分為很多種,本文采用按聚類準則分類中的K均值聚類分析(簡稱K均值)和改進K均值聚類分析(簡稱改進K均值)來進行變壓器故障診斷。
K均值算法先隨機選取K個對象作為初始聚類中心,然后計算每個對象與各個聚類中心的距離。算法步驟如下:
(1)K均值算法使用聚類準則函數為誤差平方和準則Jc:返回(2);否則算法結束。

為使聚類結果優化,應使準則Jc最小。
(2)采集n個樣本,令I=1,表示迭代次數,選取K個初始聚合中心Zj(1),j=1,2,…,K。
(3)計算每個樣本與聚合中心的距離D[xk,Zj(I)],k=1,2,…,n;j=1,2,…,K。若。
(4)計算K個新聚類中心:

(5)判斷:若Zj(I+1)≠Zj(I),j=1,2,…,K,則I=I+1,
K均值進行初始分類時,先隨機選一批代表點,然后依次計算其他樣本歸類。先計算第一個樣本,把它歸于最近的一類,形成新的分類。然后計算新聚類中心,再計算第二個樣本到新聚類中心距離,對第二個樣本進行歸類,依次類推。
K均值受初始值影響很大,不同初始點選擇會導致不同結果,改進K均值算法對K均值算法的初始聚類中心選擇方法進行了改進,從數據對象分布出發動態地尋找并確定初始聚類中心點。本文采用基于最小距離的初始聚類中心選取法[5]進行改進K均值的初始聚類中心點確定,然后再利用K均值進行運算。
在MATLAB中,調用如下程序可實現K均值聚類:[IDX,C,SUMD,D]=kmeans(data,K)。其中,IDX為聚類結果;C為聚類中心;SUMD為每一行樣本到該聚類中心距離和;D為每一個樣本到各個聚類中心距離;data為要聚類的數據集合,每一行為一個樣本;K為分類個數。
樣本數據選取改良三比值法的三對特征氣體的比值作為三個樣本特征值,即x=C2H2/C2H4、y=CH4/H2、z=C2H4/C2H6,選擇變壓器故障中的四種故障作為劃分類別,即低溫過熱、中溫過熱、高溫過熱和低能放電,分別編號為1、2、3、4。樣本數據如表1所示。

表" 樣本數據
利用K均值算法和改進K均值算法MATLAB仿真圖如圖1和圖2所示。

圖" ;均值聚類算法分析圖

圖- 改進;均值聚類算法分析圖
本文在改良三比值法的基礎上利用改進K均值算法將采集到的14組變壓器樣本數據進行正確的分類和識別,實現了變壓器故障的診斷。
由圖1和圖2對比可以看出,14個點中有一個藍色點偏離很大,這是由于不同的初始點對K均值算法的分類和識別結果影響很大,K均值算法不能完全將14組樣本數據良好地分類識別。而改進K均值算法可以很好地對14組樣本數據進行判別和分類。由表1可以看出,改進K均值算法彌補了K 均值算法對編號3和4無法良好識別的缺陷。
二者結果圖和表的對比,進一步驗證了改進K均值算法在變壓器故障診斷中的準確性、可行性和有效性。
[1]高文勝,嚴璋,談克熊.基于油中溶解氣體分析的電力變壓器絕緣故障診斷方法[J].電工電能新技術,2000,19(1):22-26.
[2]彭寧云.基于DGA技術的變壓器故障智能診斷系統研究[D].武漢:武漢大學,2004.
[3]陳舵.模糊聚類分析及其在電力變壓器故障診斷中的應用研究[D].西安:西安理工大學,2008.
[4]王子建.模糊聚類分析及其在變壓器油色譜數據分析中的應用[D].武漢:華中科技大學,2006.
[5]周潤景,張麗娜.基于MATLAB與fuzzyTECH的模糊與神經網絡設計[M].北京:電子工業出版社,2010.