杜梓銘,馬靜波,張立輝,汪 巖
(國(guó)網(wǎng)河北省電力有限公司保定供電分公司,保定 071000)
隨著國(guó)家電網(wǎng)公司確立以“三型兩網(wǎng)、世界一流”為新戰(zhàn)略的核心任務(wù),泛在電力物聯(lián)網(wǎng)將提供物理基礎(chǔ),推動(dòng)傳統(tǒng)業(yè)務(wù)提質(zhì)增效并衍生新業(yè)務(wù)新業(yè)態(tài)新商業(yè)模式,這種新變化展現(xiàn)出“智能業(yè)務(wù)”的特征,核心就是數(shù)據(jù)和智能的驅(qū)動(dòng)。變電站設(shè)備結(jié)構(gòu)復(fù)雜化,發(fā)生缺陷的位置、時(shí)間的不確定性,導(dǎo)致故障發(fā)生后檢修人員無(wú)法對(duì)事故原因作出快速判斷,同時(shí)告警眾多,故障排查定位困難,潛在風(fēng)險(xiǎn)缺乏有效辨識(shí)手段,導(dǎo)致問(wèn)題出現(xiàn)時(shí)無(wú)法及時(shí)處理。因此,提出變電站繼電保護(hù)分析平臺(tái),以確保電網(wǎng)能安全、穩(wěn)定、高效、經(jīng)濟(jì)的運(yùn)行。
變電站繼電保護(hù)分析平臺(tái)由裝置信息[1]、運(yùn)行信息、保護(hù)動(dòng)作分析、事故原因推演、保護(hù)邏輯優(yōu)化、缺陷分析及消缺建議幾部分板塊組成。平臺(tái)通過(guò)數(shù)據(jù)采集處理、波形提取、模型比對(duì)三部分對(duì)數(shù)據(jù)進(jìn)行采集處理分析得出分析結(jié)論。數(shù)據(jù)采集處理主要應(yīng)用現(xiàn)有站端系統(tǒng)進(jìn)行數(shù)據(jù)采集,實(shí)時(shí)傳送到平臺(tái)后臺(tái)進(jìn)行波形提取和模型比對(duì)。在波形提取和模型比對(duì)模塊我們研究并運(yùn)用了一種基于支持向量機(jī)(Support Vector Machines,SVM)分類(lèi)技術(shù)的故障原因診斷方法。
分析平臺(tái)通過(guò)站端故障錄波器采集[2]保護(hù)運(yùn)行數(shù)據(jù),如:實(shí)時(shí)電流電壓及動(dòng)作信息;通過(guò)保護(hù)子站系統(tǒng)采集錄波文件;同時(shí)收集裝置信息及定值、壓板投入等信息進(jìn)行核實(shí)比對(duì);將這些數(shù)據(jù)通過(guò)數(shù)據(jù)緩沖區(qū)、數(shù)據(jù)倉(cāng)庫(kù)、數(shù)據(jù)集市進(jìn)行數(shù)據(jù)存儲(chǔ)和預(yù)處理。
波形提取模型比對(duì)主要運(yùn)用基于SVM的故障診斷方法,不僅針對(duì)單個(gè)錄波文件獨(dú)立進(jìn)行分析,而且將所有錄波數(shù)據(jù)整體上進(jìn)行考慮,深度洞察隱藏于海量錄波文件中確定性的規(guī)律和模式。便于輔助電網(wǎng)運(yùn)行人員快速判定故障異常相位及故障原因,以及時(shí)采取對(duì)應(yīng)的保護(hù)措施。SVM建立在統(tǒng)計(jì)學(xué)習(xí)VC維理論和結(jié)構(gòu)風(fēng)險(xiǎn)最小原理基礎(chǔ)上的識(shí)別方法,有效地解決了小樣本、高維數(shù)、非線性等的學(xué)習(xí)問(wèn)題,并克服了人工神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)合理結(jié)構(gòu)難以確定和存在局部最優(yōu)等缺點(diǎn),大大提高了學(xué)習(xí)方法的泛化能力,能對(duì)多類(lèi)別進(jìn)行故障原因識(shí)別,速度快,對(duì)噪聲不敏感,識(shí)別率高,具有較高的識(shí)別精度。
基于SVM分類(lèi)技術(shù)是建立在嚴(yán)密的數(shù)理統(tǒng)計(jì)理論之上的新型分類(lèi)方法,其基本思想是通過(guò)用內(nèi)積函數(shù)定義的非線性變化,將輸入空間變換到高維特征空間,在這個(gè)高維空間中尋找輸入變量與輸出變量之間的一種線性關(guān)系。采用結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則,將問(wèn)題轉(zhuǎn)化為一個(gè)凸二次優(yōu)化問(wèn)題,簡(jiǎn)化了計(jì)算的復(fù)雜性,保證得到的解是全局最優(yōu)解,提高分類(lèi)模型的精度,較好的解決了分類(lèi)方法中的小樣本、非線性、高維數(shù)等實(shí)際難題。
SVM是一種二分類(lèi)模型,通過(guò)在原特征空間或經(jīng)投影后的高維空間上構(gòu)造最優(yōu)分類(lèi)面,將給定的屬于2個(gè)類(lèi)別的訓(xùn)練樣本分開(kāi),構(gòu)造超平面的依據(jù)是兩類(lèi)樣本離超平面的距離最大化。便于理解,現(xiàn)以線性可分情況下SVM為例敘述其基本原理:
設(shè)線性可分集(xi,yi),1<i<N,xi∈Rd,y i∈{-1,1}是類(lèi)別編號(hào),d維空間中線性判別函數(shù)的一般形式為g(x)=ω·x+b,相應(yīng)的分類(lèi)面方程為ω·x+b=0。將g(x)進(jìn)行歸一化,使所有的xi都滿足,即離分離面最近的樣本,這樣分類(lèi)間隔就等于(1/2)|ω|。求解最優(yōu)分類(lèi)面就等效于最小化|ω|,目標(biāo)函數(shù)為

采用拉格朗日乘子法,引入乘子α=[α1,…,αN],可以將上述問(wèn)題轉(zhuǎn)換成二次規(guī)劃問(wèn)題

αi≥0,i=1,2…,N
f(x)=sgn(ω*·x+b*)
對(duì)于線性不可分情況,SVM一方面引入松弛變量和懲罰因子來(lái)構(gòu)造目標(biāo)函數(shù),一方面通過(guò)非線性變換將輸入空間變換到高維空間,然后在新空間中求解最優(yōu)分類(lèi)面,此時(shí),線性可分情況下的點(diǎn)積運(yùn)算 (xi,xj)變?yōu)?(Φ(xi),Φ(xj)=K(xi,xj),K(xi,xj)為核函數(shù)。
將SVM推廣至多分類(lèi)問(wèn)題需要構(gòu)造SVM多分類(lèi)器。目前常見(jiàn)的構(gòu)造方法是通過(guò)組合多個(gè)二分類(lèi)器來(lái)實(shí)現(xiàn),具體涉及兩種思路:一對(duì)多算法和一對(duì)一算法。
一對(duì)多算法對(duì)于N類(lèi)問(wèn)題構(gòu)造N個(gè)二分類(lèi)器,第i個(gè)SVM用第i類(lèi)中的訓(xùn)練樣本作為正的訓(xùn)練樣本,而將其他的樣本作為負(fù)的訓(xùn)練樣本,最后的輸出是兩類(lèi)分類(lèi)器輸出為最大的那一類(lèi)。這種方法的好處是每個(gè)優(yōu)化問(wèn)題的規(guī)模比較小,而且分類(lèi)的時(shí)候速度很快(只需要調(diào)用N個(gè)分類(lèi)器就知道了結(jié)果);缺點(diǎn)是訓(xùn)練樣本數(shù)大,訓(xùn)練困難,推廣誤差無(wú)界。
一對(duì)一算法在N類(lèi)訓(xùn)練樣本中構(gòu)造所有可能的兩類(lèi)分類(lèi)器,每類(lèi)僅僅在N類(lèi)中的兩類(lèi)訓(xùn)練樣本上訓(xùn)練,結(jié)果可構(gòu)造N(N-1)/2個(gè)分類(lèi)器,使用投票法決定樣本所屬類(lèi)別。這類(lèi)方法的好處是訓(xùn)練階段復(fù)雜度低,計(jì)算量小;缺點(diǎn)是分類(lèi)數(shù)目隨類(lèi)數(shù)急劇增加。
基于SVM技術(shù)的故障原因診斷方法,包括數(shù)據(jù)抽取、訓(xùn)練樣本數(shù)據(jù)構(gòu)造、多類(lèi)別的故障原因模型訓(xùn)練和故障原因診斷等關(guān)鍵步驟。具體流程見(jiàn)圖1。
基于SVM分類(lèi)技術(shù)的電網(wǎng)故障原因診斷方法,從步驟上分為數(shù)據(jù)抽取、數(shù)據(jù)探索與預(yù)處理、建模與診斷、結(jié)果與反饋等步驟,在每個(gè)步驟,根據(jù)應(yīng)用的層級(jí)分為離線建模和在線實(shí)時(shí)應(yīng)用2個(gè)層次,2個(gè)層次在每個(gè)步驟中處理方式有細(xì)微的差別。

圖1 基于SVM分類(lèi)技術(shù)的電網(wǎng)故障原因診斷方法流程
2.2.1 數(shù)據(jù)選擇與抽取
數(shù)據(jù)抽取步驟根據(jù)從與應(yīng)用端的保信軟件系統(tǒng)的歷史錄波數(shù)據(jù)庫(kù)中,取到原始的錄波數(shù)據(jù),并取得錄波數(shù)據(jù)相關(guān)的信息,包括錄波來(lái)源線路、廠站、時(shí)間、事后確認(rèn)數(shù)據(jù),而對(duì)于實(shí)時(shí)部分,則從保護(hù)裝置取得定時(shí)或條件觸發(fā)的錄波數(shù)據(jù)。
2.2.2 數(shù)據(jù)預(yù)處理與規(guī)范化
a.數(shù)據(jù)質(zhì)量檢查對(duì)數(shù)據(jù)樣本進(jìn)行探索分析,對(duì)關(guān)鍵字缺失的數(shù)據(jù)進(jìn)行篩除,根據(jù)算法對(duì)數(shù)據(jù)質(zhì)量的要求,對(duì)原始數(shù)據(jù)進(jìn)行判定,篩除質(zhì)量較低的原始樣本。
b.故障相關(guān)原始數(shù)據(jù)提取。提取出與故障相關(guān)聯(lián)的電流電壓通道Uu、Uv、Uw、Iu、Iv、Iw。
c.故障時(shí)間點(diǎn)、故障相別判定。利用故障錄波分析庫(kù),進(jìn)行故障點(diǎn)判定。
d.故障時(shí)間點(diǎn)對(duì)齊。基于c中所判定故障時(shí)間點(diǎn),將前后若干原始錄波信號(hào)進(jìn)行提取。
2.2.3 特征提取
因?yàn)樵紨?shù)據(jù)為生數(shù)據(jù),在進(jìn)行模型訓(xùn)練前,需要將生數(shù)據(jù)轉(zhuǎn)換為熟數(shù)據(jù)即特征數(shù)據(jù)。本方法引用小波分析技術(shù),提取錄波信號(hào)在各頻率波段中的特征,采用多尺度的空間能量分布的分析方法對(duì)信號(hào)進(jìn)行頻帶分析,再分別計(jì)算所得的各個(gè)頻帶的能量作為特征向量,完成從原始信號(hào)到特征向量數(shù)據(jù)的變換。
采用小波分析,對(duì)上步中提取出故障點(diǎn)前后的若干周波進(jìn)行信號(hào)分解,首先需要根據(jù)原始信號(hào)的特點(diǎn)選擇小波基,考慮到原始信號(hào)是電壓電流信號(hào),為正弦信號(hào)疊加異常信號(hào),因此選擇db4小波基作為基函數(shù)。
采用db4基波進(jìn)行小波變換后,信號(hào)f(t)的二進(jìn)制小波分解可表示為:
f(t)=Aj+∑Dj,其中A為近似信號(hào),是低頻部分;D為細(xì)節(jié)信號(hào),是高頻部分。信號(hào)的總能量為:

選擇第j層的近似信號(hào)和各層的細(xì)節(jié)信號(hào)的能量作為特征。
針對(duì)該電壓/電流信號(hào),構(gòu)造子特征向量為:

利用小波變換可以對(duì)時(shí)間序列信號(hào)進(jìn)行特征提取,提取出可以代表時(shí)間序列信號(hào)的向量數(shù)據(jù),完成從原始信號(hào)到特征向量數(shù)據(jù)的變換。
經(jīng)過(guò)之前步驟提出來(lái)各個(gè)電壓電流的子特征向量為<FUu、FUv、FUw、FIu、FIv、FIv>
根據(jù)判定的故障相別,采用故障相別優(yōu)先的字母序原則。如故障相別確定為V相故障,則形成的該樣本對(duì)應(yīng)的特征向量為:<FUv、FUw、FUu、FIv、FIw、FIu>
2.2.4 故障原因模型的訓(xùn)練
在進(jìn)行分類(lèi)的時(shí)候,每一個(gè)訓(xùn)練樣本由一個(gè)特征向量和一個(gè)分類(lèi)標(biāo)記組成。

式中:xi為特征向量(維數(shù)一般較高);yi為分類(lèi)標(biāo)記。
在樣本集訓(xùn)練過(guò)程中,核函數(shù)算法的選取對(duì)故障診斷模型的準(zhǔn)確度有很大的影響,不同的核函數(shù)可以構(gòu)造實(shí)現(xiàn)輸入空間中不同類(lèi)型的非線性決策面的學(xué)習(xí)模型。選取不同的核函數(shù)對(duì)于不同的樣本差異很大,所以通過(guò)實(shí)驗(yàn)進(jìn)行核函數(shù)的選取。
2.2.5 故障原因模型的診斷
基于SVM分類(lèi)技術(shù)的故障原因模型的診斷與訓(xùn)練的預(yù)處理過(guò)程類(lèi)似,同樣是采用特征提取算法,將原始數(shù)據(jù)轉(zhuǎn)化為與模型訓(xùn)練輸入相同屬性的特征向量。故障原因模型將此特征向量作為輸入,最終給出屬于每個(gè)類(lèi)別的概率:

以某電網(wǎng)的故障錄波數(shù)據(jù)來(lái)診斷故障原因的實(shí)驗(yàn)為例,說(shuō)明如何基于歷史數(shù)據(jù)診斷電網(wǎng)故障。
2.3.1 數(shù)據(jù)描述
該故障錄波數(shù)據(jù)為某省網(wǎng)2014年1、5、6、7、11月份發(fā)生故障事件對(duì)應(yīng)錄波數(shù)據(jù),共154個(gè)。按故障相別的統(tǒng)計(jì)結(jié)果,1相故障119次,2相故障33次,3相故障2次。
因2相3相的故障樣本過(guò)少,不利于進(jìn)行SVM訓(xùn)練,因此重點(diǎn)針對(duì)1相故障錄波數(shù)據(jù)進(jìn)行分析。對(duì)1相故障原因的統(tǒng)計(jì):對(duì)樹(shù)木放電4次,雷擊56次,凝冰9次,其他4次,山火8次,外力破壞13次,異物25次。
2.3.2 數(shù)據(jù)選擇與抽取
故障錄波數(shù)據(jù)及相關(guān)信息,包括廠站id列為廠站的編號(hào),時(shí)間為故障錄波數(shù)據(jù)的開(kāi)始生成時(shí)間。錄波數(shù)據(jù)中,其內(nèi)容為發(fā)生故障前、后一段時(shí)間的狀態(tài)檢測(cè)數(shù)據(jù),應(yīng)包含了故障的全過(guò)程監(jiān)測(cè)數(shù)據(jù),列舉了錄波文件相關(guān)的參數(shù)。故障原因?yàn)槭潞蟠_認(rèn)的故障原因。
2.3.3 數(shù)據(jù)預(yù)處理與規(guī)范化
對(duì)每一個(gè)提取出的錄波文件,按照統(tǒng)一的頻率對(duì)原始信號(hào)進(jìn)行插值。對(duì)于本次實(shí)驗(yàn)來(lái)說(shuō),設(shè)定統(tǒng)一的頻率為5 k Hz,則其他頻率的樣本數(shù)據(jù)根據(jù)此頻率進(jìn)行降采樣或插值。將某錄波文件前2個(gè)步驟提取完的電壓電流信號(hào)見(jiàn)圖2。

圖2 從錄波中提取與挖掘相關(guān)的電壓電流信號(hào)
由圖2可看出,對(duì)信號(hào)的選擇與抽取必要的,在減少數(shù)據(jù)冗余的同時(shí),涵蓋了與故障原因相關(guān)的故障點(diǎn)前后的關(guān)鍵特征。
2.3.4 關(guān)鍵特征的提取
用小波變換將原始信號(hào)分解到第5層,得到各個(gè)錄波數(shù)據(jù)對(duì)應(yīng)的樣本。
2.3.5 按故障相別進(jìn)行特征向量組合
以一個(gè)樣本的特征向量生成作為例子,比如樣本1的故障相別為V,經(jīng)過(guò)之前步驟提出來(lái)各個(gè)電壓電流的子特征向量為FUu、F Uv、F Uw、F Iu、F Iv、F Iv,最終形成的該樣本對(duì)應(yīng)的特征向量為<FUv,F(xiàn) Uw,F(xiàn) Uu,F(xiàn) Iv,F(xiàn) Iw,F(xiàn) Iu>
進(jìn)行訓(xùn)練時(shí),需要將樣本類(lèi)別進(jìn)行數(shù)值化處理,建立映射表。
最終的訓(xùn)練樣本數(shù)據(jù)集見(jiàn)表1。

表1 訓(xùn)練樣本數(shù)據(jù)集
在樣本集訓(xùn)練過(guò)程中,核函數(shù)算法的選取對(duì)故障診斷模型的準(zhǔn)確度有很大的影響,不同的核函數(shù)可以構(gòu)造實(shí)現(xiàn)輸入空間中不同類(lèi)型的非線性決策面的學(xué)習(xí)模型。常用的核函數(shù)有:
線性?xún)?nèi)核:K(x i,x j)=x i·x j
高斯徑向基內(nèi)核:K(x i,x j)=exp(-g‖x i·x j‖2)
多項(xiàng)式內(nèi)核:K(x i,x j)=[(x i·x j)+1]q
S形內(nèi)核:K(x i,x j)=tanh(v(x i·x j)+c)
選取不同的核函數(shù)對(duì)于不同的樣本差異很大,所以核函數(shù)的選取,要通過(guò)實(shí)驗(yàn)進(jìn)行不同核函數(shù)的性能表現(xiàn)見(jiàn)圖3。

圖3 不同核函數(shù)的性能表現(xiàn)
由實(shí)驗(yàn)結(jié)果可以看出,選擇高斯徑向基內(nèi)核(Radial Basis Function)的準(zhǔn)確率要比其他內(nèi)核略好,因此對(duì)于本例實(shí)驗(yàn)采用高斯徑向基內(nèi)核進(jìn)行模型訓(xùn)練。
2.3.6 故障原因診斷
模型訓(xùn)練完畢后,對(duì)一批測(cè)試數(shù)據(jù)進(jìn)行診斷和驗(yàn)證,測(cè)試數(shù)據(jù)原始錄波信息表所示,通過(guò)診斷算法將原始數(shù)據(jù)轉(zhuǎn)換為模型的輸入向量進(jìn)行診斷,診斷結(jié)果如表2所示。可以看出,對(duì)于測(cè)試的8個(gè)樣本,除了6和7號(hào)樣本,其他樣本的診斷結(jié)果與樣本的實(shí)際所屬類(lèi)別是一致的。同時(shí)在6和7號(hào)樣本中,樣本的診斷結(jié)果與實(shí)際類(lèi)別較為接近,如6號(hào)樣本實(shí)際類(lèi)別為“外力破壞”,診斷結(jié)果中,類(lèi)別為“外力破壞”和“異物”的概率分別為18.83%和50.64%,分別為概率最大的前兩位;同樣7號(hào)樣本實(shí)際類(lèi)別為“異物”,而診斷結(jié)果中,類(lèi)別為“雷電”和“異物”的概率分別為39.93%和25.98%。

表2 診斷結(jié)果
本平臺(tái)對(duì)故障的分析判斷是自我完成的,當(dāng)發(fā)生故障后,故障錄波器會(huì)將錄波文件傳給后臺(tái),同時(shí)平臺(tái)將所有相關(guān)的數(shù)據(jù)進(jìn)行匯總,通過(guò)基于SVM分類(lèi)技術(shù)的故障原因模型的診斷,將診斷的結(jié)果推送給相關(guān)人員并且給出消缺建議。
通過(guò)統(tǒng)計(jì)這幾年變電站總數(shù)的變化,可以清楚地看見(jiàn)變電站的數(shù)量再逐步增長(zhǎng),同時(shí)設(shè)備的數(shù)量也在逐年增多。檢修人員素質(zhì)和數(shù)量的提高速度遠(yuǎn)遠(yuǎn)趕不上變電站的增速,導(dǎo)致工作量的加大,由于素質(zhì)高低不齊,導(dǎo)致處理問(wèn)題的速度快慢不一。同時(shí)變電站設(shè)備越來(lái)越復(fù)雜,分析故障過(guò)于繁瑣,經(jīng)過(guò)多次試驗(yàn),驗(yàn)證此平臺(tái)對(duì)于檢修工作起到一定積極作用。故障搶修流程中各環(huán)節(jié)用工時(shí)見(jiàn)表3。
通過(guò)表3可以得出,工作繁瑣的步驟十分耗時(shí),導(dǎo)致工作中出現(xiàn)很多安全問(wèn)題,同時(shí)造成停電時(shí)間的增長(zhǎng),通過(guò)此平臺(tái)可以有效的化簡(jiǎn)工作流程,使很多工作可以遠(yuǎn)方進(jìn)行,減少人力物力,并且分析結(jié)束后可以第一時(shí)間得到試驗(yàn)報(bào)告,并且進(jìn)行故障推演[3],用動(dòng)畫(huà)形式形成動(dòng)作過(guò)程,使故障的發(fā)展過(guò)程更加直觀。
變電站繼電保護(hù)分析平臺(tái)通過(guò)將大量歷史錄波數(shù)據(jù)綜合分析的手段。使大量的歷史數(shù)據(jù)形成能幫助運(yùn)行人員理解電網(wǎng)狀態(tài)的知識(shí),能及時(shí)識(shí)別故障原因及采取相應(yīng)的措施進(jìn)行應(yīng)對(duì),甚至進(jìn)行預(yù)測(cè)以便制定必要的預(yù)防措施。

表3 故障搶修各環(huán)節(jié)用時(shí)比較
基于支持向量機(jī)的方法屬于有指導(dǎo)型的數(shù)據(jù)挖掘,適合于具有維度完備數(shù)據(jù)樣本、數(shù)據(jù)特征可提取、樣本類(lèi)別信息已知的應(yīng)用場(chǎng)景。此方法對(duì)缺失數(shù)據(jù)敏感,而且對(duì)非線性問(wèn)題沒(méi)有通用解決方案,必須謹(jǐn)慎選擇核函數(shù)來(lái)處理。此外,其對(duì)超大規(guī)模訓(xùn)練樣本難以實(shí)施,由于SVM是借助二次規(guī)劃來(lái)求解支持向量,而求解二次規(guī)劃將涉及m階矩陣的計(jì)算(m為樣本的個(gè)數(shù)),當(dāng)m數(shù)目很時(shí)該矩陣的存儲(chǔ)和計(jì)算將耗費(fèi)大量的機(jī)器內(nèi)存和運(yùn)算時(shí)間,需要對(duì)算法進(jìn)行改進(jìn)。