李梓瑋,許麗娟
(1. 國網四川綜合能源服務有限公司, 成都 610072; 2.西南交通大學 電氣工程學院, 成都 611756)
在高壓直流輸電(High Voltage Direct Current,HVDC)系統中,直流濾波器可以濾除換流器在直流側產生的特征諧波,降低其干擾直流線路附近通信系統、造成直流設備發熱和危害系統安全穩定運行等不利影響[1-3]。其中,高壓電容器是直流濾波器的重點器件,價格不菲,同時承擔著直流側的大部分電壓,容易發生故障[4-5];低壓電容器屬于直流濾波器低壓調諧區的元件,其故障后將影響濾波性能。當電容器有部分電容元件發生開路故障后,與其并聯的正常電容元件流過的電流將增大,進而減少正常電容元件的使用期限,嚴重時可能會導致雪崩效應,使得更多的電容元件被損害,故應及時對電容器進行檢修[6-8]。在HVDC工程中,一般是通過人工逐個測量電容單元的電容值來排查電容器的故障,此種方法的檢修效率不高,同時若電容放電不完全,可能會威脅檢修人員的安全[9]。因此,有必要研究直流濾波器電容器的開路故障定位方法,提高開路故障檢修效率,保證檢修人員的安全。
目前,對直流濾波器電容器開路故障定位問題的研究甚少。文獻[10]利用不平衡支路電流、直流濾波器首端電流以及兩條高壓端橋臂支路電流在故障前后的幅值、方向的變化特征,來確定高壓電容器的具體故障橋臂。文獻[11]提出了一種利用相對電流值來確定電容器組故障位置的方法,采用兩條低壓端橋臂的支路電流和不平衡支路電流,計算得到兩個相對電流值,利用相對電流值的階躍變化將故障位置定位到高壓電容器的具體橋臂。上述方法均較好地實現了高壓電容器單個橋臂的開路故障定位,但當高壓電容器的2個橋臂同時發生相同的開路故障時,上述方法沒有考慮將故障位置定位至2個故障橋臂,同時也均沒有考慮低壓電容器的開路故障定位。
近年來,深度學習與大數據等新興技術被廣泛應用于故障診斷分類領域。概率神經網絡(Probabilistic Neural Network,PNN)是一種融合了密度函數估計和貝葉斯決策理論的智能算法,具有收斂迅速、訓練簡單、分類準確率高和容錯能力強等優點,被廣泛應用于模式分類等領域[12-14]。主成分分析法(Principal Component Analysis,PCA)是一種將具有一定相關性的原始變量重新組合成一組新的獨立的綜合變量的統計方法,其遵循降低數據維度同時數據不失真的宗旨[15-19]。
基于此,文章提出了一種基于概率神經網絡的直流濾波器電容器開路故障定位方法。該方法使用歸一化和PCA來對樣本數據進行縮小量值和降低數據維度處理,在降低問題復雜度的同時,也得到了能有效反映電容器運行狀態的特征向量,最后使用PNN對特征向量進行故障分類,從而實現對直流濾波器電容器開路故障的定位。文章利用電容器運行狀態樣本數據(正常狀態、高壓電容器4個橋臂分別發生開路故障、高壓電容器2個橋臂同時發生相同的開路故障、低壓電容器發生開路故障)對所提方法的有效性進行驗證,最后考慮電容器的開路故障電容元件數存在差異,以此驗證所提方法的適應性。
雙調諧直流濾波器具有可以同時濾除2個頻率的諧波、占地面積小等優點,被廣泛運用于HVDC工程中[20-21],因此文章對其進行研究。雙調諧直流濾波器的結構及開路故障示意圖見圖1[22],文中的電容器采用內熔絲結構。其中,H形接線方式的4個電容器組橋臂組成1個高壓電容器。高壓電容器的等效電容為C1,4個橋臂的等效電容分別為C11、C12、C13、C14,并有C11=C12=C13=C14=C1;低壓電容器的等效電容為C2。ih和iw分別為直流濾波器的首端、尾端電流,i1和i2分別為高壓電容器C11和C12橋臂的支路電流,iun為不平衡支路電流,ir為電阻器R的支路電流,il2為低壓電抗器L2的支路電流。
從圖1可知,高壓電容器C1的每個橋臂以及低壓電容器C2均有64個串聯的電容單元,每個電容單元均有60個串并聯的電容元件。當有電容元件發生擊穿短路故障后,與其并聯的正常電容元件將對其進行放電,使得與故障電容元件串聯的內熔絲熔斷,此時擊穿短路故障變化成開路故障[23-25]。圖1中F1、F2、F3和F4分別為高壓電容器C11、C12、C13和C14橋臂發生開路故障,F5為低壓電容器C2發生開路故障。

圖1 雙調諧直流濾波器結構及開路故障示意圖
從多方面研究問題時,會考慮許多與此問題相關的變量,每個變量均在不同程度地體現此問題的信息。在大多數情況下,某些變量是有相關性的,即某些變量反映了一些相同的信息。因此可以使用PCA對變量進行重新組合,然后根據研究問題的需要,選取幾個足以反映問題信息的綜合變量,從而得到能有效反映直流濾波器電容器運行狀態的特征向量,同時也達到了降低數據維度、簡化問題復雜性的目的。PCA的計算步驟如下:
假設有n個原始變量A1、A2、…、An,每個原始變量均有m個樣本數據,則原始樣本數據矩陣A記為:
(1)

(2)

(3)
(4)
(2)用標準化陣Z求相關系數矩陣M;
(5)
(3)求解特征方程|M-λE|=0,得到n個特征值λj(j=1,2,…n,按從大到小排列),同時由Mbj=λjbj求解相應的特征向量bj;
(4)求解主成分,Uj為第j主成分;
Uj=Zbj
(6)
(5)求取累計方差貢獻率ηΣ(l),確定主成分個數l。當ηΣ(l)大于95%時,對應的前l個主成分可以反映n個原始變量的大部分信息。
(7)
概率神經網絡是基于貝葉斯最小風險準則和概率密度函數估計法來進行分類的,是一種由徑向基函數發展而來的前向網絡,善于進行模式識別。在故障診斷分類方面,其學習方法是前向線性的,分類效率高,訓練過程短。概率神經網絡一般由四層構成,即輸入層、隱含層、求和層和輸出層,其基本結構如圖2所示。

圖2 概率神經網絡基本結構
在對PNN進行訓練時,訓練樣本的具體處理過程如下所示:
(1)第一層是輸入層,負責接收訓練樣本X,并將其完全不變地傳遞給隱含層,其中,該層神經元的數量等于輸入訓練樣本X的維數;
(2)第二層隱含層為徑向基層,訓練樣本X的樣本個數決定了該層的神經元數量。隱含層中的每個神經元都有一個中心,從輸入層接收數據后,計算輸入數據到各個中心的距離,每個神經元將輸出一個標量,從而計算訓練樣本X與訓練樣本中各個分類類別的匹配關系,其輸出如式(8)所示:
(8)
式中Wi為輸入層和隱含層之間的連接權值,其被設置為各類訓練樣本;δ為平滑因子;
(3)第三層為求和層,該層的每個神經元代表一個分類類別,神經元數量等于分類類別數量。求和層的每個神經元只與隱含層里同類的徑向基神經元建立聯系,對同類神經元的概率進行求和,進而得到故障類型概率密度函數估計式,如式(9)所示:
(9)
式中p為訓練樣本維度;m1為屬于分類類別1的訓練樣本個數;X1i為分類類別1的第i個訓練樣本。
(4)第四層輸出層的每個神經元代表一個分類類別,該層接收求和層的輸出,并在其中找到最高概率對應的那個神經元,如式(10)所示,該神經元輸出為1,即判斷出所測數據屬于該神經元對應的分類類別,其余神經元輸出為0。最后將輸出層的結果乘以向量[1, 2, 3, …,k]′,即乘以每個神經元對應的分類類別數值,進而將輸出層的結果轉換成分類類別數值。
y=max(f1,f2,…,fk)
(10)
概率神經網絡的“訓練”是根據輸入的訓練樣本決定網絡的神經元數量和連接權值,當PNN中的各參數值確定后訓練結束,從而得到訓練好的PNN模型。最后將測試樣本送入訓練好的PNN模型中,實現故障分類。
基于PNN的直流濾波器電容器開路故障定位流程見圖3。

圖3 基于PCA-PNN的直流濾波器電容器開路故障定位流程圖Fig.3 Flow chart of DC filter capacitor open-circuit fault location based on PCA-PNN
具體步驟如下:
(1)對高壓電容器4個橋臂和低壓電容器進行開路故障仿真,并借助電流互感器采集電容器處于正常狀態和開路故障狀態下的原始實驗數據;
(2)提取原始實驗數據的有效值,再對其進行歸一化操作,使數據分布在[0,1]內;
(3)對歸一化后的實驗數據應用PCA,并選取所需要的主成分,提取關鍵特征向量;
(4)將經過PCA處理的數據按比例7:3分為訓練和測試樣本;
(5)將訓練樣本送入PNN模型,進而得到訓練的電容器開路故障定位PNN模型;
(6)將測試樣本送入已經訓練好的開路故障定位PNN模型中,得到定位結果;
(7)將PNN模型預測的測試樣本的定位結果與實際結果作對比,計算定位正確率。
文章以葛南HVDC工程中的12/24雙調諧直流濾波器的結構和參數為例,在PSCAD/EMTDC仿真平臺的± 500 kV HVDC系統模型上,對高壓電容器的4個橋臂以及低壓電容器分別進行開路故障仿真,采集電容器處于正常狀態和開路故障狀態下的原始實驗數據,并用此實驗數據驗證所提開路故障定位方法的有效性;同時,考慮電容器的開路故障電容元件數存在差異,以此來驗證所提開路故障定位方法的適應性。程序在MATLAB R2018b條件下運行,文章所用的雙調諧直流濾波器結構如圖1所示,參數如表1所示。

表1 雙調諧直流濾波器參數


表2 直流濾波器電容器運行狀態
監測的直流濾波器變量有:直流濾波器首端電流ih、C11橋臂支路電流i1、C12橋臂支路電流i2、不平衡支路電流iun、直流濾波器尾端電流iw、低壓電抗器L2支路電流il2、電阻器R支路電流ir。根據基爾霍夫電流定律,由i1、i2和iun可得到C13橋臂支路電流i3(i3=i1-iun)、C14橋臂支路電流i4(i4=i2+iun);由iw、il2和ir可得低壓電容器C2支路電流ic2(ic2=iw-il2-ir)。因此原始實驗數據共有10維,如表3所示。

表3 原始實驗數據變量
首先采集原始實驗數據的有效值。由于較大的變量值容易覆蓋較小的變量值,可能會使信號失真,影響開路故障定位效果,降低開路故障定位準確率,同時為了簡化計算、縮小量值,對10維變量作歸一化操作,將這10維變量歸一化到區間[0,1]。為了刪去反映重復的電容器狀態數據信息以及不相關的數據信息,使研究問題簡單化,對歸一化處理后的數據使用PCA。此時樣本矩陣有12000×10個數據,首先求取10個變量各自的樣本均值和標準差,根據式(2)對樣本矩陣作標準化變換,再根據式(5)求取相關系數矩陣,并求取其特征值與特征向量,最后根據式(6)求取各個主成分。文章選取累計方差貢獻率大于95%的前幾個主成分,PCA降維結果見圖4。

圖4 PCA降維結果圖
由圖4可知,10維變量被降成6維特征向量,即第一、二、三、四、五和六主成分,共有12000×6個數據,且這6個主成分的累積方差貢獻率達到了99.390 6%,表明原始10維變量可以用這6個主成分表示。若使用全部的10個主成分,累計方差貢獻率達到100%,與前6個主成分的累積方差貢獻率僅相差0.609 4 %,故障定位正確率提升不明顯,同時還將造成較大的計算量。因此文章采用前6個主成分,其能反映原始變量的絕大部分信息,同時可以降低數據維度、簡化計算。這6個主成分中的前3個和后3個主成分的可視化圖如圖5所示,電容器同一運行狀態的數據較為集中,不同運行狀態的數據較為分散,若將數據投影到6維的特征空間,不同運行狀態數據將變得更加分散,故將其用于接下來的定位過程。

圖5 主成分可視化圖
通過多次運行程序,在不降低PNN分類正確率的前提下,不斷嘗試減少訓練樣本的數量,即減少使用的存儲空間和計算時間,最終對直流濾波器電容器的每種故障工況下的每種運行狀態均隨機選取700組數據作為訓練樣本,故總訓練樣本有8 400組數據。將訓練樣本輸入到PNN模型中,設置SPREAD參數值為1.1。此時PNN輸入層中有6個神經元,接收6個主成分的數據;隱含層有8 400個神經元,由訓練樣本的數量決定,該層根據式(8)計算每組訓練數據與每個分類類別的匹配程度;求和層有12個神經元,代表電容器運行狀態類別數,該層根據式(9)將上一層中屬于同一類別的輸出進行加權求和;輸出層由12個競爭神經元組成,該層接收求和層的輸出,并在其中找到最高概率對應的那個神經元,該神經元輸出為1,即判斷出該組數據屬于該神經元對應的電容器運行狀態類型,其余神經元輸出為0。至此,PNN定位模型訓練完成。然后將測試樣本送入PNN定位模型中,測試樣本的定位結果如圖6所示,測試樣本的混淆矩陣如表4和表5所示。

圖6 測試樣本定位結果

表4 單個支路故障和正常狀態測試樣本混淆矩陣

表5 2個橋臂同時故障的測試樣本混淆矩陣
由表4、表5和圖6可得:(1)對于單個支路發生開路故障,即C11開路故障F1、C12開路故障F2、C13開路故障F3、C14開路故障F4和C2開路故障F5,測試樣本定位正確率均為100%;(2)對于電容器處于正常狀態,其測試樣本定位正確率為88%,其中,分別有8%和4%的測試樣本被誤判為C2開路故障F5和C11C12同時開路故障F10,其原因為在這3種運行狀態中,高壓電容器的4個橋臂支路以及不平衡支路的電流特征類似,導致電容器正常狀態可能被誤判為故障F5、故障F10;(3)對于高壓電容器的2個橋臂同時發生相同的開路故障,C11C13同時開路故障F6、C12C14同時開路故障F7、C11C14同時開路故障F8、C12C13同時開路故障F9的測試樣本定位正確率均為100%,但C11C12同時開路故障F10、C13C14同時開路故障F11的測試樣本定位正確率很低,只有31.7%和29.3%。因此文章所提方法可有效定位除了F10和F11這兩種運行狀態之外的10種運行狀態。
當直流濾波器電容器處于正常狀態時,由于C11=C12=C13=C14,4個橋臂的等效阻抗相等,因此流過高壓電容器4個橋臂的電流均相等,同時不平衡支路電流為0。當C11和C12橋臂同時發生相同的開路故障時,依然有C11=C12,這2個橋臂的等效阻抗依然相等,故流過C11和C12橋臂的2個電流相等,且此時C13和C14橋臂處于正常狀態,有C13=C14,故流過C13和C14橋臂的2個電流相等,且等于流過C11和C12橋臂的2個電流,同時不平衡支路電流為0。同理,當C13和C14橋臂同時發生相同的開路故障時,流過高壓電容器4個橋臂的電流均相等,同時不平衡支路電流為0。此外,在上述3種運行狀態中,低壓電容器C2均無故障,低壓調諧區的電流故障特征有相似之處。因此,故障F10、故障F11和正常狀態的部分故障特征較相似,故障F10和F11易被錯誤分類,導致其定位正確率低。故文章所提方法不考慮故障F10和F11這兩種運行狀態。
為驗證基于PNN的直流濾波器電容器開路故障定位方法的適應性,考慮電容器的開路故障電容元件數存在差異。以電容器有2個串聯和15個并聯的電容元件發生開路故障;3個串聯和15個并聯的電容元件發生開路故障;3個串聯和18個并聯的電容元件發生開路故障為例,對電容器分別進行開路故障仿真。對上述3種故障工況,按照文章3.1節所述過程分別采集樣本數據,按照圖3所示流程對數據進行提取有效值、歸一化和PCA處理后,對每一種故障工況下的每一種運行狀態均隨機選取700組數據作為訓練樣本,訓練樣本包含了不同故障工況下的不同運行狀態的數據;將每一種故障工況下的每一種運行狀態的其余300組數據作為測試樣本,故總訓練樣本有21 000組,總測試樣本有9 000組。測試樣本的定位正確率如表6所示。

表6 不同數量故障電容元件測試樣本定位正確率
由表6可知,直流濾波器電容器發生開路故障的電容元件越多,文章所提方法的故障定位正確率越高。若故障電容元件數較少,可能會導致其故障特征不明顯,從而使得故障定位正確率降低,而在實際HVDC工程中,只有當故障電容元件達到了一定數量,才會對其進行檢修。因此,當電容器的開路故障電容元件數存在差異時,文章所提方法可以有效定位故障位置。故文章所提基于主成分分析法和概率神經網絡的直流濾波器電容器開路故障定位方法具有較高的適應性。
文章對直流濾波器電容器開路故障定位問題進行研究,提出了一種基于主成分分析法和概率神經網絡的電容器開路故障定位方法,得到以下結論:
(1)采用主成分分析法對已作歸一化處理的樣本數據進行降維操作,將原始的10維變量降為6維特征向量,累計方差貢獻率達到了99.390 6 %,因此,可用6維特征向量代表原始10維變量;
(2)利用訓練樣本訓練PNN模型,然后利用測試樣本預測PNN模型的定位結果。電容器狀態樣本數據的定位結果表明:所提方法可有效識別高壓電容器C11開路故障F1、C12開路故障F2、C13開路故障F3、C14開路故障F4、低壓電容器C2開路故障F5、高壓電容器C11C13同時開路故障F6、C12C14同時開路故障F7、C11C14同時開路故障F8、C12C13同時開路故障F9和電容器正常狀態共10種運行狀態;
(3)考慮電容器的開路故障電容元件數存在差異,以2個串聯和15個并聯等3種不同組合的電容元件發生開路故障為例,驗證所提定位方法的適應性,定位結果表明,測試樣本中不同運行狀態的定位正確率分別為99.11%、 99.11%、 99.11%、 99.11% 、 100%、 99.78%、 99.78%、 100%、100%和87%,定位正確率較高,因此所提方法可有效定位到電容器的故障位置,具有較高的適應性。