陳新美 潘笑顏 路光輝 牧繼清 姬 波
1(許昌開普檢測技術有限公司 河南 許昌 461000)2(鄭州大學信息工程學院 河南 鄭州 450002)3(許繼集團有限公司 河南 許昌 461000)
?
基于樸素貝葉斯的局部放電診斷模型
陳新美1潘笑顏2*路光輝3牧繼清3姬波2
1(許昌開普檢測技術有限公司河南 許昌 461000)2(鄭州大學信息工程學院河南 鄭州 450002)3(許繼集團有限公司河南 許昌 461000)
針對局部放電故障診斷問題,提出一種基于樸素貝葉斯的局部放電診斷模型,并對模型中的樸素貝葉斯的應用方法進行詳細研究。該模型由四部分組成:信號的接收及處理、譜圖產生、特征提取和樸素貝葉斯分類。診斷流程: 首先由UHF傳感器接收局部放電信號并交于信號調理單元處理;然后基于處理后的信號產生三維譜圖,提取譜圖的典型特征;最后采用樸素貝葉斯算法進行故障診斷。該模型已作為插件嵌入到某一電力設備生產企業的變壓器監測產品中。實際測試表明該模型較好地滿足了應用需求。
局部放電樸素貝葉斯診斷模型特征提取
局部放電[1,2]是指因為電場不均勻,高壓設備絕緣的局部區域發生的發電。由于局部放電具有重復性,雖然短時間內不會影響設備的正常運行但時間長了會形成電樹枝,最終導致絕緣擊穿。針對局部放電信號的特征提取和模式識別問題,國內外許多學者進行了深入研究。文獻[3]在全封閉氣體絕緣開關設備上采集放電指紋數據,并提取了12種特征,利用復合神經網絡來提高局部放電識別率;文獻[4]提出利用主成分分析的方法對變壓器局部放電原始特征參數進行降維,并提取出新的主成分因子,通過概率神經網絡分類器對降維前和降維后的特征向量進行訓練和識別;文獻[5]利用超聲波法提取局部放電信號,得到局放分布譜圖,獲得局部特征參數,通過支持向量機分類算法對典型缺陷信號進行模式識別;文獻[6]使用自適應最優核(AOK)的時間-頻率表示法獲取局部放電的UHF信號。然后,基于時間-頻率矩陣由非負矩陣分解輔助主成分分析(NMF-PCA),最后,所提取的特征被用作模糊k近鄰(FkNN)分類器的輸入矢量,以獲得對PD識別結果。
這些研究針對局放診斷問題提出了很好的思路和方法。但是大都局限于診斷算法的研究,未涉及應用領域中多階段整體建模問題。在實際應用中,局放診斷主要涉及四個階段:放電信號接收及處理,譜圖產生,特征提取和算法分類。它們構成了一個密切關聯的整體,不可分割。因此,本文提出了一種基于樸素貝葉斯的局部放電診斷模型。該模型利用基于電磁波的UHF檢測法提取局部放電信號,產生局部放電譜圖,基于譜圖進行特征提取,最終通過樸素貝葉斯分類算法進行模式識別,給出故障診斷結果。實測表明,作為某變壓器監測產品的插件,本模型是可行的和有效的。
局部放電診斷模型如圖1所示。該模型包括四個部分:信號的接收及處理、譜圖產生、特征提取、樸素貝葉斯分類。流程是:從開關設備上接收局部放電信號并進行去噪處理,依次產生PRPS/PRPD/N-P/Q-P譜圖,基于以上譜圖進行特征提取,并采用樸素貝葉斯算法進行故障診斷。

圖1 基于樸素貝葉斯的局部放電診斷模型
局部放電信號經UHF傳感器(天線)和高頻傳輸電纜,送到信號調理單元,經高頻濾波、放大、檢波,再通過多路信號傳輸電纜,由高速數據采集單元進行數據采集和抗干擾處理。接收及處理流程如圖2所示。

圖2 信號接收和處理過程圖
1) UHF天線傳感器:采集局部放電的超高頻信號,提取能夠反映局部放電信息的特征量,如放電量、放電次數、放電相位等。天線傳感器是局部放電信號接收和處理的關鍵設備,要求駐波比小、方向性系數高。
2) 信號調理單元:采用帶通濾波及選頻放大技術和包絡檢波技術,實現了對信號的窄帶化處理,有效抑制噪聲,濾除UHF傳感器輸出信號的超高頻成分,僅保留信號的幅值和相位信息,從而降低數據采集系統的要求和減少數據量的處理。
3) 數據采集單元:數據采集單元要考慮采樣率、模擬帶寬、單雙通道、單通道最大存儲能力等。采集卡選用杭州西湖電子研究所生產設計的UHF采集模塊,采樣率為20M,經過檢波、濾波抽點后采用TCP/IP通信協議與裝置CPU進行信息交互。采集卡完成所有的采集和抗干擾處理,抽點后的數據以每周波256個點,連續采集1秒,同時4個通道的采樣數據以TCP/IP傳送到主CPU,每秒鐘的數據流量為:256×4×50(周波)×4(通道)=0.19 MByte。
4) 信號處理:對采集到的信號進行抗干擾處理,濾除干擾信號,然后對局放信號進行放電特征量提取、放電模式識別。最后通過IEC 61850規約把處理后的放電量、放電類型等上送至綜合監測單元。
采用IEC61850通信協議,將局部放電信息,包括最大放電量及平均放電量、放電次數、放電相位、放電類型上送,單位時間長度選定為1 s(50周波),生成局部放電的工頻周期波形圖、二維譜圖(φ~q圖和φ~n圖)和三維譜圖(φ~q~n圖)。模型中圖譜產生的方法如下:
1) 采用二維數組存儲處理后的信號,該數組的三個列向量分別代表相位區間、幅值區間、次數;
2) 由二維數組生成三維PRPS譜圖,數組的三個列向量分別對應三維圖的XYZ軸;
3) 由PRPS譜圖生成PRPD譜圖,其方法為:定義一個三維數組存放PRPS數據,PRPS[i][j][k]。k代表放電相位,3.6度間隔,取值范圍為0~99;j代表放電強度,按照dB值或者百分比處理,取值范圍0~99;i代表放電周波序號,取值范圍為1~50。計算方法參照式(1)。

(1)
4) 累計PRPD的j坐標值得N-P譜圖,參照式(2):

(2)
5) 統計PRPD的k坐標值最大值得Q-P譜圖,參照式(3):
Qmax[k]=max(j)
(3)
模型中有選擇性的提取了譜圖的25個主要特征。其中前11個來自PRPD譜圖,后14個來自N-P譜圖和Q-P譜圖。特征信息見表1-表3所示。

表1 基于PRPD譜圖提取的特征

表2 基于N-P譜圖提取的特征

表3 基于Q-P譜圖提取的特征
① 第I象限的放電集中度:0~90度相位域范圍放電脈沖的比率,計算公式為式(4)。
(4)
② 第I和II象限不對稱度:先計算II象限即90~180度相位域范圍放電的比率,再計算不對稱度,即兩個象限集中度的差值。計算公式為式(5)、式(6)。
(5)
fA13=f12-f13
(6)
③ 負半周放電次數均值,參照式(7)。
(7)
④ 負半周放電次數方差,參照式(8)。
(8)
⑤ 負半周放電總次數峰度,參照式(9)。
(9)
⑥ 負半周放電總次數偏度,參照式(10)。
(10)
⑦ 相位區域平均值:每個相位區間的脈沖數與相位值的乘積累加和與脈沖總數的比值,參照式(11)。
(11)
⑧ 正半周放電次數的峰度和偏度參照負半周放電次數的峰度和偏度的計算公式。放電頻度取對數,參照式(12)、式(13)。
(12)
f19=log10(Ne+1)
(13)
⑨ 第III象限的放電集中度:180~270度相位域范圍放電的比率,參照式(14)。放電強度平均值,參照式(15)。
(14)
(15)
Qmax[k]為最大的放電強度。
⑩ 負半周放電強度峰度,參照式(16)-式(18)。
(16)
(17)
(18)

(19)
正半周放電強度峰度和偏度參照負半周放電強度峰度和偏度的計算公式。
樸素貝葉斯算法的主要思想是:將事件的先驗概率和后驗概率聯系起來,利用先驗信息和樣本數據確定事件的后驗概率。為了簡化分類運算,樸素貝葉斯分類器在估計類條件概率時假設屬性之間條件獨立[7]。
給定一個實例數據集E,E={X1,…,Xn,C}。其中X1,X2,…,Xn,是屬性變量,C是類型變量,其取值為{c1,c2,…,cm},Xi的取值為xi。實例Ii={x1,x2,…,xn}屬于cj的概率由貝葉斯表示為:
P(cj|x1,x2,…,xn)=P(x1,x2,…,xn|cj)×P(cj)
(20)
其中類cj的先驗概率是P(cj),類cj的條件概率是P(x1,x2,…,xn|cj),類cj的后驗概率是P(cj|x1,x2,…,xn)。樸素貝葉斯選擇后驗概率最大的類cj為該實例Ii的類標簽。
從訓練數據估計后驗概率時有一個問題:如果有一個屬性的類條件概率為0,則整個類的后驗概率就為0。樸素貝葉斯分類器無法分類這樣的記錄。為了解決這個問題,使用m估計方法來估計條件概率,即:
(21)
其中,n為類yj中的實例總數,nc是類yj的訓練樣例中取值xi的樣例數,m是稱為等價樣本大小的參數,p是用戶指定的參數[6]。
在本模型中考慮到放電數據的特點,分別使用兩種方法估計連續屬性的類條件概率:① 離散化每一個連續的屬性,用相應的離散區間替換連續屬性值。典型的無監督離散化方法為等寬離散化方法和等頻離散化方法。② 高斯分布表示連續屬性的類條件概率分布,均值μ和方差σ2是該分布的兩個參數。對每個類yi,屬性Xi的類條件概率為:
(22)
等寬離散化算法和等頻離散化算法是兩類典型的無監督離散化方法。如算法1、算法2所示。等寬離散化方法是將屬性的值域劃分成具有相同寬度的區間[6]。等頻離散化方法是試圖將相同數量的對象放進每個區間[8]。
算法1等寬離散化算法
要求:數據集S,實例數n,屬性個數m,類型個數k,離散區間數L
輸入:數據集S,離散區間數L
輸出:離散化后的數據集合SS
方法:
1.for i in m do
2.計算第i個屬性的最大值maxi和最小值mini
3.計算第i個屬性的離散化寬度
widthi=(maxi-mini)/L
4.切點集
gatheri={mini+widthi,mini+
2*widthi,…,mini+(L-1)*widthi}
5.end for
6. SS = S
7.for i in n do
8.for j in m do
9.if SSij>= mini&& SSij<= mini+t*widthi
10.SSij= t
11.end for
12.end for
13.return SS
算法2等頻離散化算法
要求:數據集S,實例數n,屬性個數m,類型個數k,,要分的份數a
輸入:數據集S
輸出:離散化后的數據集合SS
方法:
1. width = n/a
2. SS = S
3. for j in m
4.按SS的第j列升序排列
5. for k in a
6.SS的第j列的(k-1)*width到k*width行都賦值為k
7.end for
8.end for
9.return SS
6.1實驗數據集
實驗數據是來自現場的63例放電數據,包括11種放電類型:分別為尖刺放電,絕緣子表面放電,均勻噪聲,手機干擾,隨機干擾,懸浮放電,沿面放電,噪聲,噪聲信號,金屬顆粒和自由金屬顆粒。為了保證實驗的合理性,采用十次十折交叉法來求取診斷正確率的總平均值作為平均正確率。
6.2實驗分析
分別使用兩種估計連續屬性的類條件概率的方法做實驗,以便得到最好的計算連續屬性的類條件概率的方法。
表4展示了等寬離散化并使用m估計的實驗結果,表5展示了等頻離散化并使用m估計的實驗結果,表6展示了使用m估計的等寬離散化方法最優份數和等頻離散化方法的最優份數。表7展示了兩種計算連續屬性的類條件概率的方法的結果,從表7中可以看出第一種方法比第二種方法好,并且第一種方法中等寬離散化比等頻離散化的分類正確率高,高出2.5%。

表4 等寬離散化的實驗結果(m估計)

表5 等頻離散化的實驗結果(m估計)

表6 最優份數

表7 最高正確率對比
6.3實驗結論
由于貝葉斯分類估計連續屬性的類條件概率的方法對局部放電診斷有顯著的影響,本文詳細研究了兩種估計連續屬性的類條件概率的方法,進而方便模型的建立。實驗表明第一種方法優于第二種方法,并且第一種方法中的等寬離散化優于等頻離散化。
本文模型已作為重要插件嵌入到某一電力設備生產企業的變壓器監測產品中。該產品的主要功能是對電力設備絕緣性能進行連續實時監測,當絕緣劣化發生局部放電時,判斷電力設備是否存在缺陷,指出缺陷類型以及缺陷位置,為電力設備的維修和保養提供決策依據。本模型的任務是通過對局部放電信號的提取、分析,給出故障診斷結果。實際測試表明本模型較好地滿足了應用需求。
[1] Wu Qingyan,Liu Guoqiang,Xia Zhengwu,et al.The study of Archimedean spiral antenna for partial discharge measurement[J].International Conference on Intelligent Control and InformationProcessing(ICICIP),2013,5(4):694-698.
[2] Chen S,Czaszejko T.Partial discharge test circuit as a spark-gap transmitter[J].IEEE Electrical Insulation Magazine,2011,27(3):36-44.
[3] 李培江,朱曉錦,尤婷.基于神經網絡GIS局部放電模式的識別[J].中國電力,2013,46(10):60-63.
[4] 宛津莎,尚海昆.基于主成分分析和概率神經網絡的變壓器局部放電模式識別[J].電力自動化設備,2013,33(6):27-31.
[5] 任永恒.基于SVM算法的局部放電模式識別[J].電力科技,2014(16):153-154.
[6] Ke Wang,Jizhong Li,Shuqi Zhang,et al.Time-frequency features extraction and classification of partial discharge UHF signals[J].Electronics and Electrical Engineering(ISEEE),2014:1231-1235.
[7] 王芳,鄭建柏.基于樸素貝葉斯分類的變壓器故障診斷[J].電力安全技術,2013,15(9):32-34.
[8] Pangning Tan,Michael Steinbach,Vipin Kumar.數據挖掘導論[M].范明,范宏建,譯.北京:人民郵電出版社,2011.
[9] 丁劍,白鳳偉.一種基于相似性度量的離散化方法[J].西北師范大學學報:自然科學版,2012,48(5):43-47.
[10] 張偉.基于歸一化投影直方圖不變矩的圖像特征提取[J].計算機工程,2011,37(1):226-228.
[11] 鮑永勝.局部放電脈沖波形特征提取及分類技術[J].中國電機工程學報,2013,33(28):168-175.
[12] 李劍,孫才新,杜林,等.局部放電圖像組合特征提取方法[J].高電壓技術,2004,30(6):11-13.
[13] 王國強,朱永利,劉利鵬.變壓器局部放電的分步特征分析與模式識別[J].電測與儀表,2013,50(9):6-10.
[14] 禹建麗,卞帥.基于BP神經網絡的變壓器故障診斷模型[J].系統仿真學報,2014,26(6):1343-1349.
A PARTIAL DISCHARGE DIAGNOSIS MODEL BASED ON NA?VE BAYES
Chen Xinmei1Pan Xiaoyan2*Lu Guanghui3Mu Jiqing3Ji Bo2
1(Xuchang Ketop Testing Technology Co.,Ltd, Xuchang 461000,Henan,China)2(SchoolofInformationEngineering,ZhengzhouUniversity,Zhengzhou450002,Henan,China)3(XUJIGROUPCorporation,Xuchang461000,Henan,China)
For the problem of partial discharge fault diagnosis, we present a Na?ve Bayes-based partial discharge diagnosis model, and study in detail the application method of Na?ve Bayes in the model. The model consists of four components: reception and processing of signals, spectrum maps generation, feature extraction and Na?ve Bayes classification. The diagnosis flow is as follows: first the UHF sensor is used to receive partial discharging signals and transmits them to signal conditioning unit for processing. Then based on the processed signals the model generates three-dimensional spectrum map, and extracts typical features of the map. Finally it uses Na?ve Bayesian algorithm to diagnose the faults. The model as an important plug-in has been embedded into the transformer monitoring products of an enterprise of power equipment production. Practical tests show that the model well satisfies the application requirements.
Partial dischargeNa?ve BayesianDiagnosis modelFeature extraction
2015-05-11。國家自然科學基金項目(61170223);河南人才培養聯合基金項目(U1204610);河南省科技攻關計劃項目(132102210404)。陳新美,工程師,主研領域:自動化裝置和智能組件檢測。潘笑顏,碩士。路光輝,高工。牧繼清,助理工程師。姬波,副教授。
TP3
A
10.3969/j.issn.1000-386x.2016.09.012