季 坤, 張晨晨, 丁國成, 劉 鋒, 田 宇, 李堅林
(1. 國網安徽省電力有限公司, 安徽 合肥 230022; 2. 中國科學技術大學 信息科學技術學院, 安徽 合肥 230026; 3. 國網安徽省電力有限公司電力科學研究院, 安徽 合肥 230601)
電力變壓器的在線監測技術能夠有效監測其運行狀態,及時發現潛伏性故障從而避免嚴重事故的發生[1-2]。對此,國內外學者已開展了廣泛研究并取得了大量有意義的成果[3-5]。周泉等[6]提出了一種基于光聲光譜法的變壓器油中氣體在線監測技術,實現了變壓器油中溶解氣體的快速檢測。陳一鳴等[7]依托大數據平臺,依據負荷分布情況建立了變壓器繞組在線檢測模型,為三繞組變壓器的參數辨識與在線監測提供了參考。鄭重等[8]利用BP神經網絡研究了多頻超聲參數與變壓器運行狀態之間的映射關系,實現了對變壓器絕緣油質量的實時檢測。
相關研究通過提取變壓器運行產生的聲紋信號中的特征量[9-10],對變壓器運行狀態進行判斷,在完成在線監測的同時,實現非接觸式檢測。與傳統的檢測技術相比,不僅傳感器布置方式靈活,且信號采集過程中不產生電磁信號,不干擾設備的正常運行[11-12]。
但目前關于電力變壓器聲紋識別技術的研究較少,大多采用實驗室模擬故障的方法針對某種特定運行工況進行研究。王豐華等[13]提出了一種改進梅爾頻率倒譜系數和矢量量化算法的變壓器聲紋識別模型,研究了不同預緊力條件下變壓器運行噪聲信號提取與識別。劉云鵬等[14]提出了一種50 Hz倍頻倒譜系數和門控循環單元的變壓器直流偏磁聲紋識別模型,結果表明,該方法能更優地實現對直流偏磁狀態的識別。張重遠等[15]研究了鐵芯振動模型與變壓器運行工況之間的關系,利用Mel時頻譜和卷積神經網絡的方式實現了對聲音型號的識別。
基于上述分析,本文研究了適用于變壓器聲紋信號識別的聲音信號特征提取方法,并在此基礎上利用神經網絡構建了一種電力變壓器聲紋識別模型。利用粒子群算法對網絡權值參數進行優化,從而完成電力變壓器的運行狀態識別,實現變壓器運行缺陷的主動預警。
變壓器聲紋識別技術包括聲音信號的特征提取以及運行狀態的模式識別兩部分。電力變壓器運行過程中存在鐵芯或繞組松動、局部放電等異常現象時,會產生不同的振動聲音信號。因此,可以通過提取聲音信號特征對變壓器進行故障診斷。
目前,在聲紋識別中廣泛采用的聲學特征向量為:表征發聲系統特性的線性預測倒譜系數(LPCC)和針對聽覺系統特性的梅爾頻率倒譜系數(MFCC)。本文通過計算樣本信號的上述兩種系數作為變壓器聲紋識別的特征向量。
線性預測的基本思想是利用過去的采樣值來表示未來的采樣值,通過計算得到預測值與采樣值之間的誤差。根據均方差最小誤差準則得到一組系數,作為表征信號模型的特征參數。

(1)
t時刻的采樣點可用過去p個采樣點的線性組合來表示,則預測值為
(2)
式中:p為線性預測階數;λi~λp為線性預測系數,用于表征聲音信號的特征參數。
通常聲音信號的傳遞函數可表示為全極點模型,即
(3)
式中,G為激勵的增益。由此可得
(4)

(5)
將式(3)代入式(5),并對z-1求導數,可得
(6)
求解式(6)可得
(7)

梅爾頻率倒譜系數是一種基于聽覺系統特性的聲紋特征提取方法,該特征向量不受發聲模型的影響,更有利于變壓器聲紋特征的識別。
將聲音信號s(t)經過預處理后得到每幀的時域信號x(t),對x(t)進行快速傅里葉變換,得到線性頻譜X(k),即
(8)
將X(k)通過Mel頻率濾波器組得到相應的Mel頻譜。Mel濾波是由q個三角帶通濾波器組成,信號經濾波后可得到q個參數,計算公式為

(9)
式中:N為快速傅里葉變換的點數;Hi(k)為濾波器參數。根據式(9)計算得到mi后,對其取自然對數。最終進行離散余弦變換即可得到MFCC特征向量,余弦變換公式為

(10)
根據式(10)計算得到的c(i)即可組成MFCC特征向量。
LPCC和MFCC的特征參數多用于語音識別領域,通常在小規模樣本情況下對說話人進行識別。變壓器運行產生的振動信號不同于語音信號,且信號特征與一般的語音信號也存在一定差異。鑒于此,本文在LPCC與MFCC的基礎上進行了特征優化,從而進一步挖掘變壓器聲音信號的特征信息。
1) 特征加權
由于特征參數的各維分量對信息的表征能量存在差異,且低維分量抗噪性差,高維分量表征能力弱。因此本文采用內部加權的形式對特征向量進行線性處理,加權系數表達式為
(11)
式中,p為每幀語音參數的階數。βn即為每幀p個參數要乘以的權系數。
2) 特征差分
由式(10)計算得到的梅爾倒譜參數反映了聲音信號的靜態特性,而且沒有利用同一樣本不同幀之間的關聯關系。事實上,變壓器運行過程中的振動信號是一個連續變化的過程,不同幀信號之間存在一定的關聯關系。因此,可以利用差分倒譜參數來反映語音的動態特征,從而提高系統的識別性能。優化后的聲音信號倒譜參數可表示為
(12)
式中:c(n)為第n幀梅爾倒譜特征參數向量;h(n)為新的特征參數,是第n幀初始特征參數前后兩幀的線性組合。
神經網絡是一種典型用于處理非線性函數映射關系的人工智能算法,具有強大的學習能力和適應能力。因此可以通過對變壓器不同運行狀態下的聲紋特征參數進行學習,從而獲得模式識別能力。
一個完整的神經網絡由輸入層、隱含層和輸出層3部分構成。假設由LPCC系數或MFCC系數計算得到的變壓器聲紋特征參數為
X=[x1,x2,…,xM]
(13)
變壓器運行狀態的編碼為
Y=[y1,y2,…,yO]
(14)
y1為0.9,y2~y5為0.1時,表示工況類型1,其他情況以此類推。
隱含層神經元為
U=[u1,u2,…,ul]
(15)
令輸入層與隱含層神經元間的權值矩陣為D,隱含層與輸出層神經元間的權值矩陣為Z,隱含層神經元的閾值為θ,輸出層神經元的閾值為δ,則隱含層神經元的輸出為
(16)
輸出層神經元的輸出為
(17)
目標函數為網絡輸出與期望值的誤差,即
(18)
神經網絡的訓練過程是利用變壓器不同運行狀態下的特征參數作為輸入量,不斷調整權值矩陣D和Z以及閾值θ與δ中的各個參數,使得輸出誤差最小,從而實現模式識別。
由上文可知,網絡權值矩陣的選擇是實現模式識別的關鍵。為了克服傳統BP神經網絡在收斂速度與學習能力方面的弱點,本文選擇粒子群算法對神經網絡的參數進行優化。
本文以權值矩陣D的優化過程對其進行說明。假設共有A個種群,特征值的個數為M,第ξ代的種群為Dξ,則初始種群為
D0=[D0,1,D0,2,…,D0,4]
(19)
第i個解集為
D0(i)=[d0,1(i),d0,2(i),…,d0,M(i)]
(20)
D0(i)中各自變量均基于其概率函數隨機產生。設變異向量為
Vξ(i)=[vξ,1(i),vξ,2(i),…,vξ,M(i)]
(21)
變異向量的維數與自變量的個數相等,為了提高算法的收斂速度,本文在變異向量更新過程中引入了種群最優個體,變異向量的更新公式為
vξ+1,j(i)=xξ,j(i)+α[xξ,j(best)-xξ,j(i)]+
α[xξ,j(a)-xξ,j(b)]
(22)
式中:xξ,j(best)為種群中最優個體;α為動態縮放因子,初值取0.7,變化過程為
(23)
粒子群算法的交叉過程可將變異向量引入自變量解集中,從而達到更新解集的目的。交叉過程為
oξ(i)=[oξ,1(i),oξ,2(i),…,oξ,M(i)]
(24)
(25)
式中:i∈[1,N];j∈[1,D];φ為0~1的隨機數;r為交叉概率;cR為動態交叉因子,初始值取0.3,其定義表達式為
(26)
目標函數為minf(x),選擇操作公式為
(27)
評價粒子群中的所有個體,從中找到最佳個體,并以此產生新的個體微粒。當目標函數小于給定誤差值或達到給定循環次數時,算法中止。
綜上,基于粒子群優化算法的電力變壓器聲紋識別流程如圖1所示。

圖1 算法流程圖Fig.1 Algorithm flow chart
實驗樣本數據為試點變電站2019年~2020年期間220 kV主變聲音信號長期監測數據。傳感器測點的布置位置和距離如圖2所示。傳感器的頻率響應范圍為10 Hz~24 kHz,靈密度為50 mV/Pa,監測過程中每15 min對數據進行保存和記錄。

圖2 傳感器測點布置Fig.2 Layout of sensor measuring points
變壓器發生運行異常時,由專業人員到現場進行驗證和測試,且異常運行工況的分類是根據變壓器異常檢修結果進行歸類。本文選擇了幾種典型聲音信號樣本進行分析,如表1所示。

表1 變壓器聲音樣本類型Tab.1 Types of transformer sound samples
變壓器聲紋識別過程中,采用3層神經網絡,隱含層節點數為36。選擇不同運行工況下的樣本數量共100組,截取長度為5 s,幀長為500 ms的樣本信號。分別計算得到12個LPCC系數和MFCC系數作為待識別的特征量,即神經網絡的輸入層節點個數為12。其中70%的樣本用于網絡訓練,20%用于模型驗證,10%用于數據識別。
采用誤差函數逆向傳播的BP神經網絡和粒子群優化的神經網絡(PSO神經網絡)對變壓器聲紋信號進行對比分析。迭代截止誤差為10-6,最大迭代次數為200次。仿真結果如圖3、4所示。

圖3 LPCC作為特征向量識別結果Fig.3 Recognition results taking LPCC as feature vector

圖4 LPCC作為特征向量識別時間Fig.4 Recognition time with taking LPCC as feature vector
由圖3、4可知,選擇LPCC作為特征向量時,BP神經網絡對不同工況下的聲紋識別準確率約為84.4%,PSO神經網絡的識別準確率約為85.0%,兩種方法的識別準確率幾乎相同。在該條件下,BP神經網絡的平均識別時間約為8.2 s,PSO神經網絡的平均識別時間約為5.5 s。在識別準確率基本相當的情況下,采用PSO神經網絡對電力變壓器的聲紋識別效率要比BP神經網絡高約33%。
圖5、6為MFCC作為特征向量的識別率及時間。由圖5、6可知,利用MFCC作為變壓器聲紋識別的特征向量時,不同工況下BP神經網絡的識別準確率為87.7%,識別準確率要比PLCC作為特征向量時高3.3%。PSO神經網絡對于不同工況的識別準確率為89.7%,識別準確率比PLCC作為特征向量時高約5.3%。說明在變壓器聲紋識別過程中,采用MFCC作為特征向量要優于LPCC,即MFCC更能準確提取變壓器噪聲的特征信息。

圖5 MFCC作為特征向量識別結果Fig.5 Recognition results with taking MFCC as feature vector

圖6 MFCC作為特征向量識別時間Fig.6 Recognition time with taking MFCC as feature vector
此外,MFCC作為特征向量時,BP神經網絡的平均識別時間約為8.0 s,PSO神經網絡的平均識別時間為4.7 s,PSO神經網絡的識別效率比BP神經網絡約高了41.3%。且在相同條件下,采用MFCC作為特征向量時,變壓器聲紋識別的效率要高于LPCC作為特征時的識別效率。
本文以MFCC系數作為特征量對比了語音識別中常用的隱馬爾科夫模型(HMM)和支持向量機模型(SVM)的識別效果,實驗結果如圖7所示。

圖7 不同算法識別結果Fig.7 Recognition results of different algorithms
由實驗結果可知,采用PSO神經網絡和SVM模型的識別效果基本相當,HMM模型識別準確率要低一些。這是因為使用HMM模型需要對特征參數進行矢量量化,不可避免地會引入額外量化誤差,導致識別效果下降。同時,SVM模型核函數采用Gaussian核函數,SVM要想獲得較好的識別效果,核函數的選擇是關鍵問題,多數情況下只能根據測試結果進行嘗試。
本文研究了粒子群算法在電力變壓器聲紋識別中的應用,主要結論如下:
1) 本文采用LPCC系數和MFCC系數作為變壓器聲紋識別的特征向量,利用粒子群優化算法構建神經網絡模型,使得變壓器聲紋識別率達到85%以上。
2) LPCC系數作為特征向量時,PSO神經網絡與傳統神經網絡的變壓器聲紋識別率約為85%,PSO神經網絡的識別效率要比傳統神經網絡的識別效率高33%。
3) MFCC系數作為特征向量時,采用PSO神經網絡的變壓器聲紋識別準確率比LPCC系數作為特征向量時約高出5.3%,平均識別時間縮短約25%。