陳奇志 趙沛舟 趙海全 蔡錦濤 謝昌富



摘要:針對傳統軌道交通變壓器種類多、內部結構復雜、運行工況多樣,導致對其進行故障診斷較為困難的問題,提出深度學習融合線性預測倒譜系數(LPCC)和梅爾頻率倒譜系數(MFCC)組合特征的軌道交通變壓器故障診斷方法。首先,利用小波閾值去噪法對噪聲信號預處理;然后,分別提取噪聲信號的LPCC特征和MFCC特征,并組合成特征向量;最后,將組合特征向量輸入到基于深度學習的CNN-LSTM模型,實現軌道交通變壓器的故障診斷。實驗結果表明,該文提出的LPCC-MFCC組合特征和CNN-LSTM模型對軌道交通變壓器的故障診斷準確率可達99.48%,精度、召回率和F1分數均達到99.59%。
關鍵詞:軌道交通變壓器;故障診斷;噪聲信號分析;特征提??;深度學習
中圖分類號:TP3文獻標志碼:A 文章編號:1674-2605(2023)03-0008-06
DOI:10.3969/j.issn.1674-2605.2023.03.008
Fault Diagnosis Method forRail Transit Transformer Based on Deep Learning
CHEN Qizhi1? ZHAO Peizhou2? ZHAO Haiquan2? CAI Jintao2? XIE Changfu3
(1.ChengduJiaodaGuangmang Technology Co., Ltd.,Chengdu 610041, China
2.Southwest Jiaotong University, Chengdu 611756,China
3.Shenzhen Metro Group Co., Ltd., Shenzhen 518026,China)
Abstract:In response to the problem of multiple types, complex internal structures, and diverse operating conditions of traditional rail transit transformers, which makes fault diagnosis more difficult, a deep learning fusion of linear prediction cepstrum coefficient (LPCC) and Mel frequency cepstrum coefficient (MFCC) combined features is proposed for rail transit transformer fault diagnosis. Firstly, the wavelet threshold denoising method is used to preprocess the noisy signal; Then, LPCC and MFCC features of the noise signal are extracted separately, and combined to form feature vectors; Finally, the combined feature vectors are input into the CNN-LSTM model based on deep learning to achieve fault diagnosis of rail transit transformers. The experimental results show that the proposed LPCC-MFCC combination feature and CNN-LSTM model have an accuracy of 99.48% for rail transit transformer fault diagnosis, and the accuracy, recall rate, and F1 score all reach 99.59%.
Keywords:rail transit transformer; fault diagnosis; noise signa analysis; feature extraction; deep learning
0 引言
隨著軌道交通系統的快速發展,其電力系統的安
全穩定運行要求也日趨嚴格。軌道交通變壓器是電力系統的關鍵設備,其故障診斷對軌道交通電力系統的安全可靠運行具有十分重要的意義[1-2]。目前,變壓器的故障診斷方法主要有振動診斷法、超聲波診斷法和噪聲診斷法3類。其中,振動診斷法為接觸式測量法,通過將傳感器緊壓在待測物體的表面,可較好地避免環境噪聲的干擾,但傳感器會影響變壓器的正常運行;超聲波診斷法是利用變壓器表面的超聲波傳感器來接收放電信號,從而達到故障定位的目的,但超聲波的傳輸路徑較為復雜,受噪聲干擾影響較大,應用具有局限性;噪聲診斷法是利用變壓器的噪聲信號識別變壓器的工況,非接觸式的采集方法不會對變壓器的運行產生不良影響,且可以通過濾波技術來減少環境噪聲的干擾,應用較為廣泛。
基于深度學習的識別分類算法因學習能力強、適應性好,廣泛應用于聲音識別領域。文獻[3]搭建了變壓器鐵芯振動噪聲模型結構,建立基于Mel時頻譜的卷積神經網絡(convolutional neural network, CNN)聲音識別模型,利用深度學習模型對變壓器鐵芯松動故障工況準確識別。文獻[4]提出了一種基于卷積嵌入和線性自注意力的變壓器故障診斷算法,能準確地診斷變壓器故障。文獻[5]利用動態時間規整對變壓器噪聲信號進行故障診斷。上述方法只能識別單種故障,且樣本數據類型單一,有一定的局限性。
為此,本文提出深度學習融合LPCC-MFCC噪聲特征的軌道交通變壓器故障診斷模型。該模型提取不同類型變壓器噪聲信號的特征,結合基于深度學習的診斷識別算法,可準確地診斷識別軌道交通變壓器的多種工況。
1? 系統流程框架
基于CNN-LSTM的變壓器故障診斷流程框架如圖1所示。
首先,采集軌道交通變壓器的噪聲信號;然后,利用小波閾值去噪法對噪聲信號進行預處理,濾除干擾噪聲;接著,以線性預測倒譜系數(liner predictor cepstral coefficients, LPCC)和梅爾頻率倒譜系數(Mel-scale frequency cepstral coefficients, MFCC)的組合為特征向量,表征噪聲信號的特征;最后,將LPCC-MFCC特征向量輸入到CNN-LSTM模型進行故障診斷。
2數據采集及小波閾值去噪
本文利用拾音設備HS-26S采集某鐵路冷水牽引變電所主變壓器、某地鐵站牽引降壓混合變電所主變壓器、整流變壓器和動力變壓器運行時的42段噪聲信號樣本。采集時長5min,采樣頻率8kHz,采樣位數16位。變壓器的運行狀態分為正常運行、過負荷運行、放電和直流偏磁4種。
小波閾值去噪法具有算法簡單、計算速度快、適用范圍廣、去噪效果好等特點,適用于變壓器這種含有長持續時間低頻分量和短持續時間高頻分量的噪聲信號。小波閾值去噪參數選擇如下[6]:
小波函數,symN小波有良好的正則性和對稱性,由圖2可知,當symN小波的消失矩N為8時,均方誤差(mean squareerror,MSE)最小,去噪效果最好,故選sym8為小波函數;
確定分解層數M,由圖3可知,分解層數M取2時,MSE最小,故選取M為2;
選擇閾值,無偏似然估計閾值是一種自適應閾值的選擇方法,適用于變壓器噪聲這類含短時高頻分量、較多低頻分量的信號;
選擇閾值函數,本文選用硬閾值函數,其原理是將絕對值小于給定閾值的小波系數置0,絕對值大于給定閾值的小波系數保留,從而過濾掉噪聲信號中的干擾成分。
3特征提取
特征提取是從原始數據中提取有用的特征信息,達到降維的目的,有利于提高后續識別分類算法的泛化能力。本文分別提取噪聲信號的LPCC和MFCC特征,并將二者組合成特征向量。
3.1? LPCC
LPCC是以線性預測系數(linear predictor coefficients, LPC)為基礎的噪聲信號分析方法[7]。系統通過LPC分析,獲得的模型系統函數為
式中: 為第i階線性預測系數,p為系統的模型階數, 為系統的傳遞函數,z為復變量。
將得到的LPC,即 遞推到倒譜域,由LPC轉變到倒譜域的遞推關系式為
式中:m為LPCC的階數,c_m為第m階線性預測倒譜系數。
3.2? MFCC
MFCC是根據人耳聽覺特性提出來的,具有較高的魯棒性,且當信噪比降低時,仍具有較好的識別性能。MFCC特征向量提取步驟為[8]:
1)對噪聲信號預處理后進行離散傅里葉變換;
2)通過一組梅爾尺度的三角形濾波器組對頻譜進行平滑化,計算第m個濾波器組輸出的對數能量為
式中:X(k)為各幀信號的功率譜,H(k)為能量譜通過三角濾波器得到的頻率響應,M為梅爾濾波器總數,N為頻域中的譜線總條數;
3)進行離散余弦變換:
式中: 為倒譜系數, ,C為MFCC的數量;
4)計算MFCC的一階、二階差分系數,其計算公式為
式中: 為第t個一階差分系數, 為第t個倒譜系數,Q為倒譜系數的階數,K為一階導數的時間差,取值為1或2。
差分系數體現了信號的動態特征。將MFCC與一階、二階差分系數和幀能量進行組合,可提高識別分類系統的性能。
3.3? LPCC和MFCC組合
LPCC可較大程度地去除軌道交通變壓器噪聲信號的激勵信息,能近似逼近共振峰,反映變壓器的相應特性,但其抗噪性能較差,且無法很好地表征動態特性;MFCC抗噪能力強,且差分系數可以很好地表征動態特性,故將LPCC特征和MFCC特征進行組合,能更好地表征軌道交通變壓器噪聲信號在時域和頻域的特性。在將LPCC特征和MFCC特征進行組合時,先分別獲得LPCC和MFCC的特征向量,再將這二者進行組合,得到LPCC-MFCC組合特征向量。
4? CNN-LSTM模型
本文結合CNN和長短期記憶(long short-term memory, LSTM)網絡識別分類軌道交通變壓器噪聲信號的特點,提出一種改進模型——卷積循環神經網絡(CNN-LSTM)模型,其結構如圖4所示。
CNN-LSTM模型結構為:輸入層—3層雙向LSTM層—卷積神經網絡—全連接層—輸出層。其中,卷積神經網絡結構為:2個卷積層—最大池化層—2個卷積層—最大池化層,卷積層的激活函數為ReLU。該模型結合了LSTM善于學習時序數據特征和CNN強大的特征提取能力的優點,能夠更好地對軌道交通變壓器的運行狀態進行識別分類。
CNN特征提取部分:CNN對二維特征向量具有較強的提取能力,可有效地學習軌道交通變壓器噪聲信號的倒譜分布情況和局部時頻特征信息。其中,局部時頻特征信息是對輸入的變壓器噪聲信號特征的抽象概括,能表達變壓器同一工況下不同噪聲樣本的共同屬性,也包括了變壓器不同工況噪聲信號之間的判斷信息[9]。CNN將學習獲得的特征信息輸入到一個全連接層,此層激活函數為Softmax函數,用于輸出軌道交通變壓器不同工況類別的概率分布,選擇后驗概率最大的工況類型作為最后的預測結果[10]。
CNN層網絡結構參數設置如表1所示。
LSTM時序建模部分:軌道交通變壓器噪聲信號屬于序列數據,在時間維度上不同的幀之間具有長依賴關系,此關系蘊含了重要的信息。LSTM模塊能提取這種依賴關系,并實現前后序列特征的有效控制,使模型能很好地處理序列特征信號,故加入LSTM模塊,以獲得更好的識別準確率[11]。
5實驗結果分析
實驗采用Python基于TensorFlow和Keras框架搭建模型。為獲得充足的樣本數量以驗證CNN-LSTM模型的性能,將42段時長為5min的噪聲樣本,分割為2 559個時長為5 s的音頻樣本。為了驗證CNN- LSTM模型的泛化特征能力,按照70%訓練集、15%驗證集和15%測試集的比例進行分配。選用準確度(Accuracy)、精度(Precision)、召回率(Recall)和F1分數來評估實驗結果。
將LPCC、MFCC和LPCC-MFCC 3種特征向量分別輸入基于CNN、LSTM和CNN-LSTM的變壓器故障診斷模型中,通過實驗對比分析各項評價指標。3種特征向量的具體參數設置為:LPCC系數階數為39,系統模型的階數為10,得到維度為499×39的LPCC;梅爾濾波器階數為24,FFT變換點數為256,39維的MFCC包含12維標準特征和1維幀能量組成的13維靜態特征、13維的一階動態特征和13維的二階動態特征,維度為499×39;將39維MFCC和39維LPCC組合,輸入維度為499×78。
測試集在不同特征向量和網絡模型下識別的Accuracy、Precision、Recall和F1分數實驗結果分別如表2、3、4所示。
由表2、3、4可以看出,將3種特征向量輸入到不同的網絡模型進行識別分類時,LPCC-MFCC組合特征向量輸入的Accuracy、Precision、Recall和F1分數較高,且當LPCC-MFCC組合特征向量輸入到CNN-LSTM模型時,準確率達到99.48%,精度、召回率和F1分數均達到99.59%。
由圖5可以看出,在對軌道交通變壓器噪聲信號識別分類結果中,正確分類的真正例和真負例占大多數,說明LPCC-MFCC組合特征很好地描述了軌道交通變壓器運行時各工況的噪聲特征,同時也驗證了CNN-LSTM模型的高效性和準確性。
6結論
本文提出了一種基于噪聲信號的軌道交通變壓器故障診斷模型——CNN-LSTM模型,可以診斷識別出軌道交通變壓器的4種工況狀態,且實驗證明了該模型的高效性和準確性。模型中的LPCC-MFCC組合特征向量,很好地表征了軌道交通變壓器噪聲信號的特征,且模型融合了CNN和LSTM的特點,既具備CNN的高維度局部特征學習能力,又具備LSTM對前后幀長時依賴關系的學習能力。但該模型計算復雜度較高,下一步可以研究如何減少模型的計算復雜度;并且由于采集的樣本數據有限,不同種類變壓器的故障因素多樣,使實驗結論具有一定的局限性,下一步可以運用數據增強技術對數據量進行擴大,提高模型的泛化能力。
參考文獻
[1] JIANG B, WU Y, LU N, Et al. Review of fault diagnosis and prognosis techniques for high-speed railway traction system[J]. Control and Decision,2018,33(5):841-855.
[2] 原宇博.城市軌道交通車輛制動系統控制閥故障診斷方法[J].機電工程技術,2021,50(2):219-223.
[3] 張重遠,羅世豪,岳浩天,等.基于Mel時頻譜-卷積神經網絡的變壓器鐵芯聲紋模式識別方法[J].高電壓技術,2020,46(2): 413-423.
[4] Fang H, Deng J, Bai Y, et al. CLFormer: A lightweight transformer based on convolutional embedding and linear self-attention with strong robustness for bearing fault diagnosis under limited sample conditions[J]. IEEE Transactions on Instrumentation and Measurement, 2022,71:1-8.
[5] 杜世斌.基于音頻特征的電氣設備故障監測算法研究[D]. 濟南:山東大學,2014.
[6] JOSEPH S M, BABU A P. Wavelet energy based voice activity detection and adaptive thresholding for efficient speech coding[J]. International Journal of Speech Technology, 2016,19(3):537-550.
[7] GUPTA H, GUPTA D. LPC and LPCC method of feature extraction in Speech Recognition System[C]. 2016 6th International Conference-Cloud System and Big Data Enginee-ring (Confluence), 2016: 498-502.
[8] JO J, YOO H, PARK I-C. Energy-efficient floating-point MFCC extraction architecture for speech recognition systems[J]. IEEE Transactions on Very Large Scale Integration (VLSI) Systems,2016,24(2):754-758.
[9] HOCHREITER S, SCHMIDHUBER J. Long short-term memory[J]. Neural Computation, 1997,9(8):1735-1780.
[10] KRIZHEVSKY A, SUTSKEVER I, HINTON G E. ImageNet classification with deep convolutional neural networks[J]. Advances in Neural Information Processing Systems, 2017, 60(6):84-90.
[11] ABDEL-HAMID O, MOHAMED A-R, JIANG H, et al. Convolutional neural networks for speech recognition[J]. IEEE/ACM Transactions on Audio, Speech, and Language Processing, 2014,22(10):1533-1545.
作者簡介:
陳奇志,女,1970年生,工學碩士,研究員,主要研究方向:軌道交通供電自動化與信息化。E-mail:qizhi.chen@cdjdgm.com
趙沛舟,男,1998年生,碩士研究生,主要研究方向:模式識別、深度學習。E-mail:971894367@qq.com
趙海全(通信作者),男,1974年生,博士,教授,主要研究方向:自適應濾波、模式識別。E-mail:hqzhao_swjtu@126.com
蔡錦濤,男,1996年生,工學碩士,主要研究方向:模式識別、深度學習。E-mail:792780813@qq.com
謝昌富,男,1975年生,學士,高級工程師,主要研究方向:城市軌道交通供電系統設備與設計管理。E-mail:41324798@qq.com