劉云鵬, 王博聞, 韓 帥, 高 飛, 王 康, 張興輝
(1. 華北電力大學(xué)(保定) 河北省輸變電設(shè)備安全防御重點(diǎn)實(shí)驗(yàn)室, 河北 保定 071003;2. 中國(guó)電力科學(xué)研究院有限公司, 北京 100192;3. 國(guó)網(wǎng)福建省電力有限公司電力科學(xué)研究院, 福州 350007; 4. 國(guó)家電網(wǎng)公司, 北京 100031)
大型電力變壓器中的有載分接開關(guān)(on-load tap changer,OLTC)具有調(diào)節(jié)電壓的重要作用,其機(jī)械結(jié)構(gòu)比較復(fù)雜因此極易發(fā)生機(jī)械類故障[1]。以某省110 kV及以上變壓器統(tǒng)計(jì)為例,其中由OLTC引起的故障比重占18.13%,六成以上都是機(jī)械類故障。為了監(jiān)測(cè)OLTC機(jī)械狀態(tài),及時(shí)發(fā)現(xiàn)OLTC的異常動(dòng)作,目前已有許多研究將振動(dòng)檢測(cè)方法應(yīng)用于OLTC機(jī)械狀態(tài)監(jiān)測(cè)方法[2-5]。近年來,聲紋監(jiān)測(cè)技術(shù)也應(yīng)用于OLTC機(jī)械狀態(tài)監(jiān)測(cè)和診斷中[6-7]。振動(dòng)與聲紋為機(jī)械波在不同介質(zhì)中的表現(xiàn)形式,因此二者特征機(jī)理類似聲紋監(jiān)測(cè)在成本低廉、布置方式簡(jiǎn)單且空間敏感度低等方面具有獨(dú)特優(yōu)勢(shì)[6],然而在聲信號(hào)監(jiān)測(cè)過程中,判別系統(tǒng)易受到外界信號(hào)干擾發(fā)生誤動(dòng)或漏動(dòng),給后續(xù)診斷帶來困擾。因此在邊緣計(jì)算端需要一種能夠快速區(qū)分OLTC動(dòng)作信號(hào)與其他環(huán)境干擾信號(hào)的檢測(cè)方法。目前的聲信號(hào)檢測(cè)方法一般設(shè)計(jì)用于故障狀態(tài)識(shí)別,而沒有考慮對(duì)外界干擾的篩選,無法直接應(yīng)用于OLTC動(dòng)作聲信號(hào)的端點(diǎn)檢測(cè)。
對(duì)此,本文通過一種混合倒譜計(jì)算方法與輕量級(jí)卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)對(duì)OLTC動(dòng)作與干擾聲信號(hào)進(jìn)行快速區(qū)分。首先通過現(xiàn)場(chǎng)采集與人工混音的方式形成了聲信號(hào)樣本庫(kù),樣本庫(kù)包含1 320條OLTC動(dòng)作聲信號(hào)樣本與600條變壓器運(yùn)行環(huán)境下外界干擾聲信號(hào)樣本;其次,根據(jù)OLTC聲信號(hào)的頻率分布特性,分別采用梅爾倒譜系數(shù)(Mel frequency cepstral coefficient, MFCC)、伽馬通濾波倒譜系數(shù)(Gammatone filter cepstral coef-ficient, GFCC),冪律歸一化倒譜系數(shù)(power-normalized cepstral coefficient, PNCC)對(duì)原始信號(hào)進(jìn)行降維與初步特征提取;最后,引入類視覺幾何組(visual geometry group,VGG)結(jié)構(gòu)的卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks, CNN)將MFCC,GFCC,PNCC三重特征進(jìn)行混合,構(gòu)成OLTC聲信號(hào)與干擾信號(hào)二分類模型,并通過數(shù)據(jù)集驗(yàn)證模型的有效性。
實(shí)現(xiàn)聲紋辨識(shí)模型的訓(xùn)練,需要積累類型多樣、數(shù)量可觀的OLTC動(dòng)作和外界干擾聲信號(hào)數(shù)據(jù)。為此本文從現(xiàn)場(chǎng)和實(shí)驗(yàn)室兩方面構(gòu)建了OLTC動(dòng)作聲信號(hào)數(shù)據(jù)集、從現(xiàn)場(chǎng)和公開數(shù)據(jù)集兩方面構(gòu)建外界干擾聲信號(hào)數(shù)據(jù)集。另外,為了還原變壓器本體聲紋的背景干擾,本文采集了1 800例變壓器本體聲紋數(shù)據(jù),以提高聲紋辨識(shí)模型的泛用性。
OLTC聲信號(hào)數(shù)據(jù)集主要由現(xiàn)場(chǎng)采集與實(shí)驗(yàn)室采集兩部分組成。
1.1.1 現(xiàn)場(chǎng)采集
在±800 kV金華換流站進(jìn)行了OLTC動(dòng)作聲信號(hào)現(xiàn)場(chǎng)采集。現(xiàn)場(chǎng)采集情況如圖1所示。

圖1 換流變壓器中的OLTC動(dòng)作聲信號(hào)采集Fig.1 Acoustic signal acquisition of OLTC in converter transformer
現(xiàn)場(chǎng)采集于該站停電大修期間開展,檔位升降為手動(dòng)控制,對(duì)每臺(tái)OLTC升檔與降檔分別采集15例,具體的數(shù)據(jù)樣本分布,如表1所示。

表1 OLTC現(xiàn)場(chǎng)聲數(shù)據(jù)樣本分布Tab.1 Distribution of OLTC acoustic data samples in actual scene
采集設(shè)備選用具有指向型的槍式電容麥克風(fēng)在OLTC控制箱附近進(jìn)行采集,指向型麥克風(fēng)能夠減弱其他方向的噪音影響,提高樣本質(zhì)量。由于OLTC信號(hào)大量分布在可聽聲頻段內(nèi),因此麥克風(fēng)的頻率響應(yīng)范圍為20 Hz~20 kHz,配合使用的錄機(jī)信號(hào)采集頻率設(shè)為48 kHz,后續(xù)采集聲紋的設(shè)備與參數(shù)配置相同,不再贅述。
1.1.2 實(shí)驗(yàn)室采集
為了獲得更為豐富的OLTC聲信號(hào)樣本,增強(qiáng)后續(xù)端點(diǎn)檢測(cè)模型的泛用性,研究在數(shù)據(jù)樣本中加入OLTC傳動(dòng)機(jī)構(gòu)卡澀和內(nèi)部組件松動(dòng)兩種典型OLTC故障的模擬聲紋樣本。
實(shí)驗(yàn)室聲紋樣本基于一套CM型110 kV分接開關(guān)模型,試驗(yàn)平臺(tái)參數(shù),如表2所示。

圖2 實(shí)驗(yàn)室搭建的OLTC聲信號(hào)采集平臺(tái)Fig.2 OLTC acoustic signal acquisition platform built in laboratory

表2 OLTC試驗(yàn)平臺(tái)參數(shù)Tab.2 OLTC experimental platform parameters
兩種典型機(jī)械故障布置,如圖3所示。試驗(yàn)平臺(tái)分別使用在傳動(dòng)齒輪處加入木屑和擰松緊固螺栓的方式模擬傳動(dòng)機(jī)構(gòu)卡澀和緊固件松動(dòng)兩種故障。完成故障布置后,將不同狀態(tài)的OLTC進(jìn)行換擋操作,并開展聲信號(hào)采集。OLTC實(shí)驗(yàn)室聲音數(shù)據(jù)樣本分布,如表3所示。

(a) 傳動(dòng)機(jī)構(gòu)卡澀

(b) 內(nèi)部組件松動(dòng)圖3 OLTC試驗(yàn)平臺(tái)故障布置Fig.3 Fault arrangement of OLTC experimental platform

表3 OLTC實(shí)驗(yàn)室聲音數(shù)據(jù)樣本分布Tab.3 Distribution of acoustic data samples from OLTC experimental platform
本文使用ESC-50[8]公開數(shù)據(jù)集與自采集的變壓器處環(huán)境噪聲作為環(huán)境聲干擾數(shù)據(jù)集,數(shù)據(jù)集樣本分布如表4所示。其中,ESC-50數(shù)據(jù)集包括50類各種常見的日常聲音事件,聲音樣本與變壓器所處環(huán)境噪聲具有一定差異,因此研究額外采集并補(bǔ)充了10類變電站內(nèi)的噪音數(shù)據(jù)集,包括刀閘開合、電暈放電、電鉆等噪聲用于提高后續(xù)檢測(cè)模型在變壓器場(chǎng)景下的適用性與泛化性。

表4 環(huán)境干擾聲音數(shù)據(jù)樣本分布Tab.4 Environmental interference acoustic data sample distribution
由于現(xiàn)場(chǎng)狀態(tài)下的OLTC動(dòng)作聲信號(hào)一般存在變壓器本體聲信號(hào)背景噪聲,因此本文在河北省22個(gè)500 kV變電站進(jìn)行了變壓器本體聲信號(hào)樣本采集,并以O(shè)LTC時(shí)域信號(hào)峰值為基準(zhǔn),對(duì)背景噪聲進(jìn)行幅值調(diào)整后疊加于1.1節(jié)的OLTC動(dòng)作聲與1.2節(jié)的干擾聲中,從而模擬現(xiàn)場(chǎng)聲紋環(huán)境。在疊加過程中,將從1 800例變壓器本體聲音數(shù)據(jù)中隨機(jī)抽取樣本作為背景噪聲,以增強(qiáng)與驗(yàn)證后續(xù)檢測(cè)模型在現(xiàn)場(chǎng)應(yīng)用的效果。變壓器本體聲音數(shù)據(jù)樣本分布,如表5所示。

表5 變壓器本體聲音數(shù)據(jù)樣本分布Tab.5 Sample distribution of transformer sound data
聲信號(hào)識(shí)別整體流程,如圖4所示。流程主要包括聲信號(hào)的預(yù)處理和模式識(shí)別兩部分,其中信號(hào)預(yù)處理的主要作用是對(duì)變壓器原始時(shí)域信號(hào)的特征提取和數(shù)據(jù)壓縮,從而減少后續(xù)識(shí)別模型的運(yùn)算量、提升識(shí)別效果。

圖4 聲信號(hào)辨識(shí)流程Fig.4 Acoustic signal identification process
首先將疊加變壓器本體運(yùn)行噪聲后的時(shí)域聲信號(hào)轉(zhuǎn)化為具有時(shí)域頻域兩個(gè)維度的時(shí)頻譜圖,然后通過計(jì)算MFCCs,GFCCs與PNCCs等3種倒譜對(duì)原始時(shí)頻譜進(jìn)行特征提取和降維,后續(xù)作為卷積神經(jīng)網(wǎng)絡(luò)的輸入層。
由于原始的聲信號(hào)的特征有限,因此一般需要通過將原始的時(shí)域聲信號(hào)進(jìn)行頻譜分析,將不同時(shí)間內(nèi)的頻譜信息組合呈現(xiàn)為特征更為直觀、信息更為豐富的時(shí)頻譜圖,用于后期機(jī)器學(xué)習(xí)等識(shí)別算法的訓(xùn)練。該過程主要包含了分幀、加窗以及離散傅里葉變換。
首先,對(duì)5 s的原始時(shí)域聲信號(hào)進(jìn)行交疊分段的分幀操作,考慮有載分接開關(guān)動(dòng)作的暫態(tài)特性,本文選擇幀長(zhǎng)為0.1 s,幀移為0.05 s。
其次,為削弱傅里葉變換帶來的頻譜泄漏影響,還需要將每幀時(shí)域數(shù)據(jù)進(jìn)行加窗處理。本文選取的是具有較好的時(shí)間和頻率聚集特性的漢明窗(Hamming),即
w(n)=

(1)
式中,N為漢明窗的長(zhǎng)度,由幀長(zhǎng)和采樣率決定。
最后,對(duì)波形片段進(jìn)行短時(shí)離散傅里葉變換,計(jì)算公式為式(2),即可得到能夠同時(shí)描述時(shí)間與頻率的時(shí)頻譜。時(shí)頻譜圖中的橫坐標(biāo)為時(shí)間,縱坐標(biāo)為頻率,條紋狀的圖形的顏色代表當(dāng)前頻率在該時(shí)刻含量的大小,由功率譜密度(power spectral density,PSD)表示。

0≤n且k≤N-1
(2)
式中:k為頻點(diǎn)序號(hào);x(m,n),X(m,k)分別為第m幀原始離散時(shí)域信號(hào)和第m幀的頻譜分布。由以上步驟可得到不同廠家的OLTC動(dòng)作聲信號(hào)時(shí)頻譜圖對(duì)比,如圖5所示;外界干擾聲信號(hào)時(shí)頻譜圖,如圖6所示。由于數(shù)據(jù)庫(kù)樣本類型較多,限于篇幅此處僅展示部分時(shí)頻譜圖。

(a) 西電

(b) 華明

(c) MR

(d) 西門子圖5 不同廠家OLTC聲信號(hào)時(shí)頻譜圖對(duì)比Fig.5 Comparison of OLTC sound signal spectrum from different manufacturers

(a) 刀閘動(dòng)作聲

(b) 汽笛聲

(c) 電鋸聲

(d) 鳥鳴聲圖6 不同環(huán)境干擾聲信號(hào)時(shí)頻譜圖對(duì)比Fig.6 Comparison of interference sound signal frequency spectrum in different environments
OLTC多數(shù)故障發(fā)生在切換指令發(fā)出后30 s以內(nèi),因此相關(guān)聲紋監(jiān)測(cè)手段對(duì)實(shí)時(shí)性要求極高。本文中測(cè)得的OLTC動(dòng)作聲信號(hào)單樣本的數(shù)據(jù)量可達(dá)近22萬個(gè)數(shù)據(jù),為了快速準(zhǔn)確對(duì)聲信號(hào)進(jìn)行辨識(shí),需在保留辨識(shí)特征的前提下對(duì)樣本數(shù)據(jù)進(jìn)行壓縮處理。
各種倒譜系數(shù)都具備信號(hào)降維與特征提取功能,不同倒譜系數(shù)都具有各自優(yōu)勢(shì)和局限性,因此許多研究[9-10]將多種倒譜進(jìn)行混合使用,以獲得更好的特征提取效果。在各類倒譜系數(shù)中,MFCC的構(gòu)建基礎(chǔ)是聽覺模型,GFCC的構(gòu)建基礎(chǔ)是耳膜模型,而PNCC在噪聲背景下的聲音特征更具有優(yōu)勢(shì),以上倒譜在語音識(shí)別領(lǐng)域都已經(jīng)得到了一定程度的應(yīng)用[10-11],因此本研究選取MFCC,GFCC[12],PNCC[13]作為基礎(chǔ)倒譜特征,構(gòu)成倒譜特征矩陣,用于后續(xù)的特征融合和聲信號(hào)識(shí)別,計(jì)算流程如圖7所示。

圖7 聲信號(hào)倒譜特征矩陣計(jì)算流程圖Fig.7 Calculation flow chart of acoustic signal cepstrum characteristic matrix
(1) MFCC計(jì)算
MFCC是基于人耳聽覺感知特性的一種倒譜參數(shù),在頻域人耳聽到的聲音高低與頻率不成線性關(guān)系,而在Mel域,人耳感知與Mel頻率是成正比的。其關(guān)系可以用式(3)表達(dá)
Mel(f)=2 595lg(1+f/700)
(3)
梅爾頻率倒譜系數(shù)的計(jì)算是以幀為單位進(jìn)行的,以下為梅爾頻率倒譜系數(shù)的具體計(jì)算步驟。
步驟1按式(1)計(jì)算得到每幀頻譜X(m,k),對(duì)X(m,k)取模后平方得到功率譜。將功率譜通過頻域?yàn)槿切蔚腗el尺度濾波器組得到新的參數(shù)R,濾波器組頻率下限為fmin,上限為fmax,G為Mel濾波器數(shù)量。
步驟2將R(m,k)取自然對(duì)數(shù)
(4)
步驟3通過離散余弦變換得到G維MFCC

0 (5) 步驟4需要進(jìn)行均值歸一化。經(jīng)上述步驟便可得到G維的MFCC。 (2) GFCC計(jì)算 GFCC的提取過程與MFCC提取過程幾乎相同,兩者區(qū)別在于功率譜通過的濾波器組是由G個(gè)不同尺度參數(shù)和形狀參數(shù)的伽馬濾波器組成的Gammatone濾波器組,而非Mel尺度濾波器,濾波器組頻率下限為fmin,上限為fmax,后續(xù)步驟也相同。最終得到GFCC特征矩陣CGFCC(m,j)。 (3) PNCC計(jì)算 PNCC的提取過程的前兩個(gè)步驟與GFCC相同,當(dāng)功率譜通過Gammatone濾波器后得到Pg(m,g)。其中,Mw為平滑窗口的大小,一般將每一幀與前后兩幀做平滑處理,此時(shí)Mw=1計(jì)算中時(shí)平均功率 (6) (7) g1=max(g-gw,1) (8) g2=min(g+gw,G) (9) 式中,gw設(shè)為4。 (10) 利用平均功率估計(jì)值μ[m]可對(duì)Tg[m,g]進(jìn)行平均功率歸一化 (11) (12) 式中,λμ為系數(shù),可設(shè)置為任意常數(shù)。 為了更加接近人耳聽覺神經(jīng)的壓縮感知特性,不同于MFCC所采用對(duì)數(shù)非線性,PNCC采用冪律非線性壓縮 Vg[m,g]=Ug[m,g]1/15,0 (13) 最終進(jìn)行離散余弦變換和均值歸一化即可得到PNCC特征矩陣CPNCC(m,j)。 分別完成MFCC,GFCC,PNCC計(jì)算后,將三者合并為一個(gè)3維的倒譜特征矩陣。本文的聲原始時(shí)頻譜數(shù)據(jù)尺寸為498×24 000,經(jīng)過信號(hào)降維與特征提取后的倒譜特征矩陣數(shù)據(jù)尺寸變?yōu)?98×40×3,其中:498為時(shí)域分量;40為倒譜特征矩陣的頻域分量;3為聲信號(hào)的MFCC,GFCCs,PNCC 3層倒譜特征。倒譜特征矩陣的計(jì)算在保留聲紋特征的基礎(chǔ)上能夠提升了后續(xù)深度學(xué)習(xí)的運(yùn)算效率。 卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)作為一種典型前饋型深度學(xué)習(xí)網(wǎng)絡(luò),在非線性映射和局部特征提取方面都具有顯著優(yōu)勢(shì)[14]。在圖像識(shí)別領(lǐng)域,CNN往往將彩色圖像拆分為紅綠藍(lán)(RGB)3個(gè)顏色層作為網(wǎng)絡(luò)的輸入層,從而對(duì)不同色彩變化的特征進(jìn)行學(xué)習(xí)感知。相似地,本研究將聲信號(hào)的3種倒譜構(gòu)成的倒譜特征矩陣作為輸入層,構(gòu)建混合倒譜-卷積神經(jīng)網(wǎng)絡(luò)(mixed cepstrum-convolutional neural network,MC-CNN)識(shí)別模型,從而進(jìn)行聲音分類識(shí)別。相較于人工設(shè)計(jì)的倒譜混合方法,通過深度神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)機(jī)制對(duì)3種倒譜進(jìn)行融合能夠使混合倒譜的融合方式具有自適應(yīng)性。 為保證深度學(xué)習(xí)的有效性,在進(jìn)行模型訓(xùn)練時(shí)需要對(duì)樣本數(shù)據(jù)進(jìn)行數(shù)據(jù)集劃分:從1 320例OLTC動(dòng)作案例中隨機(jī)抽取480例作為訓(xùn)練集,120例作為測(cè)試集;外界干擾聲音案例共600例,隨機(jī)抽取480例作為訓(xùn)練集,120例作為測(cè)試集。最終形成數(shù)據(jù)集樣本分布,如表6所示。所有數(shù)據(jù)首先按照1.3節(jié)方法隨機(jī)疊加變壓器背景噪聲,然后按照第2章中的方法算得各自的倒譜特征矩陣,最終將所有帶有標(biāo)簽的倒譜特征矩陣樣本按隨機(jī)順序輸入到CNN網(wǎng)絡(luò)進(jìn)行訓(xùn)練。 表6 聲音數(shù)據(jù)庫(kù)樣本分布Tab.6 Sample distribution of acoustic database 經(jīng)過結(jié)構(gòu)參數(shù)優(yōu)化后,本文研究構(gòu)建了一個(gè)包含3層卷積-池化層的類VGG[15]小尺度CNN網(wǎng)絡(luò),詳細(xì)結(jié)構(gòu)如表7所示。在該網(wǎng)絡(luò)中,Dropout概率設(shè)置為0.5;為了加快收斂速度并防止梯度消失現(xiàn)象,進(jìn)行了批規(guī)范化操作[16]。 表7 用于OLTC聲紋識(shí)別的CNN網(wǎng)絡(luò)結(jié)構(gòu)Tab.7 CNN structure for the OLTC voiceprint recognition 為了提高模型性能,研究對(duì)MC-CNN識(shí)別模型進(jìn)行學(xué)習(xí)率(learning rate,LR)和批尺寸(batch size,BS)進(jìn)行了優(yōu)化。 3.3.1 學(xué)習(xí)率參數(shù)調(diào)節(jié) MC-CNN識(shí)別模型的訓(xùn)練集損失率,如圖8所示。過高的學(xué)習(xí)率會(huì)在迭代次數(shù)增加后降低學(xué)習(xí)效率,過低的學(xué)習(xí)率則會(huì)減慢訓(xùn)練速度。由測(cè)試結(jié)果可知,當(dāng)學(xué)習(xí)率為0.000 1時(shí),訓(xùn)練集損失率下降較為穩(wěn)定且訓(xùn)練速度較快。 圖8 不同學(xué)習(xí)率對(duì)MC-CNN模型的損失率影響Fig.8 Loss of MC-CNN model with different learning rate 3.3.2 批尺寸參數(shù)調(diào)節(jié) 批尺寸越小則誤差越小。但批尺寸減小會(huì)導(dǎo)致訓(xùn)練時(shí)間延長(zhǎng),因此需要平衡準(zhǔn)確率、誤差和訓(xùn)練時(shí)間等指標(biāo)最終確定訓(xùn)練參數(shù)。平均每次迭代的訓(xùn)練時(shí)間、最終準(zhǔn)確率和到達(dá)最終準(zhǔn)確率所需迭代次數(shù),如表8所示。可見當(dāng)批尺寸為32和40時(shí)準(zhǔn)確率下降,當(dāng)批尺寸為8,16,24時(shí)準(zhǔn)確率都達(dá)到了100%,綜合考慮迭代速度后,認(rèn)為批尺寸為24時(shí)識(shí)別模型的性能最優(yōu)。 表8 不同批尺寸訓(xùn)練時(shí)間對(duì)比Tab.8 Comparison of iteration time of different batch size 通過對(duì)學(xué)習(xí)率和批尺寸的優(yōu)化,得到最終的MC-CNN識(shí)別模型。為更加直觀地展示模型的識(shí)別效果,本文將深度學(xué)習(xí)模型進(jìn)行了100次迭代,結(jié)果如圖9所示。MC-CNN模型在迭代了80次之后,測(cè)試集識(shí)別準(zhǔn)確率在99%~100%小幅波動(dòng),迭代100次時(shí)損失率為0.001左右。 圖9 MC-CNN模型識(shí)別準(zhǔn)確率與損失率Fig.9 Recognition accuracy rate and loss rate of MC-CNN model 為進(jìn)一步驗(yàn)證本文提出方法的有效性,對(duì)MC-CNN,MFCC-CNN,GFCC-CNN,PNCC-CNN以及常規(guī)CNN模型的辨識(shí)成功率和運(yùn)算時(shí)間進(jìn)行了對(duì)比。在類VGG模型框架下,經(jīng)過參數(shù)調(diào)優(yōu)后,結(jié)果如表9所示。可見MC-CNN模型在識(shí)別成功率上表現(xiàn)最佳,樣本運(yùn)算時(shí)間相較于常規(guī)CNN方法具有明顯提升,證明了本文所提出MC-CNN聲識(shí)別模型的優(yōu)越性。與使用單獨(dú)某種倒譜系數(shù)預(yù)處理方法的方法相比,MC-CNN使用更多類型的倒譜特征能夠適應(yīng)種類繁雜的外界干擾聲信號(hào)與信噪比不同背景噪聲環(huán)境,犧牲了部分計(jì)算速度的但提高了準(zhǔn)確率。 表9 OLTC與環(huán)境干擾聲音辨識(shí)方法對(duì)比Tab.9 Comparison of OLTC sound and environmental noise identification methods 與直接使用時(shí)頻譜圖輸入CNN網(wǎng)絡(luò)進(jìn)行訓(xùn)練和識(shí)別的方法相比,MC-CNN經(jīng)過了混合倒譜計(jì)算的預(yù)處理后,數(shù)據(jù)量計(jì)算量大幅下降,樣本的數(shù)據(jù)減少也意味著降低了深度神經(jīng)網(wǎng)絡(luò)的識(shí)別難度,因此能夠提升識(shí)別率和降低識(shí)別時(shí)間。 3.3.3 外界干擾信號(hào)對(duì)識(shí)別效果的影響 由于現(xiàn)場(chǎng)運(yùn)行環(huán)境復(fù)雜,有可能出現(xiàn)OLTC動(dòng)作信號(hào)與外界干擾信號(hào)同時(shí)出現(xiàn)的情況,因此,需要對(duì)此類情況進(jìn)行識(shí)別效果驗(yàn)證。 首先,從3.1節(jié)測(cè)試集中進(jìn)行了隨機(jī)抽取與排列組合,并進(jìn)行混疊,形成了500例樣本,如圖10所示為兩個(gè)樣例的時(shí)頻譜圖。 (a) 西電+鳥鳴 (b) 西門子+連續(xù)汽笛圖10 外界干擾信號(hào)與OLTC動(dòng)作信號(hào)混合的時(shí)頻譜圖Fig.10 Spectrum diagram of mixing external interference signal and OLTC action signal 然后,利用已訓(xùn)練好的識(shí)別模型進(jìn)行測(cè)試,用來檢測(cè)在有外界干擾信號(hào)存在的情況下該模型對(duì)OLTC動(dòng)作信號(hào)的識(shí)別能力。 測(cè)試結(jié)果表明,本文中的MC-CNN能夠?qū)?8.4%的樣本識(shí)別為OLTC動(dòng)作,而對(duì)1.6%的樣本識(shí)別為環(huán)境干擾信號(hào)。其中,識(shí)別為環(huán)境干擾的樣本典型案例如圖10(b)所示,此類樣本具有以下特點(diǎn):① 環(huán)境干擾信號(hào)強(qiáng)度較大,導(dǎo)致OLTC信號(hào)信噪比過低;② 環(huán)境干擾信號(hào)為持續(xù)時(shí)間較長(zhǎng),導(dǎo)致樣本的全部時(shí)段都被環(huán)境干擾信號(hào)覆蓋。針對(duì)此類持續(xù)性強(qiáng)干擾下OLTC動(dòng)作聲信號(hào)的識(shí)別,目前有待后續(xù)研究,但在實(shí)際應(yīng)用時(shí),可通過將聲信號(hào)傳感器放置位置靠近OLTC本體的方式提高信噪比,從而改善識(shí)別準(zhǔn)確率。 本文對(duì)OLTC聲信號(hào)快速辨識(shí)方法進(jìn)行了研究。通過采集現(xiàn)場(chǎng)及實(shí)驗(yàn)室的OLTC聲信號(hào)和環(huán)境干擾信號(hào),構(gòu)建數(shù)據(jù)集,建立MC-CNN模型對(duì)信號(hào)進(jìn)行識(shí)別,得到的主要結(jié)論如下: (1) 不同廠家生產(chǎn)的OLTC聲音時(shí)頻譜特征各異,同時(shí)外界干擾信號(hào)種類繁多,直接使用幅值、峰峰值等人工設(shè)計(jì)的特征值提取手段進(jìn)行區(qū)分比較困難。 (2) 采用混合倒譜的降維處理方式,可將計(jì)算數(shù)據(jù)量壓縮2 000倍,能夠提取特征的同時(shí)有效降低原始數(shù)據(jù)的維度,提升了后續(xù)算法模型的識(shí)別速度和準(zhǔn)確率。 (3) 混合時(shí)頻譜圖結(jié)合CNN能夠?qū)LTC動(dòng)作與外界干擾信號(hào)進(jìn)行準(zhǔn)確區(qū)分,在本文的數(shù)據(jù)樣本測(cè)試集中,混合時(shí)頻譜圖的成功率高于單個(gè)時(shí)頻譜預(yù)處理和無預(yù)處理的CNN模型,且有較快的識(shí)別速度,證明了本文所提出Mel-CNN聲音識(shí)別模型的有效性。通過本文的方法與OLTC故障聲紋診斷算法相結(jié)合,能夠?qū)崿F(xiàn)在無電氣連接的情況下對(duì)OLTC進(jìn)行機(jī)械狀態(tài)監(jiān)控,對(duì)工程應(yīng)用有一定借鑒價(jià)值。

3 基于卷積神經(jīng)網(wǎng)絡(luò)的聲信號(hào)辨識(shí)
3.1 訓(xùn)練數(shù)據(jù)集與測(cè)試數(shù)據(jù)集

3.2 網(wǎng)絡(luò)結(jié)構(gòu)

3.3 訓(xùn)練參數(shù)優(yōu)化與識(shí)別模型結(jié)果






4 結(jié) 論