周靜雷, 周 智, 崔 琳
(西安工程大學(xué) 電子信息學(xué)院,西安 710600)
揚(yáng)聲器被廣泛的應(yīng)用在手機(jī)、耳機(jī)、智能音箱、家庭影院、筆記本電腦等設(shè)備上,其品質(zhì)的好壞直接決定人們的音效體驗。因此無論在揚(yáng)聲器的研發(fā)、制樣及生產(chǎn)環(huán)節(jié),都需要對揚(yáng)聲器進(jìn)行異常聲檢測。有無異常聲已是揚(yáng)聲器的關(guān)鍵必檢特性之一。而檢測的準(zhǔn)確性、時效性和自動化,對于揚(yáng)聲器生產(chǎn)而言,具有重要意義[1]。
揚(yáng)聲器異常聲檢測一般由激勵及響應(yīng)捕捉、響應(yīng)信號的特征提取、特征選擇以及分類構(gòu)成。由于揚(yáng)聲器的異常聲信號是非線性非平穩(wěn)信號[2]。對于此類信號,一般采用時頻域分析的方法,以提取最佳的信號特征[3]。特征提取的方法主要有高階諧波失真(high-order harmonic distor-tion)[4]、短時傅里葉變換(short-time Fourier transform,STFT)[5]、小波包分解(wavelet packet decomposition,WPD)[6]、經(jīng)驗?zāi)B(tài)分解(empirical mode decomposition,EMD)[7]。高階諧波失真提取法需要有經(jīng)驗的工程師設(shè)置合理的門限;STFT分辨率單一,依賴選擇的窗函數(shù),缺乏自適應(yīng)性[8];WPD雖然可以同時分解低頻與高頻信號,但是其受小波函數(shù)、信號采樣頻率等影響,存在能量泄露問題[9];EMD分解具有良好的自適應(yīng)性,但是易出現(xiàn)模態(tài)混疊和端點效應(yīng)[10]。VMD分解[11]相比EMD,有更好的抗模態(tài)混疊和降噪性能[12]。VMD分解被廣泛的應(yīng)用在機(jī)械故障診斷[13]以及心音信號[14]處理,本論文在文獻(xiàn)[15]的研究基礎(chǔ)上,著重討論特征選擇及不同分類方法在異常聲檢測中的應(yīng)用。
特征選擇[16]是為了篩選出最有效的特征、降低特征空間維數(shù)以達(dá)到最高的分類精度。依據(jù)評價方式,可分為過濾式(Filter)和封裝式(Wrapper)[17]兩種。Filter式采用某種評價準(zhǔn)則或搜索策略進(jìn)行特征子集選擇,計算效率比較高[18],但不能與具體的分類器結(jié)合,特征子集的冗余較高、分類效果較差;Wrapper式則直接以分類性能的好壞作為特征子集的評價標(biāo)準(zhǔn),在合理的學(xué)習(xí)算法中得到的較好的特征子集和分類性能[19]。隨機(jī)森林(random forest,RF)是一種典型的Wrapper式特征選擇算法,其內(nèi)置了特征重要性評價機(jī)制,在高效特征選擇的同時,還能保持著較好的選擇效果。為了選取最優(yōu)的特征選擇效果,提出了基于隨機(jī)森林結(jié)合遞歸特征消除[20](random forest and recursive feature elimination,RF-RFE)的特征選擇算法。
揚(yáng)聲器異常聲檢測中,通常采用特征距離公式、BP神經(jīng)網(wǎng)絡(luò)[21]、支持向量機(jī)(support vector machine,SVM)[22]等方法對異常聲進(jìn)行分類。但是特征距離公式通常只能檢測出是否有異常聲,不能判斷異常聲的類別;SVM雖然可以進(jìn)行多分類,但其依賴選擇的核函數(shù),消耗時間較長。RF是一種集成模型,相比SVM有著更強(qiáng)的魯棒性和分類效果,適用于多分類問題,本文選用RF作為分類器。
為了更好提取揚(yáng)聲器異常聲最佳的信號特征、有效提高診斷系統(tǒng)分類性能,本文提出了基于VMD與RF-RFE的揚(yáng)聲器異常聲分類方法。首先,對揚(yáng)聲器單元的聲響應(yīng)信號進(jìn)行VMD預(yù)分解,根據(jù)中心頻率相近法確定VMD分解后的模態(tài)K的個數(shù),之后以確定的K值對揚(yáng)聲器單元聲響應(yīng)信號進(jìn)行VMD分解,提取每個模態(tài)的時、頻域特征構(gòu)成原始特征數(shù)據(jù)集;其次使用RF-RFE模型對原始特征集進(jìn)行特征選擇,確定最優(yōu)特征個數(shù)以及最優(yōu)特征子集;最后將得到的最優(yōu)特征子集輸入至RF算法中進(jìn)行判斷,輸出分類結(jié)果。試驗表明本文提出的方法能夠有效地診斷揚(yáng)聲器的故障類型。
VMD以各模態(tài)帶寬最小和原則,采用非遞歸方式搜尋變分模型最優(yōu)解。其實質(zhì)為如式(1)所示的變分約束問題的求解
(1)

其具體求解步驟為:

步驟2更新迭代次數(shù)n=n+1;
步驟3fork=1∶K
(2)
(3)
步驟4采用對偶上升法,更新
(4)
式中:n+1為迭代次數(shù);τ為噪聲容限,一般情況下τ=0。
步驟5重復(fù)步驟1~步驟4,直到滿足收斂條件
(5)
式中,ε為收斂精度,大小通常為10-6。
VMD分解之后,分別求得各模態(tài)波形因子(Es)(X1)、波峰因子(Ec)(X2)、脈沖因子(Ed)(X3)、最大值(X4)、平均值(X5)、標(biāo)準(zhǔn)差(X6)、均方根值(X7)、方差(X8)、最小值(X9)、峰峰值(X10)、均方幅值(X11)、平均幅值(X12)、峭度(Eku)(X13)、偏度(Esk)(X14)、能量熵(Eentropy)(X15)、排列熵[23](X16)、過零點數(shù)(X17)、VMD分解中心頻率(X18)以及VMD-Hilbert時頻熵(Et)(X19)構(gòu)成原始的特征向量。對長度為N的模態(tài)分量ui,部分特征的計算公式為
(6)
(7)
(8)
(9)
(10)
(11)
(12)
隨機(jī)森林是一種集成算法,由多顆子樹構(gòu)成,每一顆子樹均通過Bootstrap抽樣方法產(chǎn)生,每一顆子樹的分布相同且獨立,最后由分類樹投票的多少決定新數(shù)據(jù)的分類。隨機(jī)森林算法不僅具有模型簡單、分類效果好的特點,同時其魯棒性強(qiáng),不易過擬合,因此被廣泛的應(yīng)用在各種分類、預(yù)測以及特征選擇等相關(guān)問題當(dāng)中[24]。
利用RF-RFE進(jìn)行特征選擇包含特征重要性計算和遞歸特征消除兩個部分。特征重要性計算是RF內(nèi)嵌的功能,以袋外(out-of-bag,OOB)數(shù)據(jù)分類準(zhǔn)確率的變量為評價準(zhǔn)則。
假設(shè)有bootstrap樣本k=1,2,…,K,K表示訓(xùn)練樣本的個數(shù),每個樣本有N個特征,特征重要性排序的計算步驟如下:
步驟1初始化k=1,創(chuàng)建決策樹Tk;


步驟4對于k=2,3,…,K重復(fù)步驟1~步驟3。
步驟5特征Xj的重要性度量Pj通過式(13)計算
(13)
步驟6對Pj降序排列,得到特征重要性排序。
將排序好的特征輸入至遞歸特征消除算法中,反復(fù)構(gòu)建模型,選出得分最高的特征放到最優(yōu)特征子集中,之后剩余的特征重復(fù)上述過程,直到遍歷所有特征后停止,最終得到最佳的特征數(shù)量和最優(yōu)的特征子集。
本文提出的分類方法分為 VMD信號分解及特征提取、基于 RF-RFE的特征選擇和基于RF的分類 3個階段,如圖1所示。
第一階段,對采集到的揚(yáng)聲器響應(yīng)信號進(jìn)行VMD分解,得到K個模態(tài)分量,分別提取每個模態(tài)的時域及頻域特征,構(gòu)成原始的特征數(shù)據(jù)集;
第二階段,將原始的特征數(shù)據(jù)集輸入至RF中,得到特征重要性排序,再通過RFE得到最佳的特征數(shù)量和最優(yōu)的特征子集,將特征子集劃分為訓(xùn)練樣本和測試樣本;
第三階段,使用訓(xùn)練樣本集訓(xùn)練RF分類器,之后使用測試樣本集對訓(xùn)練所得的RF模型進(jìn)行測試,最后輸出分類結(jié)果。
試驗采用諧振頻率為180 Hz的3580-3型彩電揚(yáng)聲器單元,阻抗為6 Ω,額定功率為10 W,該型號揚(yáng)聲器異常聲多發(fā)于低頻段,揚(yáng)聲器單元在其諧振頻率的附近振幅將達(dá)到最大,更容易激發(fā)出潛在的異常聲。在進(jìn)行揚(yáng)聲器單元測量時,使用高頻到低頻的掃描方式可以有效減少其穩(wěn)定時間[25]。因此,本次試驗采用1 800~20 Hz的連續(xù)對數(shù)掃頻信號,其時域圖如圖2所示,由高頻到低頻的掃描方式激勵被測揚(yáng)聲器單元,激勵時長為1 s,激勵電壓為1 V。本次試驗所采用的平臺如圖3所示。
本次試驗共測試了良品、異物、缺膠、碰圈、脫盆架、音小、紙盆聲7種狀態(tài)下的揚(yáng)聲器單元,每種狀態(tài)下的揚(yáng)聲器單元各14個。其中異物指揚(yáng)聲器單元中存在鐵屑等松散顆粒,缺膠指防塵帽或壓邊缺膠,碰圈指音圈變形或支架不平導(dǎo)致與磁體發(fā)生碰撞,脫盆架指盆架安裝松動,音小指支片沾有膠水或者磁鋼未充磁,紙盆聲指紙盆破裂變形等。對上述七種揚(yáng)聲器單元狀態(tài),分別貼標(biāo)簽為1、2、3、4、5、6、7。對每個揚(yáng)聲器單元進(jìn)行5次測試,減小隨機(jī)信號對數(shù)據(jù)影響的同時也增加了樣本的數(shù)量。
本試驗中所用消聲箱體積較小,在低頻段,箱內(nèi)聲場接近壓力場,如圖4、圖5分別為合格揚(yáng)聲器在自由場和消音箱條件下聲響應(yīng)信號的頻域圖,采樣時間為1 s,采樣頻率為44.1 kHz。對揚(yáng)聲器信號進(jìn)行VMD分解前需要確定模態(tài)數(shù)K。本文采用觀察中心頻率法來確定K值,不同K值的中心頻率如表1所示。

表1 不同K值對應(yīng)的中心頻率Tab.1 Center frequency corresponding to different K values
當(dāng)K=7時,出現(xiàn)中心頻率為1 204 Hz和1 300 Hz兩個模態(tài),認(rèn)為其中心頻率較近,出現(xiàn)過分解。因此選擇K=6,同時α設(shè)定為2 000,此時可以取得理想的分解效果。如圖6、圖7分別為VMD分解所得的揚(yáng)聲器在不同狀態(tài)中各模態(tài)的時域和頻域圖。
由圖6、圖7可以看出, VMD分解不僅能將合格揚(yáng)聲器單元的聲響應(yīng)信號分解到各個頻帶中,同時也能將各種異常揚(yáng)聲器單元的聲響應(yīng)信號分解到各個頻帶中,每一個頻帶對應(yīng)著一個模態(tài)分量,并且各頻帶的頻率中心未出現(xiàn)交叉和過分解,且不存在混疊現(xiàn)象,充分體現(xiàn)出VMD分解的優(yōu)勢。
針對上述7種揚(yáng)聲器聲響應(yīng)信號,將其分解為6個模態(tài)分量,分別提取每個模態(tài)的X1-X18特征,以及VMD-Hilbert變換后的X19特征。由此得到109維原始特征向量,維數(shù)較高,可能存在冗余特征,影響后續(xù)分類結(jié)果,因此利用RF-RFE模型對其進(jìn)行特征選擇,篩選出具有較高鑒別力的特征。由于RF中受決策樹數(shù)量(T)、樹的最大深度(D)、每棵樹每個節(jié)點分裂所需最小樣本數(shù)(S)影響較大,因此首先使用隨機(jī)搜索策略[26]對其進(jìn)行尋優(yōu),尋優(yōu)范圍及結(jié)果如表2所示。

表2 隨機(jī)森林參數(shù)優(yōu)化Tab.2 Random forest parameter optimization
將原始特征向量輸入至調(diào)參后的RF-RFE模型中,采用十折交叉驗證法,從當(dāng)前的109個特征中修剪最不重要的特征。在修剪的集合上遞歸地重復(fù)該過程,直到最終到達(dá)所需特征的數(shù)量,在交叉驗證中得到最佳特征的數(shù)量如圖8所示,最優(yōu)特征子集重要性排序如圖9所示。
由圖8可得出最佳的特征數(shù)量為22個,相比較原始特征集減少了87個特征,得到最優(yōu)特征子集重要性排序如圖9所示,其中u6X15表示模態(tài)u6的特征X15。由圖9可得,所篩選出的22個特征重要性之和為0.554(所有特征重要性和為1),說明此特征選擇的方法不僅極大程度減少了特征數(shù)量、去除了冗余特征,同時所篩選出的特征鑒別能力也較強(qiáng)。
將選擇好的最優(yōu)特征數(shù)據(jù)集輸入至RF算法中進(jìn)行分類識別。在分類試驗中,將最優(yōu)特征數(shù)據(jù)集隨機(jī)分為5i(1≤i≤5)份,其中第i份為測試集,其余4份為訓(xùn)練集,將5次結(jié)果取平均值作為最后測試結(jié)果,結(jié)果如表3~表5所示。這樣可以有效減少測試集、訓(xùn)練集選取不同樣本帶來的誤差,使得結(jié)果更為真實有效。

表3 隨機(jī)森林分類混淆矩陣Tab.3 Random forest classification confusion matrix
混淆矩陣[27]描繪了各測試樣本數(shù)據(jù)的真實屬性和預(yù)測結(jié)果之間的關(guān)系,可以用于評價分類算法的性能,如表3為隨機(jī)森林分類準(zhǔn)確率的混淆矩陣,其第一行為實際類別,第一列為預(yù)測類別。由表看出異物與脫盆架的識別率達(dá)到100%,良品識別率為99.06%,同時可以計算出平均識別率為98.61%,說明該方法分類效果好,同時具有更好的特征區(qū)分度。
同時為了說明本文方法的優(yōu)勢,進(jìn)行了對比試驗。對7種揚(yáng)聲器單元進(jìn)行WPD分解;分解之后對每個子帶提取特征后進(jìn)行特征選擇;最后使用RF、Adaboost及SVM進(jìn)行分類試驗,分類結(jié)果如表4所示。

表4 不同分解方法及不同分類器結(jié)果對比Tab.4 Comparison of different decomposition methods and results of different classifiers

表5 特征選擇方法對比Tab.5 Comparison of feature selection methods
由3個分類器的平均分類準(zhǔn)確率可以看出,經(jīng)VMD分解后,分類效果要優(yōu)于WPD,說明VMD分解算法能將非平穩(wěn)的復(fù)雜信號較好地分離開,避免了能量泄露和端點效應(yīng)。在分類器方面,RF分類效果要優(yōu)于Adaboost和SVM,說明了RF分類效果好,抗噪能力強(qiáng)。
RF-RFE與序列前項選擇(sequential forward selection, SFS)在耗時和選擇效果上進(jìn)行了對比,信號分解方法為VMD,分類器為RF。表5給出了不同特征選擇方法下的結(jié)果對比,其中的耗時是全部數(shù)據(jù)的總處理時間??梢钥吹轿唇?jīng)過特征選擇算法由于存在冗余特征導(dǎo)致分類準(zhǔn)確率降低,同時RF-RFE在特征選擇和耗時上比 SFS 更好,RF-RFE在耗時和選擇效果上取得了較好的平衡。充分表明了本文所提方法在揚(yáng)聲器異常聲分類中的具有更好的效果。
論文提出了一種結(jié)合VMD和隨機(jī)森林特征選擇的揚(yáng)聲器異常聲分類的方法,分別提取各模態(tài)的時頻域特征,并利用RF-RFE算法篩選出最優(yōu)特征子集,輸入隨機(jī)森林中進(jìn)行分類識別。通過對采集到的揚(yáng)聲器響應(yīng)信號進(jìn)行分析和試驗,結(jié)論如下:
(1)針對論文中7種揚(yáng)聲器單元狀態(tài),利用VMD分解可以將揚(yáng)聲器聲響應(yīng)信號較好的分離為各個模態(tài),具有更好的自適應(yīng)性和能量聚焦性,其分解效果優(yōu)于WPD分解。
(2)結(jié)合隨機(jī)森林特征重要性排序和遞歸特征消除算法,能更加有效的從多維特征中選擇出鑒別能力較好的特征,在特征選擇速度和分類精度上均優(yōu)于SFS。
(3)提出的基于隨機(jī)森林的分類方法在平均準(zhǔn)確率上均高于SVM和Adaboost。表明了本文所提分類方法在揚(yáng)聲器異常聲分類中有著更好的分類準(zhǔn)確度和泛化能力。
揚(yáng)聲器單元故障類型繁多,本文只選擇了7種進(jìn)行分類,未來還需對多種不同的故障種類進(jìn)行診斷,同時還需分析何種激勵信號能更好的激發(fā)揚(yáng)聲器異常聲。