郭 慶,何劼愷,蘇海濤,王興建
(桂林電子科技大學 電子工程與自動化學院,廣西 桂林 541004)
揚聲器作為一種常用的聲學設備,在日常生活中得到了廣泛的應用。我國是揚聲器生產及消費大國,隨著生活水平的提高,消費者對揚聲器的要求也越來越高。目前,國內揚聲器檢測標準主要依據GB 9396—1988《揚聲器的主要性能測試方法》,該標準規定了品質因素、揚聲器單元的等效容積、頻率特性、極性指標和純音等35項特性指標[1]。
純音檢測一般是通過聽音員人工聽音來判斷揚聲器是否合格,或由有經驗的工程師根據已測量得到的揚聲器異常音曲線設置一定的門限,通過門限來判斷揚聲器是否合格。上述兩種方法均存在缺陷。人工聽音法根據聽音員的主觀評價,檢測結果受聽音員的年齡、情緒、身體狀況、疲勞度等因素影響較大;設置門限法需要由經驗豐富的工程師操作,且門限的設置一般依據人的主觀感覺。門限若是設置過緊,將會產生較高的虛警率,導致生產效率降低;門限若是設置過寬,則會將不合格品投入市場,損害消費者利益,影響企業信譽。此外,以上兩種方法均未能實現揚聲器的故障分類,而故障分類對于企業排查揚聲器故障產生原因、調整生產線有著積極的指導作用。
針對上述人工聽音法和設置門限法的缺陷,殷貞強等[2]提出基于音色特征的揚聲器異常音檢測方法。本文從人耳聽覺角度出發,提出了一種新的揚聲器質量評價(speaker quality evaluation,SQE)方法,將基于人耳聽覺的心理聲學模型和粒子群優化支持向量機(particle swarm optimization-support vector machine,PSO-SVM)相結合,實現揚聲器的異常音檢測和分類。
首先,采集揚聲器的聲音響應信號[3],提取聲音響應信號并標記信息,然后將其輸入心理聲學模型,計算出能量均值,并輸入PSO-SVM,得到最優預測模型,實現揚聲器異常音的檢測和分類。SQE方法原理如圖1所示。
本文將連續對數掃頻信號作為揚聲器激勵信號。連續對數掃頻信號具有頻譜覆蓋廣的優勢,能對揚聲器在給定范圍內進行全頻譜激勵。連續對數掃頻信號的頻率隨時間的增加呈對數關系增長,并且掃過每個倍頻程的時間均為常數,其表達式如式(1)所示。
(1)
式中:A為信號幅值,A通常取1;f1為起始頻率,f1=20 Hz;f2為終止頻率,f2=20 kHz;T為采樣周期,T=1 s。
連續對數掃頻信號時域圖如圖2所示。
心理聲學模型借鑒音頻質量評價(perceptual evaluation of audio quality,PEAQ)算法中的基礎版心理聲學模型[4]。該模型雖然步驟較多,但對人耳濾波分組精細,用作揚聲器聲響應提取模塊較為合適。心理聲學模型如圖3所示。
快速傅里葉變換(fast fourier transform, FFT)。輸入信號為經過分幀處理的揚聲器聲音響應信號,采樣頻率Fs為48 kHz,取幀長NF為2 048,重疊率為50%,分幀后的信號為x[n],對其進行加窗處理,選取漢寧窗函數如式(2)所示。

(2)
經傅里葉變換,信號由時域轉變為頻域,見式(3)。
(3)

規范化。對傅里葉變換之后的結果進行規范化處理,如式(4)和(5)所示。實際應用中,亦可根據實際情況調節該步增益值。
(4)
F[kf,N]=fFf[kf,N]
(5)
式中:L為聲壓等級,可設定為92 dB;M由標準信號計算得出;N為幀數。
中外耳頻率加權。外耳道對聲音信號具有放大作用,中耳實現阻抗匹配,將聲音傳入耳蝸。根據這些生理特征,對中外耳進行數學建模[5],計算出中外耳頻率加權W,見式(6)。
(6)
其中,f[kf]通過式(7)計算得到。
f[kf]=kfFs/NF
(7)
聽覺濾波器分組。常見的心理聲學模型通常將人耳抽象為特殊的濾波器進行數學建模。將Fe[kf,N]作為輸入的能量值,其由式(8)計算得到。
(8)
采用Schroeder等[6]于1979年提出的Bark域建模函數。Bark域z和頻域f的換算公式如式(9)所示,其逆變換如式(10)所示,濾波器組數計算如式(11)所示。
(9)
f=650sinh(z/7)
(10)
(11)
式中:Δz為Bark域間隔,Δz=0.25;f為頻域,f取值區間為80~18 000 Hz。通過計算共得到109組濾波器。
每個濾波器的低頻頻率、高頻頻率和中心頻率可由式(12)推出。
zl[i]=zmin+iΔz
(12)
式中:zmin為80 Hz對應的Bark域值;zmax為18 kHz對應的Bark域值;Δz取0.25。將這些數值代入式(12)可求得每組帶通濾波器的Bark域值。最后,由式(10)統一換算至頻域。
單個濾波器子帶中,各點的能量貢獻U[i,kf]通過式(13)計算,最終得到濾波器子帶總能量Eb[i,N]見式(14)。
(13)

(14)
加入內部噪聲。由于人的血液和心跳等因素會在一定程度上影響人的聽覺。使用式(15)模擬內部噪聲,并與Eb[i,N]相加,見式(16)。
(15)
E[i,N]=Eb[i,N]+EIN[i]
(16)
式中:EIN[i]為內部噪聲;fc[i]為109組濾波器中心頻率值。
頻域擴展。以單幀信號為例,將E[i]經擴展函數擴展至整個聽域,擴展函數是個雙邊指數函數,見式(17)和(18)。

(17)

(18)
式中:i、l為擴展子帶和激勵子帶的序數;fc[l]為第l個激勵子帶的中心頻率,單位為Hz。
規范化因子A(l,E)見式(19)。
在室內空間設計中通過靈活的陳設藝術,就可以實現其分隔空間,增強空間層次感的目的。在室內空間設計時,設計人員可以通過選擇不同功能、色彩、材質的藝術陳設品,從而給人帶來不一樣的視覺、心理感受。例如比較典型的案例就是部分設計時通過在茶幾、餐桌上方設計吊燈,從而提升空間的層次感。通過靈活的陳設藝術也可以使人們在和諧、協調的空間環境中生活、工作,獲得較好的體驗。
(19)
頻域擴展的能量響應值Es(i)見式(20)。
(20)
規范化因子Bs(i)見式(21)。
(21)
時域擴展。通過一階低通濾波器模擬人耳的前向掩蔽作用,最終得到激勵模態[7],見式(22)。
E[i,N]=max(Ef[i,N],Es[i,N])
Ef[i,N]=aEf[i,N-1]+(1-a)Es[i,N]
(22)

(23)
至此,心理聲學模型計算結束。
每幀信號的能量均值見式(24)。
(24)
每幀信號的能量均值反映了心理聲學模型中各子帶能量在時間上的平均,利用該特征進行揚聲器異常音檢測與分類。
粒子群優化(particles swarm optimization, PSO)算法[8]是一種基于集群的優化技術,該算法受鳥類群體行為研究結果的啟發。鳥群通過自身經驗和種群之間的交流調整自己的搜尋路徑,從而找到食物最多的地點。其中,每只鳥的位置/路徑則為自變量組合,每次到達地點的食物密度為函數值。每次搜尋都會根據自身經驗(自身歷史搜尋的最優地點)和種群交流(種群歷史搜尋的最優地點)調整自身搜尋方向和速度(稱為跟蹤極值),直到找到最優解。由此可知,對于PSO算法最重要的參數是單個粒子的飛行速度和實時位置,其速度v、位置x更新算法見式(25)和(26)。
vis(t+1)=wvis(t)+c1r1(t)(pis(t)-xis(t))+
c2r2(t)(pgs(t)-xgs(t))
(25)
xis(t+1)=xis(t)+vis(t+1)
(26)
式中:c1和c2為學習因子,分別取1.5和1.7;r1(t)、r2(t)為相互獨立的偽隨機數,取值范圍為[0,1];w為慣性權重;pis為第i個粒子所找的最優位值;pgs為整個集群的最優位值。
支持向量機(support vector machine, SVM)通過建立一個超平面作為決策曲面,使得兩類樣本之間的分割面達到最大。SVM最初應用于二分類問題,針對多分類問題,可通過構建多個SVM來實現。
SVM核函數(Kernel)可將輸入數據映射到更高維度的空間中,使得原本糾纏在一起的數據簇在更高的維度里變為線性可分。試驗中選取的核函數為徑向基核函數(radial basis function, RBF),該函數應用最為廣泛且能夠實現非線性映射。
將粒子群算法的集群尋優特性和支持向量機算法相結合,即采用粒子群優化的支持向量機實現揚聲器異常音的檢測。PSO-SVM算法流程如圖4所示。
3.1.1 揚聲器
試驗采用的小型揚聲器如圖5所示。
3.1.2 試驗流程圖
由電腦發出連續對數掃頻信號(T=1 s,f=48 kHz),經過專業音頻Juli@聲卡輸出到功放,功放將信號放大并輸出給揚聲器。揚聲器受激勵發出聲音,聲音經過傳聲器轉變為聲響應信號,揚聲器聲響應信號通過Juli@聲卡傳給電腦。數據采集過程見圖6所示。
3.1.3 故障類型
揚聲器的異常音是由揚聲器的內部故障所導致的。紙盆式揚聲器常見的3種故障:第1種稱為揚聲器罩內漏氣故障,即由于揚聲器的振膜破損導致的異常音;第2種稱為碰圈故障,主要是由于揚聲器裝配時音圈與場心柱的同心度誤差較大或是音圈有傾斜,當揚聲器振動時,音圈與導磁板或場心柱相碰,產生異常音;第3種稱為小音故障,由于揚聲器充磁不足或音膜扼環異常,導致揚聲器聲響應偏小[9]。本試驗樣本為已知屬性的130個揚聲器。其中,70個揚聲器為正常揚聲器,漏氣故障、碰圈故障和小音故障揚聲器各為20個。
3.1.4 數據處理
揚聲器聲音響應信號經心理聲學模型處理后得到心理聲學能量譜圖,該圖反映了人耳感知聲音的特點。4類揚聲器聲音響應信號的心理聲學能量譜圖如圖7所示。
根據圖7可分析出,在幀數為34~37幀、子帶為59~68組的區間內,人耳對聲音的感知最為靈敏,其對應的中心頻率為2 987.238~4 294.979 Hz。
通過采用PSO調優的SVM模型,核函數選為RBF,采用c、g參數。c、g參數對于SVM的準確率影響較大,其選擇方法有網格搜索法、隨機參數選擇法等。本文采用PSO算法,通過交叉驗證的方式,將交叉驗證下的SVM準確率結果作為PSO的適應度函數。設置種群最大數量為20,種群最大進化數量為200。然后利用PSO的尋優特性找到最優解,從而確定最優SVM模型以及最優c、g值[10]。
用4種狀態(1為正常、2為漏氣、3為碰圈、4為小音)分別標識對應的數據組,試驗所設定的訓練集與測試集見表1。特征數據采用心理聲學能量均值,數據維度為45,經PSO-SVM調參,得到最優c、g值分別為59.078、 2.789。檢測結果見表2。

表1 訓練集與測試集

表2 檢測結果
針對揚聲器是否存在異常音,SQE法與音色特征法的檢測結果比較見表3。

表3 SQE法與音色特征法的準確率比較
由表3可知,SQE法在檢測準確性上比音色特征法得到了較大提升,體現了從人耳聽覺角度進行揚聲器異常音識別與分類的研究價值。
本文算法的運行結果如圖8所示。
本文對揚聲器異常音檢測分類問題進行了研究,從人耳聽覺角度出發,將心理聲學模型與PSO-SVM結合,提出揚聲器質量評價算法SQE,通過該算法對4類揚聲器進行檢測分類。試驗結果表明,本文算法明顯優于基于音色特征的揚聲器異常音檢測,大大提高了檢測準確率,并實現了異常音分類。本文所得結果基于實驗室內所測數據,推廣應用還需結合生產實際,增大樣本數據量。