周啟迪,孫婷婷,張忠偉,許春光,丁寧,李一帆,李滿
(中國北方發動機研究所(天津),天津 300406)
隨著消費者對NVH性能要求的提升,聲品質成為車輛市場競爭力的關鍵屬性。針對聲品質主觀評價成本高、效率低的問題,以聲品質客觀評價指標為輸入,構建聲品質主客觀預測模型對快速聲學開發具有重要意義。聲品質客觀評價指標是為了表征主觀感受而提出的物理參量,其客觀評價體系主要分為兩類:物理聲學和心理聲學參量、基于信號處理衍生的特征參量。文獻[1]以響度、尖銳度、粗糙度、抖動度、語義清晰度及其變化率作為兩級評價指標,基于多元線性回歸分析進行柴油機加速聲品質預測研究。文獻[2]以峰值響度、低頻能量、響度特征譜包絡和平均尖銳度為評價指標,形成了有效的汽車關門聲品質預測和診斷流程。文獻[3]提取汽車起動階段、停止階段和平穩運行階段的瞬態噪聲的聲品質客觀評價參量,基于BP神經網絡實現了轎車車窗上升過程的聲品質有效預測。文獻[4]以噪聲信號分解分量的樣本熵作為聲品質評價客觀參量,并進行聲品質主、客觀相關性關系,結果顯示IMF樣本熵對主觀評價具有很好的表征性。文獻[5]以EEMD分解分量的臨界頻帶計權能量作為聲品質客觀評價參量,其對主觀評價結果具有很高的表征性?;谙冗M信號處理技術提取的特征參量在一定場景下具有很好的相關性,但相對心理聲學參量缺乏主觀感知表征意義,因此,基于聲學和心理聲學參量進行聲品質預測在車輛和內燃機領域得到廣泛應用。
聲品質預測模型通過構建主客觀間的關系,實現聲品質快速評價。多元線性回歸、BP神經網絡、GA-BP神經網絡[6]、GA-小波神經網絡[4]、支持向量機[7]、遺傳支持向量機[8]、深度置信神經網絡[9](deep belief networks,DBN)、深度卷積神經網絡(convolution neural network,CNN)[10]、基于自適應學習樹的深度卷積神經網絡(ALRT-CNN)[11]、融合卷積神經網絡-長短時記憶網絡(CNN-LSTM)[12]等模型被廣泛應用到多個領域。綜合現有研究成果可知,支持向量機(support vector machines,SVM)和深度神經網絡方法在非線性預測方面具有更大的優勢。
柴油機噪聲特征復雜,不同柴油機的聲學問題存在較大的差異性,而目前聲品質客觀量化指標難以有效地對嘯叫、刺耳特征進行表征,無法有效地針對異響導致的聲品質進行預測,基于此,本研究構建了音噪比(tone-to-noise ratio,TNR)和突出比(prominence ratio,PR)的頻域衍生特征參量,完善了聲品質客觀評價體系,構建聲品質主客觀非線性回歸模型,為柴油機聲品質預測提供指導。
在半消聲室進行柴油機噪聲測試,構建TNR和PR頻域衍生特征參量,結合時、頻域特征完善了聲品質客觀評價體系,基于SVM模型構建聲品質預測模型,并檢驗預測模型精度,技術路線如圖1所示。

圖1 聲品質預測研究技術路線
為了量化噪聲產生的干擾,Beranek[14]提出了語音干擾級(speech interference level,SIL)的量化指標;隨著優先倍頻帶的提出,發展出了優先語義干擾級(preferred speech interference level,PSIL)的概念,具體計算如下。
使用中心頻率為500 Hz,1 000 Hz,2 000 Hz的倍頻程帶聲壓級計算優先語義干擾級,如式(1)所示。
(1)
式中:LP500,LP1000和LP2000分別為中心頻率在500 Hz,1 000 Hz和2 000 Hz的倍頻帶聲壓級。
音噪比[14](tone-to-noise ratio,TNR)定義為單調聲能量與單調聲所處臨界頻帶內其他噪聲能量的比值,其他噪聲能量即為臨界頻帶的總能量和單調噪聲能量的差值,計算如式(2)所示。
(2)
式中:Wt為單調聲的能量;Wn為單調聲所在臨界帶其他噪聲能量。
突出比(prominence ratio,PR)定義為單調聲所在臨界頻帶的聲音能量與其相鄰臨界頻帶平均聲音能量的比值,計算如式(3)所示。
(3)
式中:WM為單調聲所在臨界頻帶的聲能量;WL為WM相鄰低臨界頻帶的聲能量;WU為WM相鄰高臨界頻帶的聲能量。以某一模擬信號為例進行PR定義說明,如圖2所示,Δf0為單調聲所在臨界頻帶帶寬,圖中單調聲頻率為1 000 Hz,根據臨界頻帶的定義可知,Δf0為920~1 080 Hz。同理,ΔfL為單調聲所在臨界頻帶相鄰低臨界頻帶帶寬,對于該模擬信號ΔfL為770~920 Hz, ΔfU為單調聲所在臨界頻帶相鄰高臨界頻帶帶寬,對于該模擬信號ΔfU為1 080~1 270 Hz。

圖2 PR示意
根據TNR和PR定義可知,TNR和PR均屬于描述相對顯著程度的客觀參量。TNR對主觀感受的影響不僅僅受純音本身能量影響,還與純音所在臨界頻帶的其他噪聲能量相關。PR同樣受純音所在臨界頻帶的能量,以及純音所在臨界頻帶左右相鄰的兩個臨界頻帶的噪聲能量影響。因此TNR和PR的引入,為異響和嘯叫主觀感受有效的診斷提供可能。
當TNR和PR在全臨界頻帶數值不大時,在某一個頻帶里TNR和PR峰值很大,仍可能出現強烈的刺耳感,因此需要提取TNR和PR的頻域特征。構建聲品質客觀評價頻域衍生特征參量,包括突出比MAP頻域峰值,音噪比MAP頻域峰值,突出比MAP頻域均方根值,音噪比MAP頻域均方根值。圖3和圖4分別示出發動機聲品質突出比MAP和音噪比MAP頻域衍生參量提取結果。


圖3 突出比頻域衍生特征參量

圖4 音噪比MAP頻域衍生參量
本試驗采用5點法進行整機噪聲測試,如圖5所示。在半消聲室進行柴油機噪聲測試,麥克風測點分別放置在柴油機前、后、左、右、頂側1 m位置,測試系統是由LMS采集前端、PCB麥克風和筆記本電腦組成,采樣頻率為40 960 Hz,頻率分辨率設置為1 Hz,測試時間為10 s,測試工況為不同轉速、不同負荷的典型工況。為了減少氣動噪聲的干擾,將進、排氣管引出室外,同時拆除風扇,并采用吸聲材料將排氣管進行包裹。


圖5 柴油機噪聲測試
柴油機噪聲特征復雜多變,相近工況噪聲特征差異性較小,非專業人士組成評審團隊難以準確區分樣本細小特征變化的差異,同時,非專業人士在評價過程可能出現判斷標準偏移的問題,導致評價結果可信度和一致性低?;谏鲜隹紤],本研究選取20個內燃機專業人士組建評審團隊。主觀評價聽審設備包括筆記本電腦、外接聲卡、高保真耳機。
分組成對比較法(grouped pair-wise comparison,GPC)具有成對比較法精度高的優點,同時,可極大提升大規模樣本評價效率。本研究采用GPC法進行聲音樣本主觀評價,該方法通過構建關聯樣本,將大規模樣本分成多個具有相互關聯的樣本組,最后通過反演計算獲得全部樣本的評價結果。GPC的計算原理參考文獻[15],不再贅述。
聲品質客觀評價指標是為了表征主觀感受而提出的物理參量,本研究在傳統客觀評價參量,即A計權聲壓級、響度、尖銳度、粗糙度、抖動度、語義清晰度的基礎上,引入語義干擾級SIL3,構建柴油機聲品質時域客觀評價參量體系,如圖6所示。為了減少偶然因素的干擾,保證計算精度,窗長度為1 s,步長為0.5 s,重疊為50%。

圖6 聲品質時域客觀參量
根據構建的TNR頻域衍生特征參量,發現不同工況樣本TNR頻域平均有效值基本相同,如圖7所示,因此,該參量無法有效量化聲音特征的變化,不能作為柴油機聲品質客觀評價參量。綜合考慮柴油機聲品質時頻特征,即傳統聲品質時域評價參量、SIL3、突出比MAP頻域峰值、音噪比MAP頻域峰值、突出比MAP頻域均方根值,形成完善的聲品質客觀評價體系,為聲品質預測研究提供輸入。

圖7 不同工況噪聲樣本的TNR頻域平均有效值
主觀評價的精度和效率受樣本容量限制,而深度神經網絡在建模過程需要大量的數據樣本,因SVM模型在小樣本非線性擬合問題具有很高的精度,受主觀評價樣本容量的限制,本研究采用SVM方法進行柴油機聲品質主客觀預測模型構建。
假設訓練樣本集為{(xi,yi),i=1,2,3,…N},N為樣本數,xi為第i個輸入樣本,yi為對應的第i個輸出樣本,支持向量機回歸模型為
f(x)=wΦ(x)+b。
(4)
式中:w為超平面權系數向量;Φ(x)為低緯向高緯特征空間的映射關系;b為偏移量。
引入懲罰因子c以及松弛因子ξi和ξi*,支持向量回歸機的求解轉化為優化問題,如式(5)所示:
(5)
引入拉格朗日乘子,式(5)可轉化為式(6):
(6)

(7)
將式(7)代入式(6),可得到式(5)的對偶形式:
(8)
引入核函數K(x,xi)=Φ(x)·Φ(xi),將高緯空間內積計算轉化為低緯空間函數計算,獲得支持向量機回歸模型:
(9)
SVM回歸模型中懲罰因子c、核函數、核函數參數g對結果影響較大,其中c表示誤差容限,核函數的類型和參數g的選擇決定了樣本在高緯空間的分布,直接影響了SVM回歸模型的精度。目前常用來進行映射分析的SVM核函數主要包括4種。
1) 線性核函數:
K(x,y)=〈x,y〉;
(10)
2) 多項式核函數:
K(xi,x)=[xi,x+d]p;
(11)
3) 高斯RBF核函數:
K(xi,x)=exp(-gxi-x2);
(12)
4) Sigmoid核函數:
K(xi,x)=tanh(κxi,x+v)。
(13)
通過預測組樣本的最小均方誤差(mean square error,MSE)和復相關系數R2(squared correlation coefficient)結果進行精度檢驗。MSE和R2計算公式如下所示:
(14)
(15)

為了全面地反映柴油機聲品質特征,本研究考慮聲品質時、頻域特征構建完善的客觀評價體系,即時域特征參量A-SPL、響度、尖銳度、粗糙度、抖動度、語義清晰度和SIL3,聲品質頻域特征參量TNR頻域峰、PR頻域平均有效值、PR頻域平均有效值,共10個聲品質客觀評價參量。
為了對比傳統時域聲品質客觀評價參量和本研究提出的綜合考慮時頻域特征的參量在聲品質預測精度的差異性,針對待測32個噪聲樣本,隨機選擇24個樣本為建模組,8個樣本為預測組,基于SVM方法構建柴油機聲品質主客觀預測模型,SVM核函數為RBF核函數。
以傳統聲品質客觀參量作為預測模型的輸入,具體參量包括A計權聲壓級、響度、尖銳度、粗糙度、抖動度、語義清晰度。基于SVM方法進行柴油機聲品質預測,結果如圖8所示,主觀評價結果的真實值來源于文章第3部分,主觀評審團成員基于分組成對比較法打分獲得,主觀評價的預測值是聲品質預測模型計算結果。建模組樣本預測結果為MSE=0.040 2,R2=0.891 8,預測組樣本預測結果為MSE=0.079 3,R2=0.779 6。由于建模組和預測組樣本預測結果復相關系數較低,因此,基于傳統客觀參量進行聲品質預測精度較低。

圖8 基于傳統客觀參量的聲品質預測結果
綜合考慮聲品質時、頻特征,選擇A計權聲壓級、響度、尖銳度、粗糙度、抖動度、語義清晰度、頻域TNR峰值、頻域PR峰值、頻域PR平均有效值、SIL3構建的客觀評價體系作為預測模型輸入,基于SVM方法進行柴油機聲品質預測,結果如圖9所示。建模組樣本預測結果為MSE=0.007 8,R2=0.976 2,預測組樣本預測結果為MSE=0.015 3,R2=0.981 9,柴油機聲品質預測精度很高。
傳統客觀參量難以量化刺耳感,導致預測精度不足。而綜合考慮聲品質時頻域客觀參量構建預測模型具有更高的預測精度,即MSE更趨近于0,R2更趨近于1,本研究提出的聲品質預測方法可為柴油機聲學開發提供指導。
本研究構建了TNR和PR衍生特征參量,具體為突出比MAP頻域峰值,音噪比MAP頻域峰值,突出比MAP頻域均方根值,結合時、頻域特征完善了聲品質客觀評價體系,采用SVM方法構建了高精度的聲品質預測模型,具體結論如下:
a) 基于傳統客觀評價參量進行柴油機聲品質預測,預測組樣本預測結果為MSE=0.079 3,R2=0.779 6,由于傳統客觀評價參量缺乏刺耳感、嘯叫特征的表征參量,導致聲品質預測精度較低;
b) 通過構建TNR和PR頻域衍生特征參量,綜合考慮聲品質時頻特征相對傳統客觀參量具有更高的預測精度,預測組樣本預測結果為MSE=0.015 3,R2=0.981 9。