金龍娥,黃澤好,2,陳華語,鄒艾宏,陳 寶
(1.重慶理工大學 車輛工程學院, 重慶 400054;2.重慶理工大學 汽車零部件先進制造技術教育部重點實驗室, 重慶 400054;3.重慶金康賽力斯新能源汽車設計院有限公司, 重慶 401120)
汽車關門聲的聲品質是表征汽車品質的重要指標,因此研究其聲品質具有重要意義。為快速而高效評價汽車關門聲聲品質,國內眾多學者進行了研究[1-3],趙麗路[4]基于經驗模態分解和Hilbert-Huang變換提出新的關門聲聲品質評價參數,并通過多元線性回歸建立了關門聲聲品質評價模型;楊川等[5]基于偽WIGNER-VILLE分布提出一種新的關門聲聲品質評價參數,并與主觀績效值做相關分析,結果表明新的評價參數與主觀績效值的相關性比傳統心理聲學參數更高,更能準確評價關門聲聲品質;張福運[6]采用集合經驗模態方法處理關門聲信號,引入能量概念構造特征向量作為關門聲聲品質評價的輸入,結果表明以能量特征向量為輸入的聲品質評價模型的精度高于以心理聲學客觀參數為輸入的評價模型;王巖松等[7]提出一種將最優小波包變換與人工神經網絡相結合的聲品質識別方法。國外的汽車聲品質研究多側重于車內聲品質領域[8-11],而對汽車關門聲聲品質關注較少。
汽車關門聲作為非平穩信號[12],具有較強的時頻變化特征,文獻[12]針對平穩信號和非平穩信號的心理客觀參數進行研究,發現平穩信號的心理聲學客觀參數基本維持在一定幅度內不會改變,而非平穩信號的心理聲學客觀參數在短短幾秒內會發生劇烈變化,并且信號的時長會影響心理聲學客觀參數的均值。因此,僅在頻域內計算非平穩聲信號的心理聲學客觀參數均值并不能準確描述人的主觀感受[12]。為準確分析和描述人對非平穩聲信號的主觀感受,本文以乘用車關門聲為研究對象,采用小波包時頻分析方法對其進行研究,分別建立基于心理聲學客的關門聲聲品質評價模型和基于頻帶聲能量的關門聲聲品質評價模型,并對2個模型的評價結果進行分析。
聲樣本采集環境為半消聲室,本底噪聲17 dB,應用HEAD人工頭測量,三腳架支撐人工頭頭頂距離地面、車門把手中心和車門外沿分別為1 715、300、400 mm,試驗工況為關門速度(1.0±0.02)m/s、(1.2±0.02)m/s、(1.4±0.02)m/s。為保證采集到有效信號,對9款車每個工況采集3個聲樣本,從開始關門前2 s進行采集,每個聲樣本采集時間為10 s,剔除有噪聲干擾的聲樣本,每款車每個工況選擇一個有效聲樣本,得到有效聲樣本27個。考慮到主觀評價試驗中,聽音時間過長會使聽音者產生疲勞,而降低主觀評價的準確性,因此在不影響聲樣本完整性的前提下,在Artemis軟件中將聲樣本截取成2.5 s。為保證截取的2.5 s聲信號能代表原信號,截取時保留峰值部分,對截取的2.5 s信號進行時頻分析,主沖擊時間、峰值聲壓級、低頻延續時間等所有特征[13]與10 s信號對照一致。
汽車關門聲是汽車關門撞擊時產生的非平穩信號[12],其持續時間較短,這里僅以其中一個信號為例分析,該聲壓曲線如圖1所示,曲線中最高峰值由關門時發生第一次碰撞產生,約7.5 Pa;聲壓曲線經過不斷振蕩,后面的峰值大小表征聲音的衰減程度,持續1 s,聲壓衰減到0 Pa。

圖1 樣本序號1.6聲樣本聲壓曲線
圖2為該聲樣本時頻圖,縱軸為頻率,橫軸為時間,顏色表示聲音的強度,時頻圖可以表征各個頻率下的聲音強度與車門部件模態特征之間的關系[14]。由圖2可知汽車關門聲覆蓋的頻率范圍寬,高頻成分主要由門鎖碰撞產生,最高頻率在10 kHz以上,并且隨著時間推移各頻率成分逐漸衰減;聲音強度以低頻成分為主,低頻成分主要由車門與車身的碰撞及輻射產生,其強度也隨時間逐漸衰減。汽車關門聲樣本所包含的頻率成分及聲音強度均表現出較強的時變特征,說明運用時頻分析方法對其進行研究非常有必要。

圖2 樣本序號1.6聲樣本時頻圖
主觀偏好性是用來描述人對聽到的聲音的喜愛程度,將其作為本試驗的主觀評價指標。成對比較法因具有操作簡單、適用于無經驗聽音者的優點,被廣泛應用于主觀評價試驗。本試驗一共27個聲樣本,采用成對比較法進行聽音,將聲樣本隨機兩兩配對進行比較,共有729個比較組。邀請24位聽音者進行主觀評價試驗,試驗前為所有聽音者進行培訓,使其了解試驗內容及規則。
考慮到聽音時間過長會使聽音者產生疲勞和分心,從而降低評價的準確性和一致性,對評價結果進行誤判分析,結合3個類型的誤判(相同聲樣本對、交換聲樣本對、三角循環聲樣本對)計算計權一致性系數,并按照誤判剔除原則[15]對計權一致性系數低于0.75的聽音者的評價數據予以剔除,如表1所示,剔除R5、R8、R21、R24。

表1 計權一致性系數
對余下20位聽音者的評價數據進行處理,經過算術平均得到如表2所示的主觀評價結果。由表2可以看出,隨著關門速度的提高,主觀偏好值普遍降低。

表2 主觀評價結果
BP神經網絡是一種按照誤差逆向傳播算法訓練的多層前饋網絡,是目前應用最廣泛的神經網絡之一[16]。該網絡采用誤差回傳的方式來調整網絡的權值和閾值,但網絡權值和閾值初始值的確定會影響網絡學習的好壞。遺傳算法(genetic algorithms,GA)是一種模擬自然界遺傳機制和生物進化論的并行隨機搜索最優化方法,具有良好的隨機性、并行性和全局尋優能力[16]。鑒于以上優良特性,采用遺傳算法對BP神經網絡權值和閾值初始值進行全局尋優,提高BP神經網絡學習的準確性。
GA-BP神經網絡模型搭建步驟如下:
第1步:確定網絡初始結構,由此確定GA算法中染色體長度;
第2步:將BP神經網絡的權值、閾值編碼為染色體,產生初始種群,并選用合適的適應度函數對個體進行適應度值計算;
第3步:通過選擇、交叉、變異操作,不斷產生和篩選新的染色體,直到得到滿足條件的個體;
第4步:對滿足條件的個體進行解碼,并將解碼后的權值、閾值賦予BP神經網絡;
第5步:對經GA算法優化后的BP神經網絡進行訓練,直至滿足條件。
GA-BP神經網絡模型流程如圖3所示。

圖3 GA-BP神經網絡模型流程框圖
響度、尖銳度、粗糙度、波動度等心理聲學參數是汽車聲品質評價的常用客觀參數,用以描述聲音特征,目前僅響度與尖銳度有國家計算標準,在Artemis軟件中,導入聲樣本進行心理聲學客觀參數的計算,提取關注較多的6個參數[1,4,6,12,16]:響度、尖銳度、A計權聲壓級、粗糙度、語言清晰度、波動度,如表3所示。

表3 心理聲學客觀參數
將表3中的6個心理聲學客觀參數作為輸入,主觀偏好值作為輸出,基于Matlab環境建立GA-BP關門聲聲品質評價模型,將27個聲樣本導入模型后,劃分為訓練集(22個聲樣本)和測試集(5個聲樣本)。
基于心理聲學客觀參數的關門聲聲品質評價模型(evaluation model of door closing sound quality based on psychoacoustic objective parameters,EMDCSQ-POP)采用三層神經網絡結構,如圖4所示,輸入層(input)、隱含層(hidden layer)與輸出層(output layer)節點數分別為:6、10、1,隱含層選用logsig傳遞函數,輸出層選用purelin傳遞函數,W代表各層之間的權值矩陣,b代表各層之間的閾值向量。

圖4 基于心理聲學客觀參數的神經網絡結構示意圖
如圖5所示,訓練集與測試集的均方誤差分別為1.685 6、0.694 96,擬合系數R2分別為0.939 9、0.789 7,雖然模型整體預測精度較高,預測值與真實值之間表現出較好的相關性,但由圖5可以看出針對部分樣本仍存在較大誤差。

圖5 基于心理聲學客觀參數的關門聲聲品質評價模型結果曲線
小波變換又稱多分辨率分析,在時域和頻域都具有良好的局部化特性,適宜于分析任意尺度的信號。小波包變換作為小波變換的推廣,能夠對信號的低頻部分和高頻部分進行分解,具有更強的時頻局部化分析能力,其理論與方法在信號處理、語音分析等領域已廣泛應用[17-18],但在聲品質領域應用較少。
根據人耳的聽覺多頻帶濾波特性,將頻域進行重新劃分,形成24Bark域,每個Bark域形成一個臨界頻帶,在一個帶寬內人耳的聽覺感知是相同的,臨界頻帶能很好地反映人腦對聽力的特征[14]。借鑒24 Bark域的頻率劃分方式,應用小波包變換構造濾波器組模擬人耳聽覺特征頻帶濾波功能[19],選擇db35小波作為基函數,在Matlab環境下對聲樣本進行分解,并對小波包樹中的節點進行再分解和合并,在Matlab中進行小波包變換存在高頻翻轉的現象[20],考慮到此原因其頻帶分布如表4所示。

表4 小波包變換下的頻帶分布
小波包變換將原本的非平穩信號分解為多個頻帶的信號分量,每個信號分量表征該頻帶內的頻率成分隨時間的變化。小波包變換從全頻域、全時域對信號進行分解,更有利于非平穩信號的分析。
為評價關門聲聲品質,需構造聲樣本的特征向量,引入能量概念來表征各個頻帶在全時域范圍內的聲音強度,計算每個頻帶內的聲能量(如表5所示),從而構造聲樣本能量特征向量。

表5 各頻帶聲能量
將聲樣本能量特征向量作為聲品質評價模型的輸入,主觀偏好值作為輸出,構建基于頻帶聲能量的GA-BP關門聲聲品質評價模型(evaluation model of door closing sound quality of frequency band sound energy,EMDCSQ-FBSE),其訓練集和測試集的劃分與3.1節一樣。
基于頻帶聲能量的關門聲聲品質評價模型采用三層神經網絡結構,如圖6所示,輸入層(input)、隱含層(hidden layer)與輸出層(output layer)節點數分別為:24、12、1,隱含層選用logsig傳遞函數,輸出層選用purelin傳遞函數,W代表各層之間的權值矩陣,b代表各層之間的閾值向量。

圖6 基于小波包變換的神經網絡結構示意圖
如圖7所示,訓練集與測試集的均方誤差分別為0.065 9、0.002 8,擬合系數R2分別為0.998 1、0.999 4,表明模型預測精度高,預測值與真實值之間表現出更好的相關性,預測值能夠較好地反映真實值的變化趨勢,說明小波包變換下的頻帶聲能量與主觀偏好性之間呈現較好的映射關系,使模型在學習后能夠呈現更好的預測效果。

圖7 基于小波包變換的關門聲聲品質評價模型結果曲線
對模型性能評價通常采用平均絕對誤差、均方誤差、擬合系數等來指標進行評價[6,12,15],平均絕對誤差能夠避免誤差間相互抵消,可以準確反映預測數據與原始數據之間的誤差大小;均方誤差常用來表征數據的變化程度,均方誤差值越小,表明模型對原始數據的描述精確度更好;擬合系數是表征回歸時擬合程度的指標,其值越大說明擬合得越好。對3.1節、3.2節2個模型的評價數據如表6所示。可知基于頻帶聲能量的關門聲聲品質評價模型其誤差絕對值均值、均方誤差、擬合系數分別為0.046 6、0.002 8和0.999 5,與基于客觀參數的模型相比,分別降低0.553 1,降低0.692 2,提高0.209 8。

表6 測試集誤差分析
由圖5、圖7可知,相比基于客觀參數的關門聲聲品質評價模型,基于頻帶聲能量的關門聲聲品質評價模型在訓練集、測試集上的表現都更好。由于汽車關門聲信號是非平穩信號,傳統心理聲學的參數曲線會隨時間推移產生較大變化,當取值方式不同時會對聲品質評價結果產生影響。而運用小波包變換將關門聲樣本基于24Bark域分解為24個信號分量,完全覆蓋圖2所示的頻率范圍,并且基于小波包變換構造的能量特征向量將圖2中涵蓋的能量分布信息進行量化,表征了聲信號各頻帶在全時域上的能量分布情況,可基于關門聲樣本自身的信息對其進行評價,更適合汽車非平穩聲信號的聲品質評價。
考慮到關門聲的非平穩特性,應用小波包時頻分析方法構建了符合人耳聽覺特征的濾波器組;借鑒24Bark域劃分頻帶,并計算各頻帶內的聲能量,構造了聲樣本能量特征向量;建立了基于頻帶聲能量的GA-BP神經網絡關門聲聲品質評價模型。模型性能指標表明,基于頻帶聲能量的關門聲聲品質評價模型在誤差絕對值均值、均方誤差、擬合系數方面均優于以傳統心理聲學客觀參數為輸入的聲品質評價模型,以頻帶聲能量為輸入的聲品質評價模型在預測精度上有明顯提高。因此,基于頻帶聲能量的聲品質評價方法更適合于汽車非平穩聲信號的聲品質評價,可運用于汽車關門聲聲品質評價工作中。