陳燕虹,趙 健,梁 杰,井曉瑞
(吉林大學,汽車仿真與控制國家重點實驗室,長春 130025)
目前,各國政府越來越重視電動汽車的發展,各大汽車企業和科研機構也加大了對電動汽車的研發力度。隨之而來的問題也不斷顯現出來,其中由于以電機代替發動機作為驅動機構,致使電動車在低速行駛時,車外過于安靜,行人無法有效感知到行駛的車輛,不能及時發現和避讓車輛,從而釀成交通事故。可見,在電動車上安裝行人警示系統以確保道路上行人的安全是十分必要的。
2011年,日產公司通過分析各類人群對聲音的敏感程度,提出適合不同人群的聲音設計原則?;谠撛瓌t不僅可以提高老年人和正常行人對聲音的感知程度,還能減少車外噪聲對環境造成的噪聲污染[1]。同年,AVL公司針對電動汽車在許多駕駛條件下車內外總的聲壓級比傳統汽車低,且聲音特性有很大不同的情況,提出通過聲學調諧的方法來對電動車進行聲音設計,滿足車內外人群對車輛噪聲舒適性的要求[2]。他們在概念設計和聲學設計階段對電動車的NVH性能進行仿真設計,提出了聲音設計新的戰略和想法,確保低速行駛的電動車能及時被行人發現。2013年,文獻[3]中指出在電動車上添加警示聲是一對矛盾體:一方面,電動車低速行駛時非常安靜,對減少城市交通噪聲將非常有利;另一方面,安靜的車外環境對車外行人將非常危險。他們通過不同的感知試驗發現不同的音色參數將影響聲音的可檢測性、車輛距離與車速的判斷和噪聲污染的等級等。指出可根據具體的使用要求進行聲音音色參數的設計,來平衡這一對矛盾體。目前,國內只有個別公司和研究機構開展對電動轎車警示聲的研究,研究的內容也只停留在發聲系統的設計上,并未真正涉及警示聲。因此,對于警示聲設計方法的研究顯得十分必要。
本文中依據國內外警示聲設計方面的經驗,以傳統的內燃機汽車車外聲為基礎進行警示聲的設計,然后利用聲品質分析的相關理論與試驗,挑選出合適的聲音作為電動轎車的警示聲,使挑選出來的警示聲不僅能及時警示行人避讓車輛,還應使挑選出的聲音對環境產生的噪聲污染最小,同時,為簡化警示聲設計過程,建立SAGA-BP神經網絡的警示聲聲品質主觀評價客觀量化模型,可用該模型代替后續警示聲設計過程中的主觀評價過程,從而節省大量的人力物力成本。
錄制傳統車的車外噪聲信號,將為后續聲音信號的合成和選出適合的警示聲提供基礎,因此保證錄制環境無背景噪聲的干擾尤為重要,同時對錄音的位置、錄音話筒的高度和車輛運行情況等條件皆須予以細致的考慮。錄制環境選擇在半消聲室內,采用專業的錄音話筒進行錄制,并通過專業軟件進行保存,存儲的格式為.wav。錄音麥克風的位置參考測量排氣噪聲的方法和聲場分布,選擇在車輛縱向中心面上,以距離車前懸0.5m畫圓弧,所畫圓弧左右45°弧線上的任一位置放置傳聲器,傳聲器的高度參考加速噪聲測量方法,選擇0.9~1.2m的高度范圍,如圖1所示。

圖1 半消聲室內車外噪聲錄制和錄音位置示意圖
在滿足上述要求的前提下,在半消聲室轉鼓上分別錄制5輛傳統車的車外噪聲信號。錄制的噪聲信號分別包括10,20和30km/h工況。從錄制好的聲音樣本中截取長度為5s的樣本,并對其進行編號記錄,方便后續處理。
試驗顯示,不同人群對同一聲音樣本在不同頻率成分的反應不同。老年人群對0.6kHz附近的聲音更加敏感,正常聽力人群對2.5kHz附近聲音的感知能力較強,而1kHz附近的聲音易對環境造成噪聲污染[4]。
為達到對各類行人具有最好警示效果的同時噪聲污染最小,利用Matlab設計帶通濾波器。為保證采集到的聲音信號幅值不失真,采用的聲音頻率為4.8kHz。根據上文,需要提取的聲音信號的頻率區間為 0.5~0.7kHz,0.9~1.1kHz和 2.4~2.6kHz。由于過渡帶較窄,將會使濾波器階數較高,如果使用經典濾波器設計方法,將會使運算出現錯誤??偨Y各種濾波器設計方法之后,設計數字濾波器fdesign+design,此濾波器通過通帶、阻帶等參數來設計,其主要優點是得到的濾波器被分解為多個2階濾波器的串接,系數對精度要求低,在濾波過程中不會產生溢出[5]。所設計的濾波器符合設計要求,能夠得到很好的效果。濾波器阻帶衰減為90dB,通帶波紋為3dB。圖2為所設計的帶通數字濾波器的幅值響應曲線,濾波區間為2.4~2.6kHz。
利用設計的帶通數字濾波器對采集的車外噪聲樣本進行濾波處理,提取所需頻段的噪聲樣本。用波形編碼技術對所采集的車外噪聲信號和濾波后得到的各個頻段內的聲音信號進行合成,以改變特定頻段內信號的幅值。由于不能確定特定頻段內信號的幅值為何值時警示聲的警示效果最好,所以須進行大量的聲音信號合成,找出主觀評價最好的聲音信號做為警示聲?,F以采集的某車型車外噪聲信號為例,在該聲音信號的基礎上,按4種主要思路進行聲音信號的合成。

圖2 帶通濾波器幅值響應曲線
(1)不改變所采集的車外噪聲信號的幅值,在此基礎上按不同的比例成分添加濾波所得到的0.5~0.7kHz和2.4~2.6kHz范圍內的頻率成分。
(2)降低所采集的原始信號的幅值,然后在此基礎上按不同比例增加 0.5~0.7kHz和 2.4~2.6kHz頻率范圍內聲音信號的幅值。
(3)不改變所采集的車外噪聲信號的幅值,在此基礎上按不同比例降低0.9~1.1kHz范圍內頻率成分的幅值,然后再按不同的比例成分添加濾波所得到的0.5~0.7kHz和2.4~2.6kHz范圍內的頻率成分。
(4)降低所采集的車外噪聲信號的幅值,在此基礎上再按不同比例降低0.9~1.1kHz范圍內頻率成分的幅值,然后再按不同的比例成分添加濾波所得到的0.5~0.7kHz和2.4~2.6kHz范圍內的頻率成分。
按上述方法總共得到120個聲音樣本,由于篇幅所限,本文中僅列舉一組按上述4種方法合成所得聲音信號的頻譜圖,如圖3所示。
人的主觀感受是評價任何聲音適應性的重要指標,是以人為主體、以人主觀感受上的舒適性來評價聲音質量的好壞。聲品質主觀評價通過組織聽音試驗來對聲音樣本進行主觀打分,能比較直接地反映人對所聽到聲音的主觀感受[6]。

圖3 合成后語音頻譜圖
聲品質主觀評價過程中評價人員的選取對評價結果的準確性至關重要,須從產品經驗、聽審經驗和統計學等多個方面綜合考慮進行選擇[7]。根據試驗要求和國內外聲品質主觀評價經驗,選取30名評價人員,他們由聲學專家、汽車研究人員、高校學生和多年從事汽車振動噪聲研究的工程師和學者組成。其中,男女分別為21人和9人,年齡在24~56歲之間,聽力均正常。在進行主觀評價試驗之前對所有評價人員進行一定的培訓。
為了更細致地區分各聲音樣本的特性,須對聲音樣本做響度均衡化處理[8]。為保證評價試驗的準確性,在評價試驗之前對所有聲音樣本進行隨機排序,確保評價者在不了解所有聲音樣本屬性的情況下進行評價試驗,避免評價者在評價過程中通過經驗和個人喜好直接對聲音樣本做出判斷。常用的聲品質主觀評價方法有等級評分法(magnitude estima-tion)和成對比較法(paired comparison)[9]。本試驗采用等級評分法,樣本訓練試聽采用成對比較法。按照國際標準將煩躁度劃分為11個等級,如表1所示。

表1 主觀評價煩躁度等級對照
在主觀評價試驗過程中不可避免地存在各種干擾因素,不能保證每個數據都有效,所以必須進行數據相關性檢驗。Spearman是對不同變量的秩做線性相關分析,適用于主觀評價數據的相關性檢驗。表2所示為用SPSS軟件計算各評價人員之間的平均相關系數,當相關系數低于0.7時就意味著相關程度較低,應予以剔除。 由表可見,第4,7,12,18號評價者的結果與其他評價者之間的相關系數為0.633,0.584,0.619,0.605,均小于 0.65,這說明這4位評價者的評價結果與其他評價結果之間的線性關系較弱,結果的離散性較大,不具有參考性,應予以剔除,然后對剩下的主觀評價結果進行平均,即可得到各噪聲樣本的聲品質主觀評價分值。
聲品質客觀心理聲學參數是描述人對聲音的主觀感受,建立心理聲學、物理聲學與聲品質主觀感受特性之間的聯系,即通過一些具體的參量來直觀地表述人對聲音的主觀感受[9]。選取響度、粗糙度、尖銳度、抖動度、語言清晰度和A計權聲壓級6個參數作為聲品質客觀評價參數。利用Head/Artmis軟件分別計算這120個聲音樣本的客觀評價參數。
在主客觀評價之后,按照不同工況下采集和合成的聲音樣本進行分類,即分為在10,20和30km/h工況下采集和合成的聲音樣本,選擇各組中主觀評價分值最高的聲音樣本做為各自工況范圍內的警示聲。

表2 各評價者之間的平均相關系數
為簡化警示聲設計過程,為后續警示聲的設計提供方便,可建立聲品質主觀評價客觀量化預測模型,從而可省去繁雜的主觀評價過程,節省人力物力成本,縮短警示聲設計周期,同時可減小人員和環境等因素對主觀評價分值的影響。
BP(back propagation)神經網絡即誤差反向傳播神經網絡,其誤差和信號的傳播方向相反,信號向前傳播,而誤差向后傳播。BP網絡能對有限個不連續點的函數進行逼近,是目前應用比較廣泛的一種神經網絡。它采用均方誤差作為適應度函數,網絡的收斂過程是使均方誤差最小化的過程,但BP神經網絡存在全局搜索能力較差、容易陷入局部極小值和搜索速度較慢等缺點,因此須對BP神經網絡進行優化來改善其性能[10]。
遺傳算法是模擬生物進化和遺傳機制而演變出來的一種迭代搜索全局最優解的算法[11]。通過對父代優良基因的繼承和子代染色體之間的相互作用,逐漸使種群進化到最優解的狀態。
模擬退火算法(simulated annealing)模擬物體退火的過程,由Metroplis算法和退火過程構成。其基本思路是:物體在高溫時出現各種狀態的概率基本相同,在此狀態下進行粗略搜索,找到能量較低的區域;隨著溫度慢慢降低,每個狀態出現的概率將有較大差別,搜索精度也將不斷提高,從而逐漸準確地找到整個搜索空間中能量函數極小點[12]。
模擬退火算法擁有較強的局部搜索能力,能避免陷入局部最優解,但把握整個搜索空間的能力較差,收斂速度較慢,使模擬退火算法的運算效率不高[13]。遺傳算法采用迭代搜索方法,能夠很好地把握總體搜索方向,具有很強的自適應調整能力、魯棒性和全局搜索能力,但其局部搜索能力較差。
由上面分析可知,模擬退火算法和遺傳算法兩種算法都有各自的優缺點,但將兩種算法結合起來,形成一種新的算法,則可彌補各自的缺點,充分發揮各算法的優點,使算法達到理想的效果。采用模擬退火遺傳算法來優化BP神經網絡,優化后的SAGA-BP神經網絡可以有效避免典型BP神經網絡容易陷入局部極小值點、學習效率低等缺點,能在最短的時間內尋找到全局最優解,提高網絡的精度、學習速度、網絡的使用效率及應用范圍。SAGA-BP神經網絡的具體步驟如下。
(1)確定網絡拓撲結構和算法編碼方案,輸入數據并對數據做歸一化處理,確定種群規模、交叉與變異概率、迭代次數和退火初始溫度T0與終止溫度Tend。
(2)計算群體中個體的適應度值f(x0),再進行遺傳操作,得到新種群,計算新種群的適應度值f(xn),每進行一次選擇、交叉和變異操作,則迭代數i=i+1。
(3)判斷f(x0)和f(xn)的大小,若f(x0)≥f(xn),則將x0作為SA算法的初始最優點,否則執行x0=xn,再將x0作為SA算法的初始最優點。
(4)確定擾動次數k=1和最大循環步驟Lmax。
(5)在x0附近產生擾動,得到一個新解xm,并計算f(x0),f(xm)和Δf。
(6)根據Metropolis準則判斷,若 Δf>0,計算接受概率p=exp(-Δf/T),如果p>rand(0,1),則接受xm,即x0=xm進入下一步;相反則不接受xm,進入下一步;如果Δf≤0,則x0=xm,進入下一步;由于模擬退火算法和遺傳算法單獨使用時適應度函數互為倒數,當使用混合模擬退火遺傳算法時應該特別注意,在退火過程中Metropolis準則應做相應的改動。
(7)判斷是否達到擾動次數最大值,沒有達到,則k=k+1,轉至步驟(5);否則進入下一步。判斷SA抽樣是否穩定,穩定則進入下一步產生新種群,否則進行退火處理。退火次數r=r+1,更新溫度T(r),轉至步驟(4)。
(8)判斷新種群是否滿足收斂準則,滿足則進行解碼操作,得到最優解作為BP網絡的權值和閾值;否則轉入步驟(2),繼續進行模擬退火遺傳算法操作。
(9)計算BP神經網絡誤差,判斷誤差精度能否滿足要求,滿足要求則進入下一步;否則繼續此步操作,更新其權值和閾值,直到滿足結束條件,進入下一步。
(10)BP神經網絡訓練完畢,進行預測分析,得到滿意的結果。
在用模擬退火算法和遺傳算法優化BP神經網絡的基礎上建立SAGA-BP神經網絡,以6個聲品質客觀參量作為網絡的輸入,以聲品質主觀評分值作為網絡的期望輸出,建立電動轎車警示聲聲品質的主觀評價客觀量化模型。目前尚沒有明確的理論指導隱含層神經元數目的選取,只能依靠經驗公式配合實際訓練時的誤差、精度和訓練時間等參數來選取。隱含層選取的經驗公式為

式中:n和l分別為輸入層和輸出層神經元的個數;α為1~10之間的常數。
在實際操作過程中,一般從較少的隱含層數開始對網絡進行訓練,逐步增加神經元的個數,比較網絡收斂后網絡的誤差、精度和訓練時間,從而選取合適的隱含層神經元數目。
本文中結合經驗公式和實際訓練情況,選取隱含層神經元數為12,此時精度最高、檢驗誤差最小,同時訓練時間也比較適中。從而所構建的電動轎車警示聲聲品質智能化的主觀評價客觀量化SAGABP神經網絡模型的拓撲結構為 6-12-1,如圖 4所示。

圖4 SAGA-BP神經網絡的拓撲結構圖
在BP神經網絡訓練之前采用SAGA算法對其初始權值和閾值進行優化,遺傳代數選擇為130,交叉概率選取為0.6,變異概率為0.05;模擬退火中初始溫度T為999℃,退火速率α選為0.9,最大循環步驟Lmax為20;BP神經網絡期望誤差為0.000 9,訓練次數為5 000次,學習速率為0.04,附加動量因子為0.5。
選擇120個聲音樣本中的前80%,即96個樣本作為訓練樣本,剩下的24個樣本用來檢驗模型。訓練之前需對所有樣本進行歸一化處理:

式中:和xi為歸一化處理前、后樣本值,xmax和xmin為樣本中的最大值和最小值。
該模型采用訓練輸出值和期望輸出值的均方誤差作為模型誤差,用MES表示:

式中:MES為模型誤差;L為樣本數;tk為網絡第k組樣本的實際輸出值;yk為第k組樣本的期望輸出值。
圖5為SAGA-BP神經網絡訓練誤差性能曲線,在訓練了1 086步后誤差為0.000 899 84,達到了設定的目標精度。

圖5 SAGA-BP神經網絡誤差性能曲線
圖6為SAGA-BP神經網絡模型的預測值與期望輸出值之間的相關系數散點圖。從圖中可以看出,SAGA-BP神經網絡模型的相關性高達0.985 94,具有強相關性,說明SAGA-BP神經網絡模型能夠很好地完成客觀參數到主觀評價值的映射。
圖7為模型對檢驗樣本的百分比誤差。由圖可見,其檢驗誤差均在5%以內,這說明通過遺傳算法和模擬退火算法優化過的BP神經網絡模型能很好地實現聲品質客觀參量到主觀評分值的映射。在后續警示聲設計的過程中,只需將聲音信號的客觀參量代入模型計算即可精確地預測聲音樣本的主觀煩躁度,而省去組織試聽人員進行主觀評價試驗,簡化了聲品質分析過程中煩瑣步驟,避免了因人為因素而導致的誤差,節省大量人力物力等成本。

圖6 SAGA-BP網絡模型預測值與期望值之間的相關性

圖7 SAGA-BP神經網絡模型檢驗樣本百分比誤差
本文中針對電動轎車在低速行駛時車外聲很小的問題提出一種車外警示聲的設計方法。首先,在采集不同傳統車車外噪聲的基礎上利用語音波形合成技術進行聲音的設計與合成,得到大量的車外聲樣本;其次,借助國內外聲品質的研究經驗,通過聲品質的主觀評價試驗選出各工況下評分最高的聲音樣本作為該工況下電動轎車的車外警示聲;最后,依據聲品質的主客觀評價試驗數據,利用遺傳算法和模擬退火算法來優化BP神經網絡,建立SAGA-BP神經網絡的電動轎車警示聲聲品質主觀評價客觀量化模型。從模型的運行結果可以看出,所建立的模型具有很高的預測精度和收斂速度,可直接替代主觀評價過程,從而節省大量的人力物力資源,提高工作效率,節省成本。
參考文獻
[1]HEATHER K, MANABU S, TODD S.Development of approaching vehicle sound for pedestrians(VSP)for quiet electric vehicles[C].SAE Paper 2011-01-0928.
[2]STEPHAN B,BERNHARD G.Sound engineering for electric and hybrid vehicles[C].SAE Paper 2011-39-7228.
[3]ETIENNE P,RYAN R,CHAMARD J C.Detectability and annoyance of warning sounds for electric vehicles[J].Proceeding of Meeting on Acoustics,2013,19:040033.
[4]HEATHER K, MANABU S,TODD S, et al.Development of approaching vehicle sound for pedestrians(VSP)for quiet electric vehicles[C].SAE Paper 2011-01-0928.
[5]宋知用.MATLAB在語音信號分析與合成中的應用[M].北京:北京航空航天大學出版社,2013.
[6]劉強.重型商用車駕駛室內聲品質預測分析技術[D].長春:吉林大學,2016.
[7]沈哲,左言言,等.影響車輛聲品質聽審實驗的相關因素研究[J].噪聲與振動控制,2008(8):188-192.
[8]謝軍.汽車聲品質評價技術及方法研究[D].長春:吉林大學,2009.
[9]錢堃.駕駛室內聲品質合成等效模型的建立及聲品質評價分析研究[D].長春:吉林大學,2013.
[10]劉月娥,何東健,李崢嶸.一種用于BP網絡優化的并行模擬退火遺傳算法[J].計算機應用,2006,26(1):204-206.
[11]邊霞,米良.遺傳算法理論及其應用研究進展[J].計算機應用研究,2010(7):2425-2434.
[12]朱凱,王正林.精通MATLAB神經網絡[M].北京:電子工業出版社,2010.
[13]HOLLAND J H.Adaptation in natural and artificial systems[M].Cambridge MIT Press,1975.