夏 雪 羅夏云
(1.91388部隊41分隊 湛江 524000)(2.海軍工程大學 武漢 430000)
目標識別是現代海戰中的重要環節,主要通過聲納員聽聲辨識或者機器識別實現。由于水下環境的復雜性以及目標聲學特征的多變性,實際上在現階段,水下目標的識別主要依靠聲吶員聽音并結合譜圖進行分析判斷[1]。
聲納員對目標的聽音判斷主要是從心理聲學角度進行的,主觀上,人可以感覺聲音的響度、音調和音色[2]。對于能夠定量描述的響度和音調,已經在水下目標識別的研究中取得了一定的進展,但這兩類特征不能完全反映人耳主觀感知不同聲音信號的差別程度,并且非常依賴于樣本的選取[3]。
音色目前主要用于評價語音和樂音的聲品質,它囊括了除音調和響度外的所有的聲音主觀屬性,無法用一維尺度定量表述[4]。目前已參數化的聽覺感知特征主要分為頻域特征和時域特征兩類[5],前者包括譜質心、譜通量、譜下降值等;后者包括時域質心,零交點比率、上升時間、下降時間等[6]。上述這些具有明確聽覺感知含義的信號特征已被應用于樂器和語音識別中。1999年,Mcadams等發現利用譜結構中的包絡特征可以區分樂器聲[7];2000年,Eronen等利用共44維的譜特征和時域特征實現對樂器的音色識別[8];隨后,Brown等在2001年利用多維倒譜特征識別木管樂器達到75%,利用一維譜質心識別木管樂器達到50%[9];2003年,Giulio等利用譜質心、譜質心帶寬、不和諧性和諧波能量的偏斜度實現了對樂器的音色識別[10]。
對于音色屬性的建模,是模仿聽覺特征提取水面目標輻射噪聲特征量的主要途徑。水面目標輻射噪聲主要包括螺旋槳噪聲、機械噪聲和水動力噪聲,其中螺旋槳噪聲是主要噪聲[11]。本文從音色特征的物理含義出發,提取水面目標輻射噪聲音色特征[12],將提取的音色特征用于目標識別上,結果表明,音色特征在水面目標輻射噪聲的識別上有良好的效果。
音色特征量在這里指聽覺感知特征中的頻譜特征,主要包括譜質心、譜質心帶寬、譜不規律性和譜下降值,下面分別闡述其物理意義和計算方法。
1)譜質心(spectrum centroid,SC)是描述音色屬性的重要信號特征之一,它是描述聲音信號的頻率分布和能量分布的信息,當聲音集中在高頻時,聲音明亮清晰、有光澤,相反在低頻,聲音暗、悶、不美。譜質心的物理含義是聲音能量集中的區域,在頻率分析范圍內,將譜能量函數看成是頻率的概率密度函數,譜質心便是頻率的一階矩。
計算公式為

E(n)為信號x(n)經過DTFT變化后所對應頻率的譜能量,f(n)為x(n)經過DTFT變化后對應的頻率,N為DFT長度,P(E(n))為每個頻率對應的能量相對于總能量的概率值,SC為信號的譜質心。
2)譜質心帶寬(spectrum centroid bandwidth,SCB)指聲音能量集中的頻帶寬度,即在[S C,fmax]內的譜質心與在[0,SC]內譜質心之間的差值,主要反映了聲音能量集中的區域。
計算公式為

SChigh為[S C,fmax]內的譜質心,SClow為內的譜質心。
3)譜下降值(spectrum roll-off,SRO)反映頻譜的傾斜程度,在語音學領域,一般用來區分嗓音和非嗓音,也可以用來區分高頻的和敲擊的瞬時聲音。反映了聲音能量開始下降時所對應的頻率點。SRO定義為功率譜累計的幅度在C以下的頻率值。C按經驗值取0.85或者0.6。
計算公式為

4)譜不規律性(spectrum irregularity,SI)反映了包絡譜的形狀,是一個復音在頻譜上相鄰分音的幅度差程度的函數。因此,大幅度差值產生凹口包絡,而較小差值則產生較平滑包絡。
計算公式為

采用A,B,C三類實測水面目標輻射噪聲數據進行特征提取,均采用標準水聽器錄制,采樣率為44100Hz,三類水面目標輻射噪聲信號各選用120個樣本,所選用的噪聲樣本都是在不同的工況以及海洋環境下錄制的,每個信號長度為5s,特征提取前對信號進行降采樣處理,降采樣后的采樣率為8820Hz。
從聽音的角度來看,A類水面目標輻射噪聲平穩,螺旋槳擊水“嘩嘩”聲清晰,并伴有“啪啪”聲,聽起來比較輕快、明亮,譜質心的值較高;C類水面目標輻射噪聲有較強的“咕嚕咕嚕”聲,輕微的螺旋槳劃水聲,聽起來比較沉悶,所以譜質心的值較低;B類水面目標輻射噪聲聽起來音色介于A,B之間,譜質心的值也應該介于兩者之間。從圖1(a)可以看出,A目標信號的譜質心值最高,C目標的譜質心值最低,B目標的譜質心值介于兩者之間,實驗得到的結果與聽音判斷的結果吻合,理論結合實測數據說明譜質心可作為分辨三類目標的音色特征。譜質心帶寬是高于譜質心的頻帶內的SC與低于譜質心的頻帶內SC的差值。圖1(b)中,三類目標的譜質心帶寬有少部分重疊在一起,C類目標的譜質心帶寬最高,B類目標的譜質心帶寬最低。
譜不規律性主要是用來描述包絡譜的形狀,通過研究發現,信號能量越大諧波次數越多,則譜不規律性的值越小,表示信號中的噪聲特性越明顯,越不具有規律性。圖1(c)中看出,三類目標的輻射噪聲計算得到的譜不規律性的值相互交疊在一起,B類目標的SI比A和C類目標的SI稍大,而A和C類目標的SI基本上一樣,利用譜不規律性不能很好地區分三類目標。

圖1 音色特征
譜下降值在語音學中主要被用于區分嗓音和非嗓音,用來描述頻譜的傾斜程度。運用到水面目標輻射噪聲中來主要是描述功率譜的幅度累積在C以下的頻率值,C一般取0.85或者0.6,在本文中取C=0.85。圖1(d)中A目標的譜下降值與B、C目標能夠區分開,而B、C目標的譜下降值有部分疊加在一起,無法區分開。所以采用譜下降值在一定程度上能夠對三類目標進行區分。
本文將音色特征應用于水面目標輻射噪聲的特征提取,描述了音色特征參量的物理含義和計算方法,對試驗數據進行分析得到如下結論:譜質心、譜質心帶寬、譜下降值能夠對目標進行一定程度地區分,譜不規律性則不能很好地區分目標。
本文通過實測數據證明了對水面目標輻射噪聲進行音色分析能夠對其進行有效區分,在此基礎上,音色特征與水面目標輻射噪聲音質屬性的關聯程度,所反映的人耳的主觀聽覺感受,有待于進一步的深入研究,為目標機器識別和人耳識別相結合奠定基礎。