王勇 孟華 陳正武 魏春華 劉壘



摘? ?要:直升機(jī)輻射的聲信號(hào)在空氣中衰減速度慢、傳播距離遠(yuǎn),是直升機(jī)目標(biāo)識(shí)別的主要依據(jù).受人類聽覺系統(tǒng)優(yōu)異的聲音信號(hào)識(shí)別能力的啟發(fā),提出了基于人耳聽覺感知特性的Gammatone倒譜系數(shù)(Gammatone Cepstral Coefficients,GTCC)特征提取方法用于直升機(jī)聲信號(hào)的識(shí)別. 通過仿真實(shí)驗(yàn),詳細(xì)研究了參數(shù)設(shè)置對(duì)識(shí)別系統(tǒng)性能的影響,以及識(shí)別算法在噪聲環(huán)境下的魯棒性、對(duì)各種分類器的普遍適用性和相對(duì)其他特征提取方法的優(yōu)越性,對(duì)實(shí)驗(yàn)結(jié)果給出了合理的解釋. 實(shí)驗(yàn)結(jié)果表明,所提出的方法能夠根據(jù)聲信號(hào)有效地辨識(shí)直升機(jī)的類別,具有很好的抗噪聲干擾能力,有一定的應(yīng)用前景. 不同參數(shù)設(shè)置對(duì)識(shí)別性能的影響程度不同,其中窗函數(shù)長(zhǎng)度、Gammatone倒譜系數(shù)特征數(shù)量和低頻聲信號(hào)對(duì)識(shí)別率的影響較大,而高頻聲信號(hào)對(duì)目標(biāo)識(shí)別的影響較小.
關(guān)鍵詞:聲信號(hào);識(shí)別;直升機(jī);Gammatone濾波器;倒譜系數(shù)
中圖分類號(hào):TP391.4;V275.1? ? ? ? ? ? 文獻(xiàn)標(biāo)志碼:A
Recognition of Helicopter Acoustic Signal Based
on Gammatone Cepstral Coefficients
WANG Yong1?,MENG Hua2,CHEN Zhengwu1,WEI Chunhua1,LIU Lei1
(1. Key Laboratory of Aerodynamic Noise Control,China Aerodynamics Research
and Development Center,Mianyang 621000,China;
2. School of Mathematics,Southwest Jiaotong University,Chengdu 611756,China)
Abstract:The acoustic signal radiated by the helicopter has a slow attenuation speed and a long propagation distance in the air, which is the main basis for recognition of helicopter target. Inspired by the excellent sound signal recognition ability of the human auditory system, an auditory perceptual feature extraction method based on Gammatone cepstral coefficients(GTCC) is proposed to classify helicopter acoustic signal.? Through the simulation experiments,the influence of parameter settings on the recognition performance, the robustness of the proposed method in noisy environments, the universal applicability to various classifiers, and the superiority to other helicopter acoustic signal feature extraction methods were studied in detail. Reasonable explanations of the observed experimental results were also given in this paper. The results show that the proposed method can effectively identify the type of helicopter according to the acoustic signal, and has good anti-interference ability to noise, which has certain application prospects. It is also shown that different parameter settings have different effects on the recognition performance, where the length of window function, the number of Gammatone cepstral coefficient features and the low-frequency acoustic signal have a great influence on the recognition accuracy, while high-frequency acoustic signal has little influence on the recognition.
Key words:acoustic signal;recognition;helicopter;Gammatone filter;cepstral coefficient
直升機(jī)具有獨(dú)特的高機(jī)動(dòng)、低空或超低空飛行能力,不易被雷達(dá)、紅外等探測(cè)識(shí)別手段發(fā)現(xiàn). 但直升機(jī)輻射的噪聲,特別是其旋翼產(chǎn)生的強(qiáng)中低頻噪聲,在空氣中的衰減速率慢、傳播距離遠(yuǎn),極易被地面人員感知,也極易被專用的噪聲預(yù)警系統(tǒng)探測(cè)和識(shí)別.
直升機(jī)聲信號(hào)的識(shí)別與一般模式識(shí)別過程一樣,通常包含特征提取和分類識(shí)別兩個(gè)階段. 特征提取的主要目的是通過變換或映射的方法,在大幅度降低數(shù)據(jù)維數(shù)的同時(shí)提取出能反映待識(shí)別對(duì)象本質(zhì)的最有效或最具代表的個(gè)性特征,減輕分類器負(fù)擔(dān)和識(shí)別系統(tǒng)的設(shè)計(jì)難度. 在前期的研究中,自相關(guān)分析[1]、參數(shù)化譜估計(jì)[2]、小波和小波包分析[3]等各種方法都被用于直升機(jī)聲信號(hào)的特征提取,但是這些特征提取方法并未考慮人耳的聽覺處理特性. 眾所周知,人類的聽覺系統(tǒng)具有十分優(yōu)異的聲音信號(hào)識(shí)別能力,在復(fù)雜噪聲環(huán)境下可靠、便捷地辨識(shí)對(duì)象的能力. 因此,近年來,融入人耳聽覺感知特性的聲信號(hào)特征提取方法吸引了眾多研究者的興趣[4-5].
Gammatone倒譜系數(shù)特征提取方法采用一組相互交疊、中心頻率呈對(duì)數(shù)均勻分布的帶通Gammatone濾波器對(duì)人耳基底膜的沖激響應(yīng)和幅頻特性等進(jìn)行仿真,可以模擬人耳聽覺的動(dòng)態(tài)、非線性響應(yīng)過程以及頻譜分析和頻率選擇特性[6],是一種重要的聽覺感知特征提取方法,已被廣泛應(yīng)用于說話人識(shí)別[7]和水下目標(biāo)識(shí)別[8]中. 本文將Gammatone倒譜系數(shù)特征提取方法應(yīng)用于直升機(jī)聲信號(hào)的識(shí)別,詳細(xì)研究了參數(shù)設(shè)置對(duì)識(shí)別系統(tǒng)的性能影響,以及識(shí)別算法在噪聲環(huán)境下的魯棒性、對(duì)各種分類器的普遍適用性和相對(duì)其他特征提取方法的優(yōu)越性,對(duì)實(shí)驗(yàn)結(jié)果給出了合理的解釋. 仿真實(shí)驗(yàn)結(jié)果表明:本文提出的Gammatone倒譜系數(shù)特征提取方法能夠根據(jù)聲信號(hào)有效地辨識(shí)直升機(jī)的類別,具有很好的抗噪聲干擾能力;窗函數(shù)長(zhǎng)度、Gammatone倒譜系數(shù)特征數(shù)量和低頻聲信號(hào)分量對(duì)識(shí)別率的影響較大,高頻聲信號(hào)分量對(duì)目標(biāo)識(shí)別的影響較小.
1? ?基于Gammatone倒譜系數(shù)的聲信號(hào)識(shí)別
方法
1.1? ?Gammatone濾波器
人類聽覺的生理學(xué)研究表明,聽覺感知系統(tǒng)中的耳蝸基底膜的振動(dòng)響應(yīng)與受刺激的聲音信號(hào)的頻率有關(guān);基底膜具有的這種頻率分解功能是人耳進(jìn)行聲信號(hào)處理的關(guān)鍵環(huán)節(jié). Gammatone聽覺模型采用一組相互交疊的帶通Gammatone濾波器組[9]模擬耳蝸基底膜的頻率分解功能,以提取聲音信號(hào)的個(gè)性特征.
Gammatone濾波器由Aertsen等[10]提出,該濾波器的連續(xù)沖激響應(yīng)為:
gi(t) = a tn-1 ecos(2π fi t + ?i),1≤i≤N? ?(1)
式中:a為濾波器的振幅因子;t≥0為時(shí)間;n=4是模擬人耳聽覺的濾波器階數(shù);?i為相位因子,通常設(shè)為?i = 0;fi為第i個(gè)濾波器對(duì)應(yīng)的中心頻率;bi= 1.019BER(fi)是第i個(gè)濾波器的帶寬,由它決定沖激響應(yīng)的衰減速度. BER(f)為等效矩形帶寬(Equivalent Rectangular Bandwidth,ERB),它與頻率f的關(guān)系為[11]:
BER(f)=lg(0.004 37f+1)? (2)
N≥2為濾波器個(gè)數(shù),由整個(gè)濾波器組的頻率覆蓋范圍[ flow, fhigh]決定.
N = ceil(BER(fhigh) - BER(flow))? ? (3)
式中:flow和fhigh分別為頻率下界和上界;ceil是向上取整函數(shù).
Gammatone濾波器組中,濾波器的中心頻率在ERB域上呈等間隔分布. 因此,在由濾波器組的頻率覆蓋范圍[ flow,fhigh]確定濾波器個(gè)數(shù)N后,有
BER(fi) = BER(flow)+(i-1)×
,1≤i≤N? ? (4)
據(jù)此,可以利用式(2)反算出第i個(gè)濾波器對(duì)應(yīng)的中心頻率fi .
圖1給出了頻率覆蓋范圍為10~12 800 Hz的Gammatone濾波器組(從第3個(gè)濾波器開始,每間隔2個(gè)濾波器顯示1個(gè)Gammatone濾波器)的頻率響應(yīng)示意圖及其每個(gè)濾波器對(duì)應(yīng)的中心頻率和ERB尺度值.從圖1可以看出,Gammatone濾波器是一個(gè)在中心頻率位置具有最大幅度的帶通濾波器,濾波器組在ERB尺度上等間距分布,而在頻率域上呈非線性分布,實(shí)現(xiàn)了對(duì)人耳聽覺模型處理聲音信號(hào)的非線性響應(yīng)過程的模擬. 由圖1(a)可知,低頻段的濾波器數(shù)量多、帶寬窄,而高頻段的濾波器數(shù)量少但帶寬隨之變大. 這種特性使得經(jīng)過Gammatone濾波器組處理后的直升機(jī)聲信號(hào)在低頻段有較高的頻率分辨率而高頻段的頻率分辨率則較低,很好地模擬了人耳對(duì)中低頻聲信號(hào)更敏感的頻譜分析能力. 此外,每個(gè)濾波器中心頻率兩側(cè)的邊沿較陡而拖尾較長(zhǎng),使得Gammatone濾波器在具有較為尖銳的頻率選擇能力的同時(shí)能避免濾波器交界處的共振峰結(jié)構(gòu)破壞.
1.2? ?Gammatone倒譜系數(shù)特征提取與聲信號(hào)識(shí)別
基于Gammatone倒譜系數(shù)特征提取的直升機(jī)聲信號(hào)識(shí)別,采用Gammatone濾波器提取聲信號(hào)的聽覺感知特征,隨后送入分類器進(jìn)行分類識(shí)別得到直升機(jī)的類別信息,其流程如圖2所示.
具體過程如下:
1)分幀和加窗. 根據(jù)直升機(jī)聲信號(hào)的短時(shí)平穩(wěn)特性,把輸入的聲信號(hào)分成長(zhǎng)度為L(zhǎng)的若干幀,幀移通常設(shè)為50%以使幀與幀之間平穩(wěn)過渡,避免相鄰兩幀間的聲信號(hào)變化過大.
為了抑制信號(hào)分析過程中的“頻譜泄漏”,對(duì)直升機(jī)的時(shí)域聲信號(hào)增加窗函數(shù),通常選擇hanning窗:
w(n)=0.51-cos2
π,0≤n≤L-1? ?(5)
2)FFT變換. 對(duì)加窗后的直升機(jī)聲信號(hào)進(jìn)行快速傅里葉變換(Fast Fourier Transform,F(xiàn)FT),將數(shù)據(jù)從時(shí)域轉(zhuǎn)換到頻域,進(jìn)而取絕對(duì)值得到聲信號(hào)的離散能量譜.
3)Gammatone濾波器組濾波. 在指定的頻率覆蓋范圍[ flow,fhigh]內(nèi),用Gammatone濾波器組對(duì)頻譜進(jìn)行濾波處理,得到聲信號(hào)在不同頻率分量上的特征.
4)對(duì)數(shù)壓縮. 對(duì)每個(gè)Gammatone濾波器的輸出進(jìn)行對(duì)數(shù)壓縮,濾除乘性噪聲,得到一組對(duì)數(shù)能量譜.
5)DCT變換. 對(duì)上述能量譜進(jìn)行離散余弦變換(Discrete Cosine Transform,DCT),去除噪聲和特征分量之間的相關(guān)性,得到Gammatone倒譜系數(shù).
6)分類器識(shí)別. 將訓(xùn)練集和測(cè)試集上的Gammatone倒譜系數(shù)沿頻率方向取均值得到Gammatone倒譜系數(shù)特征;然后,將訓(xùn)練集的前M維Gammatone倒譜系數(shù)特征送入分類器進(jìn)行訓(xùn)練,并利用訓(xùn)練好的分類器對(duì)測(cè)試集的前M維Gammatone倒譜系數(shù)特征進(jìn)行分類識(shí)別得到直升機(jī)的類別信息.
2? ?實(shí)驗(yàn)結(jié)果與分析
2.1? ?數(shù)據(jù)與設(shè)置
本文實(shí)驗(yàn)采用的直升機(jī)聲信號(hào)數(shù)據(jù)庫(kù)包含低背景噪聲環(huán)境下采集的3類直升機(jī)在10種不同工況時(shí)輻射的聲音信號(hào),采樣率為25. 6 kHz,采樣時(shí)間為10 s. 將數(shù)據(jù)庫(kù)中的聲信號(hào)每隔0.5 s截取1 s時(shí)間段的數(shù)據(jù)組成共597段長(zhǎng)度為25 600 的聲信號(hào)數(shù)據(jù)集,進(jìn)而將每一類中的75%數(shù)據(jù)作為訓(xùn)練集,剩下的25%數(shù)據(jù)作為測(cè)試集. 因此,訓(xùn)練集和測(cè)試集的樣本數(shù)分別為448和149.
為研究本文提出的聲信號(hào)識(shí)別方法在噪聲背景下的魯棒性,對(duì)原始干凈數(shù)據(jù)加入不同信噪比(Signal-to-Noise Ratio,SNR)的高斯白噪聲,信噪比分別為0 dB、±5 dB、±10 dB、±20 dB和±40 dB. 圖3給出了不同信噪比下的聲信號(hào)頻譜. 從圖中可以看出,直升機(jī)聲信號(hào)的能量主要集中在1 000 Hz以下的低頻段,且在槳葉通過頻率及其諧波頻率附近存在明顯的尖峰. 隨著信噪比的降低,低頻段的能量不再明顯高于高頻段的能量,同時(shí)槳葉通過頻率及其諧波頻率附近的尖峰逐漸消失;信噪比為-40 dB時(shí),已經(jīng)沒有明顯的頻譜尖峰.
由于本文重點(diǎn)關(guān)注聲信號(hào)的特征提取,如無(wú)特別說明,則采用簡(jiǎn)單的最近鄰(Nearest Neighbor,NN)分類器.
2.2? ?結(jié)果與分析
從1.2節(jié)的算法描述中可以看出,基于Gammatone倒譜系數(shù)特征提取的直升機(jī)聲信號(hào)識(shí)別方法包含4個(gè)參數(shù):窗函數(shù)長(zhǎng)度L、頻率范圍[ flow,fhigh]和特征向量數(shù)M. 下面逐一考察它們的設(shè)置對(duì)識(shí)別結(jié)果的影響,在考察某一參數(shù)的影響時(shí),其他參數(shù)采用默認(rèn)設(shè)置.
圖4給出了不同窗函數(shù)長(zhǎng)度下的識(shí)別準(zhǔn)確率結(jié)果. 從圖中可以看出,窗函數(shù)的長(zhǎng)度并不是越大越好,而是有個(gè)合適的中間值,這說明在直升機(jī)聲信號(hào)識(shí)別中,加窗后的數(shù)據(jù)幀不僅需要包含足夠的有用信息,還需要滿足短時(shí)平穩(wěn)條件. 此外,從圖中還可以看出,本文提出的聲信號(hào)識(shí)別方法具有很好的抗干擾能力,即使信噪比為0 dB時(shí)仍具有較好的識(shí)別準(zhǔn)確率. 只有當(dāng)信噪比進(jìn)一步降低,有效信號(hào)逐漸淹沒于噪聲后,所提出方法的識(shí)別率才開始逐漸降低.
圖5給出了不同頻率范圍的上界fhigh和下界flow 設(shè)置下的識(shí)別準(zhǔn)確率結(jié)果. 從圖中可以看出,盡管頻率上界的變化范圍更大,但其不同設(shè)置對(duì)識(shí)別率的影響卻并不大,識(shí)別率對(duì)頻率下界更敏感. 這與直升機(jī)聲信號(hào)輻射中低頻能量大、衰減慢、傳播遠(yuǎn)的固有特性是相符的,也印證了直升機(jī)聲目標(biāo)識(shí)別的有效信息主要聚集于低頻段.
圖6給出了不同特征向量數(shù)時(shí)的識(shí)別準(zhǔn)確率結(jié)果. 從圖中可以看出,隨著特征向量數(shù)的增加,識(shí)別準(zhǔn)確率呈增加的趨勢(shì);只在信噪比極低為-40 dB時(shí),識(shí)別準(zhǔn)確率隨特征向量數(shù)的增加在30%左右波動(dòng). 同時(shí)可以看出,當(dāng)特征向量數(shù)較少時(shí),新特征向量的加入能明顯提升識(shí)別準(zhǔn)確率;而當(dāng)特征向量數(shù)足夠多時(shí),新特征向量的加入對(duì)識(shí)別準(zhǔn)確率的提升并不明顯. 存在這種現(xiàn)象的原因在于:一方面,從圖1(b)中可以看出,前幾個(gè)特征向量對(duì)應(yīng)的Gammatone濾波器的中心頻率較低,而后續(xù)特征向量對(duì)應(yīng)的Gammatone濾波器的中心頻率逐漸增大. 此外,圖5已經(jīng)表明低頻分量對(duì)直升機(jī)聲信號(hào)的識(shí)別非常重要,而高頻分量則幫助較小. 再加上特征向量越多提供的有效信息也越足,這些因素相互作用使得識(shí)別準(zhǔn)確率隨特征向量數(shù)目的增加先迅速提升再緩慢增加. 另一方面,從圖3(b)中可以看出,信噪比極低時(shí),有用的低頻聲信號(hào)已淹沒于噪聲之中,因此更多特征向量的加入并不會(huì)提升識(shí)別性能.
由于本文的重點(diǎn)是基于Gammatone倒譜系數(shù)的特征提取及其在直升機(jī)聲信號(hào)識(shí)別中的應(yīng)用,前述仿真研究中均采用最近鄰(Nearest Neighbor,NN)分類器進(jìn)行分類判決. 為驗(yàn)證所提出的Gammatone倒譜系數(shù)特征提取對(duì)于各種分類器的普遍適用性,圖7給出了本文提出的特征提取方法在不同分類器下的識(shí)別準(zhǔn)確率. 除了最近鄰分類器外,還對(duì)比了4種分類器[12]:二元決策樹(Binary Decision Tree,BDT)分類器、線性判別分析(Linear Discriminant Analysis,LDA)分類器、線性支撐向量機(jī)(Linear Support Vector Machine,LSVM;其中采用“一對(duì)一”分類策略的簡(jiǎn)記為L(zhǎng)SVM1,采用“一對(duì)多”分類策略的簡(jiǎn)記為L(zhǎng)SVM2)分類器. 從圖中可以看出,不同分類器下的識(shí)別準(zhǔn)確率基本一致,只在信噪比為負(fù)值時(shí)存在一定的差異. 當(dāng)信噪比為-5~-20 dB時(shí),二元決策樹的分類結(jié)果略差;而當(dāng)信噪比為-5~-40 dB時(shí),采用“一對(duì)一”分類策略的LSVM1的分類結(jié)果略優(yōu).
為對(duì)比本文提出的Gammatone倒譜系數(shù)(Gammatone Cepstral Coefficients,GTCC)特征提取方法與其他相關(guān)的聲音信號(hào)特征提取方法的性能,仿真實(shí)驗(yàn)中還考察了幾種文獻(xiàn)報(bào)道中采用的典型的直升機(jī)聲信號(hào)特征提取方法,包括:自相關(guān)系數(shù)(Auto-correlation Coefficients,AC)[1]、自回歸(Auto Regressive,AR)模型參數(shù)(與文獻(xiàn)[2]一致,采用前40個(gè)AR參數(shù)作為特征)、小波變換(Wavelet Transform,WT)能量特征(與文獻(xiàn)[3]一致,采用db5小波進(jìn)行10層小波分解)以及另一種基于聽覺感知特性的Mel頻率倒譜系數(shù)(Mel Frequency Cepstral Coefficients,MFCC)特征[4],圖8給出了相應(yīng)的識(shí)別準(zhǔn)確率結(jié)果. 從圖中可以看出,本文提出的GTCC特征提取方法優(yōu)于其他方法,特別是在信噪比分別為-10 dB和-20 dB時(shí),其識(shí)別準(zhǔn)確率最多比其他方法高10.7%和48.3%,具有很好的抗噪聲干擾能力;當(dāng)信噪比大于0 dB時(shí)各種方法的識(shí)別準(zhǔn)確率基本一致,而當(dāng)信噪比極低為-40 dB時(shí),各種方法的識(shí)別準(zhǔn)確率均不高.
3? ?結(jié)? ?論
本文提出了基于Gammatone倒譜系數(shù)特征提取的直升機(jī)聲信號(hào)識(shí)別方法. 通過仿真實(shí)驗(yàn),詳細(xì)研究了4個(gè)參數(shù)的設(shè)置對(duì)識(shí)別系統(tǒng)性能的影響,以及識(shí)別算法在噪聲環(huán)境下的魯棒性、對(duì)各種分類器的普遍適用性和相對(duì)其他特征提取方法的優(yōu)越性,并對(duì)實(shí)驗(yàn)結(jié)果給出了合理的解釋. 仿真實(shí)驗(yàn)結(jié)果表明:本文提出的直升機(jī)聲信號(hào)識(shí)別方法能夠根據(jù)聲信號(hào)有效地辨識(shí)直升機(jī)的類別,且具有很好的抗噪聲干擾能力,有一定的應(yīng)用前景. 參數(shù)影響分析表明:窗函數(shù)長(zhǎng)度、Gammatone倒譜系數(shù)特征數(shù)量和低頻聲信號(hào)分量對(duì)識(shí)別準(zhǔn)確率的影響較大,而高頻聲信號(hào)分量對(duì)目標(biāo)識(shí)別的影響較小.
參考文獻(xiàn)
[1]? ? 衡麗,熊淑華. 直升機(jī)聲信號(hào)的特征分析[J].? 西南科技大學(xué)學(xué)報(bào),2010,25(1):56—59.
HENG L,XIONG S H. Feature analysis of helicopter acoustical signals[J]. Journal of Southwest University of Science and Technology,2010,25(1):56—59. (In Chinese)
[2]? ? 陳虎虎,鐘方平,許學(xué)忠,等. 基于支持向量機(jī)的低空飛行目標(biāo)聲識(shí)別[J]. 系統(tǒng)工程與電子技術(shù),2005,27(1):46—48.
CHEN H H,ZHONG F P,XU X Z,et al. Acoustic recognition of low-altitude flight targets by SVM[J].? Systems Engineering and Electronics,2005,27(1):46—48. (In Chinese)
[3]? ? 李京華,張聰穎,倪寧. 基于參數(shù)優(yōu)化的支持向量機(jī)戰(zhàn)場(chǎng)多目標(biāo)聲識(shí)別[J]. 探測(cè)與控制學(xué)報(bào),2010,32(1):1—5.
LI J H,ZHANG C Y,NI N. Multi-target acoustic identification in battlefield based on SVM of parameter optimization[J].? Journal of Detection & Control,2010,32(1):1—5. (In Chinese)
[4]? ? 劉輝,楊俊安,許學(xué)忠. 基于MFCC參數(shù)和HMM的低空目標(biāo)聲識(shí)別方法研究[J]. 彈箭與制導(dǎo)學(xué)報(bào),2007,27(5):217—219.
LIU H,YANG J A,XU X Z. A novel low altitude passive acoustic target identify approach research based on MFCC and HMM[J]. Journal of Projectiles,Rockets,Missiles and Guidance,2007,27(5):217—219. (In Chinese)
[5]? ? LYON R F,KATSIAMIS A G,DRAKAKIS E M. History and future of auditory filter models[C]//Proceedings of 2010 IEEE International Symposium on Circuits and Systems. Paris,F(xiàn)rance:IEEE,2010:3809—3812.
[6]? ? 陳世雄,宮琴,金慧君. 用Gammatone濾波器組仿真人耳基底膜的特性[J].? 清華大學(xué)學(xué)報(bào)(自然科學(xué)版),2008,48(6):1044—1048.
CHEN S X,GONG Q,JIN H J. Gammatone filter bank to simulate the characteristics of the human basilar membrane[J].? Journal of Tsinghua University (Science and Technology),2008,48(6):1044 —1048. (In Chinese)
[7]? ? 茅正沖,王正創(chuàng),王丹. 基于Gammatone濾波器組的說話人識(shí)別算法研究[J]. 計(jì)算機(jī)工程與應(yīng)用,2015,51(1):200—203.
MAO Z C,WANG Z C,WANG D. Speaker recognition algorithm based on Gammatone filter bank[J]. Computer Engineering and Applications,2015,51(1):200—203. (In Chinese)
[8]? ? 程錦盛. 基于深度學(xué)習(xí)方法的水下目標(biāo)識(shí)別技術(shù)研究[D].? 北京:中國(guó)艦船研究院,2018.
CHENG J S. Underwater target recognition technology base on deep learning[D]. Beijing:China Ship Research and Development Academy,2018. (In Chinese)
[9]? ? PATTERSON R D,ROBINSON K,HOLDSWORTH J,et al.? Complex sounds and auditory images[C]//Auditory Physiology and Perception,Proceedings of the 9th International Symposium on Hearing.? Pergamon:Oxford,1992:429—446.
[10]? AERTSEN A M H J,JOHANNESMA P I M,HERMES D J. Spectro-temporal receptive fields of auditory neurons in the grassfrog[J].? Biological Cybernetics,1980,38(4):235—248.
[11]? GLASBERG B R,MOORE B C J. Derivation of auditory filter shapes from notched-noise data[J]. Hearing Research,1990,47(1/2):103—138.
[12]? 周志華. 機(jī)器學(xué)習(xí)[M]. 北京:清華大學(xué)出版社,2016:53—146.
ZHOU Z H. Machine learning[M]. Beijing:Tsinghua University Press,2016:53—146. (In Chinese)