999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

水下聲目標(biāo)的梅爾倒譜系數(shù)智能分類方法

2019-05-22 09:39:16張少康田德艷
應(yīng)用聲學(xué) 2019年2期
關(guān)鍵詞:特征提取分類記憶

張少康 田德艷

(1 海軍潛艇學(xué)院 青島 266000)

(2 青島海洋科學(xué)與技術(shù)試點(diǎn)國(guó)家實(shí)驗(yàn)室 青島 266000)

0 引言

傳統(tǒng)水下聲目標(biāo)識(shí)別分類方法需要人工提取具有可推廣性、泛化能力強(qiáng)的特征數(shù)據(jù),其過(guò)程繁瑣復(fù)雜,專業(yè)性強(qiáng),需要人的參與,識(shí)別分類過(guò)程具有較強(qiáng)的人機(jī)交互特性。近幾年,隨著浮標(biāo)潛標(biāo)、水下滑翔機(jī)、AUV、UUV 等水下無(wú)人潛航器的發(fā)展,基于水下無(wú)人移動(dòng)平臺(tái)的聲學(xué)探測(cè)體系正在不斷建立完善。水下聲目標(biāo)識(shí)別分類是水聲探測(cè)的“瓶頸”,同時(shí)也是關(guān)鍵技術(shù)之一。未來(lái)水下無(wú)人聲學(xué)探測(cè)預(yù)警體系要求潛航器本身具備水下聲目標(biāo)識(shí)別分類能力,而傳統(tǒng)水下聲目標(biāo)識(shí)別分類方法已無(wú)法滿足此要求,因此研究智能化水下聲目標(biāo)識(shí)別分類方法具有重要意義。

一直以來(lái),特征向量提取方法都是水下聲目標(biāo)識(shí)別分類的研究重點(diǎn),基于聽(tīng)覺(jué)特征的水下聲目標(biāo)特征提取方法是研究熱點(diǎn)之一,其中,基于語(yǔ)音識(shí)別方法提取梅爾倒譜系數(shù)(Mel frequency cepstrum coefficient, MFCC)進(jìn)行水下聲目標(biāo)識(shí)別是常用的方法之一。如文獻(xiàn)[1]介紹了差分梅爾頻率倒譜系數(shù)的概念和相應(yīng)的特征提取方法,對(duì)水下目標(biāo)進(jìn)行了基于MFCC 特征提取方法仿真研究和實(shí)驗(yàn)分析;文獻(xiàn)[2]將MFCC 特征應(yīng)用于船舶和鯨類水下聲信號(hào)的特征提取中,提取了船舶和鯨類聲信號(hào)的MFCC 特征,通過(guò)高斯混合模型對(duì)提取的MFCC特征進(jìn)行訓(xùn)練和識(shí)別分類,討論MFCC維數(shù)變化和不同MFCC 特征組合對(duì)識(shí)別分類性能的影響;另外文獻(xiàn)[3–5]也進(jìn)行了MFCC 特征提取相關(guān)方面的研究工作,并取得了一定的研究成果。近幾年來(lái),以深度學(xué)習(xí)為代表的人工智能算法發(fā)展迅速,深度學(xué)習(xí)是人工神經(jīng)網(wǎng)絡(luò)的發(fā)展,于2006年被提出[6],目前已發(fā)展出自編碼器(Auto encode, AE)[7]、深度置信網(wǎng)絡(luò)(Deep belief networks,DBN)[8]、卷積神經(jīng)網(wǎng)絡(luò)(Convolutional neural network,CNN)[9?10]、循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent neural networks, RNN)[11?13]、生成對(duì)抗網(wǎng)絡(luò)(Generative adversarial network, GAN)[14?15]及其相關(guān)變種等多種模型,在各個(gè)領(lǐng)域得到廣泛的應(yīng)用,其中,長(zhǎng)短時(shí)記憶(Long short-term memory, LSTM)網(wǎng)絡(luò)在語(yǔ)音識(shí)別領(lǐng)域應(yīng)用效果顯著。

深度學(xué)習(xí)具備從大量數(shù)據(jù)中自動(dòng)學(xué)習(xí)特征的能力,但其在水下聲信號(hào)識(shí)別分類領(lǐng)域的應(yīng)用目前還處于起步階段。區(qū)別于語(yǔ)音識(shí)別,水下聲信號(hào)識(shí)別分類具有樣本量少、數(shù)據(jù)獲取困難等特點(diǎn),因此有必要首先對(duì)其進(jìn)行特征提取。從當(dāng)前研究情況來(lái)看,采用MFCC特征提取方法對(duì)水下聲目標(biāo)信號(hào)進(jìn)行特征提取和識(shí)別分類被證明為一種行之有效的手段,但上述方法均采用了傳統(tǒng)的BP 神經(jīng)網(wǎng)絡(luò)或支持向量機(jī)(Support vector regression, SVM)模型作為分類器,相比之下,深度學(xué)習(xí)方法更具有挖掘深層次數(shù)據(jù)特征的能力,并更好地解決了模型訓(xùn)練過(guò)程中的梯度彌散和數(shù)據(jù)規(guī)模問(wèn)題。另外,當(dāng)前研究均針對(duì)水面艦船等有人平臺(tái)的水聲目標(biāo)識(shí)別分類問(wèn)題,而非未來(lái)水下無(wú)人平臺(tái)。

未來(lái)水下無(wú)人平臺(tái)進(jìn)行水下目標(biāo)識(shí)別分類的主要任務(wù)是能夠正確區(qū)分水面、水下兩類目標(biāo)。因此,本文以此為研究目的,通過(guò)對(duì)水上、水下兩類水聲目標(biāo)信號(hào)進(jìn)行分析,提取MFCC 特征向量,作為樣本有監(jiān)督預(yù)訓(xùn)練長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)模型,采用訓(xùn)練好的分類模型,對(duì)實(shí)際水聲信號(hào)進(jìn)行預(yù)測(cè)分類,驗(yàn)證了模型的有效性。

1 MFCC水下聲目標(biāo)特征提取與智能識(shí)別分類

1.1 MFCC水下聲目標(biāo)特征提取

MFCC 特征提取最早應(yīng)用于語(yǔ)音識(shí)別,是一種有效的特征提取方法,其特征提取過(guò)程如圖1所示[1]。

圖1 MFCC 特征提取過(guò)程Fig.1 Feature extraction process of MFCC

(1)分幀

分幀是語(yǔ)音信號(hào)分析中常用的處理過(guò)程,由于目標(biāo)噪聲信號(hào)本質(zhì)上是非平穩(wěn)過(guò)程,具有時(shí)變特性,因此通常對(duì)信號(hào)作分幀處理進(jìn)行短時(shí)分析,提取幀特征參數(shù),最后由若干幀特征參數(shù)共同組成訓(xùn)練樣本特征向量。為保持每幀信號(hào)之間的連續(xù)性,幀與幀之間存在交疊,稱為“幀移”,本文每幀長(zhǎng)度取25 ms,幀移取10 ms。

(2)求能量譜

通過(guò)快速傅里葉變換得到幀信號(hào)頻譜,進(jìn)而得到信號(hào)能量譜,其公式可表述為

其中,x(n)為輸入幀信號(hào),X(f)為輸入幀信號(hào)頻譜。

(3)濾波

將求得的能量譜通過(guò)梅爾濾波器組,其公式可表述為

其中,N為各幀信號(hào)總點(diǎn)數(shù),Hm(f)梅爾濾波器組系數(shù)。

(4)對(duì)數(shù)運(yùn)算

將濾波后的能量譜作對(duì)數(shù)運(yùn)算,其公式可表述為

(5)求倒譜

將上述對(duì)數(shù)能量譜求離散余弦變換,即可得到MFCC參數(shù),其公式表述如下:

其中,n=1,2,··· ,p,p為MFCC階數(shù),M為濾波器個(gè)數(shù)。

通常MFCC參數(shù)只表述信號(hào)的靜態(tài)特征,而差分梅爾頻率倒譜系數(shù)則表征信號(hào)的動(dòng)態(tài)特征。一階差分及二階差分梅爾倒譜系數(shù)計(jì)算過(guò)程分別如下所示:

其中,C(n)為第n幀MFCC 系數(shù),D(n)為第n幀一階差分梅爾頻率倒譜系數(shù),D′(n)為第n幀二階差分梅爾頻率倒譜系數(shù)。上述三者共同構(gòu)成幀特征向量,即

1.2 長(zhǎng)短時(shí)記憶(LSTM)模型

圖2 LSTM 基本結(jié)構(gòu)單元Fig.2 Basic structural unit of LSTM

長(zhǎng)短時(shí)記憶(LSTM)網(wǎng)絡(luò)[12]是循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的改進(jìn)形式,其基本單元被稱為記憶塊,由一個(gè)中心節(jié)點(diǎn)和3個(gè)門控單元組成。中心節(jié)點(diǎn)通常被稱為記憶細(xì)胞,用以存儲(chǔ)當(dāng)前網(wǎng)絡(luò)狀態(tài),3 個(gè)門控單元分別被稱作輸入門、輸出門和遺忘門,用以控制記憶塊內(nèi)的信息流動(dòng)。在前向傳播過(guò)程中,輸入門用以控制輸入到記憶細(xì)胞的信息流,輸出門用以控制記憶細(xì)胞到網(wǎng)絡(luò)其他結(jié)構(gòu)單元的信息流;在反向傳播過(guò)程中,輸入門用以控制迭代誤差流出記憶細(xì)胞,輸出門用以控制迭代誤差流入記憶細(xì)胞。而遺忘門則用以控制記憶細(xì)胞內(nèi)部的循環(huán)狀態(tài),決定信息的取舍或遺忘。通過(guò)這種門控機(jī)制,LSTM網(wǎng)絡(luò)得以控制單元內(nèi)的信息流動(dòng),使其具備了保存長(zhǎng)時(shí)間信息的能力,即“記憶”能力,并使其在訓(xùn)練過(guò)程中能夠防止內(nèi)部梯度受外部干擾,避免了梯度彌散和梯度爆炸問(wèn)題,其基本結(jié)構(gòu)單元如圖2所示[16]。

設(shè)單個(gè)LSTM記憶塊的輸入向量為xt,輸出向量為yt,前向傳播公式可表述為[17]

(1)長(zhǎng)期記憶單元Ct更新過(guò)程

其中,ft代表遺忘門,it代表輸入門。在每一個(gè)時(shí)刻,遺忘門會(huì)控制上一時(shí)刻記憶的遺忘程度,而輸入門則控制新記憶寫入長(zhǎng)期記憶的程度。ft、it、都是與上一時(shí)刻的短期記憶ht?1和當(dāng)前時(shí)刻輸入xt相關(guān)的函數(shù),其中,σ是sigmoid 函數(shù),取值范圍[0,1],tanh 函數(shù)取值范圍[?1,1]。另外,式(8)~(10)中Wf、Wi、Wc分別為遺忘門、輸入門及Ct更新過(guò)程的權(quán)重參數(shù),bf、bi、bc分別為這三個(gè)過(guò)程對(duì)應(yīng)的偏置參數(shù)。

(2)短期記憶單元ht更新過(guò)程

其中,ot表示輸出門,控制著短期記憶如何受長(zhǎng)期記憶影響,式(12)~(13)中Wo、bo分別為輸出門的權(quán)重和偏置參數(shù)。

1.3 MFCC特征智能識(shí)別分類

由于門控機(jī)制的作用,使LSTM 細(xì)胞單元具備“記憶”能力,因此常被用來(lái)處理帶有時(shí)間序列性質(zhì)的問(wèn)題,如語(yǔ)音識(shí)別、自然語(yǔ)言處理等。水下聲目標(biāo)信號(hào)同樣帶有時(shí)間序列特性,另外,經(jīng)分幀處理獲取的MFCC 特征數(shù)據(jù)之間存在時(shí)空連續(xù)性。因此,本文將獲取的噪聲信號(hào)MFCC 特征數(shù)據(jù)作為L(zhǎng)STM輸入向量,通過(guò)有監(jiān)督預(yù)訓(xùn)練LSTM 模型,得到網(wǎng)絡(luò)模型參數(shù)最優(yōu)解并保存,用以對(duì)未知類別噪聲信號(hào)進(jìn)行識(shí)別分類,其流程圖如圖3所示。

圖3 MFCC 智能識(shí)別分類流程圖Fig.3 Intelligent recognition process of MFCC

對(duì)水下聲目標(biāo)信號(hào)樣本作分幀處理,依據(jù)公式(1)~(7)MFCC 特征提取過(guò)程,獲取各幀包含36個(gè)特征參數(shù)的MFCC 特征向量Tn,這36 個(gè)特征參數(shù)由12 個(gè)MFCC 參數(shù)、12 個(gè)一階差分梅爾頻率倒譜系數(shù)和12 個(gè)二階差分梅爾頻率倒譜系數(shù)共同組成;按各幀時(shí)間先后順序,生成各樣本MFCC 特征數(shù)據(jù)D作為L(zhǎng)STM網(wǎng)絡(luò)輸入向量,

其中,m為幀數(shù)。

基于MFCC 特征的智能識(shí)別分類方法主要包括數(shù)據(jù)預(yù)處理、模型訓(xùn)練、預(yù)測(cè)分類幾個(gè)功能模塊。

通過(guò)前期數(shù)據(jù)預(yù)處理過(guò)程,獲取目標(biāo)噪聲的MFCC 特征向量,采用基于時(shí)間的反向傳播(Back propagation trough time, BPTT)算法,對(duì)LSTM網(wǎng)絡(luò)展開(kāi)訓(xùn)練,通過(guò)逐步減小模型輸出與理論輸出誤差,得到網(wǎng)絡(luò)模型參數(shù)最優(yōu)解,最終訓(xùn)練好的網(wǎng)絡(luò)模型可用于對(duì)未知目標(biāo)噪聲的識(shí)別分類。該識(shí)別分類過(guò)程全程不需要人的參與,通過(guò)對(duì)水下無(wú)人平臺(tái)加裝具備MFCC 特征提取及LSTM 識(shí)別分類能力的信號(hào)處理設(shè)備,將聲學(xué)傳感器實(shí)時(shí)獲取的水下聲信號(hào)進(jìn)行MFCC 特征提取,獲取初始特征向量,作為L(zhǎng)STM 預(yù)測(cè)分類模型的輸入,經(jīng)模型的預(yù)測(cè)分類過(guò)程,可實(shí)時(shí)獲取所探測(cè)目標(biāo)的類別屬性。

2 模型驗(yàn)證

為驗(yàn)證上述模型的有效性,本文使用實(shí)際水下聲目標(biāo)信號(hào)進(jìn)行了驗(yàn)證。其中,訓(xùn)練樣本時(shí)長(zhǎng)為1 s,經(jīng)分幀后獲取MFCC特征參數(shù)維數(shù)為3861,幀長(zhǎng)設(shè)置為25 ms,幀移為10 ms。本文僅針對(duì)水面、水下兩類目標(biāo)進(jìn)行分類,屬于二分類問(wèn)題,深度學(xué)習(xí)模型采用LSTM 網(wǎng)絡(luò),其相關(guān)參數(shù)設(shè)置如表1所示。

表1 網(wǎng)絡(luò)相關(guān)參數(shù)Table1 Related parameters of the network

圖4 訓(xùn)練數(shù)據(jù)分類效果圖Fig.4 Classification of Training data

模型訓(xùn)練數(shù)據(jù)庫(kù)包含各種已知類別的艦船輻射噪聲數(shù)據(jù)近1600條,按1 s 時(shí)長(zhǎng)進(jìn)行處理,MFCC特征數(shù)據(jù)作為L(zhǎng)STM 識(shí)別分類模型的樣本庫(kù)數(shù)據(jù),樣本總數(shù)為65284,其中水面目標(biāo)樣本數(shù)42375,水下目標(biāo)樣本數(shù)22909。為驗(yàn)證模型的有效性,避免因單次結(jié)果導(dǎo)致的錯(cuò)誤結(jié)論,本文采用交叉驗(yàn)證的方式獲取訓(xùn)練樣本集,即從樣本庫(kù)中隨機(jī)選取一定比例樣本生成多組訓(xùn)練集,通過(guò)綜合分析多組訓(xùn)練集條件下的模型結(jié)果得到可靠結(jié)論,本文該比例為4/5。同時(shí),為避免訓(xùn)練樣本出現(xiàn)有偏性估計(jì)問(wèn)題,在抽取訓(xùn)練樣本時(shí),兩類目標(biāo)訓(xùn)練樣本數(shù)同樣滿足此比例,即隨機(jī)抽取水面目標(biāo)、水下目標(biāo)各4/5的樣本組成訓(xùn)練集,最終測(cè)試結(jié)果如表2所示。圖4為模型訓(xùn)練完成后,各組訓(xùn)練數(shù)據(jù)分類效果圖。

表2 測(cè)試結(jié)果Table2 Test results

由上述結(jié)果可以看出,該水下目標(biāo)識(shí)別分類方法在本文所采用幾組測(cè)試集條件下,對(duì)水面目標(biāo)的識(shí)別分類正確率在86%以上,對(duì)水下目標(biāo)的識(shí)別分類正確率在87%以上,說(shuō)明本文提出的基于MFCC的水下目標(biāo)識(shí)別分類方法是可行的。另外,識(shí)別分類過(guò)程僅需要輸入水下聲目標(biāo)聲壓數(shù)據(jù),其間數(shù)據(jù)處理、分類識(shí)別都不經(jīng)人工干預(yù),因此該方法可應(yīng)用于水下無(wú)人平臺(tái)對(duì)水下目標(biāo)進(jìn)行智能化識(shí)別分類。

3 結(jié)論

本文針對(duì)未來(lái)水下無(wú)人平臺(tái)智能化識(shí)別分類水下目標(biāo)的需求,提出了一種基于梅爾倒譜系數(shù)特征和長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)的水下聲目標(biāo)智能識(shí)別分類方法,該方法通過(guò)提取水下聲目標(biāo)的MFCC特征系數(shù)作為深度學(xué)習(xí)模型輸入向量,有監(jiān)督訓(xùn)練LSTM模型,以實(shí)現(xiàn)對(duì)未知目標(biāo)噪聲進(jìn)行識(shí)別分類。經(jīng)驗(yàn)證表明,該模型能夠有效地區(qū)分水面和水下兩類目標(biāo),且具備一定的智能識(shí)別分類能力。

猜你喜歡
特征提取分類記憶
分類算一算
基于Gazebo仿真環(huán)境的ORB特征提取與比對(duì)的研究
電子制作(2019年15期)2019-08-27 01:12:00
分類討論求坐標(biāo)
數(shù)據(jù)分析中的分類討論
教你一招:數(shù)的分類
記憶中的他們
一種基于LBP 特征提取和稀疏表示的肝病識(shí)別算法
兒時(shí)的記憶(四)
兒時(shí)的記憶(四)
記憶翻新
海外文摘(2016年4期)2016-04-15 22:28:55
主站蜘蛛池模板: 久久一日本道色综合久久| 天天色综网| 2020精品极品国产色在线观看| 国产又爽又黄无遮挡免费观看| 一级看片免费视频| 欧美精品aⅴ在线视频| 国产精品网址你懂的| a级毛片一区二区免费视频| 原味小视频在线www国产| 亚洲性一区| 国产女人在线| 亚洲天堂网在线观看视频| 欧美成一级| 91成人试看福利体验区| 国产第一福利影院| 国产乱子伦视频三区| 91精品啪在线观看国产91| аv天堂最新中文在线| 伊在人亚洲香蕉精品播放 | 国产精品护士| 特级毛片免费视频| 狠狠亚洲婷婷综合色香| 国产精品午夜福利麻豆| 久久青青草原亚洲av无码| 国产精品无码制服丝袜| 2022国产91精品久久久久久| yy6080理论大片一级久久| 91精品人妻互换| 在线观看国产一区二区三区99| 亚洲天堂网2014| 欧美精品1区| 麻豆AV网站免费进入| 中文成人在线| 伊人久久精品无码麻豆精品| 国产毛片网站| 青草视频免费在线观看| 久久国产精品国产自线拍| 久久美女精品| 精品综合久久久久久97超人| 久久99热66这里只有精品一| 91精品aⅴ无码中文字字幕蜜桃| 国产18在线| 久久黄色视频影| 99视频精品全国免费品| 亚洲日本中文字幕乱码中文| 欧美影院久久| 国产精品污污在线观看网站| 亚洲美女久久| 亚洲精品无码专区在线观看| 天天干天天色综合网| 亚洲高清在线天堂精品| 欧美日韩中文国产va另类| 亚洲熟女偷拍| 精品无码一区二区三区电影| 婷婷激情亚洲| 久久超级碰| 久久这里只有精品国产99| 中文精品久久久久国产网址| 国产精品免费入口视频| 国产精品成人一区二区不卡| 欧美成人综合在线| 干中文字幕| av一区二区三区在线观看| 日本色综合网| 精品国产毛片| 福利视频99| 白丝美女办公室高潮喷水视频| 亚洲AⅤ永久无码精品毛片| 白丝美女办公室高潮喷水视频| 无码内射中文字幕岛国片| 免费播放毛片| 91精品aⅴ无码中文字字幕蜜桃 | 国产精品 欧美激情 在线播放| 又粗又硬又大又爽免费视频播放| 免费在线观看av| 欧美在线视频a| 久久熟女AV| 亚洲欧美色中文字幕| 四虎精品黑人视频| 亚洲色精品国产一区二区三区| 日韩经典精品无码一区二区| 国产熟睡乱子伦视频网站|