999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于目標MFCC特征的監督學習方法在被動聲吶目標識別中的應用研究

2018-10-15 06:29:26程錦盛杜選民周勝增
艦船科學技術 2018年9期
關鍵詞:特征模型

程錦盛,杜選民,周勝增,曾 賽

(上海船舶電子設備研究所,上海 201108)

0 引 言

由于水聲環境的復雜性及水聲對抗技術的不斷發展,傳統被動聲吶目標識別中,基于經驗及數學推理的模糊專家系統的局限性日益明顯。而人耳聽覺系統在多目標、低信噪比下的優異性能,成為新的研究熱點。王磊等[1]提出基于聽覺外周模型的水聲目標識別方法。李秀坤等[2]利用Gammatone濾波器構建人耳聽覺模型,進行水下目標識別。

隨著計算機硬件技術、信號處理技術的進一步發展,以機器學習(Machine Learning,ML)、深度學習(Deep Learning,DL)技術為代表的人工智能(Artificial Intelligence,AI)技術,已經在手寫字符識別、語音識別、圖像理解、機器翻譯等各個方面取得了一定成就,也為水聲目標識別提供了新的思路。常國勇等[3]提出了從能量角度出發,采用小波變換、經驗模態分解處理,以BP神經網絡進行水聲目標識別的方法。吳姚振等[4]提出了提取目標聽覺特征,經BP神經網絡和支持向量機進行分類的水聲目標識別方法。曾向陽等[5]提出了智能水聲目標識別系統的理論和設計實例。

本文根據水聲目標信號特點,提取目標經典聽覺感知特征——梅爾倒譜(Mel Frequency Cepstrum Coefficient,MFCC)特征,并引入機器學習中的幾種典型方法——K近鄰算法(K-nearest Neighbor,KNN)、支持向量機(Support Vector Machine,SVM)、卷積神經網絡(Convolutional Neural Network,CNN)、深度置信網絡(Deep Belief Network,DBN),對兩類水聲目標進行監督學習識別研究。根據樣本特性及算法特點,建立目標樣本集及網絡模型;調整網絡模型參數,分別進行預訓練,并進行泛化性能測試,以獲得網絡參數最優設置方案;建立海試數據測試樣本集,對預訓練網絡模型的識別性能進行統計分析。并給出了相應的樣本集建立、網絡模型設計和參數設置方案。

1 水聲目標 MFCC 特征

目標識別能力是聲吶性能的重要部分,目標特征的提取和選擇是提高目標識別率的關鍵。當前被動聲吶目標識別主要依靠聲吶員聽覺感知,結合目標時域、頻域、時頻域特征來完成。因此,對人類視覺、聽覺等生理感知特征的研究具有重要的現實意義。

在被動聲吶發現水下快速目標并進行初步判斷后,經過大致距離估算,啟用主動聲吶對目標進行精確定位。本文對被動聲吶目標輻射噪聲提取MFCC特征進行識別研究。

MFCC特征是一種經典的人耳聽覺感知特征。根據聽覺機理的相關研究發現,人耳對不同頻率聲波的靈敏度不同。Mel頻率尺度反映了人耳頻率感知的非線性特征,更符合人耳聽覺特性,而MFCC是在Mel頻率域提取的倒譜參數。

Mel頻率與實際頻率的具體關系可表示為:

式中,f為實際頻率,臨界頻率帶寬隨頻率的變化而變化,并與Mel頻率的增長一致,在1 000 Hz以下大致呈線性分布,帶寬為 100 Hz 左右,在 1 000 Hz 以上呈對數增長,這就使得人耳對低頻信號比高頻信號更敏感。Mel頻率的提出是為了方便人耳對不同頻率聲學信號的感知特性的研究。

按式(1)變換到Mel域后,Mel帶通濾波器組的中心頻率按照Mel頻率刻度均勻劃分。用Mel濾波器組對語音頻譜進行濾波和加權使語音信號更加逼近人類的聽覺特性。

MFCC的計算過程如下:

將端點檢測后的目標噪聲信號經過預加重、分幀、加窗處理,再將時域分幀信號經過N點的離散傅里葉變換后得到線性頻譜,轉換公式為:

將上述對數頻譜經過離散余弦變換(DCT)得到Mel頻率倒譜系數(即MFCC系數)

2 監督學習算法

監督學習(Supervised Learning)是指:給定一組輸入x和輸出y的訓練集,學習如何關聯輸入和輸出的過程。即利用一組已知類別的樣本,通過調整分類器的參數,使其達到所要求性能的過程。

本文選取機器學習中經典的KNN、SVM、CNN和DBN識別模型,對兩類被動聲吶目標MFCC特征進行監督學習和識別分析。

2.1 KNN模型

KNN學習模型工作機制為:給定測試樣本,基于某種距離度量找出訓練集中與其最靠近的k個訓練樣本,然后基于這k個近鄰樣本的信息來進行預測[6 – 7]。

KNN通過測量不同特征值之間的距離進行分類。其思路為:如果一個樣本在特征空間中的k個特征空間中最鄰近的樣本中的大多數屬于某一個類別,則該樣本也屬于這個類別。

具體流程為:

1)計算已知類別數據集合匯總的點與當前點的距離;

2)按照距離遞增次序排序,選取與當前點距離最近的k個點;

3)確定距離最近的前k個點所在類別的出現頻率;

4)返回距離最近的前k個點中頻率最高的類別作為當前點的預測分類。

KNN算法的結果很大程度上取決于近鄰數k的選擇,此處距離一般使用歐氏距離或曼哈頓距離:

KNN算法的優勢在于:依據k個對象中占優的類別進行決策,而非單一的對象類別決策;且通過計算對象間距離作為各個對象之間的非相似性指標,避免了對象之間的匹配問題。

2.2 SVM模型

SVM由Vapnik等于1995年提出,是一種基于統計學習理論的模式識別方法。SVM基于結構風險最小化準則,能夠在訓練誤差和分類器容量之間達到較好的平衡,在解決小樣本、非線性及高維模式識別中表現出許多獨特優勢[8]。

分類問題最基本的思路,就是基于訓練集在樣本空間找到一個劃分超平面,將不同類別的樣本分開。樣本空間中,劃分超平面可通過式(5)描述:

其中ω為超平面法向量,b為偏置項,滿足關系:

距離超平面最近的幾個訓練樣本點使式(6)等號成立,被稱為“支持向量”,2個異類支持向量到超平面的距離之和被稱為間隔:

求解分類最優超平面的過程即尋找最大間隔的過程,而最大化間隔,僅需最大化,等價于最小化,則尋找最優超平面的問題可寫為:

對非線性可分問題,則將樣本從原始空間映射到高維特征空間,將非線性可分為題轉化為線性可分為題。常用的核函數有:線性核函數、高斯核函數、Sigmoid 核函數等[6,9]。

2.3 CNN模型

CNN最初是針對二維形狀的識別而設計的一種多層傳感器,在平移情況下具有高度不變性,在縮放和傾斜的情況下也具有一定的不變性。LeCun等提出了權值共享技術,又將卷積層和降采樣層結合構成卷積神經網絡的主要結構,形成了現代卷積神經網絡的雛形LeNet結構,這是第一個真正的多層結構學習網絡,利用空間相對關系減少參數數目以提高訓練性能[10, 11]。本文主要選用LeNet結構進行改進和識別研究。

CNN是一種特殊的前饋神經網絡模型,其最顯著的特點在于其局部感受野的概念和層層迭代的結構[12]。CNN一般由輸入層、卷積層、下采樣層、全連接層及輸出層組成。

以圖2中用于手寫字符識別的LeNet網絡為例:先將樣本圖像進行規整后輸入網絡;經過卷積層C1、C3將樣本圖像與卷積核進行卷積操作,得到若干特征圖;在降采樣層C2,C4進行模糊和泛化;最后通過全連接層,生成和輸出識別結果。

其中,樣本與卷積核進行卷積后,經激活函數映射,可得到輸出特征:

由卷積層和下采樣層的組合迭代,可不斷將目標低維特征提取出來,并組合成為抽象的高維特征,某種程度上實現了網絡的“抽象思維”,而且在多維特征的學習中可以有效關注維度之間的關聯性。同時,引入BP算法,使CNN網絡訓練更高效,應用更廣泛。

在網絡訓練過程中,將訓練樣本集分為相同大小批次(batch)進行訓練,對誤差函數采用梯度下降算法進行迭代訓練直至收斂。學習率決定梯度下降速度,若太小,會導致誤差函數收斂過慢,若太大,則參數更新幅度過大,導致網絡收斂到局部最優點,或誤差函數發生異常上升。試驗中設定學習率,以獲得穩定的梯度下降。

2.4 DBN模型

DBN由Hinton等于2006年提出,是一種無監督貪婪逐層訓練算法,為解決深層結構相關的優化難題提供了新的途徑。DBN以受限波茲曼機(RBM:Restricted Boltzmann Machine)為基礎網絡結構,可以進行逐層堆疊。這種結構對于形成逐層抽象網絡結構比其他網絡模型更容易實現[14]。

RBM是一種特殊的馬爾可夫隨機場(MRF:Markov Random Field,MRF),一個RBM包含一個由隨機單元構成的隱層(一般為伯努利分布)和一個由隨機的可見預測單元構成的可見層(一般為伯努利或者高斯分布)[15]。RBM網絡的特點是:在給定可視層單元狀態時,各隱層單元的激活條件獨立;給定隱層單元狀態時,可見層單元的激活條件也獨立。且只要隱層單元的數目足夠,RBM可以擬合任意離散分布[16 – 18]。

其中E為RBM能量函數:

其中Z為歸一化函數:

DBN由多個RBM堆疊,進行無監督預訓練獲得權值,再對生成模型進行調優。DBN訓練過程中,首先充分訓練第1個RBM;固定第1個RBM的權重和偏移量,然后使用其隱性神經元的狀態,作為第2個RBM的輸入向量;充分訓練第2個RBM后,將第2個RBM堆疊在第1個RBM的上方;重復上述步驟多次直至所有RBM訓練結束。DBN調優過程中,除了頂層RBM,其他層RBM的權重被分成向上的認知權重和向下的生成權重;之后經Contrastive Wake-Sleep算法調整和更新網絡參數。

DBN網絡可以用來對數據的概率分布建模,也可以用來對數據進行分類。試驗中,為每種目標樣本分別建立了DBN模型進行識別研究,DBN模型經RBM逐層預訓練之后,再進行參數調優。

3 海試數據處理及監督學習網絡設計

試驗中對A、B兩類水聲目標海試數據進行分析和識別研究。先選取海試數據建立樣本集,對網絡進行預訓練及泛化性測試,以獲得最優網絡參數設置方案及預訓練網絡;再另選海試數據建立樣本集,以預訓練網絡對新樣本集進行識別研究。

監督學習模型的識別泛化性能可通過試驗測試進行評估,常采用一個“測試集”來測試模型的識別性能,并以測試集“測試誤差”作為模型泛化誤差的近似[6]。測試集樣本也從樣本真實分布中獨立同分布采樣而得,且與訓練集互斥,即測試樣本盡量不在訓練集中出現、未在模型訓練過程中使用過。

試驗中,采用“留出法”,將樣本集劃分為2個互斥的集合,其中A、B類目標各隨機抽取80%作為訓練集,其余20%作為測試集。

其中,識別率采用預訓練網絡對樣本集的識別正確數,除以樣本總數得到,所有試驗方案重復3次,結果取均值。

3.1 樣本集建立

試驗中根據樣本集參數設置,分別對信號分幀后各自提取特征建立樣本集。試驗中信號分幀長度80 ms,幀移50%。

首先,對歷次海試數據按信噪比進行排序,其中A類目標6次海試數據按信噪比由高到低編為A1–A6,B類目標4次海試數據按信噪比由高到低編為B1–B4,每段數據長約 200 s。

選取A類目標數據A1、A3、A5,B類目標數據B1、B3,分別提取MFCC樣本構建網絡預訓練及泛化性測試樣本集;另取A類目標數據A2、A4、A6,B類目標數據B2、B4,分別提取MFCC樣本建立目標識別樣本集,通過預訓練網絡進行識別分析。

其次,針對不同監督學習模型對樣本的要求,對網絡預訓練及泛化性測試樣本集、目標識別樣本集分別進行處理。

對KNN、SVM模型,以每幀數據提取的MFCC參數作為一個樣本,對樣本每一參數進行標記,生成table格式樣本;對CNN模型,將10幀數據提取的一維MFCC特征組合生成二維矩陣作為一個樣本,樣本重疊率80%;對DBN模型,每幀數據提取的MFCC特征作為一個樣本,所有樣本分別歸一化至[0,1]。

表 1 為各監督學習模型建立的樣本集大小Tab. 1 Databases for various unsupervised learning models

3.2 監督學習網絡預訓練及泛化性測試

試驗中,結合Matlab平臺Classification Learner APP、DeepLearnToolbox,對各樣本集分別建立識別網絡進行相關研究。

首先對KNN、SVM、CNN、DBN模型,分別設定不同網絡參數,以預訓練樣本集進行訓練,直至網絡誤差函數收斂;再以泛化性測試集對預訓練網絡進行泛化性測試,對比各參數設置方案下的網絡泛化性能,獲得最優參數設置方案,保存預訓練網絡進行新樣本集識別研究。

對KNN模型,根據目標信號特點,分別以近鄰數為1、10、100,距離選擇歐氏距離、平方反比加權歐氏距離進行預訓練。

對SVM模型,根據目標信號特點,調整核函數為線性核函數、二次多項式核函數、三次多項式核函數、高斯核函數進行預訓練。

對CNN模型,根據目標信號特點,在LeNet5結構的基礎上進行相關改進,調整參數預訓練多個CNN網絡進行識別。設定學習率,以獲得穩定的梯度下降。調整卷積核大小3×3、5×5,分批訓練規模為50個樣本、100個樣本,隱含層為2層、4層,組合為多種參數設置方案進行預訓練,直至網絡對訓練集識別均方誤差收斂;

部分網絡模型預訓練結果如圖4和圖5所示。

各參數設置方案對應的網絡預訓練完畢后,對泛化性測試集進行識別,統計識別誤差以表征預訓練網絡泛化性能。得到預訓練網絡泛化性能最優的參數設置方案為:KNN模型參數選擇歐氏距離,10個近鄰樣本;SVM模型參數選擇高斯核函數;CNN模型參數選擇學習率,分批訓練規模為100個樣本,核函數大小為3×3,網絡隱含層為4層;DBN模型參數選擇學習率,動量momentum=0.5,3個RBM,RBM包含隱藏單元200個,分批訓練規模為50個樣本。

3.3 目標識別結果

以預訓練網絡對目標識別樣本集進行識別分析,所有試驗重復3次結果取均值。分別計算預訓練網絡對兩類目標的識別性能,識別結果如表2所示。

表 2 各預訓練網絡目標識別性能(%)Tab. 2 Recognition accuracy of various pre-trained networks (%)

試驗結果表明,4種模型對A類目標識別率達到100%,KNN模型對B類目標的識別率較低,SVM、CNN、DBN模型對B類目標的識別結果相近,其中DBN模型對B類目標識別性能最佳。

4 結 語

本文從被動聲吶目標識別出發,用4種監督學習模型對A、B兩類水聲目標,不同次海試、不同信噪比數據中提取的MFCC特征樣本進行了識別研究。分析海試數據處理及多種模型識別結果可得到以下結論:

提取目標MFCC特征并以監督學習模型進行識別的方法,用于被動聲吶目標識別具有可行性,其運算速度快、識別率較高的特點對于提高被動聲吶目標識別性能有一定優勢;水聲環境復雜多變,試驗中僅對有限數據按照信噪比粗略排序后進行識別分析,信噪比條件對各識別模型性能的影響有待進一步量化和分析研究;由于樣本集規模及特征維數較小,CNN、DBN兩種深度學習模型在大數據、高階特征挖掘中的優勢未得到充分體現。

猜你喜歡
特征模型
一半模型
抓住特征巧觀察
重要模型『一線三等角』
新型冠狀病毒及其流行病學特征認識
重尾非線性自回歸模型自加權M-估計的漸近分布
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
抓住特征巧觀察
3D打印中的模型分割與打包
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
主站蜘蛛池模板: 日韩专区第一页| 亚洲福利视频网址| 精品人妻一区二区三区蜜桃AⅤ| a级免费视频| 亚洲人成网站色7799在线播放| 亚洲天堂精品视频| 超碰91免费人妻| 她的性爱视频| 亚洲第一天堂无码专区| 免费观看欧美性一级| 国模视频一区二区| 五月婷婷精品| 国产靠逼视频| 国产女人18水真多毛片18精品| 国产小视频a在线观看| 99ri国产在线| 久久久久国色AV免费观看性色| 亚洲天堂成人在线观看| 亚洲激情区| 在线播放真实国产乱子伦| AⅤ色综合久久天堂AV色综合| 98超碰在线观看| 国产午夜无码片在线观看网站| 18禁黄无遮挡网站| 婷婷伊人五月| 全部无卡免费的毛片在线看| 亚洲国语自产一区第二页| 亚洲三级电影在线播放| 伊人成人在线视频| 国产精品永久不卡免费视频 | 国产真实乱了在线播放| 玖玖精品视频在线观看| 久久精品这里只有精99品| 久久综合伊人 六十路| 午夜视频在线观看免费网站 | 亚洲黄色成人| 日韩成人免费网站| 亚洲av日韩av制服丝袜| 欧美自慰一级看片免费| 国产97视频在线| 国产亚洲精品自在久久不卡| 精品欧美日韩国产日漫一区不卡| 亚洲av无码牛牛影视在线二区| 日韩精品中文字幕一区三区| 人妻精品久久无码区| 欧美成人影院亚洲综合图| 日韩毛片免费| 青青草国产免费国产| 国产精品久久久精品三级| 国产成人高清在线精品| 青青青视频免费一区二区| 亚洲Av综合日韩精品久久久| 少妇极品熟妇人妻专区视频| 青青青国产视频手机| 免费看美女毛片| 国产精品第| 99这里只有精品在线| 性色一区| 97视频免费在线观看| 一本一道波多野结衣一区二区| 丰满的熟女一区二区三区l| 亚洲永久色| 在线精品亚洲一区二区古装| 欧美五月婷婷| 性激烈欧美三级在线播放| 国产va免费精品| 久久精品丝袜| 又粗又大又爽又紧免费视频| 特级精品毛片免费观看| 91小视频在线播放| 亚洲高清国产拍精品26u| 亚洲五月激情网| jizz亚洲高清在线观看| www亚洲天堂| 亚洲婷婷六月| 国产视频一区二区在线观看| 99热6这里只有精品| 五月天婷婷网亚洲综合在线| 久久semm亚洲国产| 亚洲国产成人综合精品2020| 久久96热在精品国产高清| 在线观看精品国产入口|