999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于DTW改進算法的孤立詞語音識別仿真

2013-06-28 17:14:30曲金玉李東榮
關鍵詞:信號檢測

劉 靜,王 儒,曲金玉,李東榮

(山東理工大學交通與車輛工程學院山東淄博255091)

基于DTW改進算法的孤立詞語音識別仿真

劉 靜,王 儒,曲金玉,李東榮

(山東理工大學交通與車輛工程學院山東淄博255091)

為提高識別率和識別效率,采用雙門限過零率和短時能量作為端點檢測的依據,提取Mel頻率倒譜系數作為語音特征參數,并使用DTW算法進行模式匹配.由于傳統DTW算法計算量大,所以采用局部路徑約束和區域約束進行改進,并用Matlab對改進后的DTW算法進行了仿真.實驗證明該算法對孤立詞語音識別能夠達到較好的識別結果.

孤立詞;語音識別;Matlab;DTW

語音識別研究開始于20世紀50年代,貝爾實驗室的Davis等人研制了特定說話人孤立數字識別系統[1].20世紀60年代末,RAC實驗室的Martin等人開始研究語音信號時間尺度不統一的解決辦法,開發了一系列的時間規正方法,明顯地改變了識別性能[2].1972年,Sakoe提出了DTW算法,DTW是把時間歸正和距離測度計算結合起來的一種非線性歸正技術,也是語音識別中一種很成功的匹配算法,掀起了語音識別研究的熱潮[3].

孤立詞語音識別是語音識別的一個重要研究領域,不僅比連續語音識別靈活性好,而且具有很高的應用價值[4],主要應用于自動控制,如駕駛、機器人操縱、儀器設備操縱及收集撥號、智能玩具、家用電器操縱,尤其當人手已被占用或無法使用的情況下,進行聲音控制可以起到不可替代的作用.

1 系統設計

本系統基于Matlab軟件,系統主要功能有語音信號的采樣及量化、預處理、端點檢測、特征提取、訓練和識別,系統的開發流程如圖1所示.

1.1 采樣及量化

Matlab軟件運用wavrecord函數可進行語音錄制,應用wavread函數讀取錄制好的wav語音文件,采樣頻率為8k Hz.為了處理方便,先將信號進行幅度歸一化處理,運用命令x=x/max(abs(x))便可實現.

圖1 語音識別系統流程圖

1.2 預處理

1)預加重

經過采樣和量化過程后,還要對語音信號進行預加重[2].預加重用具有6dB/倍頻程提升高頻特性的預加重數字濾波器實現,其計算公式為

式中,u=0.95,預加重后的信號在分析處理之前要進行去加重處理,即加上―6dB/倍頻程下降的頻率特性來還原成原來的特性.數字“6”預加重后的波形如圖2所示.

圖2 數字“6”預加重后的波形

2)加窗分幀

為了得到短時的語音信號,要對語音信號進行加窗操作.本系統采用可以有效克服泄漏現象的漢明窗,漢明窗公式為

數字“6”加窗分幀后的波形如圖3所示.

圖3 數字“6”加窗分幀后的波形

1.3 端點檢測

語音的端點檢測就是確定語音的起點和終點,從語音信號中排除無聲段[5],常用的檢測參數有短時能量和短時過零率等[6].本文采用雙門限端點檢測算法,利用短時能量來檢測濁音,利用短時過零率來檢測清音,兩者配合以實現可靠的端點檢測.

1)短時能量分析

由于短時能量是對信號進行平方運算,人為增加了高低信號之間的差距,因此采用短時平均幅度來表示能量的變化[7].短時能量的計算公式為

3)檢測語音起點和終點

用短時平均過零率區分無聲和清音在有些情況下不是很可靠[8],本文采用雙門限端點檢測法,將門限提高一些,這對于清音的影響不大,而在無背景噪聲的情況下,無聲段將不會穿越這一提高的電平,因此可以正確區分清音段和無聲段.

首先根據濁音情況下的短時平均幅度參數的概率密度函數P(M|V)確定一個閾值參數MH,MH= min(M1,max(M)/4).根據MH可判定輸入語音的前后兩個點A1和A2,但語音的精確起點還要在A1之前和A2之后仔細查找.再設定一個較低的閾值參數ML,由A1點向前找,當短時平均幅度由大到小減至ML時,可以確定B1點.類似地,可以確定B2點.在A2和B2之間仍能肯定是語音段.數字“6”的端點檢測結果如圖4所示.

圖4 端點檢測結果

1.4 特征提取

特征提取是語音識別的一個重要步驟,本系統采用Mel頻率倒譜系數(MFCC,Mel-Frequency Cepstral Coefficients)進行特征提取.Mel頻率表示公式為

Mel濾波器組如圖5所示,MFCC倒譜系數的計算過程如圖6所示.

圖5 Mel濾波器組

圖6 MFCC倒譜系數的計算流程圖

先將信號進行預加重和漢明窗處理,然后進行短時傅里葉變換得到其頻譜.求出頻譜平方,即能量譜,再用24個帶通濾波器進行濾波,得到功率譜.將每個濾波器的輸出取對數并進行反離散余弦變換,得到15個MFCC系數,MFCC系數計算公式為

用公式(7)求一階和二階差分參數,得到相應的動態特征.

1.5 模板匹配

在孤立詞語音識別中,最為簡單有效的方法是采用DTW算法,該算法基于動態規劃(DP)的思想,解決了發音長短不一的模板匹配問題,是語音識別中出現較早、較為經典的一種算法[9].

假設參考模板的特征矢量序列為

輸入語音特征矢量序列為

DTW算法就是要尋找一個最佳的時間歸正函數,使待測語音的時間軸j非線性地映射到參考模板的時間軸i上,使總的累計失真量最小.

設時間歸正函數為

式中,N為路徑長度,c(n)表示第n個匹配點對是由參考模板的第i(n)個特征矢量與待測模板的第j(n)個特征矢量構成的匹配點對.兩者之間的距離稱為局部匹配距離.DTW算法就是通過局部最優化的方法實現加權距離總和最小,即

為了提高識別速度,給時間規正函數如圖7(a)所示的局部路徑約束和如圖7(b)所示的平行四邊形區域約束Reg.平行四邊形有兩個位于(1,1)和(N,M)的頂點,相鄰兩條邊的斜率分別為2和1/2.

求累計距離的遞推公式為

圖7 局部路徑約束和區域約束

對于圖7(a)所示的局部路徑,一般取距離加權值為Wn(1)=Wn(3)=1,Wn(2)=2.

2 Matlab仿真實驗結果

程序運行后,首先讀入wav文件,用vad函數對其進行端點檢測,用mfcc函數獲得其MFCC參數,并保存語音部分的MFCC參數到參考模板的結構數組ref(i).mfcc中或測試模板的結構數組test (i).mfcc中.

在模板匹配階段,計算所有測試模板和參考模板之間的距離,保存到矩陣中,將最后的匹配分數用min函數找到最小值對應的模板.

表1為測試語音與標準模板庫之間的匹配矩陣,圖中行表示數字“1~10”的標準模板庫,列表示數字“1~10”的測試語音.語音樣本“1~10”均和模板庫中的模板“1~10”有最小的距離,因此具有較好的相似性,即都取得了較好的識別效果.

表1 測試語音與標準模板庫之間的匹配矩陣

3 結束語

本文在Matlab編程上實現了簡單詞的語音識別.DTW算法較HMM算法運算量小,在孤立詞小詞匯量的語音識別系統有著較為廣泛的應用.實驗結果證明,通過提高端點檢測結果的準確率和運用改進的DTW算法,系統取得了較好的識別效果.后續可以通過完善語音數據庫來提高模板搜尋匹配的效率和可靠性,通過改進語音識別算法來提高識別的精度和準確性.

[1]韓紀慶,張磊,鄭鐵然.語音信號處理[M].北京:清華大學出版社,2004.

[2]楊曦,蘇娟,彭勇群.孤立詞語音識別系統的MATLAB實現[J].微計算機信息,2007,23(3-1):288-290.

[3]吳黎明,王桂堂,吳正光.語音信號及單片機處理[M].北京:科學出版社,2007.

[4]彭輝,魏瑋,陸建華.特定人孤立詞的語音識別系統研究[J].控制工程,2011,5(3):397-400.

[5]朱蕊楠.車載藍牙語音控制系統的語音識別算法研究與設計[D].長春:吉林大學,2011.

[6]江官星,王建英.一種改進的檢測語音端點的方法[J].微計算機信息,2006,22(5-1):138-139.

[7]劉志偉,盧文科.孤立詞的語音識別[J].微計算機信息,2011,27 (6):181-182.

[8]劉長明,任一峰,語音識別中DTW特征匹配的改進算法研究[J].中北大學學報:自然科學版,2007,27(1):37-40.

[9]肖春華,黃樟欽,侯義斌,等.基于孤立詞語音識別系統的DTW硬件實現[J],微計算機信息,2010,26(11-2):114-117.

(編輯:郝秀清)

Design of isolated words speech recognition system based on improved DTW algorithm

LIU Jing,WANG Ru,QU Jin-yu,LI Dong-rong
(School of Traffic and Vehicle Engineering,Shandong University of Technology,Zibo 255091,China)

To improve recognizing rate and recognizing efficiency,double-threshold zero-crossing rate is adopted in the endpoint detection,Mel-Frequency Cepstral Coefficients is obtained as speech characteristic parameters,and DTW algorithm is used for matching of the model.For the large amount of data in the matching process,DTW algorithm is improved by using local constraints and global constraints and it was simulated by Matlab.The experiment shows that this algorithm can achieved good results in isolated word speech recognition.

isolated word;speech recognition;Matlab;DTW

1672―6197(2013)01―0063―04

TP391.42

A

2012- 12- 27

劉靜,女,15064360598@126.com;通信作者:曲金玉,男,qujinyu@sina.com

猜你喜歡
信號檢測
“不等式”檢測題
“一元一次不等式”檢測題
“一元一次不等式組”檢測題
信號
鴨綠江(2021年35期)2021-04-19 12:24:18
“幾何圖形”檢測題
“角”檢測題
完形填空二則
孩子停止長個的信號
小波變換在PCB缺陷檢測中的應用
基于LabVIEW的力加載信號采集與PID控制
主站蜘蛛池模板: 六月婷婷激情综合| 亚洲美女视频一区| 激情無極限的亚洲一区免费| 亚洲品质国产精品无码| 在线欧美一区| 亚洲精品图区| 欧美精品在线免费| 日本国产精品一区久久久| 伊人色综合久久天天| 久久精品国产电影| 真实国产乱子伦高清| 欧美精品v日韩精品v国产精品| 久久99国产乱子伦精品免| 老司国产精品视频91| 久久免费观看视频| 国产成人一区在线播放| 在线日韩日本国产亚洲| 啪啪免费视频一区二区| 69精品在线观看| 九色在线视频导航91| 国产99热| 欧美精品1区| 91精品亚洲| 青青草国产免费国产| 九色在线观看视频| 丁香六月激情婷婷| 精品视频第一页| 综合久久五月天| 精品自窥自偷在线看| 国产成人你懂的在线观看| 亚洲综合天堂网| 亚洲综合片| 91视频99| 青草视频免费在线观看| 四虎精品国产AV二区| 国产欧美日韩视频怡春院| 在线观看免费国产| 亚洲国产欧美国产综合久久 | 亚洲国产精品VA在线看黑人| 91无码国产视频| 成人免费视频一区| 久久久久久久久久国产精品| 好紧太爽了视频免费无码| 国产91蝌蚪窝| 国产视频一区二区在线观看| 日韩欧美国产中文| 日韩不卡高清视频| 素人激情视频福利| 亚洲免费毛片| 国产成人精品无码一区二| 波多野结衣在线一区二区| 免费又爽又刺激高潮网址| AV天堂资源福利在线观看| 日本在线欧美在线| 激情综合五月网| 在线观看亚洲天堂| 熟女成人国产精品视频| 国产哺乳奶水91在线播放| 亚洲v日韩v欧美在线观看| 国产浮力第一页永久地址 | 久久精品中文字幕少妇| 99er这里只有精品| 免费中文字幕一级毛片| 国产人前露出系列视频| 丰满人妻一区二区三区视频| 伊人久久大线影院首页| 国模沟沟一区二区三区| 亚洲狠狠婷婷综合久久久久| 午夜毛片免费观看视频 | 欧美综合成人| 亚洲国产成人久久精品软件| 亚洲av无码人妻| 免费在线国产一区二区三区精品| 手机在线免费不卡一区二| 狠狠干综合| 国产成人综合久久精品下载| 欧美自慰一级看片免费| 日韩免费视频播播| 亚洲色图综合在线| 一级高清毛片免费a级高清毛片| 国产产在线精品亚洲aavv| 亚洲人成影院在线观看|