田雪陽+楊宇++劉子寒+李淵
LI Yuan
(上海電機學院,上海 201306)
(Shanghai Dianji University,Shanghai 201306,China)
摘要:在基于虛擬儀器LabVIEW的環境中,通過與MATLAB相結合設計一個語音識別登陸系統,對電腦聲卡采集到的語音信號進行處理分析,提取聲音的特征參數Mel倒譜系數并保存,然后通過矢量量化的模式匹配來進行身份確認。
Abstract: The whole study is based on virtual instrument LabVIEW with the combination of MATLAB. This system processes and analyzes the voice signal collected by computers sound card, then extracts the signals characteristic parameters MFCC and save them in the computer. The parameters are designed through VQ algorithma to identify speaker.
關鍵詞:語音識別;LabVIEW;MATLAB;Mel倒譜系數;矢量量化算法
Key words: speech recognition;LabVIEW;MATLAB;MFCC;VQ algorithm
中圖分類號:TN912.3 文獻標識碼:A 文章編號:1006-4311(2017)21-0203-03
1 語音識別模型
語音識別系統是建立在一定的硬件平臺和操作系統之上的一套應用軟件系統。語音識別一般分兩個步驟,第一步是訓練階段,是建立識別基本單元的聲學模型以及進行文法分析的語言模型等;第二步是語音識別階段,根據實際情況的要求采用一種語音識別的算法,采用語音分析方法分析出這種識別方法所要求的語音特征參數,按照一定的準則和測度與系統模型進行比較,通過判決得出識別結果。
2 Mel倒譜系數
語音信號的時域分析通常是將一幀語音信號中的各個時域采樣值直接構成一個參數矢量,這種分析方法的特點是表示語音信號比較直觀、物理意義明確、實現起來比較簡單、運算量少等。語音信號的頻域分析就是分析語音信號的頻域特性,這種參數是將一幀語音信號進行某種變化后而產生的參數矢量。在語音信號的頻域特征參數中,目前使用最為廣泛的是線性預測倒譜系數(Linear Predictive Cepstral Coding,LPCC)和Mel頻率倒譜系數(Mel Frequency Cepstral Coefficient,MFCC),由于MFCC更符合人耳的聽覺特性,因此本文語音識別系統采用的特征參數是MFCC。……