周曉武
(寶雞文理學院 外語系,陜西 寶雞721000)
嵌入式實時英語語音識別系統的設計與研究
周曉武
(寶雞文理學院 外語系,陜西 寶雞721000)
針對本次英語語音識別系統的設計之中,應用嵌入式技術,可以應用嵌入式DSP語音芯片,以連續隱含馬爾可夫模型為基本識別框架,優化設計英語語音識別系統。結果證實,設計出基于嵌入式的實時英語語音識別系統,可以在實際應用中實時識別出不同的英語語音,而且也能夠提升系統在應用中對于英語語音的識別率,提升29.0%,對于英語語音的識別速度也快,發揮積極應用效益。研究結論表明,設計嵌入式的實時英語語音識別系統,具有可行性,不僅可以提升系統識別英語語音的速度,也發揮積極的應用效益,可以在實踐中推廣該系統設計方法。
語音識別;實時英語語音識別系統;嵌入式設計;設計語音系統
speech system
針對本次研究中,分析研究關于實時英語語音識別系統設計方面的問題,還能夠基于嵌入式現代信息技術,優化設計實時的英語語音識別系統,以便利用嵌入式系統開發板硬件平臺,設計語音識別算法程序,設計實現實時英語語音識別系統,發揮積極影響。以下本篇對此做具體分析。
對于我國當前信息化技術發展前提下,嵌入式技術也不斷被推廣應用到工業、農業、教育信息化等多種領域。實際中,嵌入式技術,就是將設備控制程序寫進芯片中,將芯片嵌入到設備中,從而通過該嵌入式芯片控制設備完成相應操作的技術。并且嵌入式技術在語音識別系統設計中,也具備一定的應用優勢,將嵌入式技術應用到語音識別系統中,在識別特定人的語音方面,可以使系統的識別精度提升到98%以上[1]。其次,在實際應用中,嵌入式技術還具備可靠性高、體積小以及耗電低的優勢,可以節約語音識別系統設計成本,發揮積極應用優勢。而且在設計實時英語語音識別系統中,應用嵌入式技術,可以在用戶講話后,實時傳輸處理語音信號,提升系統設計性能[2-6]。在實際中,應用嵌入式技術優化設計實施英語語音識別系統,發揮積極應用價值。
設計嵌入式實時英語語音識別系統,能夠應用嵌入式芯片,簡化系統體積,也可以獲得更為簡化的人際交互模式,優化系統設計性能[7]。對于實時英語語音識別系統設計中,還應該確保該系統具備很好的人機交互平臺,確保系統用戶可以個性化應用該系統,消除人機交互過程中的語言障礙[8-13]。目前英語語音識別系統中,語言識別準確性不會達到百分百[14];英語語音識別受特定人、口音以及方言的影響,會降低英語語音識別系統的精度;對此,可以應用嵌入式技術,在系統中應用嵌入式語音識別算法,確保系統可以快速實時識別英語語音,提高系統識別英語語音的識別率與識別速度[15]。同時,對于本文設計嵌入式的實時英語語音識別系統中,也應該確保系統具備很好的工作穩定性好,提升英語語音識別率,提升系統在工作中的抗噪聲能力,確保設計出的系統滿足實際用戶應用需求。
3.1 系統的總體結構設計
對于本次設計的嵌入式技術支持下的實時英語語音識別系統設計之中,對于系統中,主要可以由“嵌入式的中央處理器、只讀存儲器、外圍控制電路、可讀寫存儲器以及外圍設備”等組成。系統總體設計結構如圖1所示。

圖1 系統總設計結構
并且,對于本次設計的嵌入式實時語音識別系統,應該盡量降低系統體積,提升系統語音識別正確率。由相應的語音解碼芯片轉換語音信號,通過S3C2440的計算和處理,轉換成控制指令(可以由數碼管或二極管對輸出進行檢測),最好可以在控制處設立顯示界面以便于操作者進行監控。
3.2 系統功能設計
具備語音訓練的功能:對于本次設計的嵌入式實時英語語音識別系統,確保可以根據用戶輸入的英語語音,經過嵌入式算法對用戶的語音機械能若干次的訓練,并可以預處理語音,提取出在該英語語音中的特征參數,從而可以根據特征矢量參數進程特征建模,建立系統中基于英語語音訓練的參考模型,以便能夠提升系統對于用戶語音的識別精度。
語音識別的功能:系統可以將輸入的語音,根據語音的特征矢量參數,與系統中的參考模型庫進行相似性度方面的比較,之后可以將相似性高的特征矢量,當作英語語音識別的結果在系統中輸出。
3.3 嵌入式語音識別算法
基于HMM(隱馬爾科夫)模型,使用馬爾科夫鏈來模擬信號的統計特性變化,可以由三元的參數函數進行表示,其之間關系如下。

HMM(隱馬爾科夫)模型中,簡化該模型參數后可以得到:
N:表示模型之中的Markov鏈。其狀態的集合表示為S={s1,s2,…,sN}。
初始狀態的概率分布矢量。 π=(π1,π2,…,πN),其中

初始狀態分布滿足如下條件:

對于HMM中,Markov鏈可以由π,A進行描述,能夠產生狀態序列。
在本次設計的嵌入式實時英語語音識別系統中,在系統中嵌入HMM算法芯片,可以對語音信號進行預加重以及分幀、FFT變換等處理,提出實時英語語音信號,以確保系統可以實時識別出英語語音。
3.4 系統硬件部分設計
對于本次設計嵌入式系統中,其硬件設計部分,主要包括主控核心部分以及語音識別部分。在識別實時英語語音方面,嵌入式的微處理器芯片,應用ST公司生產的STM32F103C8T6芯片作為主控制器;對于STM32芯片中,不僅有內置64 KB高速存儲器,還有增強I/O端口,滿足本次系統設計需求。語音識別部分,是應用ICRoute公司生產的LD33 20芯片,在該芯片中,集成優化的語音識別算法,該英語語音識別算法,實時識別語音的準確率高。
3.5 系統軟件代碼實現
針對嵌入式的實時英語語音識別系統設計中,系統軟件設計中應用C語言進行代碼編程。部分代碼實現如下:


對于本次設計的嵌入式實時英語語音識別系統,在實際中為保證應用該系統能夠正確識別出英語語音,因此針對實際應用需求,基于系統的語音識別率進行試驗測試,對嵌入式實時英語語音識別系統做了相應的測試。設置的測試環境分別是安靜的環境,以及嘈雜環境,然后可以應用5條英語語音方面的指令,針對傳統的語音識別系統以及本次設計的實時英語語音識別系統進行測試;對于每條語音指令,可以針對系統分別測試10次,并且可以在每個不同環境下,對特定人進行試驗,總的試驗次數是50次,然后可以記錄系統成功識別英語語音的次數。語音信號的采樣頻率設為12 500 Hz,16 bit量化,加入的噪聲控制系統在進行英語語音識別過程中的信噪比,可以從-5~20 dB信噪比范圍內,根據5 dB遞增產生不同的信噪比,并可以基于MVDR波束,采樣分析英語語音識別系統的識別率。測試結果如表1所示。

表1 測試結果
測試中兩個特定環境中,綜合分析其識別率,設計的嵌入式實時英語語音識別系統,其識別實時英語語音的正確識別率能夠達到89%,而對于傳統的聲音識別系統,其對于英語語音的識別率為60%,兩種系統相互對比,可知本次設計的嵌入式實時英語語音識別系統,其實際的識別率可以提升29.0%。因而,對于當前時代下,設計出嵌入式的實時英語語音識別系統,不僅能夠運用該系統實時性的識別英語語音,而且也能夠提升系統在應用中對于英語語音的識別率,提升29.0%,對于英語語音的識別速度也快,發揮積極應用效益。設計嵌入式實時英語語音識別系統,不僅提升系統中語音識別算法的實時性,也可以在保證識別率的前提下,提升對于實時英語語音的識別速度,即能夠語音發出后,應在最短的時間內識別出來,用來發出準確控制命令,提升系統應用效益,發揮積極影響。
綜上所述,設計嵌入式的實時英語語音識別系統,具有可行性,能夠在最短的時間內識別出來英語語音,可以根據英語語音做出系統控制命令。不僅可以提升系統識別英語語音的速度,也發揮積極的應用效益,可以在實踐中推廣該系統設計方法。
[1]屈慶琳.嵌入式語音翻譯系統的研究[D].淮南:安徽理工大學,2012.
[2]劉萬鳳,胡軍,袁偉偉,等.陸空通話標準用語(英語)的語音指令識別技術研究[J].計算機科學,2013,40(7):131-137.
[3]杜衛衛.英語翻譯器語音識別系統設計及其應用[J].電子測試,2015(4):103-105.
[4]王朔.基于Android平臺的智能英語發音訓練系統的設計與實現[D].南京:南京郵電大學,2013.
[5]劉江華.“語音識別”在中職英語口語教學中的應用[J].江蘇教育(職業教育版),2013(10):48-50.
[6]崔金鐘,周遠彬,陳雷霆,等.基于DHMM的嵌入式語音識別系統的實現與優化[J].電子科技大學學報,2013(6):930-934.
[7]申小虎,萬榮春,張新野,等.一種改進動態特征參數的話者語音識別系統[J].計算機仿真,2015,32(4):154-158.
[8]路娜.孤立詞語音識別系統的研究與設計 [D].濟寧:曲阜師范大學,2014.
[9]于樹本.基于MFCC的說話人語音識別系統的研究[J].黑龍江科技信息,2015(27):69-70.
[10]嚴家明,李永恒.EMD-SDC方法在機載連接詞語音識別系統中的應用[J].計算機工程與應用,2012,48(8):137-140.
[11]高忠生,高紅琴.計算機語音識別系統的架構設計[J].信息記錄材料,2013,14(3):50-53.
[12]倪曼蒂,李彪,鄒麗萍,等.基于空間增強和譜減法的語音識別系統[J].湖南師范大學自然科學學報,2014,37(3):63-68.
[13]王赫楠,燕燕,王甜宇,等.DTW算法在嵌入式語音識別系統中的應用研究 [J].科技創新導報,2014,11(8):71.
[14]馬寧,陳曉冬,李亞楠,等.內窺鏡自動定位語音識別系統[J].計算機工程與應用,2014(8):207-210.
[15]韓放.基于Android的英語學習平臺的設計與實現[D].大連:大連理工大學,2013.
The design and research of embedded real time English speech recognition system
ZHOU Xiao-wu
(Department of Foreign Languages,Baoji University of Arts and Sciences,Baoji 721000,China)
For the English speech recognition system design,the application of embedded technology,embedded application voice DSP chip,the continuous hidden Markov model as the basic recognition framework for optimal design of English speech recognition system.The results confirm that the design based on embedded real-time English speech recognition system,in the practical application of real-time identification of the different English pronunciation,but also can enhance system in the application for the English speech recognition rate,improve 29.0%,for English speech recognition speed is also fast,play positive effect in application.Research results show that the design of embedded real-time English speech recognition system is feasible,not only can lifting system English speech recognition rate,also play positive benefits for the application and can be popularized in practice the system design method.
speech recognition;real time English speech recognition system;embedded design;design
TN99
:A
:1674-6236(2017)08-0187-04
2016-04-12稿件編號:201604113
2015年寶雞文理學院校級重點項目(ZK15068)
周曉武(1980—),女,陜西安康人,碩士,講師。研究方向:美國文學及教學法。