語音識別技術在語言實驗室中的應用分析

2013-04-29 05:11:23任寧寧李連民

都市家教·下半月 2013年6期

任寧寧李連民

【摘要】隨著語音識別技術的發展，其識別能力和糾錯能力的提高，語音識別技術已經成為提高外語教學的一種途徑。本文就語音識別技術在語言實驗室中的應用及發展趨勢做了分析，以供大家借鑒。

【關鍵詞】語音識別技術；語言實驗室

語音識別技術是使用計算機能識別和理解的語言，把語音信號轉變為相應的文本或命令的過程。語音識別是一門涉及到語音語言學、信號處理、模式識別、人工智能的多學科交叉技術，也是2000年至2010年間信息技術領域十大重要的科技發展技術之一。隨著語音識別技術的發展，在傳統的數字化語言實驗室中其可以作為一種新的外語輔助教學的手段，完善現有的數字化語音室的功能。

一、語音識別技術

語音識別技術是一種讓計算機能夠聽懂人的語音命令的技術。對使用者來說，這種人機交互的途徑是最自然的一種方式。早在三四十年前，美國的一些大學和實驗室就開始了語音識別技術的研究，50年代的AT&T Bell實驗室研發的Audry系統第一個實現了可識別十個英文數字。60和70年代，提出了線性預測分析技術（LP）等相關理論并深入研究，創造出可以實現特定人孤立語音識別系統；80 年代和90年代是語音識別技術應用研究方向的高潮，HMM 模型和人工神經元網絡（ANN）的成功應用，使得語音識別系統的性能比以往更優異；伴隨著多媒體時代的來臨，微軟，Apple 等著名公司都研發出相當成功的商業應用語音識別系統，比如，Apple的Siri系統，微軟的Phone Query（電話語音識別）引擎等。近二三十年來，語音識別在交通、軍事、工業、醫學等諸多方面，特別是在計算機、通信與電子系統、信息處理、自動控制等領域中有著非常廣泛的應用。目前，語音識別技術產品在人機交互應用中己經占到越來越大的比例。例如，在聲控應用中，計算機可識別輸入的語音內容，并根據內容來執行相應的動作，這包括了聲控語音撥號系統、聲控智能玩具、醫療服務、賓館服務、家庭服務、股票查詢服務和工業控制等。也可用于基于微型機的辦公、教學、娛樂等智能多媒體軟件，如語言學習、教學軟件、語音玩具、語音書籍等。語音識別技術作為語音控制的主體，在應用領域中正成為一個具有競爭力的技術。

語音識別的開發平臺現已逐步成熟，在windows下有微軟的SAPI語音識別開發平臺，在Unix/Linux下有IBM的ViaVoice和開源的Xvoice開發平臺。它們都是相當優秀音識別開發系統，提供了良好的開發接口，使語音識別應用程序開發能夠不需要對現有系統做大規模的修改，以較少投入、較短周期、以組件方式加入到當前的語言實驗室中。

二、語音識別技術在語言實驗室中的應用

1.有聲圖書

可以將一些由外籍專家錄制的有聲圖書加入到語言實驗室的資料庫中。標準的美式或英式發音，結合文本，逐字逐句的朗讀，讓學生可以在閱讀英語圖書的同時聆聽到原汁原味的英語。所有圖書都支持自動播放，可以一次聽完整本書，學生也可以選擇單獨播放某個句子，并鼓勵學生模仿標準的語音語調朗讀圖書。從而對學生的閱讀、聽力、口語進行全方位的提高。

2.口述作文

影響語音識別系統輔助學生口述作文的最為關鍵技術是識別率和糾錯能力，從某種意義上說，只要這兩個關鍵的技術得到了提高，則其輔助寫作的有效性就會得到較大提高。近幾年，隨著多媒體技術和人工智能技術的進步，不僅語音識別系統的識別率得到很大提高，而且多語言的語音識別產品也大為豐富。目前國際商業機器（IBM）公司推出的語音識別軟件具有非特定人，無限詞匯量，連續語音識別，高識別率，專業文章智能分析、理解等強大的語音功能。該軟件通過對個人話語進行測試與分析來適應說話者，適應后的語音識別正確率可以達到95%以上。與過去相比，其識別率提高了很多，已經完全可以接受。語音識別系統除了識別率目前已有很大提高，其智能糾錯能力也大為提高。一是糾錯的操作更加方便和容易，目前的語音識別系統，可以有三種糾錯方式：①通過鍵盤輸入方式；②系統智化地產生錯誤詞的相近詞列出，供修改者選擇；③還可以通過重讀來糾錯。二是通過糾錯，可讓語音識別系統更進一步地熟悉說話者的聲音，而非常有效地提高系統識別率。隨著信息技術的迅速發展，今后的語音識別系統必將是功能更加強大，智能化程度更高，兼容性更強，抗噪音能力更強的系統，其輔助口述作文的有效性也會更強。

3.英語口語糾正系統

語音識別技術的應用使得軟件可以具有發音評測的功能，能夠幫助學習者及時發現和糾正發音的錯誤，避免重復錯誤形成習慣，從而極大提高了學習者的學習效率。英語口語學習中語音識別技術遇到的難點主要有：①語音識別選取基元的問題。一般地，欲識別的詞匯量比較多時，所用基元應該越小越好；②端點檢測。語音信號的端點檢測是語音識別的關鍵。據研究表明，即便是在安靜的環境下，語音識別系統也會有一半以上的識別錯誤源自端點檢測器。提高端點檢測技術的關鍵所在是尋找穩定的語音參數；③找出反映發音質量的性能指標。主要是對發音段（指一段發音的語速、韻律、語調以及重音等）的研究；④對給定的發音進行錯誤檢測和糾正，尋找合理的評分機制。

由于語音識別在理論與技術方面的復雜性，現有的口語糾正軟件仍有很大限制范圍，但隨著語音技術的發展相信其在外語語言學習中的應用會越來越廣泛。

三、結束語

語音識別技術作為一種逐漸成熟的計算機技術，是計算機輔助外語教學中的一種重要虛擬現實手段。而人機交互是數字語音室的一個發展方向，也是外語網絡教學的核心內容。所以，語音識別技術會是未來語言實驗室的建設中的一個重要方向。

參考文獻：

[1]夏晴.ARS和TTS技術在外語口語教學中的應用研究[J].外語電化教學，2006（2）

[2]周英.語音識別技術發展趨勢的分析[J].計算機光盤軟件與應用，2012（19）

[3]孔菊芳.基于語音識別技術的英語學習網站分析[J].哈爾濱職業技術學院學報，2012（5）

作者簡介：

任寧寧，碩士研究生，助理實驗師，主要研究方向為計算機應用技術。