劉 磊,趙 鵬
讀者出版傳媒股份有限公司
語音識別聲控技術在移動客戶端的應用
劉磊,趙鵬
讀者出版傳媒股份有限公司
計算機信息技術的高速發展與廣泛應用,讓語音識別聲控技術得到了長足的進步。本文分析了語音聲控識別技術的發展現狀,并探討了語音識別聲控技術在移動客戶端的具體應用。
語音識別聲控;移動客戶端;應用
移動通訊技術與信息技術的迅猛發展,讓智能手機這類移動客戶端得到了迅速普及,并且成為應用語音識別聲控技術的重要領域。借助一定的識別裝置或者設備,對被識別對象的有關信息進行及時收集與處理,并將處理結果上傳至計算機系統,這就是識別技術。語音識別聲控歸屬于識別技術中,這種技術主要是將語音作為識別信息。由于手機等便攜式移動客戶端具備的運算能力有限,如何提高客戶端的運算量,這是當前語音識別聲控技術應用中需要重點研究的問題。
自上世紀五十年代開始,很多學者就開展了對語音識別聲控技術的研究[1]。1952年,一些研究者通過大量實驗,最終構成可以對簡單英文數字發音進行識別的語音系統。而日本NEC實驗室則在1963年,嘗試從數字方向開展對語音識別聲控的長期研究。經過全球研究者的共同努力,語音識別聲控技術得到了迅速發展,并且逐漸從理論研究轉向實際應用中。但是在應用過程中若要對語音識別進行信息校對或糾正,將極大影響系統的識別速度。鑒于此,研究者開展了更為深入的語音識別聲控研究,以解決由于口音、環境不同導致的識別誤差。
從當前語音識別聲控技術的應用情況來看,對于特殊的語音或詞匯,應用該系統均可以快速進行識別。例如,在電話查詢與電話轉接過程中,語音識別聲控系統接收任務后會自動存儲信息,并且根據設定數據的匹配度完成任務,以提高識別率。但是目前應用語音識別聲控技術還存在較多限制因素,如移動客戶端運算量不高等,這就需要進一步對該技術進行鞏固。
移動客戶端由于運算能力較小,只能對計算機中的部分存儲與處理功能給予支持,這樣系統對語音的識別與處理需要一定的時間,之后才能顯示到手機等移動客戶端上。盡管移動客戶端在應用語音識別聲控技術上還存在一些限制,但是我們可以通過對手機終端進行編程,讓其可以識別數字撥號語音,或者識別撥打人的姓名。由于移動客戶端內存較小,能夠識別的語音一般不超過十條[2]。此外語音識別聲控技術在移動客戶頓的應用,其最大限制因素就是噪音。研究表明,受噪音影響的移動客戶端語音用戶遠比受互聯網影響的用戶多[3]。目前來看,語音識別聲控技術在手機等終端設備中的應用并不多見,這與手機商家營銷方式不當或者技術不成熟有關。
隨著移動客戶端信息處理能力的提升與內存的增加,逐漸增強了智能手機等終端的語音識別聲控能力。例如,2005年三星電子推出的一款SCH-p-207型手機,就具備語音撥號功能與語音聲控聽寫功能。用戶只需要通過語音聲控,就可以完成文本書寫與撥號。而智能手機內存的逐漸增加,也減少了語音識別聲控技術的應用限制[4]。另一個促進語音識別聲控技術發展的重要因素,就是網速的提升。高速的無線通信網絡促進了大量新技術的應用,其中一個就是語音識別聲控技術。高速網絡能夠迅速傳遞語音處理信息,而遠程服務器能夠及時獲取處理結果。
當前語音識別聲控技術在智能手機中的應用,并不限于語音書寫與撥號方面。語音撥號是智能手機最為基本的語音識別功能,甚至在很多低端手機中均可見這種功能。Gartner分析師指出,智能手機等移動客戶端將具有更為開放的語音識別功能。同時在不進行復雜編程的情況下,僅依靠可識別語音程序,就可以讓移動客戶端完成相應的指令任務。若引入運算、存儲能力更為強大的設備,將更好的促進語音識別聲控的應用。
與其它語音識別聲控技術相比,谷歌語音搜索存在的限制因素更少。這是因為它是由互聯網服務器完成繁雜的工作,減少了客戶端的工作量,這也讓谷歌語音搜索更加具有實用性。例如,用戶通過客戶端發出“查找附近電影院”的語音指令,系統將根據語音迅速識別并搜集信息,然后將搜索結果發送至客戶端頁面。此外,谷歌語音搜索程序不僅可以識別各類語音短語的意思,還可以讓用戶了解移動客戶端(手機)的具體位置。
互聯網信息時代的到來以及移動通訊技術的進步,讓世界各地的人們能夠更加便捷、靈活地進行語音通信。目前各種基于語音識別聲控開展的活動均可以在互聯網上實現,如電子商務、語音翻譯等。本文對語音識別聲控技術在移動客戶端的應用進行了探究,以此為促進語音識別聲控技術的發展提供參考。
[1]禹琳琳.語音識別技術及應用綜述[J].現代電子技術,2013(13).
[2]王宏志,徐玉超,李美靜.基于Mel頻率倒譜參數相似度的語音端點檢測算法[J].吉林大學學報(工學版),2012(05).
[3]文翰,黃國順.語音識別中DTW算法改進研究[J].微計算機信息,2013(19).
[4]邵學彬,徐太花,章亦葵.基于語音識別的汽車空調控制系統[J].單片機與嵌入式系統應用,2012(10).