張晗 昝鷺鷥
摘 要:隨著科技的進步,我們身邊的機器、設備都得到了極大的發展。以我們身邊的家電為例,以前我們的降溫方式大多是通過電風扇,而現在家家都使用空調來降溫,生活條件得到了極大的改善。隨著時間的推移,那些智能設備的控制方式也有了很大的發展。從起初單一的手動開關到現在的紅外遙控、藍牙控制、手機控制、遠程控制以及語音控制等實現了多種控制方式。而說到語音控制,它有一個關鍵的問題,那就是降低發生語音誤識別的概率。
關鍵詞:語音控制,語音誤識別
語音控制是我們現在使用的控制方式的一種。語音控制的關鍵模塊為語音模塊,它可以接收語音信息,將接收到的語音信息轉換為電信號,并將轉換好的電信號輸出給單片機等主控板。通過主控板對這些電信號進行處理,最后給執行元件的驅動裝置下達指令,然后驅動裝置將控制執行元件運動,以實現預定的動作。現在我們使用的語音模塊大多是可以再編輯程序的,也就是說我們可以通過向語音模塊寫入指令關鍵字,以實現用戶說出相應的關鍵字就可以讓機器執行相應的動作。但是,語音模塊在使用的過程中,通常會有語音誤識別事件的發生,所謂的語音誤識別是指,當我們沒有說出指令關鍵字時,機器卻執行某個指令的動作。出現誤識別現象的原因為:語音模塊將我們說出的非指令關鍵字誤識別為指令的關鍵字,導致機器執行了某個指令的動作。在語音誤識別中,那些讓語音模塊誤識別的非指令關鍵字稱為“垃圾詞匯”。如果某設備要求使用語音控制,那么我們需要解決的關鍵問題為在控制成本的要求下,盡量降低語音誤識別的發生概率。
現將降低發生語音誤識別概率的方法總結為兩種。一個方法是在語音模塊中編寫垃圾詞匯庫,具體的實施方法是將上述提到的垃圾詞匯組合起來,組成一個垃圾詞匯庫,當使用者說出垃圾詞匯庫中的詞匯時,通過程序設置,將這些詞匯置空。也就是說當使用者說出垃圾詞匯庫中的垃圾詞匯時,語音模塊雖然識別了這些詞匯,但是卻不向主控板發出任何信號。這種方法從根本上解決了語音誤識別的發生,但是具體實現困難,原因之一是實際應用場景復雜,垃圾詞匯不可能被完全考慮到,所以還不能解決語音誤識別的發生,只能一定程度上降低語音誤識別的發生概率。換句話來說,語音模塊中垃圾詞匯庫越豐富,發生語音誤識別的概率就會越低;原因之二為語音模塊程序中的垃圾詞匯庫還受到語音模塊容量大小的限制。故這種方法在理論上是可以實現的,但是在實際中還需要研發人員不斷去發掘垃圾詞匯,這也是一項具有很大工作量的工作。
降低語音模塊發生語音誤識別的概率的第二種方法是通過減少語音模塊的工作時間來降低語音模塊發生語音誤識別的概率。實現的具體方式為:使語音模塊只有在用戶使用語音輸入時,才處于工作狀態,即語音模塊開始接收并傳遞使用者的語音執行指令,當用戶不使用時,語音模塊處于待機狀態,既不接收也不傳遞使用者的語音執行指令。在這種方法中,我們把語音指令分成兩種,第一種指令是語音開關指令,這種指令即為語音工作狀態的控制指令。它共有兩個指令,其中一個指令是“開機”指令,開機指令的作用是使語音模塊從待機狀態轉變為工作狀態;另一個指令就是“待機”指令,待機指令的作用就是使語音模塊從工作狀態轉變為待機狀態。第二種指令為語音執行指令。語音執行指令的作用是控制機器動作的執行。具體的使用方式如下:當使用者使用機器時,先說出“開機”,語音模塊處于工作狀態,即整個機器處工作狀態。之后使用者可依次說出語音執行指令,使整個機器作出相應的動作。當使用者不使用機器的時候,說出“待機”,使語音模塊從工作狀態轉變為待機狀態,不再接收語音執行指令,即整個機器處于待機狀態。這樣就大大降低了語音模塊的工作時間,也就降低了有效工作時間內發生語音誤識別的概率。
綜上,這兩種方法都可以使語音模塊發生語音誤識別的概率降低,相互結合使用,效果會更好。
參考文獻:
[1].程鋼, 殷轔, 梁富廣,等. 一種基于語音辨識的收視率統計系統及方法:, CN102984559A[P]. 2013.
[2].李玉萍, 樸春俊, 韓永成. 一種改進的語音信號端點檢測方法研究[J]. 國外電子測量技術, 2008, 27(1):7-9.
[3].吳亮春, 潘世永. 一種語音信號端點檢測方法的研究[J]. 計算機與信息技術, 2009(3):17-18+21.