摘 要:陸空通話是空中交通管制員從業上崗的基礎,也是在日常工作中時刻使用的標準語言。其使用是否標準將直接影響空中交通安全,因此各類專業人員需要不斷訓練,提高陸空通話能力。文章在陸空通話英語標準發音的基礎上,設計發音模板,并進行語音識別,輔助專業人員進行陸空通話英語練習。
關鍵詞:空中交通管理;陸空通話;語音識別;教學輔助
陸空通話具有標準的發音規則,區別于日常用語[1-2]。本文提取陸空通話數據并進行整理,通過MATLAB制作成標準的陸空通話模板。同時針對個體發音需要進行語音比對,測量其標準性,進而可以實現語音識別功能。
1 模板設計的意義
進行語音識別的關鍵是設計合適的發音模板,依據此模板對個別發音進行評價,評定出發音所代表的含義??展荜懣胀ㄔ挷煌谄胀ǖ挠⒄Z,其發音具有明顯的行業特點,如字母A的發音不是/ei/而是/a:lf/、B的發音不是/bi:/而是/|brɑ:|v?藜?尬/,因此由于針對性非常強,因此需要根據標準單獨制作發音模板,在行業內推廣使用。
2 模板提取方法
本文采用陸空通話標準用語教材中的發音作為標準進行參考,一般的錄音頻率為44k Hz,如字母A的發音振幅如圖1(a)所示。雖然原始語音信號精度較高,但是后期實現語音識別的時候,需要對上百句模板進行一一對比,判定最相似的一個為其識別出來的語音,這樣算法運行時會耗費大量的時間,實時性難以保證,因此我們對語音模板進行離散取點,通過實驗,將其頻率降為2000Hz時,依然可以保證識別的準確性,如圖1(b)所示。這樣,我們對經常使用的字母、數字以及一些常用的陸空通話用語提取了發音模板,其形式為雙精度的數字序列。
3 語音識別方法實現
由于所設計的語音模板標準性非常強,其應用就是為了避免日常英語中發音的混淆,因此我們采用最為簡單有效的DTW(Dynamic Time Warping,動態時間歸整)算法進行語音識別[3-4]。DTW算法是一種衡量兩個長度不同的時間序列的相似度的方法,模板的設計便不需要考慮時間的長短,即采樣序列的數量,可以有效提高應用的效率。
本文使用MATLAB中DTW工具箱進行模擬仿真,同樣以字母A為例輸入的語音波形如圖2所示。經過DTW算法,其發音與部分字母模板的對照如表1所示,可以看到此發音與模板A的距離最短,為7.1926,識別正確。
4 結束語
本文對陸空通話的標準語音數據進行了整理,提取出發音模板用語課堂輔助訓練,通過語音識別方法準確識別具體的發音。項目進一步的研究目標是將模板應用于Android系統中,實現移動端的訓練軟件開發。
參考文獻
[1]劉萬鳳,胡軍,袁偉偉.陸空通話標準用語(英語)的語音指令識別技術研究[J].計算機科學,2013,40(7):131-137.
[2]王博,李振宇.無線電陸空通話英語特點與教學策略[J].沈陽航空航天大學學報,2010,27(6):61-64.
[3]韋春麗,霍春寶.基于DTW的語音識別在MATLAB中的實現方法淺析[J].數字技術與應用,2011(12):184-185.
[4]肖利君.基于DTW模型的孤立詞語音識別算法實現研究[D].中南大學,2010.
作者簡介:孫禾(1988-),男,助理實驗師,研究方向:空中交通管理。