魏海龍 張劍 陳俊 張智
【摘 要】針對地空通話系統中麥克風、音量控制及音頻信號等識別精度受環境噪聲影響問題,提出了語音文字轉換輔助系統的設計,以51單片機、語音模塊、液晶顯示器等模塊組成,實現語音播放和文字顯示以增強民航地空通信中的信息交流。
【關鍵詞】地空通信;語音識別;LD3320語音模塊;文字顯示
中圖分類號: TN92;V243.1;V351.36文獻標識碼: A文章編號: 2095-2457(2019)04-0116-002
DOI:10.19694/j.cnki.issn2095-2457.2019.04.046
Design of Auxiliary conversion system for speech-text in radiotelephony communication of Civil Aviation
WEI Hai-long ZHANG Jian CHEN Jun ZHANG Zhi
(School of Air Transport, Shanghai University of Engineering and Technology, Shanghai 201620, China)
【Abstract】the recognition accuracy of microphone, volume control and audio signal in aeronautical speech system is affected by ambient noise. This paper puts forward the design of the Auxiliary system of speech and text conversion, which is composed of LD3320 speech module, SD card interface, touch display module and so on, which is controlled by 51 single chip microcomputer system. Voice playback and text display are implemented to enhance the communication between civil aviation and air-to-air communications.
【Key words】Radiotelephony communication; Speech Recognition; LD3320 speech module; Text display
0 引言
目前民航地空語音通信主要是利用HF、VHF技術[1],飛行員在語音通信時,在多語言環境以及飛行員所承受的巨大壓力下導致遺忘部分信息,甚至可能存在口音問題導致理解錯誤,因此通過語音文字轉換輔助系統將語言轉換成文字顯示出來,方便機組人員理解查找,避免遺忘,將增強民航地空通信的信息交流的可靠性,有利于民航飛行的安全。
語音識別系統是建立在語音技術、信號處理、模式識別等學科的數學模型基礎上,運用不同的計算機算法來實現的,可促進和改善人與人,人與機器之間的信息交流[2]。本文語音文字轉換輔助系統設計以51單片機系統作為核心控制,由LD3320語音模塊進行語音識別處理、SD卡接口、液晶顯示器等模塊組成,實現語音的播放與文字的顯示以加強民航地空通信信息的交流。
1 系統總體框圖
根據目前航空語音系統中麥克風、音量控制及音頻信號等識別精度受環境噪聲影響問題,以及受應用環境的影響。本文設計出語音文字轉換輔助系統。該系統設計采用51單片機作為核心控制處理,由LD3320語音模塊進行語音識別處理,外加SD卡存儲飛行員通信專用術語,由液晶顯示屏顯示語音識別出的文字。其基本結構框圖如圖1所示。
2 系統模塊原型設計
2.1 語音識別模塊
語音識別中主要有非特定人語音識別和特定語音識別兩種技術,非特定人語音識別技術側重提取能夠表征語義的特征參數,忽略語音所包含的個體信息;特定人語音識別技術不僅提取能夠表征語義的特征參數,也會提取語音所包含的個體信息[4]。
基于統計特征的非特定人語音識別系統可大致分為三部分:
(1)語音信號預處理與特征提取:濾除與語音識別無關的信息,提取語音識別的重要特征信息。
(2)聲學模型與模式匹配:利用訓練算法對語音特征進行處理生成聲學模型,語音識別時首先提取語音特征,然后與已生成的聲學模型進行模式匹配得到識別結果。聲學模型是語音識別系統的核心部分,其設計單元、識別統詞匯量、訓練數據量、識別率和語音應用環境特點密切相關。
(3)語言模型處理:通過語言模型對所識別出的語音模型語進行語法、語義分析[5]。
本系統采用基于非特定語音識別技術,語音識別模塊主要采用LD3320芯片,語音識別電路設計圖如圖2所示。該芯片基于非特定人語音識別(SI-ASR:Speak-Independent Automatic Speech Recognition)技術的語音識別和聲控芯片,內置非特定人語音識別算法,并且集成了語音識別處理器以及部分外部電路[3],識別詞語條目支持動態編輯,可滿足基本的航空陸空通話專用術語模式的應用需求。
2.2 控制及輔助模塊
(1)控制模塊:采用STC89c51單片機作為系統主控制芯片,片上資源比較豐富,可利用的I/O口較多,處理速度能滿足該系統要求。
對語音識別芯片的設置和數據傳送主要通過對寄存器的操作來實現[6]。進行語音識別時,通過預先設置的識別關鍵詞語列表,設定芯片的識別模式,LD3320識別完成后,識別結果通過寄存器返回識別出的關鍵詞語在預先設置好的關鍵詞語列表中排列索引值index。
(2)文字顯示模塊:采用9648液晶屏,顯示LD3320芯片識別出的語音內容。
(3)電源模塊:利用三端穩壓集成電路LM7805為語音識別系統提供5V直流電源,語音芯片LD3320的工作電壓為3.3V,利用LM1117-3.3芯片實現5V-3.3V電壓轉換為LD3320供電。
3 結束語
本文結合實際情況,從語音轉換的實際意義出發,結合自身條件以及利用現有技術,設計了語音文字轉換系統,通過單片機控制LD3320語音模塊,以及液晶顯示模塊,實現語音播放及文字顯示。本語音文字轉換輔助系統的設計通過將信息以文字的方式呈現,增強民航地空通信中的信息交流。使民航工作更為安全穩定。
【參考文獻】
[1]周偉康.淺談民航地空通信技術的發展[J].信息系統工程,2014(08):24.
[2]方紅峰,馮嘉禮,韋夢蕓,劉永昌.英語語音轉換英文文字的軟件實現[J].哈爾濱工程大學報,2006(07):584-586.
[3]陳喜春.基于LD3320語音識別專用芯片實現的語音控制[J].電子技術設計與應用,2011(11):20-21.
[4]郭昕.基于HMM和匹配追蹤的多參數語音控制[J].科研發展,2013(09):92-93.
[5]趙力.語音信號處理[M].第2版.北京.機械工業出版社,2009,233-234.
[6]ICRoute Ltd..LD3320數據手冊[EB/OL].http://www.icroute.com/web_cn/ DownLoad.html.