宋金澤(上海飛機設計研究院,上海 201210)
語音識別系統在民機駕駛艙的應用
宋金澤
(上海飛機設計研究院,上海 201210)
在飛機駕駛艙引入語音識別系統,是時代與科技發展的必然結果,減輕駕駛員負荷,并符合新一代飛行員對智能科技的追求。語音識別系統的核心在于特性提取、模式匹配和噪聲濾除,該領域的研究都比較成熟,使得語音識別系統在飛機駕駛艙應用成為可能。本文結合飛機駕駛艙使用環境與民機設計特點,對民用飛機駕駛艙內貫徹語音識別系統進行了探討。
民機 駕駛艙 語音識別
民航系統出于安全考慮,對技術的成熟度要求較高,因此不論機載還是地面系統,并不總是急于第一時間嘗試新技術。然而在飛機駕駛艙引入語音識別系統,是技術進步帶來的一種必然[1],可以減輕飛行員負荷,并符合新一代飛行員對智能科技的追求。
語音識別系統的核心在于特性提取、模式匹配和噪聲濾除,這些領域的研究目前都已比較成熟。
參數提取的算法主要有LPCC(線性預測倒譜系數)和MFCC (Mel頻率倒譜)。MFCC具有更強的抗干擾能力等特點,更適合與噪聲較多、發話人不能離輸入設備很近的環境。模式匹配通過計算現有語音模式與語音模板庫中的模板的距離,來獲得最佳的匹配模式。主要有DTW(動態時間規整)、HMM(隱馬爾科夫模型)和ANN(人工神經元網絡)法。ANN與HMM需要大量的計算,DTW更適合用于孤立詞、小詞匯量的語音識別[2]。噪聲是影響識別準確率的重要因素,但是汽車領域里已經有了較好的實踐,可以做到即使車內環境很嘈雜(副駕駛座上的乘客在說話, 或者車載音響被打開),也不影響駕駛者操控語音系統[3]。
某些航空設備制造商已經推出了語音識別產品,但是只局限于個別廠家的單個產品,功能有限。相比單一設備供應商,主制造商具有無以倫比的綜合集成優勢:(1)在機上選用性能更強的機載硬件,富余的計算資源可以支持復雜的運算;(2)采用集成度高的航電系統,語音識別的結果可以有效輸出到各系統。以下給出一種設想的實施架構。
(1)在飛機上增加專用設備——“語音處理單元”用于處理飛行員的語音輸入并產生指令輸出;或不增加專用設備,而將該部分功能——“語音處理功能”駐留在綜合航電系統中。(2)通過各系統的設計保障等級與系統安全性分析,制定控制飛機的語音指令集,分別對應不同安全級別系統的響應。可以通過航電軟件升級對語音指令集進行修改。對于不影響安全的一些語音指令,允許航空公司通過USB等方式快速更新。(3)飛機駕駛艙處于持續噪聲環境中,而且隨著飛行階段的不同,噪聲水平也不同。因此除了選用良好的麥克風輸入設備,還需要精準的噪聲濾除。可根據不同飛行階段的環境噪聲建立數據庫,比較合適的方式是在飛機型號研制試飛時,隨著對飛機包線的摸索一并完成。(4)飛行員通過打開指令接收通道來激活語音處理單元/功能,激活指令的方式可選(以下選項互不排斥):1)在飛機上加裝專用的激活按鈕;2)使用現有的PTT內話按鈕;3)關鍵詞激活HOT MIC。(5)語音處理單元/功能激活后,將按照事先規定的標準句法識別飛行員的意圖。飛行員可以隨時中斷語音輸入。語音輸入成功后根據命令等級不同對應不同的確認程序,如音響或機器人聲的語音回放。該聲音的大小可調。語音輸入的同時系統將會監視對應的設備有無被手動操作,如有將取消語音輸入指令并提示飛行員。
下面結合4條實例說明在駕駛艙實裝語音識別系統的優勢。
(1)飛行員注意到EICAS上有一條故障信息,通過語音助手打開對應的CMS顯示頁面,這些頁面在沒有語音識別的情況往往需要飛行員多步導航才能到達;(2)飛機正在飛越一片嚴重湍流區,飛行員忙于穩住飛機的姿態,通過語音助手打開系緊安全帶指示燈,并實時下傳湍流報,提醒地面規劃好后續飛機的航線;(3)惡劣天氣下,飛行員通過語音助手發出氣象請求,并顯示收到的回復。當管制員要求飛機復飛轉場時,飛行員通過語音助手更改飛行計劃到備用機場。 (4)延時提醒,管制員要求飛行員在某高度報告,飛行員告知語音助手,當系統檢測到飛機達到指定高度時提醒飛行員。
語音識別技術在國內外均有大量研究,技術的成熟度日漸提高,普及領域呈現拓展趨勢,如蘋果的”SIRI”、電腦平臺的“Saybot”、百度語音搜索等。許多汽車也具有語音識別功能,作為高端產品的飛機更不應當落后于潮流。
如果說當前還沒有廣泛使用是因為可靠性尚待提高,那么當技術水平進步到以前的劣勢,如可靠性,已經不再是制約瓶頸的時候,就是新技術一馬平川的應用之時。在飛機駕駛艙應用語音識別系統前景廣闊,技術儲備逐漸成熟,國外嗅覺敏銳的航電系統集成商已經開始建立專利壁壘,如HONEYWELL公司就在2010年申請了一項美國專利Methods and systems for utilizing voice commands onboard an aircraft[4]。波音夢想飛機的夢幻燈光爭取了乘客的好奇心,語音識別系統也同樣會爭取到飛行員的好奇心,行業內應當引起重視。
[1]凱文 凱利.必然[M].北京:電子工業出版社,2016:29.
[2]石可箴.車載多媒體系統中語音識別技術研究[J].數字技術與應用.2012(2):82-82.
[3]朱敏會.Nuance 的創新語音技術[J].汽車與配件.2012(1):30-31.
[4]DONG X Q,QIN X L.Methods and systems for utilizing voice commands onboard an aircraft[P].USA.2011.
宋金澤(1986—)男,漢族,黑龍江哈爾濱人,上海交通大學碩士,工程師,研究方向:民機甚高頻通信、數據鏈、靜電放電。