摘要:應用語音中間件、嵌入式語音引擎、多語言信息服務系統架構和多語言模板翻譯引擎等多項已處于實用化階段的高新技術成果,研發面向首都公安應用的多語言智能移動翻譯軟件,為首都公安干警在社會治安、出入境管理、交通管理和邊防檢查等幾個方面提供信息查詢和語言翻譯的手段,以推進首都公安的信息化建設,提高奧運安保工作水平,適應新時代公安工作需要。
關鍵詞:語音識別; 語音合成; 多語言信息服務系統架構; 多語言模板翻譯引擎
中圖分類號:TP391.2文獻標志碼:A
文章編號:1001-3695(2007)11-0175-03
隨著我國經濟建設和社會發展的步伐進一步加快,各種對外國際交流合作日漸增加,我國警務人員正愈來愈多地參與國際間的警務交流與合作。因此,公安執法和治安服務領域中涉外交往和治安接觸將成為全國警察的日常工作之一。特別是北京成功申辦2008年奧運會和上海成功申辦2010年世博會,對全國警察涉外治安事件處置能力和涉外治安服務水平提出了更高的要求和更緊迫的任務。在這種背景下,提出供信息查詢和語言翻譯的產品,用以輔助警務人員在治安、戶政、交通管理、刑事偵查、經濟偵查、邊檢、國內安全保衛、消防領域處理涉外事務時與外國人進行及時的交流和溝通,以推進首都公安的信息化建設,提高奧運安保工作水平,適應新時代公安工作需要。
1多語言智能移動翻譯軟件的系統框架
多語言智能移動翻譯軟件集成語音中間件、語音引擎和多語言信息服務系統架構等多項已處于實用化階段的國內外高新技術成果,研發面向公安應用的嵌入式多語言模板翻譯引擎和多語言智能移動終端的語音和圖形多模態用戶接口,形成面向公安應用的智能移動終端成果。系統總體框架如圖1所示。
2關鍵技術
2.1語音中間件VQL
VQL(voice query language)是Voice Insight的專利技術,它能夠與各種語音引擎(ASR、TTS)集成在一起(只要VQL和語音引擎滿足接口要求),并提供了開發不同語音應用系統的接口。通常一個基于VQL的語音應用系統具有如圖2所示的結構。
VQL技術具有如下的優點:
a)獨立于特定的語音識別引擎和語音合成引擎,并支持多種語言:美國英語、英國英語以及主要的幾個歐洲語言,如法語、荷蘭語。
b)獨立于特定的設備,適用于手持設備、無線設備(如電話、PDA)、PC、交互式電視等。
c)獨立于應用,能夠較少重復開發,并能夠適應不同的應用需求。
d)支持當前主要的語音工業標準,如SAPI、XML、VoiceXML、JSAPI、SAPI。
VQL的技術特征在于它的三層體系結構,即一般領域、特定領域和數據庫應用模塊。這使得Voice-Insight既可以提供完整的VQL解決方案,也可以提供基于VQL的開發工具包,由客戶部署并開發出不同的語音應用系統。VQL的顯著特點就是能夠將現有的應用系統轉換為語音驅動的應用系統。
2.2嵌入式語音引擎
嵌入式語音引擎的研發涉及聲學、語言學、數字信號處理、計算機科學等多個學科技術,是信息處理領域的一項前沿技術。它通常包含語音合成和語音識別兩個獨立的子模塊。語音合成和語音識別技術是實現人機語音通信,并建立一個有聽、講能力的口語系統所必需的兩項關鍵技術。
嵌入式語音引擎是一套面向多種軟硬件平臺、多個語音通道的SDK應用工具,具有易用性強、性能穩定、正確率高的特點。它的特色還在于用戶無須進行訓練,引擎的設計已經保證了非特定人這一重要特點;API提供的管理工具使得用戶可以自如地定義自己所需的詞表和語法,以便應付不同的應用需求。該引擎可運行于多種嵌入式軟件平臺和多款移動設備上,是一個跨平臺的語音解決方案。
2.3多語言信息服務系統架構
首信公司在國家“863”計劃、北京市科技計劃支持下,在掌上電腦PDA上嵌入語音識別和合成技術,與電子地圖集成實現了漢、英雙語語音電子導游功能。該終端能夠通過語音命令查找所在位置和最優路線,同時在電子地圖上實時顯示用戶當前位置、目標位置和路線。此外,該終端還可以實時接收用戶所定制的信息。基于該終端成果,本軟件研發了多語言信息服務系統構架,該架構可運行于多種嵌入式軟件平臺和多款移動設備上,可方便地集成語音中間件、語音引擎,并提供信息發布、信息定制、信息查詢、用戶界面可視化設計等功能。
2.4嵌入式多語言模板翻譯
現有機器翻譯方法包括基于規則、基于統計和基于實例的機器翻譯等。由于自然語言的復雜性,這些機器翻譯方法還沒有一種能夠徹底解決機器翻譯系統所涉及的各種難題。為了綜合利用這三種方法的優點,同時克服各自所存在的問題,一種常用辦法是將多種翻譯策略有機地集成在一起,以實現各種策略之間的優勢互補,改善系統的性能。
基于模板的翻譯方法就是介于基于規則和基于實例兩種方法的結合。模板可以看做是一個帶有變量的語句,而語句可以看做一種不帶變量的模板。用模板代替語句可以使很多具有相似句子結構的語句合并成一個模板,因此模板在語料庫中出現的頻率要比作為其特例的語句大。為了刻畫一個語料庫中的語言現象,所需要的模板數量將遠遠少于所需要的語句數量,雖然使用模板具有的歧義可能要比一個語句的歧義多,但是在實際應用于面向領域的應用時,常常可以消解模板中單個詞的多種歧義,滿足系統設計的需要。
同樣,模板可以看做是一個詞匯化的規則,而規則可以看做一種不帶詞匯的模板。用模板代替規則可以使在實際應用中容易引起歧義的規則具有不同的錨點,從而得以區分,使得對語料庫中的語言現象的刻畫更為準確;同時,雖然模板的數量較規則要大,但是要比語料庫中的實例少很多,而且由于模板中帶有變量,還增加了系統的歸納能力,能夠概括較語料庫中更多的語言現象。
本軟件研發嵌入式多語言模板翻譯引擎,以解決在嵌入式設備,資源受限條件下,大數據量、多語種翻譯引擎和設備儲存、計算資源有限的矛盾。圖3為嵌入式多語言模板翻譯引擎架構。
3系統的實現
3.1類依賴關系圖
筆者完全按照軟件復用原則,盡量使產品具有通用性和獨立性,并采用面向對象技術來建立實現整個系統,將各種問題細化為類,把系統設計原型分解為一系列的類對象。系統對象關系如圖4所示。
其中:CPoliceToneDlg類為首頁界面,它顯示了公安人員在執勤和服務中的不同領域(本軟件設計了九個領域),用按鈕顯示;CDomainDlg類為主框架界面(圖5),它主要包括一個領域和場景選項,自定義的列表框(CTemplateBox)和一個靜態文本框;CTemplateBox類顯示了公安干警日常工作中常用的句子;CIniFile、CTemFile文件類用于裝載語料和模板變量;CVQL類為語音引擎,包括語音識別和語音合成,人們可以通過語音識別輸入語音信息選定語句或進行領域和場景的切換,通過語音合成技術將選定的語句朗讀出來;CPopButton類設計了一個帶有彈出式菜單的按鈕類。
3.2場景實例
1)軟件設計了公安人員在執勤和服務中的九個常用領域,每個領域又包含若干個場景,每個
場景中采用的句子都是公安干警日常工作中使用頻率較高的口語,體現了實用性。
2)圖5為治安領域中的火災事故現場處理的場景。列表框中列有該場景中警務人員常用的語
句。句中帶下畫線的詞是模板語句的變量。點擊鼠標左鍵出現浮動菜單可以選擇相應的詞進行替代。
3)加入了語音識別和語音合成技術,即除了可以手動選擇語句、切換領域和場景外,
還可以通過語音輸入選擇語句、切換領域和場景。當點擊小喇叭按鈕時系統會朗讀翻譯語句。
4結束語
本文主要介紹了一款面向公安領域的在Pocket PC終端上應用的翻譯軟件。隨著全球化經濟的發展,國際間的交往與合作日益增多,并且伴著Internet的日益普及和發展,語言不通的問題已經受到人們的廣泛關注,市場上也出現了許多比較成熟的翻譯產品。由于機器翻譯技術和嵌入式語音技術本身的限制和復雜性,在移動終端上將翻譯技術與語音技術相結合的例子很少。本軟件成功地集成了語音中間件、嵌入式語音引擎、多語言信息服務系統架構和多語言模板翻譯引擎等多項技術,有利于促進我國機器翻譯研究的發展,推動語音技術和嵌入式技術的發展。由于在嵌入式方面的翻譯系統的可借鑒經驗很少,還存在一些問題,如本軟件僅限于某個領域,且句子數量不宜太多、句子不宜太長等。
參考文獻:
[1]TAKEDA K.Pattern-based context-free grammars for machine translation[C]//Proc of the 34th Annual Meeting of the Association for Computational Linguistics.San Fransisco:Morgan Kaufmann Publishers,1996:144-151.
[2]McTAIT K. Translation pattern extraction and recombination for example-based machine translation[D]. Manchester:University of Manchester Institute of Science Technology,2001.
[3]WU De-kai.Stochastic inversion transduction grammars with application to segmentation bracketing and alignment of parallel corpora[C]//Proc of the 14th International Joint Conference on Artificial Intelligence.San Fransisco:Morgan Kaufmann Publishers,1995:1328-1337.
[4]SHIRAI S, BOND F, TAKAHASHI Y.A hybrid rule and example-based method for machine translation[C]//Proc of the Natural Language Processing.1997:49-54.
[5]朱躍龍,王勇,濮淼清,等. 面向對象技術的機器翻譯系統的設計與實現[J].計算機工程, 2001,27(11):47-49.
[6]鄭保山,劉群,張祥.機器翻譯模板的建立原則和方法[C]//全國第五屆計算語言學聯合學術會議論文集. 北京:清華大學出版社,1999.
[7]胡日勒,宗成慶,徐波.基于短語結構抽取和對齊的機器翻譯模板自動獲取方法[C]//第二屆全國學生計算語言學研討會論文集.2004:363-368.
[8]劉群,詹衛東,常寶寶,等.一個漢英機器翻譯系統的計算模型與語言模型[C]//吳泉源,錢躍良.智能計算機接口與應用進展——第三屆全國智能接口與智能應用學術會議論文集.北京:電子工業出版社,1997.
“本文中所涉及到的圖表、注解、公式等內容請以PDF格式閱讀原文”