鄭州電視臺 單志霞
TTS功能在移動終端的應用
鄭州電視臺 單志霞

TTS(Text To Speech),即從文本到語音。TTS所用的關鍵技術就是語音合成(Speech Synthesis)技術。早期的TTS一般采用專用的芯片實現,但主要應用于家用電器或兒童玩具中。目前,中文TTS系統中比較常用的有IBM、Microsoft、Fujitsu、科大訊飛、捷通華聲等研究的系統。本文,筆者主要介紹科大訊飛TTS系統開發包Aisound的應用。
訊飛輕量級語音合成系統Aisound是科大訊飛基于全球領先的語音合成技術,主要針對各行業應用的嵌入式設備,為用戶提供語音信息獲取和語音交互應用能力的軟件模塊,并將普通文本字符轉換為自然語音輸出的一款TTS軟件。Aisound語音合成系統不受操作系統的限制,不增加用戶額外的硬件成本,并針對嵌入式設備資源受限的特點,在資源占用、可移植性等方面都取得了突破性進展,其合成效果整體上已超過普通人的說話水平。語音合成系統的系統框架圖如圖1所示。

圖 1 語音合成系統框架
在移動終端上實現TTS,其開發原理比較簡單。由于目前移動終端的開發基本上已經實現語音、短信、數據等業務的模塊化,并且UI系統也做的相當成熟,因此我們在添加TTS功能時,只需要使用第3方的軟件開發包即可:通過修改編譯規則,將開發包提供的庫文件編譯進去,然后調用其提供的標準API接口。
1.語音合成的基本流程。
(1)為TTS分配一塊足夠大的堆空間。
(2)初始化資源。
(3)使用ivTTS_Create創建一個TTS實例。
(4)使用ivTTS_SetParam設定TTS的各種參數。如,各回調函數、輸入輸出方式、語言、文本編碼類型、音量和語速等。……