陳少華,楊勝忠,顧 欣
(貴州省黔東南自治州氣象局,貴州 凱里 556000)
氣象“12121”咨詢電話是氣象部門服務公眾的重要服務窗口,是快捷查詢到每天最新氣象信息和災害天氣預警信息的重要途徑。隨著人民群眾生活水平的提高和社會經濟活動的增多,社會各界愈來愈關注每天的最新氣象信息,“12121”在健全防災體系、構建和諧社會以及指導公眾有序防御氣象災害,合理安排工作與生活等方面發揮了積極作用。黔東南州氣象災害頻繁,各種氣象災害如冰雹、強降水等時有發生,為了滿足社會對氣象信息的需求,讓氣象更好的服務于黔東南經濟建設和人民群眾的日常生活,黔東南州氣象局在原有的“12121”氣象語音自動答詢系統上增加了氣象預警和天氣實況兩項內容。
目前,全國“12121”氣象語音自動答詢系統主要有伍豪和雙順達兩個品牌,貴州省主要也是在使用這兩個廠家的系統。和其它系統一樣,伍豪和雙順達系統的原理都大同小異,系統根據平常使用的播報內容,錄制成語音詞條,形成專用語音庫,當制作預報時,選擇相應的語音詞條來制作播報內容,因此,播報內容受制于語音庫,如果想要播報的內容找不到相應的語音詞條,就無法制作。隨著社會經濟的發展,人們對“12121”播報內容要求越來越豐富,如氣象預警信息,其內容多變,沒有固定模式,也不能預知其內容,所以無法利用事先錄制好的語音詞條來制作氣象預警信息,解決缺少語音詞條文件成了制作播報內容最大的難題。據了解,全國有條件的少數地區“12121”氣象預警信息是通過人工現場錄制,這就需要花費較大的人力和物力,在大多數地區無條件實施,不現實。通過研究發現,利用計算機自動處理是最好的解決方法。
本研究主要以伍豪“12121”天氣自動答詢系統為例,采用TTS文本轉換語音技術[1],實現播報內容如氣象預警信息等直接以文本內容轉換成語音文件,通過開發計算機軟件實時自動完成播報內容的更新,使撥打用戶了解到最新的氣象信息。同時,也給其它廠商的系統實現這一功能提供進一步參考。
伍豪“12121”氣象語音自動答詢系統是目前比較常用的氣象語音自動答詢系統之一,它制作氣象播報內容的原理和其它系統一樣,較為簡單。即根據常用的播報內容錄制成相應的語音詞條,并以PCM格式的語音文件存放于系統中,形成專用語音庫。伍豪通用的語音文件格式編碼為PCM,A律(A-Law),8 000Hz,8位,單聲道。制作播報內容時,選定相應內容的語音詞條,保存確定后,系統調用該詞條的語音文件聯接合并成完整內容的語音文件,用戶撥打時,系統播放相應的語音供用戶收聽。
伍豪“12121”氣象語音自動答詢系統目前存在的弊端是由于系統中所有的語音詞條都是根據常用的內容事先錄制好的,當出現播報內容找不到相應的語音詞條文件時,就無法制作。因此,播報內容完全受制于語音詞條,即受制于系統內置語音庫。
氣象災害預警信息和天氣實況內容靈活多變,無法用固定的語音詞條來確定,不可能使用事先錄制好的語音文件,特別是出現氣象災害預警信息時,預警信息的內容更是不確定性,包括內容和出現的時間;天氣實況每個小時內容需要更新一次;通過系統自帶的功能,可以進行人工現場錄制播報內容來完成制作。但如果安排人工進行實時錄制更新,那將要花費較多的人力和物力,特別是夜間需要值守班,需要安排4~6名普通話標準的工作人員進行24 h值班,一般情況下,各地“12121”值班人員只有1~2人,無法承擔以上工作。因此,該伍豪系統在實際業務使用上,存在一定的弊端。
了解伍豪“12121”氣象語音自動答詢系統原理后,根據需要的功能,通過研究發現,采用TTS文本轉換語音技術,可以解決缺少語音詞條文件的難題。
TTS是Text To Speech的縮寫,即“從文本到語音”,是人機對話的一部分,讓機器能夠說話,它是同時運用語言學和心理學的杰出之作,在內置芯片的支持之下,通過神經網絡的設計,把文字智能地轉化為自然語音流。TTS技術對文本文件進行實時轉換,轉換時間之短可以以秒計算。在其特有智能語音控制器作用下,文本輸出的語音音律流暢,使得聽者在聽取信息時感覺自然,毫無機器語音輸出的冷漠與生澀感。TTS語音合成技術即將覆蓋國標一、二級漢字,具有英文接口,自動識別中、英文,支持中英文混讀,所有聲音采用真人普通話為標準發音,實現了120~150個漢字/s的快速語音合成,朗讀速度達3~4個漢字/s,使用戶可以聽到清晰悅耳的音質和連貫流暢的語調。
基于計算機應用的TTS一般用純軟件實現,主要包括以下幾部分:
①文本分析。對輸入文本進行語言學分析,逐句進行詞匯的、語法的和語義的分析,以確定句子的低層結構和每個字的音素的組成,包括文本的斷句、字詞切分、多音字的處理、數字的處理、縮略語的處理等。
②語音合成。把處理好的文本所對應的單字或短語從語音合成庫中提取,把語言學描述轉化成言語波形。
③韻律處理。合成音質(Qualityof Synthetic Speech)是指語音合成系統所輸出的語音的質量,一般從清晰度(或可懂度)、自然度和連貫性等方面進行主觀評價。
利用TTS技術,通過編寫處理程序,即可實現氣象災害預警信息和天氣實況內容自動合成語音文件。轉換成的語音采用優質語音庫,語速適宜,朗讀流暢,幾乎能與標準普通話媲美。
原理如圖1所示:

圖1 “12121”播報內容實時自動更新原理
以氣象預警信息為例:
①在伍豪“12121”氣象語音自動答詢系統上設置一個預警信箱,用來放置預警信息,并指定一個無內容的播報語音文件。
②預警信息的獲取。氣象臺發布預警信息,會生成一個預警文件,讓其自動發送到“12121”系統計算機上,設計一個程序,當接收到新的預警信息文件時,讀取該文件內容即可得到播報內容,即預警信息內容文本。
③得到內容文本后,通過TTS程序處理,調用專用語音庫,根據內容合成伍豪“12121”氣象語音自動答詢系統通用PCM格式的語音文件。
④自動覆蓋替換掉預警信箱中的原有的語音文件。
通過以上操作,當氣象臺發布預警信息時,會自動讀取預警內容并處理生成語音文件,替換掉原先的文件,使用戶能聽到最新的預警信息。
天氣實況及天氣預報內容的更新也是相同原理。
根據以上原理,利用Visual Basic程序設計開發了伍豪“12121”系統播報內容自動制作軟件”。
①“12121”系統電腦連上氣象局內網,安裝FTP服務器。貴州省發布的氣象災害預警信息都是通過中國氣象局下發的氣象災情直報系統,因此,只要在該軟件設置FTP發送設置選項中增加發送到“12121”FTP服務器的配置,氣象臺發布氣象災害預警時,即可多發送一份到“12121”系統電腦上。
②程序通過實時監控預警信息文件夾,當收到新的預警文件時,會自動讀取預警內容并正確判斷,生成預警文本內容。通過調用TTS文本語音轉換功能生成PCM語音文件。
③預警信箱所播放的內容存放在“12121”軟件目錄下一個指定的文件夾中,當有新預警語音文件生成時,自動替換掉原來的文件,成為最新內容。
氣象監測資料(包括各縣(市)城區氣象站資料和各鄉鎮多要素氣象資料)存放統一的數據庫中,通過開發程序可以實時調取。本研究中所需要天氣實況信息為黔東南州全州16個縣(市)每個時次的正點氣溫、當日最高氣溫和最低氣溫、縣城降水量以及全縣(市)最大降水量和出現的地名(鄉鎮)。如凱里北京時3月2日14時天氣實況的內容為:2日14時正點氣溫12.5°,1日20時至當前最高氣溫15.6°,最低氣溫5.6°,1 日 20 時至當前市區降水量為2.3 mm,全市最大降水量為 4.2 mm,出現在龍場。每個縣(市)的天氣實況內容設置為每個小時正點后10 min自動獲取。同樣,得到實況文本內容后,轉換成相應的語音文件并替換更新。
天氣預報內容和其它信箱的內容也可以用同樣的方法自動更新。天氣預報每天07時、09時、16時更新,可以采用無人值守的方式自動讀取氣象臺制作的天氣預報內容自動更新即可,也可進行人工干涉,當出現失誤時及時更正。
其它內容如氣象科普,也可用文本轉換成語音文件的方式來更新。
伍豪“12121”氣象語音自動答詢系統播報內容自動制作軟件在后臺運行,實時更新災害預警和天氣實況內容,也可人工制作,如圖2所示,程序界面簡潔,主要功能是實現播報內容自動和手動更新。當人工制作播報內容時,修改所要播報的預警、實況和預報內容后,點擊“全部處理”,后臺處理程序便會自動更新內容到“12121”系統指定的信箱中,方便用戶撥打收聽。

圖2 軟件界面
①利用Visual Basic程序設計語言開發了伍豪“12121”氣象語音自動答詢系統播報內容自動更新軟件,軟件采用TTS文本轉換語音技術,實現了氣象災害預警信息、天氣實況及預報內容的自動更新的功能。程序運行穩定,解決了工作中的實際困難,使廣大公眾通過固定電話或移動手機隨時撥打“12121”,便可了解到最新的氣象信息。
②全國大多數氣象語音自動答詢系統的原理都大同小異,包括雙順達品牌的“12121”系統,因此,利用TTS文本轉換語音技術和以上方法,完全可以實現雙順達“12121”氣象語音自動答詢系統播報內容的自動更新。唯一有差別的地方在于雙順達品牌系統的語音格式是VOC格式,即在合成語音文件時,轉成VOC格式即可。
③TTS文本轉換語音技術在其它行業的自動答詢系統中,也可做一定的參考。
[1]http://baike.baidu.com/subview/66087/5117538.htm?fr=aladdin.
[2]馬月枝.氣象報文編發監控報警系統設計[J].氣象與環境科學,2009,32(1):91-93.