語音導航在虛擬城市漫游系統中的應用

2012-12-31 00:00:00鄭剛徐瑾王逢娟

科技創新導報 2012年10期

摘要:數字漫游技術已經廣泛應用城市規劃中，但目前的數字漫游方式存在操作單一、語音交互性不足的問題。本文依據虛擬現實及語音控制技術理論，結合城市規劃的實際需求，對語音導航技術在數字漫游技術中的應用進行了設計與研究。

關鍵詞:語音虛擬現實數字漫游城市規劃

中圖分類號:TU984文獻標識碼:A文章編號:1674-098X(2012)04(a)-0251-01

數字漫游技術也就是我們常說的虛擬現實技術。虛擬現實技術是20世紀90年代發展起來的一個新的研究領域，它是集計算機圖形學、人工智能、計算機網絡、信息處理、機械設計與制造等技術綜合發展的產物，在社會各行各業中都具有廣泛的應用空間。虛擬現實系統設計的目的在于操作的便捷性，且適合不同專業、不同層次人員的參與，再加上直觀逼真的反饋信息，在很大程度上滿足盡可能的滿足了使用者的心理訴求。目前，在城市規劃中就大量的使用了虛擬現實仿真技術。

1 引言

語音導航是指以語音識別、語音編解碼為代表的智能語音技術。語音識別是以語音為研究對象，它是語音信號處理的一個重要研究方向，是模式識別的一個分支，設計到語言學、生理學、心理學、計算機科學以及信號處理等學科。語音識別的目的是為了使機器能夠準確地識別出人的語音及其內容，以便控制其他設備來滿足人類的各種需要，它是發展人機有聲通信和新一代智能計算機的重要組成部分。語音編解碼是指一個能夠對數字音頻進行壓縮或者解壓縮的程序或者設備。通常這種壓縮屬于有損數據壓縮。常見算法一般分為三類:波形編碼、參數編碼和混合編碼。

目前，語音導航技術主要應用于汽車、輪船及手機等領域，在城市虛擬漫游系統中的應用還沒有相關研究。傳統的虛擬現實系統在虛擬環境中進行漫游時都是以手動控制鼠標的方式進行的，這就使得整個漫游的過程有著很強的依賴性。同時，在一個虛擬的城市中進行漫游時，我們想要到達一個具體的目的地時必須按照一定的路線才能到達，這就給我們帶來了繁重的操作。當我們面對龐大的虛擬城市時，就更加需要快速的到達目的地。因此，為了改善目前虛擬現實漫游中的不足，我們依據虛擬現實及語音導航技術理論，結合城市規劃的實際需求，對語音導航技術在數字漫游技術中的應用進行了研究。

2 關鍵技術

2.1 語音識別算法

語音導航是在語音識別技術發展的基礎上產生的。因此，對于語音導航技術來說，語音識別的準確性是至關重要的，然而語音識別的準確性主要取決于所使用的語音識別算法。目前三種主流的語音識別算法分別是動態時間規整(DTW)、隱馬爾科夫模型(HMM)和人工神經網絡(ANN)。在對幾種常見的語音識別算法進行對比分析后發現，DTW算法簡單有效，容易理解，適用于特定人、孤立詞的語音識別;而HMM模型算法相對復雜，沒有顯式的計算公式，且需要大量的訓練來獲得參考模板，但它很好地描述了語音信號的產生過程，在大詞匯量、非特定人、連續詞的語音識別中得到了廣泛的運用;單純的ANN在識別率方面并沒有優勢，它跟其他的識別算法結合才能獲得更好的效果，也同樣存在時間規整的問題。因為在城市虛擬漫游系統中語音所輸入的待識別語音詞匯多是固定的詞組，如建設銀行、幼兒園等。而且從軟硬件實現的角度來看，采用DTW算法來實現比較實際可行。在本次研究中選擇了一種比較成熟的動態時間規整(DTW)算法作為語音識別算法。實驗結果表明，在特定人、孤立詞的語音識別上，該算法具有識別率更高、耗時更少的優點，識別率高于96.3%，達到了既定的語音識別目的，可以很好的服務于該系統。

2.2 虛擬現實系統設計

虛擬現實系統的實現關鍵在于虛擬現實平臺技術的應用。目前很多虛擬現實的平臺在技術方面都相對比較成熟，但是面對城市規劃領域的應用時，我們需要解決三維圖形的實時生成、觀者視角的寬視野立體顯示、基于GIS的虛擬環境的實現、虛擬現實系統的交互性等問題。為了解決以上這些具體問題，我們應用北京中視典公司的虛擬現實平臺作為對虛擬現實系統的開發工具。

3 語音導航的城市虛擬現實系統的實現過程

3.1 系統的總體設計思路

城市虛擬現實系統啟動以后手動啟動語音識別控制，通過語音識別控制可以監測到整個操作系統中的全部語音輸入設備，一旦有語音從語音設備輸入進來，語音識別系統馬上開始語音識別并形成指令，并對虛擬現實系統的漫游方式形成控制，生成前進、后退、轉彎、停止等操作。

3.2 系統的實現的實現過程

該系統的實現主要包括三大部分:一部分是虛擬場景的構造，主要包括三維實體模型構建與整合優化，得到場景數據模型，場景數據的構造主要通過3DMAX2011軟件軟件來實現，第二部分是語音輸入及語音識別，只要包括對使用者聲音的采集、識別及形成語音控制指令，第三部分是虛擬漫游的設計，主要實現場景的三維顯示、相關多媒體信息的介紹、漫游時的語音及手動交互控制。

3 總結

在基于數字漫游的城市規劃系統中使用語音交互控制技術，可以實現語音導航控制功能，為廣大人群乃至特殊人群服務，如:盲人、語言障礙人士等;語音導航功能的實現還可以減輕系統操作的工作量，使得人們在使用的過程中可以將全部精力放在內容上，而不是具體的操作上;這種基于語音導航、語音反饋、語音情境真實再現的虛擬現實系統進一步加強了虛擬環境的真實性、沉浸感。同時，增強了使用者對城市中某些特定環境的具體了解。

參考文獻

[1]鄭皓，藍運超，范凌云.淺析虛擬現實技術及其在城市規劃中的應用[J].武漢大學學報，2001(6):110～113.

[2]李宏梅，伍小芹.有關語音識別技術的研究.現代電子技術，2010(8):138～140，144.

[3]馬利亞．基于虛擬現實的漫游系統關鍵技術的研究．哈爾濱工程大學碩士學位論文，2010.3.

[4]陳宏偉，潘俊.虛擬現實技術在城市規劃設計中的應用[J].山西建筑，2007(31):367～368.

[5]李蘇旻.虛擬現實技術在建筑與城市規劃中的應用研究.長沙理工大學碩士學位論文，2008.5.

[6]黃文龍.語音識別關鍵技術研究及系統實現.重慶大學碩士學位論文，2010.5.

[7]李秀珍.語音識別算法及應用技術研究.重慶大學碩士學位論文文，2010.4.

科技創新導報2012年10期

科技創新導報的其它文章: 黨政干部網絡輿論引導路徑研究; 電視編輯思維的概述; 對學生運動損傷的成因和預防方法的初步分析; 館藏宣傳方法探討; 英漢翻譯中處理英語移就修辭格的技巧分析; 中國傳統地方民俗與現代婚慶產品設計