999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

車(chē)載語(yǔ)音導(dǎo)航系統(tǒng)的語(yǔ)音語(yǔ)料庫(kù)構(gòu)建探究

2013-09-14 08:07:02王大鵬
電子測(cè)試 2013年6期
關(guān)鍵詞:文本

王大鵬

(渤海大學(xué)大學(xué)外語(yǔ)教研部, 遼寧錦州 121013)

0 引言

計(jì)算機(jī)語(yǔ)料庫(kù)建設(shè)是自然語(yǔ)言處理領(lǐng)域的核心基礎(chǔ)工作,在機(jī)器翻譯、人機(jī)對(duì)話、信息提取、語(yǔ)言學(xué)研究、自動(dòng)語(yǔ)音識(shí)別和人工智能等諸多方面起著重要作用,是一門(mén)將語(yǔ)言和計(jì)算機(jī)融合在一起的交叉學(xué)科。隨著計(jì)算機(jī)技術(shù)的日新月異,語(yǔ)料庫(kù)的建設(shè)模式也從純文本的單一模式逐步過(guò)渡到可以融合圖片、語(yǔ)音和圖像的多模態(tài)模式。在GPS全球定位技術(shù)商用和民用的今天,基于GPS的車(chē)載語(yǔ)音自動(dòng)導(dǎo)航系統(tǒng)的研究對(duì)于汽車(chē)未來(lái)的發(fā)展有著不可估量的影響,未來(lái)的汽車(chē)可以通過(guò)人類語(yǔ)音指令自動(dòng)駕駛、電腦自動(dòng)選擇最佳行進(jìn)路線。因此,語(yǔ)音導(dǎo)航系統(tǒng)的語(yǔ)音語(yǔ)料庫(kù)建設(shè)是一項(xiàng)重要的基礎(chǔ)任務(wù),它涉及到多模態(tài)語(yǔ)料庫(kù)的設(shè)計(jì)和構(gòu)建。

1 語(yǔ)音語(yǔ)料庫(kù)與語(yǔ)音導(dǎo)航系統(tǒng)

語(yǔ)料庫(kù)是按照一定的語(yǔ)言學(xué)原則,運(yùn)用隨機(jī)抽樣方法,收集自然出現(xiàn)的語(yǔ)言運(yùn)用文本或話語(yǔ)片段來(lái)建立。從其本質(zhì)上講,語(yǔ)料庫(kù)實(shí)際上是通過(guò)對(duì)自然語(yǔ)言運(yùn)用的隨機(jī)抽樣,以一定大小的語(yǔ)言樣本來(lái)代表某一研究中所確定的語(yǔ)言運(yùn)用總體(馮志偉,2008)。現(xiàn)階段的語(yǔ)料庫(kù)指的都是基于計(jì)算機(jī)處理或研究語(yǔ)言的方式。完整意義上、初具規(guī)模的計(jì)算機(jī)語(yǔ)料庫(kù)最早可以追溯到20世紀(jì)60、70年代,典型的實(shí)例是Brown、LOB、SSE、LLC等;80年代至今語(yǔ)料庫(kù)的發(fā)展有海量化的趨勢(shì),如:Cobuild、Bank of English、BNC、COCA等。但不管語(yǔ)料庫(kù)規(guī)模如何擴(kuò)大,從媒介上看本質(zhì)上都是純文本的語(yǔ)料庫(kù);只是語(yǔ)料庫(kù)的文本存儲(chǔ)格式從TXT轉(zhuǎn)變?yōu)閄ML。但隨著時(shí)代和科技的發(fā)展,單一純文本的語(yǔ)料庫(kù)已經(jīng)不適用于研究和學(xué)習(xí)的需要;超越純文本的語(yǔ)音和視頻語(yǔ)料庫(kù)是時(shí)代發(fā)展的必然產(chǎn)物。多模態(tài)語(yǔ)料庫(kù)可以包括文字、聲音和圖像等多種媒介,全方位表現(xiàn)語(yǔ)言的多種特性。語(yǔ)音語(yǔ)料庫(kù)中的主體媒介是音頻,因此對(duì)聲音的搜集、處理、分類、標(biāo)注和存儲(chǔ)是語(yǔ)音語(yǔ)料庫(kù)需要研究和解決的問(wèn)題。語(yǔ)音語(yǔ)料庫(kù)可以為語(yǔ)音導(dǎo)航系統(tǒng)提供實(shí)驗(yàn)語(yǔ)料,是語(yǔ)音識(shí)別與合成技術(shù)的基礎(chǔ)性研究。隨著語(yǔ)料庫(kù)語(yǔ)音學(xué)與韻律學(xué)的發(fā)展和波形拼接技術(shù)的成熟,語(yǔ)音語(yǔ)料庫(kù)的發(fā)展也進(jìn)入了相對(duì)成熟期。語(yǔ)音導(dǎo)航系統(tǒng)的開(kāi)發(fā)和研制是科技發(fā)展的必然產(chǎn)物,具有人工智能的特色;其與GPS定位技術(shù)的結(jié)合,使其成為車(chē)載定位系統(tǒng)的最佳載體。

2 語(yǔ)音語(yǔ)料庫(kù)的設(shè)計(jì)原則

基于GPS的車(chē)載導(dǎo)航儀是汽車(chē)上的必備裝置,它可幫助司機(jī)辨別方向,選擇最佳行進(jìn)路線;但目前的車(chē)載導(dǎo)航儀大多是通過(guò)點(diǎn)擊電子地圖或手寫(xiě)進(jìn)行操作,這樣無(wú)形中增加了操作的繁瑣性,為行車(chē)帶來(lái)安全隱患。因此,可以識(shí)別語(yǔ)音指令的車(chē)載語(yǔ)音自動(dòng)導(dǎo)航系統(tǒng)的研發(fā)就成為時(shí)代發(fā)展的必然。語(yǔ)料庫(kù)的設(shè)計(jì)原則是語(yǔ)料要具有代表性,加之音頻資源較為占用空間,因此車(chē)載語(yǔ)音語(yǔ)料庫(kù)的語(yǔ)音錄入源均為地理方位名詞和行車(chē)指令等專門(mén)用途詞匯,盡可能減少無(wú)關(guān)信息的錄入。用盡可能少的語(yǔ)音語(yǔ)料覆蓋即盡可能多的語(yǔ)音現(xiàn)象,充分利用語(yǔ)音識(shí)別和語(yǔ)音合成技術(shù)。語(yǔ)音語(yǔ)料庫(kù)采用SQL Server 2005數(shù)據(jù)庫(kù)、C/S模式,基本平臺(tái)為.NET。為了兼顧語(yǔ)音指令實(shí)時(shí)聯(lián)網(wǎng)查詢數(shù)據(jù),語(yǔ)音的錄入和輸出均采用適用DSP芯片的語(yǔ)音壓縮技術(shù)。語(yǔ)音的描述采用三音子模型為基本單位描述連續(xù)語(yǔ)音,這樣可更好的兼容其它語(yǔ)音源。具體的設(shè)計(jì)環(huán)節(jié)包括原始語(yǔ)料的搜集、錄音模塊和數(shù)據(jù)庫(kù)維護(hù)的設(shè)計(jì)、語(yǔ)音語(yǔ)料的標(biāo)注和后期語(yǔ)音壓縮。本套語(yǔ)音語(yǔ)料庫(kù)采用開(kāi)放動(dòng)態(tài)語(yǔ)料庫(kù)的建設(shè)理念,實(shí)時(shí)交互、更新是本套語(yǔ)音語(yǔ)料庫(kù)的核心思路。本套語(yǔ)料庫(kù)系統(tǒng)不僅可以讀取語(yǔ)音語(yǔ)料,還可根據(jù)漢字文本自動(dòng)機(jī)讀語(yǔ)音以及完成用戶語(yǔ)音的更新錄入。因此,本套語(yǔ)料庫(kù)同時(shí)也開(kāi)發(fā)語(yǔ)料庫(kù)前臺(tái)的語(yǔ)音輸入和輸出技術(shù)。

3 語(yǔ)音語(yǔ)料庫(kù)的具體構(gòu)建步驟

語(yǔ)音語(yǔ)料庫(kù)是語(yǔ)音數(shù)據(jù)及其標(biāo)注的集合。漢語(yǔ)語(yǔ)音語(yǔ)料庫(kù)近年來(lái)是我國(guó)語(yǔ)料庫(kù)研究的熱點(diǎn),大規(guī)模語(yǔ)音語(yǔ)料庫(kù)的一個(gè)直接應(yīng)用是文語(yǔ)轉(zhuǎn)換系統(tǒng)或TTS(Text to Speech), 它是利用計(jì)算機(jī)等平臺(tái)將文本信息轉(zhuǎn)變?yōu)橐纛l數(shù)據(jù),以語(yǔ)音的方式播放出來(lái)的技術(shù)(章森,2010)。語(yǔ)料搜集范圍如谷歌地圖,凱立德導(dǎo)航地圖和用戶汽車(chē)指令等。首先采用中科院漢語(yǔ)分詞軟件ICTCLAS對(duì)文本進(jìn)行分詞處理;然后采用TTSUU (Text to Speech Universal Utility)將文本內(nèi)容轉(zhuǎn)換為語(yǔ)音文件,所有語(yǔ)音文件都要進(jìn)行人工校驗(yàn)并進(jìn)行壓縮存儲(chǔ)。語(yǔ)音語(yǔ)料庫(kù)要想進(jìn)行檢索和批量分類等操作,需要對(duì)語(yǔ)料庫(kù)進(jìn)行基本的語(yǔ)音標(biāo)注。

圖1:C-ToBI韻律標(biāo)注層級(jí)

圖2:本套語(yǔ)音語(yǔ)料庫(kù)的總體設(shè)計(jì)框架

語(yǔ)音語(yǔ)料庫(kù)的語(yǔ)音標(biāo)注是最重要的核心環(huán)節(jié),漢語(yǔ)語(yǔ)音語(yǔ)料庫(kù)的標(biāo)注可以采用中國(guó)社會(huì)科學(xué)院研究所的C-ToBI(Tones and Break Indices)韻律標(biāo)注軟件進(jìn)行標(biāo)注。它兼容各種語(yǔ)言理論機(jī)制,機(jī)器可讀性好,有詳細(xì)的標(biāo)注向?qū)АKm用于朗讀語(yǔ)音語(yǔ)料庫(kù),較之荷蘭阿姆斯特朗大學(xué)開(kāi)發(fā)的Praat語(yǔ)音標(biāo)注軟件更適合用來(lái)標(biāo)注普通話。它對(duì)普通話的韻律標(biāo)注共分為8層:音段標(biāo)注層、聲韻層、間斷指數(shù)層、重音指數(shù)層、語(yǔ)句功能層、雜類層、話論層和口音層(鄒法欣,2012)(圖1)。其中口音層的設(shè)計(jì)使得這一程序更適合用于讀取和標(biāo)注普通人的話語(yǔ)信息。標(biāo)注完畢后,標(biāo)注文件和語(yǔ)音文件需要進(jìn)行對(duì)齊處理和人工校驗(yàn)來(lái)完成最終環(huán)節(jié)。

語(yǔ)音數(shù)據(jù)的管理采用SQL Server 2005數(shù)據(jù)庫(kù)、C/S模式,基本平臺(tái)為.NET。為了實(shí)現(xiàn)語(yǔ)音數(shù)據(jù)的便捷瀏覽和用語(yǔ)音訪問(wèn)互聯(lián)網(wǎng),如用手機(jī)訪問(wèn)語(yǔ)音導(dǎo)航網(wǎng)站,可將此語(yǔ)音語(yǔ)料庫(kù)在線化,所有數(shù)據(jù)上傳云端。語(yǔ)音網(wǎng)站設(shè)計(jì)采用JSP和VoiceXML,基本框架為B/S。VoiceXML是建立在XML規(guī)范基礎(chǔ)之上,用于語(yǔ)音瀏覽的標(biāo)記語(yǔ)言,是語(yǔ)音瀏覽技術(shù)和語(yǔ)音互聯(lián)網(wǎng)的核心。VoiceXML與其數(shù)據(jù)集成模型,是本課題設(shè)計(jì)的又一個(gè)核心環(huán)節(jié)。它由語(yǔ)音識(shí)別與合成、語(yǔ)音瀏覽程序和VoiceXML網(wǎng)關(guān)等若干部分組成。為了便于管理,我們?cè)O(shè)計(jì)了結(jié)合語(yǔ)音的圖形用戶界面(GUI/S),使語(yǔ)音語(yǔ)料庫(kù)的瀏覽和管理更加清晰明了。語(yǔ)音語(yǔ)料庫(kù)的建設(shè)為語(yǔ)音自動(dòng)導(dǎo)航系統(tǒng)的開(kāi)發(fā)提供了必要的參照和技術(shù)支持,同時(shí)將語(yǔ)音語(yǔ)料庫(kù)在線化共享可以減少同行重復(fù)建設(shè)。云端語(yǔ)音語(yǔ)料庫(kù)網(wǎng)站的設(shè)立,可以降低移動(dòng)設(shè)備訪問(wèn)的硬件門(mén)檻。本研究中語(yǔ)音語(yǔ)料庫(kù)的總體設(shè)計(jì)思路、必備條件、采用的計(jì)算機(jī)技術(shù)、項(xiàng)目目標(biāo)和難點(diǎn)思維導(dǎo)圖如下(圖2)。

4 結(jié)語(yǔ)

車(chē)載語(yǔ)音自動(dòng)導(dǎo)航系統(tǒng)的開(kāi)發(fā)涉及GPS定位技術(shù)、電子地圖語(yǔ)音讀取、語(yǔ)音識(shí)別、語(yǔ)音指令處理和語(yǔ)音語(yǔ)料庫(kù)建設(shè)等多項(xiàng)自然語(yǔ)言處理領(lǐng)域核心技術(shù)。語(yǔ)音語(yǔ)料庫(kù)的建立可以為車(chē)載語(yǔ)音自動(dòng)導(dǎo)航系統(tǒng)提供語(yǔ)音支持,可避免同類研究重復(fù)性建設(shè);同時(shí)也為多模態(tài)語(yǔ)料庫(kù)的建設(shè)積累了重要經(jīng)驗(yàn)。但研究中也存在技術(shù)難點(diǎn)和尚需改進(jìn)的地方,如:如何提高語(yǔ)音語(yǔ)料庫(kù)的標(biāo)注規(guī)范和精度,如何將語(yǔ)音語(yǔ)料庫(kù)和其他更多平臺(tái)對(duì)接,如何改善語(yǔ)音讀取的自然度和合成問(wèn)題。總體而言,多模態(tài)語(yǔ)料庫(kù)是時(shí)代發(fā)展的必然產(chǎn)物,其應(yīng)用于語(yǔ)言學(xué)習(xí)和教學(xué)、服務(wù)于人類民生和人工智能領(lǐng)域是大勢(shì)所趨。

[1] 馮志偉. 序言 語(yǔ)料庫(kù)語(yǔ)言學(xué)的進(jìn)展 [Z]. 2009:d9.

[2] 章森,劉磊,刁麓弘. 大規(guī)模語(yǔ)音語(yǔ)料庫(kù)及其在TTS 中應(yīng)用的幾個(gè)問(wèn)題[J]. 計(jì)算機(jī)學(xué)報(bào),2010(4):687-696.

[3] 鄒法欣. 語(yǔ)音語(yǔ)料庫(kù)的設(shè)計(jì)與實(shí)現(xiàn)[D]. 桂林:廣西師范大學(xué),2012

猜你喜歡
文本
文本聯(lián)讀學(xué)概括 細(xì)致觀察促寫(xiě)作
重點(diǎn):論述類文本閱讀
重點(diǎn):實(shí)用類文本閱讀
初中群文閱讀的文本選擇及組織
甘肅教育(2020年8期)2020-06-11 06:10:02
作為“文本鏈”的元電影
在808DA上文本顯示的改善
“文化傳承與理解”離不開(kāi)對(duì)具體文本的解讀與把握
基于doc2vec和TF-IDF的相似文本識(shí)別
電子制作(2018年18期)2018-11-14 01:48:06
文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學(xué)隱喻
從背景出發(fā)還是從文本出發(fā)
主站蜘蛛池模板: 久久伊人操| 国产靠逼视频| 91成人在线免费视频| 欧美 国产 人人视频| 国产91久久久久久| 五月天丁香婷婷综合久久| 91精品国产麻豆国产自产在线| 午夜三级在线| 欧美日韩成人在线观看| 亚洲日韩精品欧美中文字幕| 人人澡人人爽欧美一区| 欧美激情综合| 一本一道波多野结衣一区二区 | 日韩精品免费一线在线观看| 国产精品自拍合集| 激情在线网| 欧美午夜小视频| 亚洲色图欧美一区| 亚洲日韩精品无码专区| 天天色综网| 成人在线视频一区| 草草影院国产第一页| 欧美97欧美综合色伦图| 欧美日在线观看| 无码一区二区波多野结衣播放搜索| 91精品久久久无码中文字幕vr| 欧美精品黑人粗大| 国产免费观看av大片的网站| 四虎精品黑人视频| 刘亦菲一区二区在线观看| 国产在线拍偷自揄观看视频网站| 久久黄色毛片| 国产欧美专区在线观看| 91蜜芽尤物福利在线观看| 激情乱人伦| 五月天综合婷婷| 国产丝袜丝视频在线观看| 日韩高清无码免费| 亚洲中文字幕在线观看| 1769国产精品免费视频| 久久一色本道亚洲| 天堂久久久久久中文字幕| 国产人成在线观看| 高清免费毛片| 九九九久久国产精品| 国产一级做美女做受视频| 国产欧美视频在线观看| 国产真实乱子伦视频播放| 嫩草国产在线| 青草91视频免费观看| 色综合天天操| 精品小视频在线观看| 玩两个丰满老熟女久久网| 综合网久久| 中文字幕1区2区| 丁香婷婷久久| 日韩午夜福利在线观看| 大香伊人久久| 成人午夜免费观看| 国产精品无码AV片在线观看播放| 国产成人精品视频一区二区电影 | 91亚洲精品第一| 免费在线a视频| 亚洲国产AV无码综合原创| 国产精品无码久久久久久| 在线一级毛片| 在线精品视频成人网| 久久永久精品免费视频| 天天综合天天综合| 精品国产女同疯狂摩擦2| 亚洲人成人伊人成综合网无码| 91精品国产自产在线老师啪l| 午夜精品久久久久久久99热下载| 欧美午夜久久| 一区二区影院| 欧美人在线一区二区三区| 丁香综合在线| 美美女高清毛片视频免费观看| 精品久久久久久久久久久| 亚洲天堂网站在线| 免费可以看的无遮挡av无码| 毛片网站免费在线观看|