999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

上下文無關(guān)文法在孤立詞識別中的應(yīng)用

2011-10-25 08:02:24李玉萍
關(guān)鍵詞:分析

李玉萍

(商丘師范學(xué)院,河南 商丘476000)

上下文無關(guān)文法在孤立詞識別中的應(yīng)用

李玉萍

(商丘師范學(xué)院,河南 商丘476000)

在孤立詞識別的過程中引入了非遞歸上下文無關(guān)文法。針對語音識別中的多個(gè)變量問題需要進(jìn)行多次訓(xùn)練,根據(jù)樣本中表達(dá)特征的字符串集在訓(xùn)練模式中為每個(gè)孤立詞構(gòu)造一個(gè)上下無關(guān)文法。在識別的過程中,對輸入的字符串進(jìn)行分析,符合該文法輸出該字符串,并說明該字符串符合該文法。

上下文無關(guān)文法;孤立詞;識別

語音識別是一門結(jié)合了計(jì)算機(jī)技術(shù)和計(jì)算機(jī)語言學(xué)等多種學(xué)科的交叉學(xué)科。孤立詞識別是語音識別的一種,語音識別模型如圖1所示。孤立詞識別系統(tǒng)對人的發(fā)聲間隔中的詞進(jìn)行單獨(dú)識別的一個(gè)系統(tǒng),同時(shí)語音識別也是一種模式識別的實(shí)例。孤立詞識別系統(tǒng)通常由特征抽取和識別器兩部分組成。特征抽取把語音信號轉(zhuǎn)換成字符串符號;識別器考察該字符串是否在詞匯表,如果在則輸出,不在輸出錯(cuò)誤信號。傳統(tǒng)的識別方法大都是建立在模式識別的基礎(chǔ)上,本文引入上下文無關(guān)文法對識別器進(jìn)行構(gòu)造,并對輸入串進(jìn)行識別。

一、相關(guān)定義

定義1:設(shè)G=(VN,VT,P,S)為一文法,其中VN為非終結(jié)符號,VT為終結(jié)符,P為文法的產(chǎn)生式集合,若P中的每個(gè)產(chǎn)生式α→β均滿足:α是一非終結(jié)符,β∈(VN UVT)*,則此文法稱為2型的或上下文無關(guān)文法。

定義2:任何非空,并且不含ε的上下文無關(guān)文法G,如果G中所有的產(chǎn)生式的形式為下列兩個(gè)形式之一:

(1)A-->BC

(2)A-->a

其中,A,B,C∈VN,a∈VT,

那么,我們稱這種形式的文法G為喬姆斯基范式文法或者喬姆斯基范式 (Chomsky Normal Form),簡記為:CNF。

二、上下文無關(guān)文法的應(yīng)用

上下文無關(guān)文法(CFG)是這樣的一種文法:它所定義的語法范疇(或語法單位)完全獨(dú)立于這種范疇可能出現(xiàn)的環(huán)境。其特點(diǎn)是在對非終結(jié)符進(jìn)行替換時(shí)不需要聯(lián)系上下文,并且可以替換成空串。上下文無關(guān)文法的識別問題,就是對給定的一個(gè)上下文無關(guān)文法G,和一個(gè)串α(α∈VT*),確定是否存在推導(dǎo):S=>*α的問題。在上下文無關(guān)文法中,喬姆斯基范式是經(jīng)常使用的特殊文法。并且所有的上下文無關(guān)文法都可以轉(zhuǎn)換成喬姆斯基范式。

在孤立詞識別系統(tǒng)中,假設(shè)特征抽取出的符號是有限數(shù)量的,每個(gè)孤立詞產(chǎn)生的字符串長度也是有限的。在設(shè)計(jì)識別器時(shí)可以分成兩部分工作,如圖2所示,首先構(gòu)造能夠生成樣本符號串的上下文無關(guān)文法,這個(gè)過程可以看成一個(gè)編碼過程;然后利用該文法模型對任意輸入的字符串進(jìn)行分析識別,看是否符合該文法,該過程可以看成一個(gè)解碼過程。

在文法構(gòu)造的過程中,詞匯中的每個(gè)單詞聲音由特征抽取轉(zhuǎn)換成符號串,該符號串由識別器自動(dòng)生成上下文無關(guān)文法,通常該文法在構(gòu)造的過程中采用喬姆斯基范式的形式,存儲到計(jì)算機(jī)中供以后使用。經(jīng)過多次訓(xùn)練,反復(fù)重寫,為樣本字符串集構(gòu)造相應(yīng)的上下文無關(guān)文法,每個(gè)模型可以描述相似的字符串。具體的構(gòu)造算法:首先為第一個(gè)字符串構(gòu)造文法G1,該文法目前只能生成該字符串,然后對其他的字符串進(jìn)行考察,如果能夠被識別,則考察其他字符串,不能識別則生成G2,依次對樣本中的所有字符串進(jìn)行考察,直到文法規(guī)則不再擴(kuò)大為止。構(gòu)造好的上下文無關(guān)文法模型對以后的輸入串進(jìn)行識別分析,從而判斷該輸入串是否符合該文法,符合則輸出,不符合則拒絕。

三、基于上下文無關(guān)文法的孤立詞識別算法

在識別過程中,被輸入的字符串采用上下文無關(guān)文法識別字符串的算法進(jìn)行識別,常用的分析方法有自上而下分析法、自下而上分析法、CYK算法等。由于語音信息具有噪音信息,轉(zhuǎn)換成的字符串符號針對該文法具有二義性,因此我們采用三層分析方式。第一層對輸入的字符串進(jìn)行分析,如果只能采用一個(gè)文法,則輸出該字符串,如果不能采用第二層分析,第二層采用近似匹配的原則對可以由兩個(gè)以上的文法所能識別的字符串進(jìn)行分析,采用最優(yōu)的文法。第三層對采用近似匹配策略仍有多個(gè)文法可以生成該字符串,采用隨機(jī)算法進(jìn)行分析,從而選取最合適的文法進(jìn)行輸入串識別,然后輸出。

上下文無關(guān)文法為孤立詞識別提供了一個(gè)非常好的分類和描述方法。用上下文無關(guān)文法規(guī)則來表達(dá)樣本字符串代替直接存儲樣本字符串,從而節(jié)省了大量的存儲空間,提高了訪問效率,對語音識別技術(shù)的發(fā)展提供一個(gè)很好的模型,上下文無關(guān)文法在孤立詞識別中的應(yīng)用具有重要的理論和實(shí)踐意義。

[1]吳哲輝,吳振寰.形式語言與自動(dòng)機(jī)[M].北京:北京機(jī)械工業(yè)出版社,2007:40-42.

[2]陳火旺,劉春林,譚慶平等.程序設(shè)計(jì)編譯原理[M].北京:國防工業(yè)出版社,2003:51-53.

H02

A

1673-0046(2011)05-0174-01

猜你喜歡
分析
禽大腸桿菌病的分析、診斷和防治
隱蔽失效適航要求符合性驗(yàn)證分析
電力系統(tǒng)不平衡分析
電子制作(2018年18期)2018-11-14 01:48:24
電力系統(tǒng)及其自動(dòng)化發(fā)展趨勢分析
經(jīng)濟(jì)危機(jī)下的均衡與非均衡分析
對計(jì)劃生育必要性以及其貫徹實(shí)施的分析
GB/T 7714-2015 與GB/T 7714-2005對比分析
出版與印刷(2016年3期)2016-02-02 01:20:11
中西醫(yī)結(jié)合治療抑郁癥100例分析
偽造有價(jià)證券罪立法比較分析
在線教育與MOOC的比較分析
主站蜘蛛池模板: 日韩国产黄色网站| 日日噜噜夜夜狠狠视频| 亚洲第一成网站| 国产美女主播一级成人毛片| 欧美精品高清| 国产成人乱无码视频| 欧美黄网站免费观看| 黄色网页在线播放| 毛片最新网址| 无码中文字幕加勒比高清| 色婷婷电影网| 农村乱人伦一区二区| 国产精品第| 国内视频精品| 亚洲三级a| 午夜三级在线| 亚洲bt欧美bt精品| 福利在线一区| 久久久久青草大香线综合精品| 欧美成人第一页| 国产精品19p| 免费中文字幕一级毛片| 亚洲视频在线青青| 国产噜噜噜视频在线观看| 欧美国产精品不卡在线观看| 老司机精品99在线播放| 国产精品一线天| 国产无码高清视频不卡| 久久久久久高潮白浆| 她的性爱视频| 久久久精品久久久久三级| 久久黄色免费电影| 天堂亚洲网| 97青青青国产在线播放| 亚洲IV视频免费在线光看| 高清不卡一区二区三区香蕉| 欧美国产日韩在线| 高清久久精品亚洲日韩Av| 91精品国产91久久久久久三级| 亚洲欧洲天堂色AV| 高h视频在线| 国产三级韩国三级理| 人妻精品久久久无码区色视| 狠狠躁天天躁夜夜躁婷婷| 欧日韩在线不卡视频| 欧美日韩精品一区二区在线线| 色噜噜狠狠狠综合曰曰曰| 亚洲成a人片| 欧美亚洲第一页| 亚洲成网站| 亚洲色图另类| 在线无码私拍| 91亚瑟视频| 精品国产Ⅴ无码大片在线观看81| 国产亚洲成AⅤ人片在线观看| 99这里精品| 三级欧美在线| 亚洲欧美另类专区| 伊人久久婷婷五月综合97色| 毛片一级在线| 国产亚洲精久久久久久久91| 亚洲成人在线网| 91精品啪在线观看国产91| 精品国产污污免费网站| 国产91在线|日本| 激情亚洲天堂| 成人伊人色一区二区三区| 色亚洲成人| 黄色网在线| 亚洲色偷偷偷鲁综合| 亚洲第一视频网站| 玖玖精品视频在线观看| 国产熟女一级毛片| 免费中文字幕在在线不卡 | 国产一级妓女av网站| 欧美精品成人一区二区在线观看| 无遮挡国产高潮视频免费观看| 99ri精品视频在线观看播放| 欧美自慰一级看片免费| 亚洲 成人国产| 99热亚洲精品6码| 99精品影院|