999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

自然音節(jié)狀態(tài)下聲母區(qū)別特征檢測

2016-01-27 03:06:32徐益華劉亞麗孟子厚

徐益華,劉亞麗,孟子厚

(中國傳媒大學(xué) 傳播聲學(xué)研究所,北京 100024)

?

自然音節(jié)狀態(tài)下聲母區(qū)別特征檢測

徐益華,劉亞麗,孟子厚

(中國傳媒大學(xué) 傳播聲學(xué)研究所,北京 100024)

摘要:從基于言語知覺特性的聲母區(qū)別特征出發(fā),觀察MFCC和美爾能量取值在區(qū)別特征有無上的表現(xiàn)差異,修正了聲母區(qū)別特征的客觀參數(shù)特性,與修正前的結(jié)果相比更合理。定義含有區(qū)別特征參數(shù)特性的語音幀為有效幀,在自然音節(jié)中通過能量確定出聲母初判范圍位置的基礎(chǔ)上,利用該范圍內(nèi)有效幀的含量Para作為檢測探針,實(shí)現(xiàn)自然音節(jié)狀態(tài)下聲母區(qū)別特征檢測。正檢率在80%左右。

關(guān)鍵詞:聲母區(qū)別特征;自然音節(jié);計(jì)算機(jī)輔助評測

1引言

目前漢語普通話的評測主要以人工評測和機(jī)器評測相結(jié)合的方法進(jìn)行,人工方法測試成本較高,而且測試信度得不到保證。現(xiàn)有的機(jī)器評測從統(tǒng)計(jì)模型角度設(shè)計(jì)計(jì)算機(jī)輔助的評測策略,雖然克服了人工評測的主觀性的缺點(diǎn),但該方法較難鎖定發(fā)音缺陷,對數(shù)據(jù)過分依賴[1][2]。語音錯誤或缺陷往往發(fā)生在最小對立體之間,這與區(qū)別特征的定義很相似,區(qū)別特征是構(gòu)成語音的基本元素,是區(qū)分音位的最小差別[3-5]。從區(qū)別特征角度設(shè)計(jì)計(jì)算機(jī)輔助評測策略,有望從言語本質(zhì)角度為鎖定發(fā)音缺陷提供了新的思路。張家騄由知覺混淆結(jié)果,初步構(gòu)建了普通話聲韻調(diào)區(qū)別特征體系[5][6]。論文[7]在孤立聲母的條件下根據(jù)聲母的語音特征,結(jié)合二元對立的特點(diǎn),構(gòu)建了由13個區(qū)別特征參數(shù)構(gòu)成的聲母參數(shù)體系,如圖1,該體系可以用于聲母檢測。論文[8]分析了不同聲學(xué)傳遞條件下聲母的清晰度特點(diǎn)和知覺混淆規(guī)律。建立由13個聲母區(qū)別特征組成的普通話聲母區(qū)別特征體系,如圖2。文中對各區(qū)別特征進(jìn)行初步的參數(shù)化,不過都是從聲母參數(shù)體系中直接選取的,由于聲母參數(shù)體系與基于言語知覺特性的聲母區(qū)別特征體系的聚類邏輯是不一樣的,如此給區(qū)別特征匹配客觀參數(shù)是不太合理的。表1給出了初步參數(shù)化后的檢測結(jié)果,可以發(fā)現(xiàn)并不理想,而且聲母的區(qū)別特征的確定和客觀參數(shù)的選取都是在人工切分后的孤立聲母情形下進(jìn)行的,如何在自然音節(jié)狀態(tài)下檢測到聲母區(qū)別特征也是非常重要的問題。

本文從基于言語知覺特性的聲母區(qū)別特征體系出發(fā),在孤立聲母情形下,觀察區(qū)別特征的有無在聲學(xué)線索上的表現(xiàn)差異,確定各區(qū)別特征對應(yīng)的客觀參數(shù)特性。與此同時,在自然音節(jié)狀態(tài)下,設(shè)定檢測探針,觀察檢測探針在區(qū)別特征的有無上的表現(xiàn)差異,確定在自然音節(jié)狀態(tài)下聲母區(qū)別特征的檢測探針條件。最后對檢測探針有效性進(jìn)行分析。

表1 聲母區(qū)別特征初步參數(shù)化失效性結(jié)果

圖1 用于聲母檢測的聲母參數(shù)體系 

圖2 基于言語知覺特性的聲母區(qū)別特征體系 

2聲母區(qū)別特征參數(shù)的修正

本文中使用的語料庫包括212位女生和126位男生,他們的年齡范圍是18-22歲。文中使用的孤立聲母語料是從發(fā)音較為清晰的單音節(jié)中,通過人工切分的方式得到,共計(jì)21類聲母,零聲母暫不考慮。其中40%的語料用于尋找與特征對應(yīng)的參數(shù),剩余60%用于測試這些參數(shù)的有效性。

在對區(qū)別特征進(jìn)行檢測之前,得先對其進(jìn)行合理的參數(shù)化,聲母的持續(xù)時間較短,分幀后各幀的差異不大,故使用各幀的聲學(xué)參數(shù)平均值并歸一化代表聲母的總體特征。主要使用MFCC和美爾濾波器能量這兩類聲學(xué)參數(shù),MFCC舍去一維對數(shù)能量,只保留其余12維,Mi代表第i維的MFCC值,美爾濾波器共有40維,包含有13 個線性濾波器和27 個對數(shù)濾波器。濾波器組由混迭的三角窗構(gòu)成,將每個濾波器頻帶內(nèi)的能量進(jìn)行疊加作為濾波器的輸出,f(i)代表第i維的美爾濾波器輸出值。

求出21類聲母的12維MFCC值和40維美爾濾波器輸出值。由圖2可知,基于言語知覺特性的聲母區(qū)別特征共有13個,對于某個區(qū)別特征,聲母含有該特征,標(biāo)志為“+”,不含有該特征標(biāo)志為“-”。觀察這兩類聲母在兩類聲學(xué)參數(shù)上的表現(xiàn)差異,確定區(qū)分這兩類聲母的客觀參數(shù),該參數(shù)就是該區(qū)別特征對應(yīng)的客觀參數(shù),圖3給出了“濁音的”區(qū)別特征“+”標(biāo)志聲母l、m、n、r和“-”標(biāo)志的其它聲母在美爾濾波器能量上的取值情況,可發(fā)現(xiàn)在第一維到第三維的取值上出現(xiàn)差異,故設(shè)定N1=(f(1)+f(2)+f(3))/3為該特征對應(yīng)的客觀參數(shù)。

圖3 區(qū)別特征“濁音的”涉及的聲母的美爾能量曲線 

在確定好聲母區(qū)別特征對應(yīng)的客觀參數(shù)的基礎(chǔ)上,進(jìn)一步確定各區(qū)別特征所對應(yīng)的參數(shù)特性。以“濁音的”區(qū)別特征為例,計(jì)算含有“濁音的”“+”類聲母和“-”類聲母的N1值,圖4給出了這兩類聲母的N1值的概率分布。

圖4 “濁音的”“+”類、“-”類聲母的N1值概率分布圖 

設(shè)判決閾限為兩曲線的交點(diǎn)0.52,“濁音的”區(qū)別特征參數(shù)特性為N1=(f(1)+f(2)+f(3))/3>0.52。故通過N1的取值實(shí)現(xiàn)有無“濁音的”區(qū)別特征判定。

同樣的方法確定出其余11個聲母區(qū)別特征所對應(yīng)的客觀參數(shù)以及參數(shù)特性,如表2所示。f(2:12)=f(2)+f(3)+...+f(12)。

對于“雙唇的”區(qū)別特征并沒有找到一個聲學(xué)參數(shù)同時區(qū)分m和n、b p和d t g k。進(jìn)一步思考,基于圖2的區(qū)別特征體系,需要檢測“雙唇的”特征的聲母主要是塞音(b p d t g k)和鼻音(m n)兩種,對于這兩種情形通過不同的聲學(xué)參數(shù)進(jìn)行“雙唇的”特征的檢測。

表2右側(cè)給出的正檢率是指理論上含有某區(qū)別特征的聲母樣本中,客觀參數(shù)滿足對應(yīng)參數(shù)特性的聲母樣本所占比例。誤判率是指理論上沒有該區(qū)別特征的聲母樣本中,客觀參數(shù)滿足對應(yīng)參數(shù)特性的聲母樣本所占比例。各區(qū)別特征的正檢率在80%左右,誤判率在20%左右。“舌尖前的”和“雙唇的”正檢率略低,說明匹配的聲學(xué)參數(shù)不太適合,有待進(jìn)一步修正。

對修正前后的參數(shù)化結(jié)果進(jìn)行對比,表3給出了修正前后總體正檢率和誤判率的差異,可以發(fā)現(xiàn),修正后總體的特征正檢率有了大幅提升,總體誤判率也有明顯地下降,故修正后的區(qū)別特征參數(shù)化結(jié)果更加合理。

3音節(jié)中聲母區(qū)別特征的檢測探針

上節(jié)中為聲母的各區(qū)別特征匹配了聲學(xué)參數(shù),確定了各特征的參數(shù)特性,利用這些參數(shù)和參數(shù)特性可以實(shí)現(xiàn)在孤立聲母的情形下聲母區(qū)別特征的檢測。本節(jié)觀察區(qū)別特征的有無在自然音節(jié)語音幀角度上的表現(xiàn)差異,以此設(shè)計(jì)探針實(shí)現(xiàn)自然音節(jié)中聲母區(qū)別特征檢測。

表2 聲母區(qū)別特征的參數(shù)化修正后結(jié)果

表3 聲母區(qū)別特征的參數(shù)化修正后結(jié)果

定義:具有某聲母區(qū)別特征參數(shù)特性的語音幀為該區(qū)別特征的有效幀。

對于自然音節(jié),聲母部分語音幀的能量值要低于整個音節(jié)語音幀的能量平均值。利用此特征可以實(shí)現(xiàn)音節(jié)中聲母位置的初判。

聲母的持續(xù)時間短,分幀后各幀差異不大[10],故在自然音節(jié)中,某聲母區(qū)別特征的有無將會在聲母初判范圍內(nèi)有效幀的含量上出現(xiàn)差異。將音節(jié)中聲母初判范圍內(nèi)有效幀的含量設(shè)定為該區(qū)別特征的檢測探針,記為Para。圖5給出Para的定義示意圖。

圖5 聲母區(qū)別特征檢測探針Para的定義示意圖 

自然音節(jié)中某聲母區(qū)別特征的有無,將會在檢測探針上出現(xiàn)差異。下面將通過樣本對這種差異進(jìn)行分析,確定音節(jié)中檢測聲母區(qū)別特征的探針條件。本節(jié)所使用的樣本與前1節(jié)的樣本來自同一語料庫,不同的是不含有靜音區(qū)的自然音節(jié)。

以“濁音的”聲母區(qū)別特征為例,該特征對應(yīng)的檢測探針Para為聲母初判范圍內(nèi)N1>0.52的語音幀比例,記作Para1。觀察理論上含有該特征的音節(jié)(A類)與理論上不含有該特征的音節(jié)(B類)在Para1概率分布,A類音節(jié)的Para1值為Para1A,B類音節(jié)的為Para1B,如圖6所示。設(shè)判決閾限為兩曲線的交點(diǎn)0.66。該特征的有無與Para1值的關(guān)系如表4所示。A類音節(jié)的Para1值一般大于等于66%。即可以通過Para1的取值來進(jìn)行音節(jié)中“濁音的”聲母區(qū)別特征檢測。

圖6 A類和B類音節(jié)的Para1概率分布圖 

音節(jié)中“濁音的”特征閾值Para1范圍有無66%≥66%<66%

同樣的方法,確定出自然音節(jié)中其他聲母區(qū)別特征的探針條件,如表5所示。

表5 自然音節(jié)中檢測聲母區(qū)別特征的探針條件

4自然音節(jié)中聲母區(qū)別特征檢測

利用第3節(jié)中表5給定的檢測探針條件,在自然音節(jié)狀態(tài)下對各音節(jié)樣本進(jìn)行聲母區(qū)別特征檢測。檢測結(jié)果如表6所示。正檢率是指理論上含有某區(qū)別特征的音節(jié)樣本中,滿足對應(yīng)區(qū)別特征檢測條件的音節(jié)樣本所占比例。誤判率是指理論上沒有該區(qū)別特征的音節(jié)樣本中,滿足對應(yīng)區(qū)別特征檢測條件的音節(jié)樣本所占比例。

由表6可知,正檢率普遍在80%左右,誤判率在20%左右,“舌尖前的”和“雙唇的”正檢率略低,與孤立聲母情形下的檢測結(jié)果類似。

表6 自然音節(jié)中聲母區(qū)別特征的檢測結(jié)果

5檢測探針的有效性檢驗(yàn)

第4節(jié)中設(shè)計(jì)了在自然音節(jié)中實(shí)現(xiàn)聲母區(qū)別特征檢測的探針,該探針的有效性主要通過自然音節(jié)狀態(tài)下聲母區(qū)別特征的檢測效果與孤立聲母下區(qū)別特征檢測效果的差異來表征。從兩個角度考慮:第一,總體上對比兩種狀態(tài)下的檢測效果;第二,考察各區(qū)別特征下兩種狀態(tài)下的檢測效果。

由表7可知,孤立聲母狀態(tài)下檢測聲母區(qū)別特征的總體結(jié)果與自然音節(jié)狀態(tài)下的檢測效果差異不大。具體表現(xiàn)在自然音節(jié)狀態(tài)下特征總體正檢率要略優(yōu)于孤立聲母狀態(tài),但同時帶來的是誤判率的提高。

表7 總體測試結(jié)果

在兩種狀態(tài)下總體檢測效果相當(dāng)?shù)幕A(chǔ)上,下面從各區(qū)別特征的角度分析,設(shè)定檢測探針失效條件為:自然音節(jié)狀態(tài)與孤立聲母狀態(tài)相比,在檢測某一特征時,正檢率絕對下降10%,或者誤判率絕對增加10%。觀察圖7到9,其中,聲母-正檢和聲母-誤判表示孤立聲母狀態(tài)下聲母區(qū)別特征的正檢率和誤判率;同理,音節(jié)-正檢率和音節(jié)-誤判表示自然音節(jié)狀態(tài)下聲母區(qū)別特征的正檢率和誤判率。可見,并沒有特征滿足失效條件,故可以認(rèn)為用文中提出的探針在自然音節(jié)中檢測聲母區(qū)別特征的方法是有效的。

圖7 兩種狀態(tài)下特征檢測效果對比圖(一) 

圖8 兩種狀態(tài)下特征檢測效果對比圖(二) 

圖9 兩種狀態(tài)下特征檢測效果對比圖(三) 

6結(jié)論

本文修正了各聲母區(qū)別特征對應(yīng)的聲學(xué)參數(shù),確定了各區(qū)別特征的參數(shù)特性,并提出利用探針Para實(shí)現(xiàn)自然音節(jié)狀態(tài)下聲母區(qū)別特征的檢測的方法。具體工作如下:

孤立聲母的狀態(tài)下,對聲母各幀聲學(xué)參數(shù)值進(jìn)行幀間平均,修正了12對聲母區(qū)別特征的客觀參數(shù),參數(shù)為12維MFCC值和40維美爾濾波器輸出值。利用客觀參數(shù)對聲母區(qū)別特征進(jìn)行檢測,檢測效果與修正前的結(jié)果相比更加合理。

定義了具有某區(qū)別特征參數(shù)特性的語音幀為該區(qū)別特征的有效幀。在自然音節(jié)狀態(tài)下,定義探針,樣本訓(xùn)練確定出各區(qū)別特征的檢測探針條件。在音節(jié)中對聲母區(qū)別特征進(jìn)行集內(nèi)外檢測,檢測效果良好。

自然音節(jié)狀態(tài)下的特征檢測效果與孤立聲母狀態(tài)下的檢測效果相當(dāng),且良好。這說明聲母區(qū)別特征匹配的區(qū)別特征參數(shù)是合理的,并且文中提出的自然音節(jié)狀態(tài)下檢測聲母區(qū)別特征的探針是有效的。

自然音節(jié)中聲母區(qū)別特征檢測的實(shí)現(xiàn)有助于推動基于區(qū)別特征的普通話評測技術(shù)的發(fā)展,但僅僅實(shí)現(xiàn)音節(jié)中聲母區(qū)別特征檢測問題是不夠的,還得進(jìn)一步考慮韻母區(qū)別特征檢測問題,以及如何在將本文的結(jié)果應(yīng)用在連續(xù)語流問題中,與此同時,“舌尖前的”、“塞擦的”這兩個特征的檢測效果不佳,可能是參數(shù)化中匹配的參數(shù)并不是很合適,下一步將為其尋找更合適的參數(shù)。

參考文獻(xiàn)

[1]張家騄.言語知覺反映論[J].中國科學(xué),1978,(5):519-530.

[2]張家騄.論語音技術(shù)的發(fā)展[J].聲學(xué)學(xué)報,2004:29(3):193-199.

[3]吳宗濟(jì). 試論普通話語音的“區(qū)別特征”及其相互關(guān)系[J].中國語文,1980,(5):321-327.

[4]吳宗濟(jì),林茂燦. 實(shí)驗(yàn)語音學(xué)概要[M]. 北京:高等教育出版社,1989.

[5]陸致極. 試論普通話音位的區(qū)別特征[J].語文研究,1987,(4):10-21.

[6]張家騄. 漢語普通話區(qū)別特征體系[J].聲學(xué)學(xué)報,2005:30(6):506-514.

[7]張家騄. 漢語普通話區(qū)別特征體系樹狀圖[J].聲學(xué)學(xué)報,2006:31(3):193-198.

[8]馮曉亮,孟子厚. 面向普通話輔音檢測的區(qū)別特征參數(shù)測量[J].聲學(xué)技術(shù),2013,(1):297-305.

[9]章斯宇,孟子厚. 混響環(huán)境下漢語語音知覺特征的實(shí)驗(yàn)分析[J].聲學(xué)學(xué)報,2013,(1):85-91.

[10]馮曉亮,孟子厚.舌尖輔音和舌面輔音的區(qū)別特征參數(shù)[J].北京:第八屆中國語音學(xué)學(xué)術(shù)會議,2008.

(責(zé)任編輯:王謙)

Detection of The Mandarin Initials Distinctive Feature in Natural Syllables

XU Yi-hua,Liu Ya-li,MENG Zi-hou

(Communication Acoustics Laboratory,Communication University of China,Beijing 100024,China)

Abstract:According to Mandarin initials distinctive feature systems based on speech perception characteristics,objective signal parameters was corrected which correspond to the distinctive features.Initial distinctive feature was detected tin Natural syllables by parameter Para,which is based on the percentage of effective frames in the initial preliminary position.The effective frame is that speech frame containing the parameter characteristics of a distinctive feature. Initial preliminary position is determined due to energy in Natural syllables. The average detection accuracy of initial distinctive feature was about 80%.

Keywords:Mandarin initials distinctive feature;natural syllables;computer aided speech evaluation

作者簡介:徐益華(1990-),男(漢),江蘇鹽城人,碩士研究生.E-mail:xuyihua0708@163.com

基金項(xiàng)目:國家自然科學(xué)基金項(xiàng)目(11174275)

收稿日期:2015-04-27

中圖分類號:0428

文獻(xiàn)標(biāo)識碼:A

文章編號:1673-4793(2015)05-0029-06

主站蜘蛛池模板: 伊人久久影视| 国产一区亚洲一区| 亚洲黄网在线| 亚洲 日韩 激情 无码 中出| 国产精品精品视频| 高清免费毛片| 制服丝袜国产精品| 精品日韩亚洲欧美高清a | 午夜精品一区二区蜜桃| 亚洲国产一区在线观看| 欧美色视频在线| 精品国产污污免费网站| 永久免费精品视频| 国产成人福利在线视老湿机| 国内精品一区二区在线观看| 久久天天躁狠狠躁夜夜躁| 国内精品一区二区在线观看 | 97青草最新免费精品视频| 久久福利网| 欧美中文字幕无线码视频| 91在线无码精品秘九色APP| 欧美中文字幕无线码视频| 亚洲精品大秀视频| 国产系列在线| 99热国产这里只有精品无卡顿"| 国产免费网址| 精品色综合| 日韩免费毛片视频| 国产www网站| 欧美区国产区| 国产网站免费看| h视频在线播放| 国产白浆一区二区三区视频在线| 福利片91| 国产91熟女高潮一区二区| 国产91麻豆视频| 少妇精品网站| 国产国模一区二区三区四区| 少妇露出福利视频| 国产综合在线观看视频| 波多野结衣中文字幕一区| 免费人成又黄又爽的视频网站| 日韩毛片免费视频| 亚洲第一页在线观看| 久久99国产乱子伦精品免| 中文字幕在线欧美| 亚洲成人一区二区三区| 狠狠干综合| 免费国产无遮挡又黄又爽| 天天摸夜夜操| 国产欧美日韩综合在线第一| 国产不卡一级毛片视频| 欧美激情视频二区三区| 国产成人久视频免费| 毛片在线播放a| 欧美成人一级| 九色在线视频导航91| 日本欧美在线观看| 午夜啪啪福利| 亚洲人成日本在线观看| 欧美日本中文| 超碰精品无码一区二区| 国产成人夜色91| 久久夜夜视频| 亚洲天堂色色人体| 欧美日韩国产一级| 久热精品免费| 青青青伊人色综合久久| 日韩最新中文字幕| 狠狠五月天中文字幕| 中国精品自拍| 久久无码高潮喷水| 国产啪在线| 97se亚洲| 亚洲成人手机在线| 亚洲国产精品成人久久综合影院| 她的性爱视频| 日韩精品一区二区三区大桥未久| 五月天在线网站| 日韩欧美一区在线观看| 中文字幕永久在线看| 欧美成人精品欧美一级乱黄|