999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于RFC模型的英語語調差異性研究

2016-09-13 07:25:53劉猛潘洋緒
電子設計工程 2016年3期
關鍵詞:英語

劉猛,潘洋緒

(河海大學 計算機與信息學院,江蘇 南京 210098)

基于RFC模型的英語語調差異性研究

劉猛,潘洋緒

(河海大學 計算機與信息學院,江蘇 南京210098)

本文主要對英語語調差異性進行研究,分析中國英語語者與英語母語者語調差異性。對實驗數據語音文件利用已建立的實驗包通過MATLAB軟件提取基頻,基于提取的基頻生成基頻曲線。對得出的基頻曲線基于上升/下降/連接模型(RFC模型)[]在起始位置斜度,結束位置斜度,基音頻率均值,頻域范圍,語速五個方面參數方面進行研究。分別對中國英語語者和英語母語者就上述五個參數進行分析。實驗數據表明基于RFC模型的語調差異性研究可行,中國英語語者和英語母語者在分析的5個參數上都有明顯的差異。

語調;MATLAB;基頻;RFC模型

語調通常指的是語音語句基頻的變化,基頻承載了大量的語調信息。語調是目前語音分析,語音合成等領域都比較關注的重要課題。目前,現代英語語調研究大體可分為三大流派[2],偏重于語音層面的構形方法研究;偏重音位層面的音高音位方式研究;試圖在音系和語音層面建立聯系的自主音段-節奏方式研究。國外的英語語調習得研究主要是對不同母語學習者的語調的習得過程、語調特征和口語發聲時定的描述性研究[3]。在語調模型研究方面,Fujisaki提出重音和短語以對數形式相加的語調模型[4]。國內對中國英語語者的語調研究起步于理論研究,主要通過對比分析英漢兩種語言在語調上的差異,解釋中國學習者這語調習得中存在的問題[5]。

也有研究學者通過實證研究,借助語音實驗研究軟件分析頻譜語圖來揭示中國英語語者的語調特征[6]。該類研究多是從語言學的角度去分析中國學習者的口語語調特征,缺乏對中國英語語者語調模式的概括。本文根據語音合成中用來描述語調的RFC模型 ,利用能夠很好反映出中國英語語者和英語母語者的語調差異方面的特征參數。通過實驗對比計算特征參數間的差異,得出結論。

1 總體設計

本文的目標是基于RFC模型分析中國英語語者和英語母語者語調的差異性。通過利用RFC模型原理建立基頻語調模型分析參數差異性,從而得出語調的差異性大小是否明顯。總體的流程圖如圖1所示。

圖1 總體設計流程圖Fig.1 The overall design flow chart

步驟一:實驗數據集的得到,文中用 COOLEDIT軟件錄制語音文件,生成原始語音材料;步驟二:對得到的原始語音材料進行預處理,包括重采樣改變文件的格式,采樣率等便于后面利用軟件包提取基頻;步驟三:利用實驗室前期建立的實驗包以及MATLAB軟件提取基,生成基頻曲線;步驟四:對得到的基頻曲線通過分析起始位置斜度、結束位置斜度、基音頻率均值,基音頻率范圍、語速5個參數,得出中國英語學習者和英語母語者語調在這5個參數上的差異性。

2 基于RFC模型的參數分析

s為一句語音的單詞數,采樣頻率fs=16 000,t1和t4分別為起始位置采樣點數和結束位置采樣點數。由于采樣率fs為16 000 Hz,即每秒有16 000個采樣點,因此在計算時乘以采樣率得到語速單位為單詞數/秒。

起始位置斜度,用δ1表示,定義為

大部分的語調信息主要隱含在基頻中,因此分析基頻中可以很好的得到語調的差異。Cruttenden研究中指出起始位置和結束位置的上升或下降是反映不同的口音類型語調的一個重要指標[7]。上升/下降/連接模型是用來描述在音調輪廓的差異。通過提取的基頻生成基頻曲線,利用RFC模型原理建立基頻語調模型[8-9]。本文就是通過此模型分析起始位置斜度、結束位置斜度,基音頻率范圍,基音頻率均值,語速五個參數分析差異性。圖2是一個反映語調的基頻曲線圖模型,其中實黑線是基頻曲線。橫坐標是采樣點數,用表示,縱坐標是頻率,用表示。

這里對需要分析的5個參數進行定義:

語速,用表示,則語速定義為

即從起始采樣點處到基頻曲線第一個上升段和下降段結合點處的相對斜度,可直觀的顯示出語音語句開始時的起伏程度。

結束位置斜度,用δ2表示,定義為

即基頻曲線最后一段曲線的起伏程度,基頻曲線最后采樣點處到最后一段曲線下降時最高點處的相對斜度,可直觀的顯示出語音語句結束時語調。

基音頻率均值,用fθ表示,定義為

即基音頻率均值是所有采樣點出頻率的均值。

基音頻率范圍,用λ表示,定義為

即基音頻率范圍是基頻曲線中最大值與最小值的差值,反映出說話人音域范圍的寬窄度。

3 實 驗

3.1實驗數據集

來自WSJCAM0數據庫和英國學術口語語料庫BASE的包含多種句型的語篇。隨機找尋中國英語學習者和英語母語者(男女比例大致相當)在噪音小的環境下朗讀語料,利用COOLEDIT進行錄音,采樣率為16 kHz,格式為PCM的語音。對錄制的語音材料進行處理,利用COOLEDIT將每個錄音中的每個語句切分出來,形成實驗數據集,分別包含108句中國英語語者句子(男性、女性各54句)和80句英語母語者句子(男性、女性各40句)。

圖2 反映語調的基頻曲線圖模型Fig.2 Reflect the intonation of the fundamental frequency graph model

3.2提取基頻曲線

對語句進行處理得到基頻曲線,包括以下實驗步驟:

1)對得到的語音語句用COOLEDIT軟件進行轉化格式,轉為格式為采樣率為每秒16000,單聲道的WAV格式。轉化后的格式便于語音在MATLAB中進行進一步的處理。利用實驗室前期建立的實驗包對WAV格式語音文件進一步處理,生成pmk格式文件,文件中是初步提取的基頻信息。

2)對生成pmk文件在MATLAB中打開,方式示例為fid= fopen(‘語音2.pmk’,‘r’);output=fread(fid,inf,‘uint16’);fclose(fid)。這里output是矩陣,矩陣中數值為每個采樣點是頻率值。由于提取時會出現提取的頻率值是基頻的一半(半頻)或是基頻的二倍(倍頻)的錯誤,需進一步對半頻和倍頻處進行處理,設定一個閥值(本文中設定閥值為基頻頻率均值),將頻率值中小于的值乘以2β,大于的值除以2β,消除半頻和倍頻。然后對其分別進行一次5點中值平滑和7點中值平滑消除奇點和部分未處理到半頻以及倍頻。再經過修正,去掉沒有基頻地方的頻率值,將得到的離散的采樣點值利用插值函數生成基頻曲線。利用MATLAB中軟件處理的語音波形及提取的基頻曲線如圖3所示。圖3中最上面部分是原始語音波形圖;中間圖是沒有經過半頻、倍頻處理以及中間平滑處理的各離散采樣點處的頻率值;下面圖是經過平滑處理和半頻、倍頻處理后,將各離散采樣點處的值經過插值處理后生成的基頻曲線圖。

3.3實驗參數分析

對提取的基頻曲線用本論文上面描述的反映語調的基頻曲線圖模型的參數分析進行處理,分別就語速,起始位置斜度,結束位置斜度,基音頻率均值,頻域范圍五方面進行分析。這里在分析時,對男性和女性分開進行分析處理。我們將中國男性語者、中國女性語者、英語母語男性語者、英語母語女性語者的語速按照柱狀圖進行統計。圖4、5、6、7分別為中國女性語者語速分布圖、中國男性的語速分布圖、英語母語者男性語速分布圖以及英語母語者女性語速分布圖,可以看出均呈現高斯分布。從而語速的均值能夠很好的體現中國英語語者和英語母語者整體語速的特征。因此計算語速的均值和方差。表1數據為中國英語語者和英語母語者語速均值和方差。

圖3 原始語音波形、離散采樣的頻率值以及經過處理后生成的基頻曲線Fig.3 The original voice waveform,frequency value of discrete sampling points and processed pitch contour

圖4 中國男性語者語速分布Fig.4 Chinese male speaker Speed Distribution

圖5 中國女性語者語速分布Fig.5 Chinese female speaker Speed Distribution

對比來看,英語母語者男性語速高于中國英語者男性達到27.52%,英語母語者女性語速高于中國英語者女性達到42.37%。兩者存在著明顯的差異,從中可看出外教的語速明顯高于中國學習者的語速。對另外4個參數按照語速分析的方法進行分析,得出均值和方差,如表2和表3所示。

從表格中數據均值的對比來看,可以看出中國英語者男

圖6 英語母語者男性語速分布Fig.6 Speed distribution of male native English speakers

圖7 英語母語者女性語速分布Fig.7 Speed distribution of female native English speakers

表1 中國英語語者和英語母語者語速的均值和方差Tab.1 The mean and variance of Chinese English speaker speed and English native speakers speed

表2 音域頻率范圍和基音頻率均值的均值和方差Tab.2 The mean and variance of Frequency range and the pitch frequency mean

表3 起始位置斜度和結束位置斜度的均值和方差Tab.3 The mean and variance of start position and end position slope

性和中國英語者女性的音域頻率范圍比相對應的英語母語者男性和英語母語者女性要高,其中中國英語者男性音域范圍均值比英語母語者男性高出53.82%,中國英語者女性音域范圍均值比英語母語者女性高出10.81%。中國英語者男性和中國英語者女性的基音頻率均值比相對應的英語母語者男性和英語母語者女性要高,其中中國英語者男性基音頻率均值比英語母語者男性高出18.45%,中國英語者女性基音頻率均值比英語母語者女性高出8.62%。

對比起始位置斜率,中國英語者男性和中國英語者女性比相對應的英語母語者男性和英語母語者女性要高,其中中國英語者男性起始位置斜度均值比英語母語者男性高出41.13%,中國英語者女性起始位置斜度均值比英語母語者女性高出19.67%。對比結束位置斜度,中國英語者男性結束位置斜度均值比英語母語者男性高出58.24%,中國英語者女性結束位置斜率均值比英語母語者女性高出36.87%。

4 結 論

基于RFC模型的語調差異性研究為語音識別,說話人識別等方面研究提供了語調方面的理論方法。本文正是基于該模型的分析,研究了中國英語語者和英語母語者語調的差異性。通過實驗分析了起始位置斜度,結束位置斜度,基音頻率均值,基音頻域范圍,語速五個參數。可以看出中國英語語者與英語母語者在這五個參數方面都有明顯的差異。相對于英語母語者,中國英語語者的語速相對較慢,基音頻率均值相對較大,同時頻率范圍也相對較大。在起始位置斜度和結束位置斜度上,中國英語語者相對于英語母語者都相對較大,即語句開始和結束時的起伏度大。

[1]Paul Taylor.The rise/fall/connection model of intonation[J]. Speech Communication,1994,15(94):169-186.

[2]Ladd D R.Intonational Phonology[M].Cambridge University Press,1996.

[3]Wenk B J.Speech Rhythms in Second Language Acquisition [J].Language and Speech,1985(2):157-175.

[4]Fujisaki H,Wang C,Ohno S,et al.Analysis and synthesis of fundamental frequency contours of Standard Chinese using the commend-response model[J].Speech Communication,2005,47(1/2):59-70.

[5]陳樺.中國學生英語語調模式研究[M].上海:上海外語教育出版社,2008.

[6]Setter J.Speech rhythm in world Englishes:The case of Hong Kong[J].TESOL Quarterly,2006,(4):763-782.

[7]Cruttenden A.Intonation[M].Cambridge University Press,1997.

[8]Yan Q,Vaseghi S.Modeling and synthesis of English regional accents with pitch and duration correlates[J]. Computer Speech and Language,2010,24:711-725.

[9]Yan Q,Vaseghi S,Rentzos D,et al.Analysis of acoustic correlates of British,Australian and American accents[J].Proc. IEEE Automatic Speech Recognition and Understanding Workshop,2003,3(39):345-350.

Study of English intonation difference based on RFC model

LIU Meng,PAN Yang-xu
(College of Computer and Information of HoHai University,Nanjing 210098,China)

The paper mainly researches on English intonation difference and analyzes the difference between English speakers in China and English-as-mothertongue speakers.Pitch is extracted from the experimental data in speech file on MATLAB and then pitch curve is generated based on the extracted pitch.Besides,the pitch curve is discussed based on raising/falling/ connection(RFC model)from five parameters as starting slope,ending slope,average pitch,pitch range and speech speed. Also,the above mentioned parameters are analyzed for English speakers in China and English-as-mothertongue speakers. Experimental data show that the study of English intonation difference based on RFC model is feasible and there is great difference between English speakers in China and English-as-mothertongue speakers in the above parameters.

intonation;MATLAB;pitch;RFC model

TN912.3

A

1674-6236(2016)03-0152-04

2015-05-19稿件編號:201505163

劉 猛(1990—),男,安徽合肥人,碩士。研究方向:信號與信息處理、語音處理與識別。

猜你喜歡
英語
玩轉2017年高考英語中的“熟詞僻義”
英語
讀英語
酷酷英語林
英語大show臺
興趣英語(2013年12期)2014-02-11 03:21:38
悠閑英語(86)感恩與忘恩
海外英語(2013年11期)2014-02-11 03:21:02
英語大show臺
興趣英語(2013年3期)2013-05-13 09:21:06
英語大show臺
興趣英語(2013年2期)2013-04-25 01:50:06
主站蜘蛛池模板: 专干老肥熟女视频网站| aa级毛片毛片免费观看久| 热九九精品| 精品成人一区二区三区电影 | 免费在线看黄网址| 强乱中文字幕在线播放不卡| 国产原创自拍不卡第一页| 欧美亚洲欧美| 91麻豆国产在线| 在线亚洲小视频| 国产精品视屏| 国产中文一区a级毛片视频| 国产在线视频欧美亚综合| 亚洲精品视频网| 青青草原国产| 精品国产欧美精品v| 国产女同自拍视频| 久久婷婷人人澡人人爱91| 国产91精品久久| 久久99热这里只有精品免费看| 国产精品无码久久久久久| 天天综合亚洲| 欧美国产视频| 毛片视频网| 不卡视频国产| 亚洲综合一区国产精品| 亚洲欧美国产高清va在线播放| 日韩经典精品无码一区二区| 亚洲欧美国产高清va在线播放| 亚洲午夜片| 亚洲综合片| 成人精品免费视频| 国产在线91在线电影| 国产喷水视频| 亚洲有码在线播放| 国产偷国产偷在线高清| 国模在线视频一区二区三区| 国产精品女人呻吟在线观看| 四虎精品国产永久在线观看| 黄片在线永久| 成人在线不卡视频| 91伊人国产| 狂欢视频在线观看不卡| 国产又大又粗又猛又爽的视频| 久无码久无码av无码| 久久鸭综合久久国产| 亚亚洲乱码一二三四区| 久久国产高潮流白浆免费观看| 国产精彩视频在线观看| 国产视频大全| 亚洲男人的天堂久久精品| 中文字幕亚洲电影| 精品午夜国产福利观看| 午夜福利在线观看入口| 女人18一级毛片免费观看| 香蕉伊思人视频| 99精品一区二区免费视频| 精品无码日韩国产不卡av | 激情综合五月网| 亚洲综合18p| 免费看黄片一区二区三区| 久久久久久国产精品mv| 日韩欧美国产另类| 亚洲视频在线网| 97超爽成人免费视频在线播放| 中文无码毛片又爽又刺激| 麻豆国产精品一二三在线观看| 亚洲AV无码一区二区三区牲色| 欧美激情视频二区| 亚洲免费三区| 中文字幕无线码一区| 成人国内精品久久久久影院| 91成人精品视频| 热99re99首页精品亚洲五月天| 久久精品中文字幕少妇| 欧美亚洲国产精品第一页| 国产激情无码一区二区三区免费| 久久人人97超碰人人澡爱香蕉| 国产伦精品一区二区三区视频优播 | 亚洲区欧美区| 国产肉感大码AV无码| 岛国精品一区免费视频在线观看|