999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

一個面向藏族學(xué)生雙語教學(xué)的漢藏語料庫建設(shè)

2023-11-24 11:02:20梁青青周小燕趙春艷

梁青青,周小燕,趙春艷

(蘭州文理學(xué)院 傳媒工程學(xué)院,甘肅 蘭州 730000)

我國是多民族國家,除漢族外,藏族是人口眾多的少數(shù)民族之一,在我國約有七百萬人口(2016),主要分布在西藏自治區(qū)、青海省、四川省西部、云南迪慶和甘肅甘南等地區(qū).生活在這些少數(shù)民族地區(qū)的人們,藏語是他們的主要語言[1].國家為了民族統(tǒng)一和共同發(fā)展,目前正在積極推廣普通話.《國家中長期教育改革和發(fā)展規(guī)劃綱要(2010-2020年)》中第九章民族教育的第二十七條指出:大力推進雙語教學(xué),全面開設(shè)漢語言文學(xué)課程,全面推廣國家通用語言文字[2].因此,面向藏族學(xué)生的雙語教學(xué)對于提高他們的普通話水平尤為重要.然而,藏族人的普通話發(fā)音容易受到其母語發(fā)音習(xí)慣的影響,總會帶有一些固定類型的錯誤發(fā)音,這就需要有專業(yè)教師對其普通話發(fā)音進行針對性的糾正.這種方式費時費力,效率也不高.隨著語音信號處理技術(shù)的不斷成熟以及智能語音技術(shù)的快速發(fā)展,計算機輔助語言學(xué)習(xí)系統(tǒng)(Computer Aided Language Learning,CALL)[3]用于藏族學(xué)生的普通話發(fā)音評估越來越受到人們的青睞.構(gòu)建一個適用于藏族學(xué)生普通話發(fā)音評估的語料庫是其應(yīng)用的基礎(chǔ).關(guān)于藏語信息技術(shù)方面的研究起步較晚,資源也相對缺乏.根據(jù)知網(wǎng)查詢發(fā)現(xiàn),已有的成果有:西北民族大學(xué)藏文信息處理研究所設(shè)計的安多藏語語音合成語料庫;中國社會科學(xué)院民族學(xué)與人類學(xué)研究所、西藏語委、新疆大學(xué)和西南民族大學(xué)共同完成的“藏、維、彝民語語音參數(shù)數(shù)據(jù)庫”;西藏大學(xué)藏文信息技術(shù)研究中心的“面向藏語聲紋識別的語料庫”[4].這些數(shù)據(jù)庫主要用于語音合成和語音識別,大部分還處于語料收集和研究階段,而且現(xiàn)有的語料庫也未涉及普通話聲韻調(diào)發(fā)音特征和藏語聲韻調(diào)發(fā)音特征的差異.因此,本文以甘肅地區(qū)藏族學(xué)生在雙語教學(xué)中學(xué)習(xí)普通話發(fā)音為研究內(nèi)容,先從語言學(xué)角度對比分析藏語和標準普通話的發(fā)音特征,歸納總結(jié)出藏語語者普通話的發(fā)音特征,在此基礎(chǔ)上進行文本設(shè)計和語音錄制,構(gòu)建合適的語料庫.進一步對錄制的音頻文件進行分層標注:短語層用漢字標注;音節(jié)層用漢語拼音標注;利用計算機可讀音標(Speech Assessment Methods Phonetic Alphabet,SAMPA)來標注音素層;用調(diào)值來標注聲調(diào)信息,最后,將所有標注信息寫入.TextGrid文件中.

1 語料庫設(shè)計

在設(shè)計文本語料庫的過程中,需要科學(xué)地設(shè)計語料內(nèi)容,用盡量少的語料覆蓋語言的所有發(fā)音現(xiàn)象.藏族人在說普通話時容易受到母語的影響,說出的普通話具有明顯藏腔藏調(diào).由于藏語和漢語在結(jié)構(gòu)上具有相似性,所以采用漢語中拼音的構(gòu)成,即聲母、韻母以及聲調(diào)的概念來比較分析藏語語者的普通話語音特征.本文結(jié)合藏族小學(xué)的課本,從聲母、韻母以及聲調(diào)上對比藏族學(xué)生的普通話與標準普通話的差異,歸納出藏族學(xué)生易混淆的聲韻調(diào),進行文本語料的設(shè)計.

1.1 漢藏雙語的發(fā)音特點

漢語是音節(jié)型語言.漢語拼音有23個聲母,24個韻母,每個漢字的拼音都有聲母(零聲母)、韻母和聲調(diào).聲母起輔音作用.韻母由單元音或者元音與輔音構(gòu)成,可以分為單韻母、復(fù)韻母和鼻韻母.聲調(diào)分為陰平、陽平、上聲和去聲.

藏語和漢語屬于同一個語系,并且藏語也是音節(jié)型語言.目前藏語方言主要分為3類:衛(wèi)藏方言(拉薩話)、康方言(德格話、昌多話)和安多方言,本文以衛(wèi)藏方言中的拉薩藏語為研究對象.藏語和漢語不同,藏語是由字母組合形成的文字,每個字母都有自己的發(fā)音,字母的組合實際上就是音與音之間的拼合,所以稱之為拼音文字[5].

1.2 藏語和漢語的主要區(qū)別

1.2.1 聲母發(fā)音特征的區(qū)別

根據(jù)拉薩藏語聲母系統(tǒng)來進行分析,藏語和普通話共享20個聲母,如表1所列.除此之外,藏語和普通話還有其特有的聲母,如表2所列.通過對比發(fā)現(xiàn)藏語相對普通話多出4個聲母,但藏語聲母系統(tǒng)缺少清擦音f[f]和h[x],藏族人通過借用其他音來發(fā)這兩個音[6].例如,有時會將f[f]音發(fā)成[ph],有時會用藏語聲母中的[h]來匹配普通話中的h[x],或者用濁擦音[]來發(fā)h[x].趙金燦[7]在調(diào)查中發(fā)現(xiàn),藏語中的送氣聲母在雙音節(jié)詞中的后位會變成不送氣,這個習(xí)慣導(dǎo)致他們學(xué)習(xí)普通話時聲母被替換.因此,藏族人在學(xué)習(xí)“c”“z”“s”“ch”“zh”“sh”時會遇到較大困難,在普通話聲母中還容易混淆p[ph]-b[p]、t[th]-d[t]、k[kh]-g[k]、c[h]-z[]、ch[h]-zh[].

表1 藏語和普通話共享的聲母

表2 藏語和普通話各自特有的聲母

1.2.2 韻母發(fā)音特征的區(qū)別

藏語和普通話共享11個韻母,具體情況如表3所列,藏語34個特有韻母如表4所列.從表中可以發(fā)現(xiàn),藏語和普通話的韻母差異比聲母系統(tǒng)大.藏語中特有的鼻化元音是普通話中沒有的,但是藏語中缺少了普通話中的復(fù)元音.另外,豐富的輔音韻尾是藏語韻母區(qū)別于普通話的另一個主要特征.

表3 藏語和普通話共享的韻母

表4 藏語特有的韻母

根據(jù)趙金燦等人的調(diào)查顯示,藏族人在學(xué)習(xí)普通話時,容易發(fā)生偏誤的韻母有:①把o[o]發(fā)音成 u[u];②普通話中的e[],在藏族人中容易發(fā)成[?],藏族人容易出現(xiàn)舌位的錯誤;③藏語中沒有兒化音,因此,藏族人在在帶兒化音的詞中兒化音常常發(fā)音為零聲母;④藏語中因缺乏普通化的ou[ou],常常與[u]混淆;⑤藏族人在學(xué)習(xí)an[an]、ang[??]時容易將兩者混淆;⑥藏族人在學(xué)習(xí)en[n]、in[in]時也極易出錯.

1.2.3 聲調(diào)發(fā)音特征的區(qū)別

藏語和普通話一樣都是聲調(diào)語言,不同的聲調(diào)可以表達不同的語義,也可以表達不同的語法功能.對于聲調(diào)的研究通常會用“五度值記調(diào)法”來表示不同的調(diào)音[8],藏語和普通話的調(diào)型調(diào)值如表5所列.

表5 藏語和普通話的調(diào)型調(diào)值

通過對比發(fā)現(xiàn),普通話的陰平調(diào)值高于藏語的高平調(diào),二者的調(diào)值略有差異;普通話的去聲和藏語的高降調(diào)在調(diào)型和調(diào)值上都一樣.這兩種語言的差別在升調(diào)和曲降調(diào),普通話的陽平是中升調(diào),而藏語是低升調(diào),藏語調(diào)值整體比普通話要低.普通話的上聲調(diào)值是214,屬于中降升調(diào),而與其對應(yīng)的藏語調(diào)值是132,屬于是低升降調(diào).從調(diào)值可以發(fā)現(xiàn),普通話的上聲是先降后升,而藏語的是先升后降,二者差異較大.因此,藏族人學(xué)習(xí)普通話聲調(diào)的難點主要在于陽平和上聲.

1.3 文本語料設(shè)計

本文主要從藏語和普通話在聲母、韻母和聲調(diào)上的主要差別出發(fā)來設(shè)計文本語料庫.由于雙語教學(xué)語料庫既能對小學(xué)生普通話發(fā)音進行糾正,也能用來研究藏語的語音分析、韻律建模、語音轉(zhuǎn)換和語音合成等,因此,該語料庫應(yīng)滿足以下條件:

(1)應(yīng)盡可能覆蓋漢語普通話中所有由聲母、韻母和聲調(diào)組合而成的音節(jié);

(2)藏語音節(jié)中的濁輔音和輔音韻尾在日常發(fā)音中經(jīng)常被簡化,進而會給藏族學(xué)生學(xué)習(xí)普通話發(fā)音造成一定影響.因此,在構(gòu)建文本語料庫中需要重點考慮對這種情況的覆蓋;

(3)需要考慮聲調(diào)發(fā)生變化的情況,例如:由兩個三聲的字組成詞時,第1個字通常會變?yōu)槎?一些詞語及句子中存在聲調(diào)變成輕聲的情況.

基于以上條件,結(jié)合小學(xué)階段的科學(xué)課教材,通過對比普通話和藏語在聲韻母、聲調(diào)、語調(diào)、節(jié)律、語速等方面的異同,設(shè)計面向藏族學(xué)生學(xué)習(xí)普通話的雙語教學(xué)文本語料[9],語料庫要包含單字、詞組和連續(xù)語句.單字要包含藏語和普通話里面所有的聲韻母組合以及不同聲調(diào)組合;詞組需要包含所有不同聲調(diào)組合的詞語;連續(xù)語句要包含陳述句、祈使句、疑問句等不同句型.最后,我們構(gòu)建單字500字、雙字詞1 000詞、三字詞400詞和語句800句4種藏語的文本語料.以下為設(shè)計的4種藏語的文本語料實例.

2 語音語料錄制

選擇甘南州以普通話為主要教學(xué)語言的合作第一小學(xué)的藏族學(xué)生錄制藏語,錄制藏語的學(xué)生既會說藏語,也會說普通話,錄制普通話的漢族學(xué)生只會說普通話.最后,從一到六年級,每個年級挑選10名學(xué)生,5名藏族學(xué)生和5名漢族學(xué)生,共60名學(xué)生,其中男生28名,女生32名,錄制全部文本語料.

所有的語音語料都是在專門的錄音環(huán)境中通過專業(yè)的錄音設(shè)備錄制的.錄音設(shè)備采用高保真話筒和外置聲卡,保證音頻采集質(zhì)量,利用筆記本電腦安裝的CoolEdit軟件進行音頻錄制.錄音過程中CoolEdit軟件可以實時顯示語音波形,根據(jù)波形幅值大小的變化來保證錄音人最佳音量和語速,這樣可以最大限度避免反復(fù)錄制,保證錄音質(zhì)量.最后錄制好的語音語料以單聲道、16位采樣精度、44.1 kHz采樣頻率保存為WAV格式的文件.從錄制的具體內(nèi)容來看,首先錄制了單字,單字簡單,錄制時不易出錯;然后錄制了雙字和三字,詞語在朗讀的時候會有變調(diào)的情況,需要錄音人仔細斟酌;最后錄制了語句,語句較長,需要把控好語速和語調(diào).

錄音的音頻總時長大約為8 h,為了使用方便,后期通過專門的音頻軟件CoolEdit對所有的音頻文件進行編輯切分,并保存為對應(yīng)的文件.對于單字、二字詞和三字詞,根據(jù)字數(shù)分類,分別保存為對應(yīng)文件;一個語句保存為一個文件,并按照類別進行編號.

3 數(shù)據(jù)集標注

普通話和藏語都是音節(jié)作為最小發(fā)音單位,閱讀、分析也都以音節(jié)為單位,因此要將雙字詞、三字詞和句子切分成單個音節(jié),標注出每個音節(jié)的起止位置,得到每個音節(jié)的時長.普通話和藏語每個音節(jié)的基本發(fā)音都由聲母、韻母和聲調(diào)決定,根據(jù)這些語音特征,本文采用國際上通用語音標注軟件Praat,對語料庫進行標注[10].其標注分為5個層級:第1層為line,表示漢字標注;第2層是pinyin,是語音針對漢語拼音的標注;第3層為Phone層,利用國際上通用的機讀音標方案SAMPA來標注音素;第4層為mistake層,標注可能的發(fā)音偏誤信息;第5層為tone層,標注聲調(diào)信息.

漢語具體標注的實例如圖3所示,具體標注說明如表6所列.

圖3 漢語標注實例

表6 標注符號說明示例

對標注過的語料編寫腳本程序,將標注好的內(nèi)容按照和語音文件一一對應(yīng)的關(guān)系寫入.TexGrid文件,里面包含了標注的所有層級信息.最后通過Praat軟件自動提取基頻值和共振峰,以供后續(xù)分析使用.

4 結(jié)語

本文主要介紹了如何構(gòu)建一個面向藏族學(xué)生在雙語教學(xué)中學(xué)習(xí)普通話發(fā)音評估研究的語料庫.從語言學(xué)角度對比分析藏語和標準普通話的發(fā)音特征,歸納總結(jié)出藏語語者普通話的發(fā)音特征.基于此設(shè)計文本語料,錄制語音語料.用Praat軟件對錄制好的語音語料進行5層標注,并將其獨立保存為.TextGrid格式文件,獲得該語音信息的相關(guān)特征.所構(gòu)建的語料庫既可以用來研究藏語計算機輔助發(fā)音系統(tǒng)設(shè)計,也可以用來進行藏語的實驗語音學(xué)研究.今后將會從覆蓋性、全面性、質(zhì)量和可重復(fù)使用性等指標,對該語料庫進行評估.

主站蜘蛛池模板: 亚洲乱码在线播放| 91 九色视频丝袜| 超清无码一区二区三区| 国产亚洲男人的天堂在线观看| 黄色网页在线播放| 欧美中文一区| 青青草国产一区二区三区| 99re热精品视频国产免费| 久99久热只有精品国产15| 欧美一级专区免费大片| 国产成+人+综合+亚洲欧美| 国产精品美女在线| 欧美日本在线一区二区三区| 一级一毛片a级毛片| 亚洲中字无码AV电影在线观看| 国产在线日本| 国产a网站| 国产激情在线视频| 9久久伊人精品综合| 中文字幕欧美日韩高清| 免费高清a毛片| 波多野结衣中文字幕久久| 亚洲一级毛片免费看| 一本久道久久综合多人| 91精品啪在线观看国产91九色| 免费AV在线播放观看18禁强制| 欧美精品一区在线看| 亚洲国产高清精品线久久| 日本道综合一本久久久88| 欧美亚洲一区二区三区导航| 亚亚洲乱码一二三四区| 青青草原国产一区二区| 国产流白浆视频| 日韩欧美中文字幕在线韩免费| 亚洲视频三级| 91小视频版在线观看www| 免费看久久精品99| 色悠久久久久久久综合网伊人| 99精品在线视频观看| 亚洲人成在线精品| 欧美a级在线| 国产成人综合在线视频| 亚洲无码高清免费视频亚洲| 国产黑丝一区| 国产H片无码不卡在线视频| 亚洲精品第1页| 欧美成人午夜视频| jizz国产在线| 深夜福利视频一区二区| 丰满的少妇人妻无码区| 日韩在线视频网| 久久青草视频| 亚洲最猛黑人xxxx黑人猛交| 欧美成人午夜影院| 久久久噜噜噜久久中文字幕色伊伊| 久久久久亚洲AV成人人电影软件| 成人精品视频一区二区在线| 妇女自拍偷自拍亚洲精品| 国产成人精品一区二区| 色成人亚洲| 无遮挡一级毛片呦女视频| 国产午夜一级淫片| 波多野结衣中文字幕一区| 久久久久无码国产精品不卡| 91精品国产一区| 中文字幕不卡免费高清视频| 在线欧美日韩| 国产成人亚洲毛片| 亚洲免费黄色网| 国产欧美成人不卡视频| 国产成人亚洲毛片| 欧美成人免费一区在线播放| 伊人久综合| 亚洲欧美自拍中文| 中文字幕无码制服中字| 亚洲人成色在线观看| 女人18毛片一级毛片在线 | 国产精品午夜电影| 国产永久无码观看在线| 日本精品一在线观看视频| 91热爆在线| 在线观看国产一区二区三区99|