999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

普通話測試語音信息庫的設計與實現(xiàn)

2010-01-01 00:00:00嚴志宇趙欣如譚軍華
計算機時代 2010年3期

摘要:每年的國家普通話測試,都留下普通話測試的相關信息。為了有效利用這些信息,建立了普通話測試語音信息庫,實現(xiàn)了信息錄入、信息查詢、數(shù)據統(tǒng)計、權限管理等多種功能。為了實現(xiàn)最小到音節(jié)的錄音語料查詢,信息庫利用HTK進行音頻文件的自動切分處理。普通話測試語音信息庫可方便地用于包括測試錄音語料在內的各種資料的調用和各種關聯(lián)數(shù)據的統(tǒng)計。

關鍵詞:普通話測試;語音信息庫;信息查詢;設計與實現(xiàn)

0 引言

分析利用普通話測試信息,可以了解不同背景人群習說普通話的規(guī)律和特點,了解普通話各種語音單元的實際發(fā)音狀況,了解普通話測試的具體實施情況。在普通話語音特征研究、普通話教學改進與完善、普通話測試方法的科學與智能化發(fā)展等方面,普通話測試信息是不可多得的資料。有效地利用普通話相關測試信息,對掌握普通話推廣工作的形勢,加快普通話推廣進程,加強全國各地區(qū)各民族人民的交流與交往,促進和諧社會的發(fā)展都具有十分重要的意義。

一般情況,普通話測試信息被分成幾種形式保存:現(xiàn)場錄音語料為音頻資料,專家評定的分數(shù)為紙質試卷,考生及管理信息則多為電子信息。其中,音頻資料和試卷查閱起來比較困難,錄音、分數(shù)和其他不同形式的信息之間的關聯(lián)查詢更為不易。此外,信息利用和隱私保護之間的矛盾也難以協(xié)調。

為了更好地利用和保護普通話測試信息,有必要建立普通話測試語音信息庫。信息庫應綜合各類普通話測試信息,方便各種信息的關聯(lián)調用,并具有信息保護與權限管理功能。

國內外學者對語音及相關信息的利用價值早有定論,開發(fā)出了各式各樣的語音信息庫。國內也有一些和普通話測試相關的信息處理軟件,在普通話測試實踐中發(fā)揮了巨大作用。這些軟件的功能偏重于測試管理,在信息利用方面有待進一步完善。

本文以一個普通話測試中心為背景,建立了一個包含數(shù)字化錄音語料信息、數(shù)字化試卷與分數(shù)信息、其他測試相關信息的普通話測試信息數(shù)據庫,實現(xiàn)了錄音語料、試卷分數(shù)、考生背景等信息的關聯(lián)查詢。數(shù)據庫還附有分數(shù)錄入工具和錄音自動切分工具。分數(shù)錄入工具可以用來錄入試卷分數(shù),測試專家也可以用它進行現(xiàn)場打分。錄音自動切分工具可以從語流中切分出單字和單詞并分別存放,以實現(xiàn)細化到字、詞的音頻語料查詢。

普通話測試語音信息庫存貯了錄音語料音頻信息、試卷分數(shù)信息、試題信息、考生信息及考試信息,具有信息錄入、信息查詢、數(shù)據統(tǒng)計、音頻文件處理及權限管理功能。普通話測試語音信息庫中的Windows應用程序采用Visual C++編寫,由OBDC接口與Microsoft SQL Server數(shù)據庫相連,實現(xiàn)系統(tǒng)軟件的構建。

1 普通話測試語音信息庫總體設計

1.1 用戶需求分析

普通話測試語音信息庫主要服務于普通話水平測試管理、普通話推廣與教學研究、語音處理與語音學研究。

在普通話水平測試管理方面,需要實現(xiàn)測試前和測試中的報名、考試安排以及測試后信息的分類查詢等功能。現(xiàn)有的普通話測試信息軟件,多數(shù)只服務于普通話測試前和測試中的管理工作,測試后可供查詢的信息種類較少。本文的普通話測試語音信息庫提供了多種信息的綜合查詢。可查詢的信息主要有:考試信息、考生信息和試題信息。考試信息用于了解各個考場的使用、評委工作量的分配情況。考生信息用于計算考生比例、了解不同語言背景下考生的分布情況,分析普通話測試的影響力。試題信息可用于查閱歷次測試的試題內容。

在語音處理與語音學研究中,需要大量具有不同發(fā)音質量的語音材料,以提高語音識別的正確性和自動語音評估系統(tǒng)的精確度。本文的普通話測試語音信息庫能處理測試錄音語料,得到以單字、單詞、段落形式存放的音頻文件。這些音頻文件同時關聯(lián)和反映了發(fā)音質量的測試分數(shù),以及發(fā)音者來自哪個方言區(qū)、從事專業(yè)、年齡等信息,可為測試錄音語料的研究和利用提供方便。

在普通話推廣與教學研究方面,母語、日常方言對語音、語調誤讀的影響較為明顯,為了解不同語言背景下的發(fā)音特點,需要大量不同背景發(fā)音者的不同質量的發(fā)音語料。本文的普通話測試語音信息庫實現(xiàn)了發(fā)音文本、發(fā)音質量和發(fā)音人背景信息的關聯(lián),為分析不同背景學生普通話說不準的原因提供了方便,有助于有的放矢地開展普通話教學。另外,本信息庫可以動態(tài)地接收學生的讀音,并對其發(fā)音的標準性給出即時的評價。

1.2 信息種類

為了滿足普通話水平測試管理、普通話推廣與教學研究、語音處理與語音學研究的需要,普通話測試語音信息庫需要包含錄音語料音頻信息、試卷分數(shù)信息、試題信息、考生信息及考試信息。

錄音語料音頻信息是普通話測試現(xiàn)場記錄的考生讀音。根據普通話測試的內容,每個測試考生的錄音語料音頻信息分為單字(100個音節(jié))朗讀、單詞(i00個音節(jié))朗讀、短文朗讀和主題談話四個部分。前兩部分經過語音切分后,以獨立單字、單詞的形式存貯,并將路徑索引到數(shù)據庫中。后兩部分則整體分別存貯,路徑同樣索引到數(shù)據庫中。

試卷分數(shù)信息是普通話測試時測試專家根據測試者的讀音正誤給出的分數(shù)。字、詞部分的分數(shù)包含了每個音節(jié)的發(fā)音分數(shù)。短文朗讀和主題談話部分的分數(shù)包含了發(fā)音的準確性、流暢性、語速控制等方面的分數(shù)。數(shù)據庫存貯了上述各單項分數(shù)、總分及其相對應的測試等級。

試題信息包括題號、題目文本、以及相應的拼音等內容。

考生信息包括考生個人信息和考生語言背景信息。考生的個人信息包含考生的專業(yè)、出生年月、學歷等基本信息。考生的語言信息包含考生的家庭使用語言、父母學歷、母語等先天語言背景信息,還有日常用語、工作用語等后天語言背景信息。

考試信息記錄了普通話測試時的時間、地點、測試專家等信息。

2 主要功能的設計與實現(xiàn)

普通話測試語音信息庫的主要功能為:信息錄入、信息查詢、數(shù)據統(tǒng)計(第三章中進行討論)、音頻文件處理及權限管理。

2.1 信息錄入

錄入信息包含:錄音語料音頻信息、試卷分數(shù)信息、試題信息、考生信息及考試信息。

錄音語料音頻信息的錄入采用現(xiàn)場錄音的方法,與測試同步進行,經語音自動切分后,存放在數(shù)據庫中(將在2.3節(jié)討論)。

試卷分數(shù)信息需要人工錄入。有兩種錄入方式:其一是在測試時,由測試專家直接在界面上打分;其二是在測試后,由數(shù)據庫維護人員錄入各題分數(shù)。試卷分數(shù)錄入界面與紙質試卷版面嚴格一致。計算機統(tǒng)計各題得分和總分后,將分數(shù)信息輸出到屏幕或存入數(shù)據庫。

試題信息由工作人員錄入數(shù)據庫。

考生和考試信息在普通話測試報名和考試安排時獲得,由考生和普通話水平測試管理人員分別在普通話測試網絡管理系統(tǒng)上填寫個人信息、考場和評委信息。這些信息直接存入數(shù)據庫。

普通話測試語音信息庫有較好的人機交互接口和完善的信息保護設置。

2.2 信息查詢

信息錄入以后,按照相應的數(shù)據模型組織到數(shù)據庫中。系統(tǒng)利用Microsoft SQL Server存貯人員信息,試卷分數(shù)信息、錄音語料音頻信息等多種數(shù)據,具有較小的冗余度,較高的數(shù)據獨立性和易擴展性,并可被各種用戶共享。

系統(tǒng)對各查詢條件使用“交”的關系操作。如:關系R和關系S的交,就是同時在R和S中存在的元素的集合。

本程序采用開放數(shù)據庫互聯(lián)技術(Open Database Connec-tivity,ODBC)使Visual C++與Microsoft SQL Server數(shù)據庫相連,通過添加相應的控件(DBGird和RemoteData)來完成查詢系統(tǒng)的界面與數(shù)據源的綁定。

2.3 音頻文件處理

測試者的錄音資料經過數(shù)字化以后,需要以單字、單詞、段落的形式存放。本文利用HTK工具箱(The Hidden Markov Model Toolkit——劍橋大學開發(fā)),通過普通話測試語音材料的訓練,得到普通話測試語音模型。在此基礎上利用HTK的自動強制對齊(Force Alignment)功能,將普通話測試錄音語流中的單字、單詞等語音單元與試卷中對應的文本進行時間對齊,標出每一個語音單元的邊界時間。最后根據標注出的邊界編寫程序,實現(xiàn)語音單元自動切分,得到以單字、單詞等形式存放的音頻文件。切分后的音以“WAV”的文件格式存放在特定的文件夾中。利用查詢功能用戶可以快速、準確地找出各個語音的存放路徑,進行語音查詢。

系統(tǒng)調用Visual C++MCI(Media Control Interface)中自帶的音頻處理函數(shù),實現(xiàn)后綴名為“.way”的音頻文件播放。

2.4 權限管理

使用普通話測試語音信息庫的人員大致劃分為:系統(tǒng)管理人員、試卷分數(shù)錄入人員、普通話測試管理與研究人員、語音研究人員。

權限管理的主要方法是:①管理人員對不同類型的用戶設定不同的密碼;②用不同的密碼登錄之后,只能進行特定的操作。

權限管理采用的技術路線是:①系統(tǒng)對用戶輸入的密碼進行類型判別,激活相應的操作菜單,提供相應的操作;②只有激活的菜單才具有可操作性。例如:試卷分數(shù)錄入人員輸入相應的密碼后,“試卷錄入”的菜單被激活,點擊菜單后彈出相應的對話框,即可進行試卷分數(shù)的錄入。這時,信息查詢的菜單處于未激活狀態(tài),即使點擊信息查詢菜單,也不能彈出相應的對話框,從而達到阻止下一步操作之目的。

3 數(shù)據庫設計

普通話測試語音信息庫需要將大量的數(shù)據存入數(shù)據庫中,以方便用戶查詢。我們根據不同目標用戶的需求,對數(shù)據庫進行了概念結構、邏輯結構和物理結構的設計。

3.1 概念結構

根據數(shù)據庫需求分析及系統(tǒng)功能需求分析,可以確定數(shù)據庫的概念結構。本系統(tǒng)中有考生、音頻、考試、試題、試卷分數(shù)5個基本實體,分別記錄了考生信息、測試后的語音資料、考場與評委信息、試題和分數(shù)信息等。數(shù)據庫實體(entity)一關系(relationship)的E-R圖如圖1所示。

3.2 邏輯結構

根據數(shù)據庫的概念結構,構建了5張數(shù)據總表來存貯和反映5個基本實體。即:考生(student)、音頻(speech)、考試(test)、試題(test paper)、試卷分數(shù)(test score)。每張數(shù)據總表又包含若干分表,存貯各個實體的各方面信息。例如:考生信息包括出生年月、所在單位等多種屬性。5個實體之間存在相互作用的關系,故在構建數(shù)據庫時將具有關系的實體項進行了級聯(lián)。

3.3 物理結構

數(shù)據庫的物理結構設計如圖2所示。

主鍵是實體中惟一標識元組的屬性。本系統(tǒng)中考生編號(student_ID)是每個實體的主鍵。相較考生姓名(有可能重復)等屬性,考生編號更能夠惟一地標識數(shù)據庫中的一條記錄。

外鍵用于實現(xiàn)數(shù)據庫中表與表之間的關聯(lián),起到橋梁作用。考生編號(student_D)為各個表的外鍵。例如:查詢來自不同單位的考生成績時,“考生”和“測試成績”這兩個表就需要實現(xiàn)關聯(lián)。為此,在考生表中找出滿足查詢條件的考生,即可獲得相應的考生編號,再將考生編號對應到測試成績表中,就可查詢出考生的成績。

4 應用舉例

普通話測試語音信息庫中的試卷分數(shù)信息、試題信息、考生信息及考試信息可統(tǒng)稱為文字基礎信息。經處理后,從文字基礎信息中可得到數(shù)據統(tǒng)計信息。

4.1 文字基礎信息

文字基礎信息在普通話水平測試管理、考生成績管理、普通話推廣與教學研究、語音處理與語音學研究等方面,有較為廣泛的應用(表1)。

作為實例,圖3示出了考生測試成績查詢界面,表2列出了—個具體的查詢結果。

4.2 數(shù)據統(tǒng)計信息

數(shù)據統(tǒng)計信息也廣泛應用于普通話推廣與教學研究、語音處理與語音學研究中。

數(shù)據庫中的數(shù)據經過導出,可生成一份EXCEL的電子表格文件,利用EXCEL自帶的圖表操作功能,最后可以生成直觀的統(tǒng)計圖表,利用這些圖表可以得到許多有價值的論斷。

例如:圖4所示為某次測試對不同方言背景的考生發(fā)“仄”音的得分分布情況的統(tǒng)計。由圖4可以看出:使用少數(shù)民族語言和吳方言的考生發(fā)“仄”音的正確率較高,贛方言、閩方言的考生發(fā)“仄”音的正確率較低。可能的原因有:①“仄”音在少數(shù)名族語言中出現(xiàn)頻率高,其發(fā)音標準與普通話的發(fā)音標準基本一致;②在贛方言和閩方言中,“仄”音的發(fā)音標準與普通話的發(fā)音標準有較大差異;③一些考生不認識“仄”音的部分字,不能正確地發(fā)音。

實際上,日常方言對語音、語調的影響較大。通過對不同方言背景下考生對某個字發(fā)音正誤率的比較,可以得出具有該方言背景的人的發(fā)音特點。普通話測試語音信息庫系統(tǒng)可以給出不同方言背景下的考生對某個字發(fā)音的正誤率,以助于語音研究。

4.3 錄音語料音頻信息

通過查詢界面。找到某一語言背景下某個單字的得分和存放路徑,可以幫助建立該語言背景下某單字的語言模型,此模型可運用到語音識別和自動發(fā)音評估系統(tǒng)中。圖5所示為日常用語是北方方言的考生發(fā)“拐”音的情況。

得到查找音的存放路徑后,在音頻播放界面點擊“打開文件”按鈕,彈出對話框,在對話框中填入相應的路徑,就可進行音頻播放。

系統(tǒng)沒有音頻播放的暫停/繼續(xù)、停止等功能(圖5)。語音研究者可以根據需要選擇合適的播放方式。

5 結束語

本文開發(fā)了普通話測試語音信息庫,軟件具有信息錄入、信息查詢、數(shù)據統(tǒng)計、音頻文件處理、權限管理等功能。語音信息庫包含了錄音語料音頻信息、試卷分數(shù)信息、試題信息、考生信息及考試信息。系統(tǒng)可應用于普通話水平測試管理、普通話推廣與教學研究、語音處理與語音學研究中,具有廣泛的實用價值。

主站蜘蛛池模板: 亚洲人成网址| 中文字幕在线观| 亚洲综合天堂网| 午夜福利免费视频| 亚洲二区视频| 中文字幕在线免费看| 中文字幕精品一区二区三区视频 | 九九线精品视频在线观看| 国产屁屁影院| 国产精品爽爽va在线无码观看| 亚洲精品无码专区在线观看| 2020亚洲精品无码| 3D动漫精品啪啪一区二区下载| 欧美精品H在线播放| 毛片基地视频| 97一区二区在线播放| 国产在线日本| 亚洲欧洲国产成人综合不卡| 91麻豆精品国产高清在线| 麻豆AV网站免费进入| 98超碰在线观看| 欧美色99| 国产成年无码AⅤ片在线| 18禁不卡免费网站| 久久久四虎成人永久免费网站| 久久a级片| 青青草原国产| 国产色网站| 亚洲日韩高清在线亚洲专区| 色135综合网| 色视频国产| 国产三级精品三级在线观看| 久久精品嫩草研究院| 日韩精品无码免费一区二区三区 | 久久国产黑丝袜视频| 色婷婷久久| 啪啪国产视频| 国产免费精彩视频| 日韩精品欧美国产在线| 国产成本人片免费a∨短片| 国产色伊人| 超薄丝袜足j国产在线视频| 国产第三区| 欧美日韩高清| 污污网站在线观看| 成人午夜精品一级毛片| 国产美女叼嘿视频免费看| 91极品美女高潮叫床在线观看| 亚洲天堂免费观看| 中文字幕久久精品波多野结| 欧美一级黄片一区2区| 亚洲欧美日韩成人在线| 欧洲日本亚洲中文字幕| 一本大道东京热无码av | 91在线丝袜| 色视频国产| 国产欧美高清| 国产精品免费电影| 毛片网站在线播放| 成人午夜福利视频| 无码aⅴ精品一区二区三区| 国产特级毛片| 又爽又大又光又色的午夜视频| 亚洲国模精品一区| 国产色爱av资源综合区| 亚洲天堂福利视频| 91色在线观看| 国产精品第| 曰AV在线无码| 中文字幕天无码久久精品视频免费| 在线免费a视频| 午夜精品久久久久久久无码软件| 爱色欧美亚洲综合图区| 久久精品中文无码资源站| 91久久偷偷做嫩草影院电| 国产二级毛片| 国产精品入口麻豆| 99久久国产综合精品2020| 色久综合在线| 亚洲综合色婷婷| 亚洲无码电影| 永久成人无码激情视频免费|