秦臻楠


[摘? ? ? ? ? ?要]? 隨著信息技術(shù)的迅速發(fā)展,智能語音技術(shù)已日漸成熟并被廣泛地應(yīng)用到語言類課程的教學(xué)中,但是在導(dǎo)游教學(xué)中應(yīng)用較少。導(dǎo)游講解是導(dǎo)游的核心技能之一,是學(xué)生未來從事導(dǎo)游崗位工作的必備技能。智能語音技術(shù)的出現(xiàn),不僅能夠有效提高學(xué)生的導(dǎo)游詞寫作能力和導(dǎo)游語言表達能力,還是對現(xiàn)在的導(dǎo)游講解訓(xùn)練方式和評價模式的顛覆性變革。以導(dǎo)游VR智慧教學(xué)系統(tǒng)為例,闡述了智能語音技術(shù)中的語音識別技術(shù)和語音評測技術(shù)在導(dǎo)游講解實訓(xùn)教學(xué)中的應(yīng)用。
[關(guān)? ? 鍵? ?詞]? 智能語音技術(shù);導(dǎo)游講解實訓(xùn);智慧教學(xué)系統(tǒng)
[中圖分類號]? G712? ? ? ? ? ? ? ? ? ?[文獻標(biāo)志碼]? A? ? ? ? ? ? ? ? ? ? ? [文章編號]? 2096-0603(2020)52-0228-02
智能語音技術(shù)是人工智能技術(shù)的重要領(lǐng)域,其研究可追溯到20世紀(jì)50年代。隨著信息技術(shù)的迅速發(fā)展,如今的智能語音技術(shù)已經(jīng)非常成熟,并且得到了廣泛的應(yīng)用。導(dǎo)游講解是導(dǎo)游的核心技能之一,是學(xué)生未來從事導(dǎo)游崗位工作的必備技能。導(dǎo)游講解技能的形成取決于學(xué)生的景區(qū)景點知識水平、景區(qū)導(dǎo)游詞寫作水平、語言表達能力和即時應(yīng)變能力。在導(dǎo)游講解技能中,語言表達能力是導(dǎo)游講解的核心,是學(xué)生學(xué)習(xí)的難點。基于智能語音技術(shù)的導(dǎo)游VR智慧教學(xué)系統(tǒng)為學(xué)生提供了可以進行自主學(xué)習(xí)與訓(xùn)練的情境,使學(xué)生在不斷反復(fù)的強化訓(xùn)練中提升語言表達能力,進而提高導(dǎo)游詞寫作能力。
一、智能語音技術(shù)概述
智能語音技術(shù)是實現(xiàn)人機語言的通信,包括語音識別技術(shù)、語音合成技術(shù)和語音評測技術(shù)。語音識別(Automatic Speech Recognition,ASR)技術(shù)是指讓計算機能夠接受、識別和理解人的言語信息,將語音信息自動轉(zhuǎn)換成相應(yīng)文本信息或命令的技術(shù),實現(xiàn)人機交互的輸入;語音合成(Text To Speech,TTS)技術(shù)是指讓計算機能夠像人一樣說話,將文本信息自動轉(zhuǎn)換成語音信息的技術(shù),實現(xiàn)人機交互的輸出[1];語音評測(Automatic Speech Certification,ASC)技術(shù)可以實現(xiàn)自動對發(fā)音人語音水平評價、缺陷定位和問題分析,是近年來智能語音技術(shù)出現(xiàn)的第三個分支[2]。
本系統(tǒng)中主要運用了語音識別技術(shù)和語音測評技術(shù)。
(一)智能語音技術(shù)的人機交互原理
智能語音技術(shù)的人機交互種類主要包括語音識別、語音合成和語音評測。大部分智能語音系統(tǒng)的人機交互過程一般從語音識別開始,系統(tǒng)成功接收語音信息后,通過預(yù)設(shè)的算法將其轉(zhuǎn)換為文本信息,完成人機交互中的輸入;在語音信息全部輸入后,語音評測技術(shù)開始將輸入的語音信息和系統(tǒng)語料庫進行比對,根據(jù)預(yù)設(shè)的評測標(biāo)準(zhǔn)輸出評測結(jié)果;語音合成技術(shù)則是將文本信息再次轉(zhuǎn)換為人造語音信息,實現(xiàn)人機交互中的輸出[3]。
(二)智能語音技術(shù)在教學(xué)中的應(yīng)用現(xiàn)狀
近年來,隨著我國語音識別技術(shù)和語音測評技術(shù)的飛速發(fā)展,智能語音技術(shù)在語言類教學(xué)中得到了廣泛的應(yīng)用,如英語教學(xué)中的各類口語學(xué)習(xí)軟件、普通話教學(xué)中的普通話水平測試軟件等,這些基于智能語音技術(shù)的教學(xué)軟件在很大程度上激發(fā)了學(xué)生的語言學(xué)習(xí)興趣,提升了教學(xué)效果。
在知網(wǎng)中以“智能語音技術(shù)”“智能語音系統(tǒng)”“語音識別技術(shù)”“語音評測技術(shù)”為搜索關(guān)鍵詞,發(fā)現(xiàn)與教學(xué)相關(guān)的文獻較少,其中大部分是針對英語教學(xué)、普通話教學(xué)的研究,沒有與導(dǎo)游教學(xué)相關(guān)的文獻研究。在實際導(dǎo)游教學(xué)中,智能語音技術(shù)的應(yīng)用只是作為豐富課堂的一些教學(xué)手段,如訊飛輸入法的語音轉(zhuǎn)換功能、景區(qū)的語音導(dǎo)覽服務(wù)等,缺少一個功能完整的教學(xué)系統(tǒng)。
二、智能語音技術(shù)在導(dǎo)游VR智慧教學(xué)系統(tǒng)中的應(yīng)用
導(dǎo)游VR智慧教學(xué)系統(tǒng)是我校自主開發(fā)的一款智能導(dǎo)師系統(tǒng),該系統(tǒng)整合了虛擬仿真資源、多媒體資源、智能語音功能等,其中智能語音功能是本系統(tǒng)最大的特色。利用語音識別技術(shù)實現(xiàn)了講解語音到導(dǎo)游詞文本的智能轉(zhuǎn)換,基于知識圖譜和語音語料庫能夠?qū)?dǎo)游詞的智能批改;借助語音評測技術(shù),對導(dǎo)游講解進行智能評價和即時反饋。
(一)語音識別技術(shù)的應(yīng)用
語音識別系統(tǒng)的搭建包括兩個階段:數(shù)據(jù)訓(xùn)練階段、模型匹配識別階段。在數(shù)據(jù)訓(xùn)練階段,首先對提前收集的語音語料庫進行信號處理和特征挖掘,得到語音識別階段所需的語言模型和聲學(xué)模型[4]。因此,語料庫的設(shè)計顯得尤為重要。
1.語音語料庫的設(shè)計
語音語料庫是指計算機中存儲語言音頻文件和文字副本的數(shù)據(jù)庫。本系統(tǒng)采用了基于語料庫的語音識別系統(tǒng),本系統(tǒng)中的語音識別屬于大詞匯量的連續(xù)語音識別,在設(shè)計這類語音識別系統(tǒng)的語音語料庫時,應(yīng)當(dāng)有目的地選擇恰當(dāng)?shù)?、能盡可能涵蓋各種自然語言現(xiàn)象的語料,以提高語音識別的質(zhì)量和效率[5]。
根據(jù)導(dǎo)游證考證的要求,我們設(shè)計了普通話和英語雙語語音語料庫??紤]到江蘇地區(qū)五年制中高職旅游專業(yè)學(xué)生的普通話水平和英語口語水平參差不齊,適當(dāng)降低了對發(fā)音標(biāo)準(zhǔn)度的要求,在我校旅游管理專業(yè)三年級學(xué)生中挑選了6位學(xué)生(3男和3女)朗讀了無錫市導(dǎo)游證考證的11篇中文導(dǎo)游詞范文和5篇英文導(dǎo)游詞范文,這些學(xué)生均已通過導(dǎo)游考證且普通話和英語口語處于中等偏上水平,這在一定程度上增強了語音識別的有效性。
2.導(dǎo)游詞的智能轉(zhuǎn)換與批改
在傳統(tǒng)的導(dǎo)游講解訓(xùn)練中,導(dǎo)游詞寫作采用的是“先寫后說”的訓(xùn)練方式,學(xué)生先寫出導(dǎo)游詞文本,由教師批改后學(xué)生進行背誦、講解,這種方式寫出的導(dǎo)游詞通常比較書面化,學(xué)生不容易背誦,講解時也比較生硬。
為了解決這一問題,導(dǎo)游VR智慧教學(xué)系統(tǒng)設(shè)計了基于語音識別技術(shù)的導(dǎo)游詞智能轉(zhuǎn)換與批改功能。學(xué)生利用系統(tǒng)的語音轉(zhuǎn)換功能,將自己口述的導(dǎo)游詞語音錄入系統(tǒng)并實時轉(zhuǎn)換成文本。系統(tǒng)對這些文本進行智能批改,將語法錯誤、錯別字等問題以不同的形式進行標(biāo)注,學(xué)生根據(jù)系統(tǒng)給出的批改結(jié)果進行反復(fù)的修改與訓(xùn)練,形成更加生動、流暢的導(dǎo)游詞。該功能的實現(xiàn),有效提升了學(xué)生的導(dǎo)游詞寫作能力,創(chuàng)新了“先說后寫”的講解訓(xùn)練模式。
(二)語音評測技術(shù)的應(yīng)用
1.語音評測的基本框架與流程
語音評測首先需要構(gòu)建語音模型和評分映射模型。該技術(shù)基于一個標(biāo)準(zhǔn)發(fā)音的語音語料庫,在獲取標(biāo)準(zhǔn)發(fā)音數(shù)據(jù)后,提取其語音特征,進而構(gòu)建語音模型,使計算機能夠自動判斷哪些是標(biāo)準(zhǔn)發(fā)音,哪些是不標(biāo)準(zhǔn)發(fā)音。語音評測研究包括標(biāo)準(zhǔn)發(fā)音模型的建立、發(fā)音的音段韻律質(zhì)量分析和人工評分映射訓(xùn)練等核心內(nèi)容[6],語音評測基本框架如圖2所示。
語音評測的流程是:系統(tǒng)在接受學(xué)生的語音輸入后,首先提取其語音特征,然后用語音語料庫中的語音模型對語音特征進行音段切分(通常采用Viterbi算法),接著在音段上計算出各種發(fā)音質(zhì)量測度,最后用訓(xùn)練好的評分映射模型,把發(fā)音質(zhì)量測度轉(zhuǎn)換為直觀的分數(shù)[7]。
2.導(dǎo)游講解智能評價
目前導(dǎo)游講解的評價模式主要采用主觀性評價,評分完全依賴教師的主觀判斷,在實際教學(xué)中,這種評測方式存在兩個比較明顯的問題:(1)主觀性評價對教師來說耗時耗力,評價效率較低。(2)盡管有統(tǒng)一的評分標(biāo)準(zhǔn),但受到教師自身的語言水平、主觀喜好等諸多因素的影響,不可避免地會出現(xiàn)評分偏差,從而影響評分的可靠性和公正性。
為了解決這兩個問題,系統(tǒng)加入了導(dǎo)游講解智能評價功能,利用語音評測技術(shù),系統(tǒng)自動對學(xué)生的講解語音進行錄制,然后將講解語音與語音語料庫中的標(biāo)準(zhǔn)發(fā)音進行分析對比,根據(jù)預(yù)設(shè)的評分標(biāo)準(zhǔn)給出評測分數(shù),并將系統(tǒng)無法識別的語音文字、錯誤的發(fā)音文字等進行標(biāo)注,學(xué)生根據(jù)評分和錯誤提示及時糾正自己的錯誤,提升導(dǎo)游語言表達能力。在該功能的設(shè)計上,我們參考了普通話水平測試系統(tǒng),本系統(tǒng)中的語音評測目前僅針對學(xué)生導(dǎo)游講解時的講解流暢度和發(fā)音標(biāo)準(zhǔn)度進行評價,考慮到導(dǎo)游講解的特殊性,后期還應(yīng)加入針對講解語調(diào)和情緒的評價。
語音評測功能可以及時反饋學(xué)生的學(xué)習(xí)情況,能夠讓學(xué)生了解自身存在的問題,從而進行有目的的矯正練習(xí)。教師在課上可以借助語音評測功能了解學(xué)生的導(dǎo)游講解水平,學(xué)生在課前或課后也可以利用語音評測功能進行講解訓(xùn)練,既減輕了教師的負擔(dān),又增強了評測的可靠性和公正性。
(三)應(yīng)用效果分析
導(dǎo)游VR智慧教學(xué)系統(tǒng)在我校旅游管理專業(yè)3年級80名學(xué)生的導(dǎo)游講解實訓(xùn)中進行了初步應(yīng)用,并取得了一定的效果。
1.語音識別的準(zhǔn)確度
經(jīng)過測試,當(dāng)學(xué)生的講解比較流利且普通話比較標(biāo)準(zhǔn)時,識別率一般都能達到95%以上。對于系統(tǒng)不能識別的字符,我們設(shè)置了一些特殊符號以提醒學(xué)生及時修改;對于一些生僻字、專用詞,修改后還可以對語料庫進行補充,不斷提高語音識別的準(zhǔn)確度。
2.語音評測的可信度
為了檢測語音評測系統(tǒng)的可信度,我們邀請了5位不同年齡和性別的導(dǎo)游教師對學(xué)生的導(dǎo)游講解進行了人工評價,測試表明:系統(tǒng)智能語音測評結(jié)果與人工評分一致性較高。
3.學(xué)生滿意度調(diào)查
在使用導(dǎo)游VR智慧教學(xué)系統(tǒng)一個學(xué)期后,我們對試用了該系統(tǒng)的學(xué)生進行抽樣調(diào)查,結(jié)果表明,96%的學(xué)生更愿意使用導(dǎo)游VR智慧教學(xué)系統(tǒng)進行導(dǎo)游講解訓(xùn)練,94%的學(xué)生認為該系統(tǒng)能夠有效提高自己的語言表達能力和導(dǎo)游寫作能力。
三、結(jié)語
作為一種成熟的新型信息技術(shù),智能語音技術(shù)顛覆了傳統(tǒng)的導(dǎo)游講解訓(xùn)練方式和評價模式。本研究針對當(dāng)前導(dǎo)游講解訓(xùn)練中存在的導(dǎo)游詞記憶困難、講解生硬等問題,設(shè)計了基于智能語音技術(shù)的導(dǎo)游VR智慧教學(xué)系統(tǒng),應(yīng)用效果表明該系統(tǒng)能夠有效提高學(xué)生的導(dǎo)游語言表達能力和導(dǎo)游詞寫作能力。目前,該系統(tǒng)在智能語音功能方面尚不完整,缺少語音合成功能。如何借助語音合成技術(shù),實現(xiàn)學(xué)生與系統(tǒng)之間的人機對話,創(chuàng)設(shè)更加真實的導(dǎo)游講解訓(xùn)練情境,將是下一步研究的重點。
參考文獻:
[1]張筱蘭,王保論.智能語音技術(shù)在教學(xué)中的應(yīng)用研究[J].現(xiàn)代教育技術(shù),2011,21(11):1.
[2]黃楠.智能語音技術(shù)在小學(xué)英語教學(xué)中的應(yīng)用研究[D].南昌:南昌大學(xué),2016.
[3]郝惠萍.智能語音教具系統(tǒng)在英語教學(xué)中的應(yīng)用研究[D].蘭州:西北師范大學(xué),2012.
[4]顧亞平.基于智能語音交互技術(shù)的智慧語音助理系統(tǒng)實現(xiàn)[D].南京:南京郵電大學(xué),2015.
[5]鄒法欣.語音語料庫的設(shè)計與實現(xiàn)[D].桂林:廣西師范大學(xué),2012.
[6]梁迎麗,梁英豪.基于語音評測的英語口語智能導(dǎo)師系統(tǒng)研究[J].現(xiàn)代教育技術(shù),2012,22(11):2.
[7]劉慶升.計算機輔助普通話發(fā)音評測關(guān)鍵技術(shù)研究[D].合肥:中國科學(xué)技術(shù)大學(xué),2010.
◎編輯 魯翠紅