王曉茹
(咸陽(yáng)師范學(xué)院 外國(guó)語學(xué)院,咸陽(yáng) 712000)
移動(dòng)信息技術(shù)的快速發(fā)展,使得在線教育方式發(fā)生了變化,越來越多的學(xué)習(xí)者傾向于隨時(shí)隨地的學(xué)習(xí)模式,這就要求移動(dòng)端的學(xué)習(xí)軟件要有更為強(qiáng)大的功能。隨著智能技術(shù)性能的提升,準(zhǔn)確的語音識(shí)別使得英語聽說軟件的研發(fā)成為可能,并可以根據(jù)深度學(xué)習(xí)模式為用戶提供合理的課程推送。本文主要對(duì)英語聽說自主學(xué)習(xí)軟件的總體架構(gòu)進(jìn)行了介紹,并且對(duì)軟件的需求分析進(jìn)行了詳細(xì)的說明。
移動(dòng)學(xué)習(xí)在國(guó)內(nèi)外已經(jīng)得到了廣泛的應(yīng)用,歐盟為了提升國(guó)民的教育程度,研究推廣了M-Learning系統(tǒng),該系統(tǒng)能夠?yàn)槿藗冊(cè)谌魏蔚攸c(diǎn)任何時(shí)候提供所需要的學(xué)習(xí)內(nèi)容,解決了落后地區(qū)以及貧困家庭的青年人接受教育的問題。國(guó)外相關(guān)研究機(jī)構(gòu)對(duì)語音識(shí)別引擎有較為深入的研究,主要采用基于神經(jīng)網(wǎng)絡(luò)的語音識(shí)別手段提升了語音識(shí)別的準(zhǔn)確率,推進(jìn)了英語在線學(xué)習(xí)的普及。國(guó)內(nèi)在線教育的發(fā)展主要集中于近幾年,主要開發(fā)了一系列的手機(jī)App應(yīng)用,如科大訊飛公司的識(shí)別引擎,是國(guó)內(nèi)較領(lǐng)先的語音識(shí)別工具,并以此為基礎(chǔ),相關(guān)公司機(jī)構(gòu)開發(fā)了大量的英語學(xué)習(xí)軟件[1-5]。
在線英語聽說學(xué)習(xí)軟件的核心是語音識(shí)別引擎,此類引擎主要采用隱馬爾科夫算法實(shí)現(xiàn)對(duì)數(shù)據(jù)的自學(xué)習(xí),形成強(qiáng)大的模板庫(kù),根據(jù)用戶的個(gè)性化輸入形成特定的用戶庫(kù),并能夠按時(shí)地為用戶推送更新的學(xué)習(xí)方案。本文基于語音識(shí)別引擎,基于B/S軟件體系架構(gòu),利用開源軟件的優(yōu)勢(shì),將識(shí)別算法進(jìn)行了集成,并對(duì)主要的功能需求進(jìn)行了介紹。
英語聽說自主學(xué)習(xí)軟件的搭建采用基于B/S的體系架構(gòu),系統(tǒng)的體系架構(gòu)圖,如圖1所示。
調(diào)用語音識(shí)別引擎通過Apache服務(wù)器為用戶提供英語學(xué)習(xí)服務(wù),其中數(shù)據(jù)庫(kù)主要包括用戶管理數(shù)據(jù)庫(kù)、基礎(chǔ)單詞數(shù)據(jù)庫(kù)以及語法數(shù)據(jù)庫(kù)等,分別用于管理該系統(tǒng)用戶信息(基本信息、學(xué)習(xí)信息、課程安排信息等)、基礎(chǔ)單詞信息(單詞拼寫、一詞多義等信息)以及語法信息(常用的語法信息、關(guān)聯(lián)信息等),通過在服務(wù)器端的運(yùn)行語音識(shí)別引擎以及智能化處理中間件,對(duì)用戶的英語語句按照語法規(guī)定進(jìn)行判別準(zhǔn)確性。

圖1 系統(tǒng)架構(gòu)圖
Apache的工作原理采用的是用戶使用URL來請(qǐng)求對(duì)應(yīng)的資源,服務(wù)器端會(huì)根據(jù)用戶請(qǐng)求按照程序相應(yīng)的識(shí)別算法進(jìn)行操作,并將所找到的資源返回給客戶端,即為完成一次請(qǐng)求;隨后等待下一次請(qǐng)求,由于Apache服務(wù)器可同時(shí)為數(shù)百萬用戶提供服務(wù),因此在基于B/S架構(gòu)的海量用戶的系統(tǒng)中常用。
基線模型是一種類似于文獻(xiàn)[6]描述的混合的基于隱馬爾可夫的神經(jīng)網(wǎng)絡(luò)模型(Neural Network-Hidden Markov Model,NN-HMM)模型。NN計(jì)算給出每個(gè)輸入特征向量的所有HMM狀態(tài)的后驗(yàn)概率,NN輸入是由多個(gè)連續(xù)幀的窗口內(nèi)的所有語音特征向量組成的超級(jí)向量;該模型在不使用任何揚(yáng)聲器標(biāo)簽信息的情況下進(jìn)行訓(xùn)練。NN訓(xùn)練目標(biāo)是HMM狀態(tài)標(biāo)簽,使用標(biāo)準(zhǔn)的反向傳播程序來優(yōu)化,將交叉熵用作目標(biāo)函數(shù)的NN權(quán)重。如圖2的右側(cè)所示。

圖2 基于語音代碼的自適應(yīng)識(shí)別混合NN-HMM模型

本系統(tǒng)的智能識(shí)別算法的優(yōu)點(diǎn)是只需要為每個(gè)新的揚(yáng)聲器估計(jì)一個(gè)小的揚(yáng)聲器代碼;當(dāng)為每個(gè)揚(yáng)聲器選擇一個(gè)小揚(yáng)聲器代碼時(shí),這種算法大大減少了每段揚(yáng)聲器代碼所需的適應(yīng)數(shù)據(jù)量。因此,基于每個(gè)揚(yáng)聲器只有幾個(gè)話語,可以對(duì)混合NN-HMM模型進(jìn)行非常快速的用戶自適應(yīng)。另一方面,如果每個(gè)揚(yáng)聲器有大量合適數(shù)據(jù)可用,則揚(yáng)聲器代碼的大小可以增加以允許更好地表示每個(gè)揚(yáng)聲器;此外,使用所有數(shù)據(jù)來訓(xùn)練通用自適應(yīng)NN。這樣可以建立一個(gè)足夠強(qiáng)大的大規(guī)模自適應(yīng)神經(jīng)網(wǎng)絡(luò)來模擬不同特征空間之間的復(fù)雜變換函數(shù)。 這種方法明顯優(yōu)于其他用戶自適應(yīng)方法,它們?yōu)槊總€(gè)用戶學(xué)習(xí)完全獨(dú)立的變換,其中每個(gè)變換都需要線性化。
軟件主要分為后臺(tái)和前臺(tái)部分,根據(jù)軟件的實(shí)際需求設(shè)計(jì)后臺(tái)及前臺(tái)的功能模塊。其中后臺(tái)模塊主要完成用戶管理、數(shù)據(jù)管理以及系統(tǒng)運(yùn)維等工作;前臺(tái)模塊主要為客戶操作模塊,包含用戶登錄、英語聽說以及朋友圈等功能,功能組成結(jié)構(gòu),如圖3所示[7-8]。

圖3 系統(tǒng)功能模塊組成圖
2.3.1 后臺(tái)功能介紹
(1)用戶管理模塊
該模塊主要完成管理人員的操作響應(yīng),包括系統(tǒng)管理員的賬號(hào)、密碼、郵箱等信息。包含對(duì)管理員的基本管理,如增加、刪除等。通過超級(jí)管理員角色進(jìn)入系統(tǒng)后臺(tái),然后完成對(duì)以上功能的執(zhí)行,而普通管理員只可完成一些常用基礎(chǔ)數(shù)據(jù)的管理工作。
(2)數(shù)據(jù)管理模塊
數(shù)據(jù)管理模塊主要包含數(shù)據(jù)錄入和數(shù)據(jù)下載兩個(gè)主要功能。其中數(shù)據(jù)錄入功能主要將系統(tǒng)所需基礎(chǔ)數(shù)據(jù)進(jìn)行錄入,比如常用的單詞、語法規(guī)則信息等,主要包含課本管理、文章管理以及語句管理等單元;數(shù)據(jù)下載模塊是響應(yīng)用戶URL的請(qǐng)求,在Apache服務(wù)器上完成資源下載的分配,并將客戶請(qǐng)求的信息返回。
(3)系統(tǒng)運(yùn)維模塊
系統(tǒng)運(yùn)維模塊主要是系統(tǒng)管理員完成對(duì)系統(tǒng)擴(kuò)展、性能優(yōu)化等工作,包含對(duì)系統(tǒng)前臺(tái)及后臺(tái)接口的維護(hù),如語句接口定義,如表1所示。

表1 語句的接口詳細(xì)參數(shù)
客戶端可通過以上接口完成對(duì)所需數(shù)據(jù)的獲取。
2.3.2 前臺(tái)功能介紹
(1)用戶登錄模塊
用戶在輸入用戶名密碼后,會(huì)向服務(wù)器發(fā)送響應(yīng)的請(qǐng)求,請(qǐng)求消息可定義為
(2)英語聽說模塊
英語聽說模塊包含選取文本語句、播放原生語句、錄音、播放語音等功能,用戶根據(jù)自身需要選取不同的功能按鈕,服務(wù)端根據(jù)用戶的請(qǐng)求結(jié)合語音識(shí)別引擎完成用戶響應(yīng)。該模塊作為軟件的主要功能,占據(jù)了系統(tǒng)功能需求的80%。
(3)朋友圈模塊
學(xué)習(xí)圈的建立對(duì)于學(xué)員學(xué)習(xí)主動(dòng)性的提升有較大的影響,因此該軟件設(shè)計(jì)了朋友圈模塊,學(xué)員可每天將自己的學(xué)習(xí)經(jīng)驗(yàn)、心得在好友圈里進(jìn)行分享,并且支持與好友的在線聊天功能,聊天功能采用XMPP通信協(xié)議采用如下方式對(duì)報(bào)文進(jìn)行封裝。
from =Lily@sina.com/local.local to =Hanmm@sina.com/local.local type =“chat” xml:lang =“en”;
“你好,你今天英語第二課程學(xué)習(xí)狀況如何”(消息內(nèi)容)
消息采用XML結(jié)構(gòu)化形式進(jìn)行封裝,在服務(wù)端接收到該XML信息后對(duì)其進(jìn)行解析,并將信息內(nèi)容發(fā)送到目的方。
系統(tǒng)運(yùn)行后功能界面,如圖4所示。

圖4 系統(tǒng)運(yùn)行界面
2.3.3 用戶使用流程
用戶使用流程,如圖5所示。

圖5 用戶使用流程圖
本文主要介紹了英語聽說自主學(xué)習(xí)軟件的總體架構(gòu),以及對(duì)關(guān)鍵的智能語音識(shí)別技術(shù)進(jìn)行了簡(jiǎn)單的介紹,從系統(tǒng)后臺(tái)功能以及系統(tǒng)前臺(tái)功能介紹了軟件的主要功能需求,并且各個(gè)功能的關(guān)鍵交互架構(gòu)進(jìn)行了簡(jiǎn)要說明。