蘆展華 喻瑩 莊甲鵬 楊佳泰 鄭世玨



關鍵詞:高校思政課;高校虛擬教師;語音識別及合成;答疑數據庫;小雅智能助教平臺
中圖分類號:TP311 文獻標識碼:A
文章編號:1009-3044(2023)12-0105-04
0 引言
高校思政課是我國落實立德樹人根本任務的關鍵課程,是為國育人、為黨育才的關鍵步驟[1]。2016年習近平總書記在全國高校思想政治工作會議上明確指出:“要運用新媒體新技術使工作活起來,推動思想政治工作將傳統優勢同信息技術高度融合,增強時代感和吸引力。”[2]
新媒體以數字化為主要特征,呈現出及時性、互動性、共享性等特點,高校思政課程具有內容廣泛、理論深刻的特征,因此,借助人工智能的相關技術為高校學生的思想政治教育賦能是一項極佳的選擇。2021年北京理工大學在VR+思政課領域率先建成大規模沉浸式虛擬仿真思政課體驗教學中心[3]。在美國加利福尼亞大學,JOHNSON W L和SHAW E研發了虛擬教學代理Adele,并成功應用于教授醫學專業外傷及腫瘤課程。針對教學問答輔助系統的發展現狀,中南財經政法大學的陳宇對實際課堂中獲取的數據進行分析處理,為學生提供了問答檢索的服務,驗證了問答形式對于教學的輔助效果[4]。
針對高校學生對思政課程的問題與建議,筆者進行了走訪調查,了解到主要問題如下:高校思政課程內容與中學所學部分重復度較高,思政課大班教學的模式限制師生交流互動,學生學習方法缺乏靈活性。為解決以上問題,高校思政課需要引入新技術、新模式、新方法,故如何設計出高藝術性與高吸引力的智慧課堂成為高校教師積極探索的熱點。
對于上述現狀,本文嘗試將高校思政課程引入智慧課堂新模式,借助語音識別及合成技術,搭載科大訊飛API實現語音交互,通過構建虛擬教師形象,在原有小雅智能助教平臺的基礎上,設計高校思政虛擬教師答疑數據庫,實現了高校思政虛擬教師答疑系統,改變傳統的人機交互模式,增強高校思政課程的趣味性及靈活性,提高學生對思政教育的熱情和興趣,打破傳統模式下師生交流的時空壁壘,充分發揮高校學生在思政教育中的主體地位。
1 系統的相關技術
1.1 小雅智能助教平臺
小雅平臺是由教育大數據應用技術國家工程研究中心和華中師范大學共同研發的云端一體化智能教育SPOC 平臺,如圖1所示,該平臺構建了智能問答、知識圖譜等多個智能模塊,支持伴隨式采集教學數據和數據驅動分析。目前小雅平臺已完成在華中師范大學、武漢理工大學等多個高校的部署,用戶人數持續上升,開設課程4.5萬余門,涵蓋校內各類教育資源220萬余個。小雅平臺作為連接師生的智能終端,支持多種教學模式,學生可以借助平臺隨時隨地對課程內容進行學習,教師可以通過平臺布置課程任務、分派小組學習等。根據學生的學習情況,小雅平臺將學生的學情進行數字化分析并加以可視化呈現,助力學生查漏補缺,加強對知識體系的掌握,同時幫助教師實施精準化差異教學。本文以小雅平臺作為研究載體,用新媒體技術提高虛擬課堂的輔助教學效果,讓高校思政教育更加智能、便捷。
1.2 語音識別及語音合成方法
本文研究主要涉及智能語音技術中的自動語音識別技術(ASR,Automatic Speech? Recognition) 和語音合成技術(TTS,Text To Speech) :語音識別技術主要用于實現讓計算機“聽懂”人類發出的聲音,即將人的音頻轉換為文本信息的技術;語音合成技術主要用于實現讓計算機像人類一樣“會說”,即通過機械的、電子的方法將文本信息轉換為人造語音的技術。借助語音識別及語音合成技術,使得虛擬教師和高校學生之間的人機交互更加簡明快捷,智能語音交互系統結構圖如圖2所示。
科大訊飛提供了智能語音開發技術的應用程序編程接口(API,Application Programming Interface)。本文將采用科大訊飛API作為語音識別及語音合成的技術支持,將其API直接嵌入整體系統中,當用戶使用高校思政虛擬教師系統進行語音提問時,通過網絡直接訪問科大訊飛平臺,調用其語音識別API,將轉換后的文本信息返回傳遞給系統;在系統查詢得到正確的回答對話后,再次通過網絡訪問科大訊飛平臺,調用其語音合成API,將回答對話的文本信息轉換為音頻信息。通過調用科大訊飛API,極大地簡化了虛擬教師答疑系統的搭建過程,提高系統整體語音技術的響應速度。
1.3 Okapi BM25算法
系統在數據庫中匹配學生問題的正確率是影響系統使用效果的關鍵因素,匹配正確率的高低將直接影響系統為學生解答的有效性及幫助程度。因此,本系統采用BM25(Best Matching 25) 算法進行學生問題和數據庫問答表中問題的匹配。BM25算法多用于搜索相關性的評分,系統使用BM25算法將語音識別得到的問題文本與答疑數據庫中的問題文本進行相關性評分,并將得分高于某一預設值的問題視為用戶提問的問題,調出其預先存儲的答案文本,從而實現系統在答疑數據庫中的一次查詢。
2 系統總體設計
2.1 系統總體框架設計
本系統總體架構層次設計如圖3所示:客戶端層用于獲取用戶信息,互聯網層用于提供網絡信息。虛擬教師系統依托于華中師范大學小雅平臺,其內部共分為四個層次,分別為前臺界面層、核心計算處理層、數據管理層和系統信息安全層。其中的數據管理層用于存放各類資源和數據,同時也是對前臺用戶提交的請求進行響應的區域,是本文的研究重點。
數據管理層可以細分為四個子層:系統數據管理子層用于存儲系統自身相關數據,如系統軟件數據等;資源管理子層用于將各種資源(原始資源、處理后的資源)和數據等存放在既定的邏輯區域中,以便更好地對各種資源進行管理;問答數據管理子層負責整合并存放所有的問題及其對應的答案,以便后續更好地查詢題目;個人數據管理子層存放著學生的個人基本信息等與學生有關的數據[7]。
2.2 答疑數據庫設計
MySQL是一種關系型數據庫管理系統,其管理的數據庫將數據保存在不同的表中,從而增加了速度并提高了靈活性[8]。本文將使用MySQL作為系統后臺數據庫的管理系統,用于存儲大量有關虛擬教師思政課知識問答對話等信息,借助MySQL查詢速度快、支持多線程等特點,提高系統的整體性能。
在本文設計的系統中,建立答疑數據庫是搭建整個系統的重要環節。系統對學生幫助的程度及有效性,取決于系統的答疑數據庫。數據庫中的信息越完善,越能真實復現教師的思維過程、解題方法等,進而答疑系統的輔助教學效果越強[9]。
本文整體以高校思政課程知識答疑為背景,故系統答疑數據庫主要針對高校大學生思政課程學習內容等方面的情況進行數據庫的設計及構造。在建立答疑數據庫之前進行相關調研活動,并整合歸納出對應數據模型,設計出如圖4所示系統E-R圖。
2.3 答疑數據庫的建立及系統設計
系統答疑功能主要借助答疑數據庫實現,而在答疑數據庫構造前,需要先構建知識庫。知識庫是用于知識管理的一種特殊數據庫,能夠對相關知識進行有效整合與轉化,使知識在答疑數據庫內部進行傳遞和應用。系統想要很好地實現答疑功能,就要兼具以下兩個功能:①作為知識的來源;②作為衡量學生知識掌握情況的一個標準。因此,采用有效而統一的結構來組織存儲知識、較為完整地表示知識內容,是答疑數據庫結構合理、有效性強、覆蓋知識面廣的前提條件。根據分析,本文在建立答疑數據庫前先建立如圖5所示的知識庫,系統將使用專家模塊的知識響應學生行為,并生成相關問題分析。
本文答疑數據庫主要針對高校大學生對于思政課程存在的問題進行數據庫的設計與構造。通過走訪等相關調研活動,設計出高校思政課虛擬教師答疑系統的E-R 圖。故系統整體建立一個數據庫VRTeacher,該數據庫中包含如下幾個表:學生信息表、學生行為表、學生成績表、學習記錄表、課程表、知識點表、常用對話表、問答題表、使用記錄表。基于對E-R關系圖的分析,轉化出如下幾個關系模式:
學生信息(學號、真實姓名、密碼、用戶、專業、年級)
學生行為記錄(學號、登錄時間、登錄次數、累積登錄時長)
學生成績(學號、試卷編號、試卷得分)
課程學習記錄(學號、當前學習知識點、已學習且通過測試的知識點)
知識點信息(知識點序號、知識點主題、知識點關鍵詞、知識點內容、知識點難度、所屬課程)
常用對話(對話編號、對話內容、使用次數、對話關鍵詞)
課程(課程編號、課程名稱、課程難度)
課程問題(課程名稱、創建者、創建時間)
答疑問題(問題編號、問題內容、問題答案、關鍵詞、所屬課程編號、難度、使用次數、知識點編號、問題分析)
如圖6所示是問答題表中的兩條記錄示例,其中:Qno指問題編號,Que指問題內容,Ans指問題答案,KeyWord指關鍵詞,ClassNo指所屬課程編號,Deg指難度,Fre指問題使用次數,KnoNo指知識點編號,Anyl 指問題分析。其他表單以此類推,不再一一列舉。
2.4 語音調用及實現
本文人機交互多基于語音交互實現,系統的語音調用及實現過程歸納如圖7所示:
1) 語音識別
系統通過麥克風采集用戶提問的音頻;計算機對音頻信息進行A/D轉換等預處理;之后對采集的音頻進行語音信號特征的抓取,提取出反映語音特征的矢量序列;對提取到的矢量序列進行模式匹配,把輸入的語音特征同模板庫中的模型進行匹配,將最佳匹配對象作為識別結果,得到最終的文本信息[10]。
對于語音識別功能模塊,我們選擇調用科大訊飛的接口,獲取所需應用的Appid 及secretkey,通過在demo.js中的play函數傳遞所獲得的信息取得與科大訊飛平臺的對接[11]。調用函數onResults(ArrayList results, Boolean isLast)獲取識別后的結果,其中,ArrayList 是語音識別后的結果,isLast 是用于判斷識別的文本是否讀完的標志變量。麥克風采集音頻信息后,將得到的參數通過網絡傳到語音API分析器中,并將返回的結果放入result的臨時變量中,同時將結果做相應的正則表達式處理得到最終的分析結果。
2) 問題匹配
當系統API識別成功后,將轉換后的文本傳至虛擬教師系統。系統將獲取到的問題文本與答疑數據庫中的問答表中的問題一一借助BM25算法進行相關性評分,將得分最高的問題作為用戶提出的問題,將其答案返回給系統。
3) 語音合成
系統對于獲得的答案文本,首先對其進行文本分析,將文本分析得到的參數用于實現韻律控制;從基元庫挑選出一個最符合當前韻律要求的候選基元,將其及分析得到的韻律與文本相結合,進行語音合成。
3 系統使用流程
基于系統的整體設計,將高校思政課虛擬教師答疑系統使用流程歸納如下:用戶通過瀏覽器進入Web 端小雅智能助教平臺或通過手機、平板等個人終端設備進入小雅App;用戶登錄自己的賬號進入平臺,若為首次使用,則需要先進行賬號注冊;在首頁,用戶可以搜索或點擊進入需要提問的課程;點擊頁面上“虛擬教師答疑”按鈕進入高校思政課虛擬教師答疑系統;用戶點擊“開始提問”按鈕并對問題進行表述;等待片刻,即可聽到虛擬教師對于問題的解答。系統使用流程圖如圖8所示。在系統的使用過程中,用戶需確保良好的網絡環境,并擁有麥克風及揚聲器等設備。
4 系統測試
在系統整體實現后,筆者對各個功能模塊都進行了測試。測試結果如下:首先,分別在Web端及An?droid端對小雅平臺進行了測試,經十組測試,用戶均可成功進入小雅平臺并轉入高校思政虛擬教師答疑系統。之后,在某一特定條件下(帶寬10Mbps,較標準普通話,音量高于45dB,輸入語音長度為2.5~4.5s,噪音低于25dB) 測試了本系統的語音識別和回答響應時間。測試結果如圖9所示:共進行十組實驗,橫坐標表示實驗組數(單位:組),縱坐標表示實驗測試所得時間(單位:秒)。由十組測試數據計算可得,系統平均語音識別時間為0.84687s,平均響應時間為1.55293s。
最后,對答疑數據庫的匹配效果進行測試,從三個渠道(高校教師提供、高校學生提問、網絡隨機查詢)隨機選取了共計200道思政題目,經測試,系統對這些題目的匹配正確度可達96%。綜合以上測試,系統及答疑數據庫設計基本符合預期效果。
5 結束語
隨著科技的進步及教學需求多樣化的發展趨勢,如何使用現代科學技術助力教育發展是一個值得研究的問題。本文采用科大訊飛的語音交互技術,依托于小雅智能助教平臺,在前期調研的基礎上設計并構造高校思政課程虛擬教師答疑對話數據庫,最終實現了高校思政課虛擬教師答疑系統,借助互聯網+教育調動高校學生學習思政課程的熱情,助力高校學生思想政治教育“活”起來。