賈積有 孟青泉



摘 要:本文在簡要介紹智能教學系統概念的基礎上,詳細闡述了國際上常用的智能教學系統的評價方法,包括客觀性的成績評價方法和主觀性的調查問卷評價方法。然后基于這些評價方法,以三個典型學科(數學、英語和語文)的智能教學系統為例,分析了選擇智能教學系統時需要考慮的因素。
關鍵詞:智能教學系統;評價;選擇;學科
中圖分類號:G434 文獻標志碼:A 文章編號:2096-0069(2019)03-0001-09
一、概念簡介
人工智能技術在教育領域具有廣泛應用[1],其中的一個重要領域就是智能教學系統。該概念的英文表達為Intelligent Tutoring System,簡稱ITS,在國內也被翻譯作智能導學系統。我們認為,智能教學系統更能全面而準確地反映ITS的內涵和外延。智能教學系統作為教育領域的專家系統,能夠模仿人類教師或者助教,幫助學生學習某門學科、某個領域或者某個知識點的知識[2]。一個成功的智能教學系統應該像一個優秀教師或者助教那樣,具有某個學科、領域或者知識點的專業知識,根據學生情況用合適的方式向學生展示或者講解知識,通過作業、測驗和考試等各種手段了解學生對知識的掌握程度,回答學生學習過程中產生的問題,也就是對學生進行個性化教學。所以說一個智能教學系統的智能程度,就是對優秀教師或者助教的模仿程度。
二、智能教學系統的評價方法
(一)客觀性的學習效果評價
客觀性的學習效果評價方式主要采用智能教學系統所涉及的教學領域的效果評估方法,比如教育科學研究中常用的準實驗法。準實驗法的研究對象通常有實驗班或者實驗組(下文稱實驗班)、對照班或者對照組(下文稱對照班)兩組學生,前者使用某種智能教學系統進行學習,后者不使用智能教學系統進行學習,除此之外,兩者沒有其他區別。經過一段時間的教學實驗后,以使用智能教學系統與否作為自變量,以使用者的學習成績改善程度為因變量,考察因變量與自變量的關系,也就是考察使用智能教學系統是否會對使用者的學習成績改善造成影響,以及影響程度有多大。
學習者的成績改善程度的衡量,需要綜合考慮教學實驗前后的成績變化。實驗之前的成績即前測反映了學習者的學習基礎,實驗之后的成績即后測反映了學習者的學習成果。最理想的實驗情況為,實驗組和對照組的前測成績沒有統計意義上的顯著性差異,而這種差異通常是通過獨立樣本學生T檢驗或者F檢驗(即方差分析或變異數分析,ANOVA, Analysis of Variance的縮寫)來檢測的[3]。在這種前測無顯著性差異的前提下,再對實驗班和對照班的后測進行獨立樣本學生T檢驗。根據檢驗結果的概率p值,檢測結果可能有三種情況:(1)兩個班的成績無顯著性差異(p>0.05)時,這表明智能教學系統相對于傳統或者其他方法而言,對學生學習成績沒有顯著影響;(2)兩個班的成績有顯著性差異(p<0.05)、實驗班成績高于對照班時,這表明智能教學系統相對于傳統或者其他方法而言,對學生學習成績有顯著正面影響;(3)兩個班的成績有顯著性差異(p<0.05)、實驗班成績低于對照班時,這表明智能教學系統相對于傳統或者其他方法而言,對學生學習成績有顯著負面影響。
后測中實驗班和對照班的成績差異可以用效果量(Effect Size,簡稱ES)來進行準確衡量。在國際文獻中,效果量一般用一個無量綱的分數來表示,分子為實驗班和對照班的平均成績差,而分母則為一個合并后的標準差Spooled,這個標準差如何計算,國際文獻中存在一些差異。我們介紹常用的兩種:Cohen’d[4][5][6]和Hedges’g[7]。
Cohen’d的計算公式為:
Hedges’g的計算公式為:
以上兩個公式中的n1和n2分別為實驗班和對照班的樣本量,SD1和SD2分別為實驗班和對照班的標準差。兩個公式的細微差異僅僅在于分母上對混合的標準差的計算。不管怎樣計算,兩個班的平均成績差異越大,班內的標準差越小,則效果量越大。
按照Cohen’d來衡量,效果量如果是0.2左右,就是一個小的效果;如果是0.5左右,就是一個中等規模的效果;如果是0.8以上的話,就是一個大的效果。當然一個效果到底是小還是大,與檢驗背景等很多因素緊密相關,就像Cohen(科恩)所強調的:所謂的小、中、大的概念都是相對而言的,不僅僅彼此之間,而且是針對行為科學領域,甚至是針對某個特定背景和研究手段而言。面對這種相對性,為這些術語提供傳統的操作定義,以便在不同的研究領域如行為科學中用于效果分析,存在一定的風險。然而,這種風險是可以接受的,因為我們相信,通過提供一個通用的常規參考框架,可以獲得比損失更多的收益。只有在沒有更好地估計效果量的基礎時,才建議使用該參考框架。[8]
Sawilowsky(薩維羅夫斯基)[9]在Cohen對效果量的相對大小的評述基礎上,進一步建議:效果量如果為0.01,那是非常小的,1.2是非常大的,2.0是巨大的。
不管怎么計算,效果量綜合反映了實驗班和對照班全體學生的成績差異,因此在國際研究文獻中經常被用來作為衡量某種教學方法效果大小的一個重要指標。因為分母反映的是標準差的大小,效果量的單位通常被稱作標準差。
如果前測和后測考試內容相同,則實驗組和對照組可以分別進行成對樣本學生T檢驗,檢測每個組從前測到后測的變化幅度在統計意義上是否具有顯著性。同前面的獨立樣本學生T檢驗類似,檢測結果也是三種情況:無顯著性差異;后測成績顯著高于前測成績;前測成績顯著高于后測成績。后測和前測的差異大小也可以通過效果量的計算精確表示出來,只不過這時候的計算因為后測和前測樣本相同而得到了簡化,比如Cohen’d中,因為前測和后測樣本數相同,n1=n2=n,
如果前測中實驗班和對照班的差異在統計意義上是顯著的,也就是說基礎不同,那么在檢驗后測的差異時就必須考慮這種差異。這時候就要采用共變量分析(或稱協方差分析,Analysis of Covariance, 簡稱ANCOVA)的方法來研究智能教學系統對學生成績的影響。ANCOVA在比較智能教學系統與其他方法的效果時,可以同時考慮或控制其他對學習效果有影響的自變量,使我們在相同的背景或基礎上去比較不同教學方式的效果。而控制其他自變量對因變量的影響也是回歸分析的基本功能,因此ANCOVA可以說是結合了ANOVA與回歸分析的功能,排除了前測的差異,以更精確地分析兩組或兩組以上后測是否有顯著性差異。
共變量分析需要滿足三個基本前提條件。(1)常態性:即符合正態分布的要求;(2)獨立性:量表的內部一致性信度或α值最好在0.8以上;(3)回歸系數同構型:組內回歸系數無顯著差異。在滿足這三個條件之后,以學習方式(智能教學系統支持的教學或者其他教學方式)為自變量、學生學習前測成績為共變量、學生的學習后測成績為因變量,進行共變量分析。分析結果也與樣本學生T檢驗類似,分為三種情況:無顯著性差異(p>0.05);智能教學系統的效果顯著好于其他教學方式(p<0.05); 智能教學系統的效果顯著差于其他教學方式(p<0.05)。當然,也可以用效果量來精確表示后測中實驗班和對照班的差異量的大小。
(二)主觀性的用戶體驗
主觀性的用戶體驗主要通過調查問卷方式采集用戶對智能教學系統的反饋數據,包括技術接受度、學習滿意度、學習動機、學習態度、學習效能、認知負荷等多個維度。一般來說,調查問卷的每個條目都采用李克特5點或者7點量表,因而具有可計算性和可比性。與學習成績的比較類似,可以在實驗前后的實驗班和對照班各測量一次,然后通過T檢驗、F檢驗或者共變量分析等方法來檢測實驗前后學生對于這些調查條目回答的變化,也就是學生用戶體驗的變化,以及這種變化在統計意義上是否顯著。當然在檢測之前,要檢驗問卷的信度和效度。最好采用經國內外廣泛使用、信度和效度較高的調查問卷。下面介紹一些這樣的問卷。
在評估智能教學系統模型的技術接受度方面,很多量表是對戴維斯技術接受度模型(Technology Acceptance Model,簡稱TAM)[10]的進一步發展和完善。這種模型認為,當用戶面對一個計算機信息系統時,認知有用性和認知易用性是兩個主要的決定因素。認知有用性(Perceived Usefulness,簡稱PU)是指用戶在使用某一信息系統時,主觀上認為其所帶來的工作績效的提升程度。認知易用性(Perceived Easeof Use,簡稱PEOU)是指用戶在使用某一信息系統時,主觀上認為能為其省事、減少用心費神的程度。
在這方面,Hwang等[11][12][13]所設計的“計算機支持的學習接受度調查問卷”可供參考。關于系統認知有用性的問題包括:我覺得使用這樣的學習方式(或系統)讓學習活動的內容更豐富;我覺得使用這樣的學習方式(或系統)對我學習新知識很有幫助;這樣的學習方式(或系統)所提供的學習機制讓我的學習過程更為順暢;這樣的學習方式(或系統)可以幫助我在需要時獲得有用的信息;這樣的學習方式(或系統)可以讓我學得更好;本次學習活動中,使用這樣的學習方式(或系統)比一般的計算機輔助學習更有效果。關于系統認知易用性的問題包括:對我而言,學習這套系統的操作并不困難;我只花費短短的時間就完全學會這套系統的使用;使用這套系統所進行的學習活動是容易理解的;我很快便學會這套系統的操作方式;我覺得這套系統的接口是容易使用的;整體而言,本次學習活動所使用的系統是容易學習和使用的。
學習滿意度方面可以參考Chu等人的設計[14],內容包括:這次的學習任務,讓我更理解學習內容;這次的學習任務中,我努力學習觀察事物的差異;這次的學習任務雖然不簡單,但學習方式卻不難理解;這種學習方式比以前的學習方式更具有挑戰性和趣味性;使用這種方式學習,我可以獲得一些新發現或新知識;這種方式學習能讓我用新的方法或思考模式來學習;這種學習方式有助于我學習分辨事物的特性;這種學習方式有助于我運用新的角度觀察事物。
學習動機方面可以參考Pintrich(佩尼奇)[15]和Wang & Chen[16]等所設計的調查問卷。關于內在動機的問題包括:在本課程中,我比較喜歡有挑戰性的教材,因為這樣我可以學到新的事物;在本課程中,我比較喜歡能引起我好奇心的教材,即使困難也無所謂;如果可以,我會選擇能學到東西的課程,即使分數不高也無所謂。關于外在動機的問題包括:在本課程中得到好成績,對我來說是最滿足的事情;如果可以,我希望能在本課程中得到比大多數學生要好的成績;我希望在本課程中能有好的表現,因為在家人、朋友、老師或其他人面前展現我的能力是很重要的。
學習態度方面可以參考Hwang等人的工作[17][18][19],內容包括:我覺得學習這個課程是有趣而且有價值的;我想要學習更多且觀察更多有關這個課程的內容;我覺得學習跟這個課程有關的事物是值得的;我覺得學好這個課程對我來說很重要;我覺得了解這個課程與生活環境之間的關系是重要的;我會主動搜尋更多信息來學習這個課程;我覺得學習這個課程對每個人來說都是重要的。
學習效能方面可以參考 Pintrich等[20]的設計。內容包括:我相信我可以在本課程中得到優異的成績;我確信能理解本課程中最困難的部分;我自信能理解本課程所教授的基本觀念;我自信能理解本課程中老師所教最復雜的部分;我自信能在本課程的作業和測驗上表現優異;我預期能學好本課程;我確信能精通本課程所教授的技能;考慮本課程的難度、老師和我的能力,我覺得我可以學好本課程。
認知負荷方面可以參考Hwang等人[21][22][23]的設計。其中關于心智負荷也就是內容難度或任務的挑戰性方面的問題包括:這個活動中的學習內容對我而言是困難的;我花了很大的心力,才能回答這個學習活動中的問題;回答這個活動中的問題令我感到困擾;我沒有足夠的時間來回答這個活動中的問題。關于心智努力也就是內容形式方面的問題包括:在這個學習活動中,教學方式或是教材內容的呈現方式對我而言比較吃力;我必須投入許多心力來完成這個學習活動或是達成這個學習活動的目標;這個學習活動的教學方式于我來說很難理解或是跟上進度。
當然,在采用以上這些問卷評估某個智能教學系統時,可根據該系統和教學應用的具體情況修改、補充或者刪除某些條目。修訂后的問卷最好先在小范圍測試后再應用到教學實驗中。
三、智能教學系統的選擇
(一)數學:“樂學一百”在線智能教學系統
數學教學對于鍛煉中小學生的邏輯思維至關重要,但是如何針對學生的特點進行個性化數學教學也是一個世界性的難題?!皹穼W一百”是一個專注于中小學數學等學科,為教師、學生和家長提供在線智能教學服務的個性化智能教學平臺。在深入了解我國中小學教學改革的實際情況和研究數學領域知識模型的基礎上,設計者采用自適應學習系統模型[24],運用學習科學的相關原理和技術,科學地設計了引導流程和步驟,讓學生在自我探索的過程中高效地吸收知識,強化技能,優質高效地完成學習任務,達成高水平的學習目標。在個性化輔導方面,該系統將在線學習活動指數模型OLAI加入系統設計中[25][26],進一步提高其自適應程度,增強應用效果?;驹O計理念包括如下三點:
1.個別自適應學習。自定步調:不規定統一的進度,學生根據自身情況確定學習內容和進度,教師基于強大的后臺教學分析系統,針對不同學生給予全天候個別化指導。
2.漸進掌握式學習。小步闖關:將學科知識體系加以精細切分,成為學習時長15分鐘左右的單元,并按照知識點間邏輯順序、考試考查的能力以及學生認知規律編排。學生一個一個單元進行闖關學習,前一個單元達到規定的過關分數后,才能進入下一個單元,依此類推,直到完成所有單元通關。每題答完系統自動判斷對錯,答對之后才能進入下一題,既保護孩子自信心,又能系統扎實學習。
3.互動發現式學習。持續互動:把知識點轉化成一個個層次遞進的“問題”,向學生提問,刺激學生不斷思考,由淺入深,由易到難,循序漸進。學生在逐一回答問題的過程中獲得系統給予的“即時反饋”,正確的則繼續前進,錯誤的可以查看系統提示或者在線請教老師后改正。學生逐一完成這些題目后,在課程的引導下自然而然地建構起彼此聯系的知識體系。
在上述設計理念的指導下,“樂學一百”開發團隊研制并推出了基于云端的教學平臺,該系統可以幫助教師方便快捷且有效地實施翻轉課堂,幫助學生在課外以自己的進度學習,是一套較為成熟且面向用戶實際需求的在線教學系統。從功能模塊來看,“樂學一百”系統包括6個子系統(學生、教師、家長、課程、激勵和分析)、3個核心數據庫(學生、學材和行為)、1個互動學習引擎和1個智能推薦引擎。這些子系統、數據庫和引擎相互依存和相互作用。
在內容方面,“樂學一百”覆蓋了小學和初中數學所有單元,這些單元按照教學目標又針對每章知識系統設計了引導、練習、強化、綜合、測試、復習、挑戰等12種單元類型。單元之間環環相扣,難度螺旋上升。這些學習單元由精細切割的知識點組成,從零基礎到高難度層層遞進、全部覆蓋;將一個個互相關聯的知識點問題化,這些問題互相關聯,在合適的時機持續啟發學生的思維。
“樂學一百”系統的智能性還表現在這幾個方面。(1)答案智能判斷:及時且正確的反饋是學生持續學習的關鍵,“樂學一百”的自適應引擎中已經實現了對初中階段知識點的答案智能判斷,使得學生學習過程一氣呵成,思維連貫,成就感更強。(2)作圖智能判斷:通過 “做中學”的方法,智能判斷引擎能夠自動判斷學生幾何作圖是否符合題目要求,學生不僅能夠學習常規作圖方法,更能創造性解決現有幾何問題。(3)錯題智能訓練:系統自動收集學生所有錯誤的題目,并且全程記錄每個題目曾經的錯誤答案,針對性加以強化練習。錯題痕跡全保留,自動生成錯題單元。題目動態變化,可反復練習。
在激發學生學習動機方面,“樂學一百”設計了經驗值、學分、樂幣、禮品店、排行榜、通關勛章等激勵手段。學生每做對一題都可獲得經驗值鼓勵,過關加學分,樂幣換禮品,從而體驗成功的喜悅,逐步樹立自信。家長還可加分表揚,鼓勵孩子。
“樂學一百”系統自2013年上線以來,經過近10萬用戶的使用,其效果得到了驗證。借鑒前面提到的客觀成績與主觀性問卷相結合的評價方法,并輔之以學生訪談等定性研究方法,賈積有和張必蘭等[27][28]對該系統的效果進行了較為嚴格的評估,考試成績和調查問卷數據分析證明,運用該系統輔助教學的實驗班成績顯著高于其他班級,學生和家長對“樂學一百”系統有較高的滿意度。
(二)英語:“希賽可”智能英語教學系統
英語教學對于中小學生掌握英語這一世界上廣泛應用的語言很重要。然而如何給學生提供個性化的語言環境,如何幫助學生從音、形、義三個方面掌握詞匯,在我國中小學教學中是需要解決的重要問題。通過調研教師和學生在英語學習中的實際需求,我們研發了“希賽可”智能英語教學系統,包含詞匯、對話、語法、聽力和閱讀等基本內容,該系統(結構如圖1所示)可以提供個性化、層次化、游戲化教學策略,具有課程、用戶等數據統計分析的高級功能,充分體現以教師為主導、以學生為主體的指導思想,包含了從小學、中學到大學各個學段、多個教材版本的配套學習內容。
詞匯是英語學習的基礎,也是重點和難點。每個英文單詞都有其拼寫、發音和中文含義,這三者相互關聯,密不可分。因此,我們設計的詞匯練習的形式為:根據單詞的發音,學生填寫其英文拼寫,選擇或者填寫其漢語意思;系統自動判斷答案對錯,給出反饋。這種形式可以彌補傳統教學方法的不足,極大減輕教師的負擔,強化學生的聽力、詞匯書寫和理解能力。而詞匯掌握程度的提高能夠進一步改進學生在語法、閱讀、寫作等方面的表現。詞匯練習模塊的智能性主要體現在以下四個方面:(1)題目排列的隨機性。每個單元或者模塊的填字游戲、選擇題和填空題測驗所包含的詞匯總量是確定的,對于每個學生都一樣。但是,在每個學生做練習時,題目出現的順序不同,選擇題的選項順序也不同。這樣的練習就是一種個性化的練習,每個學生都必須獨立解決各自的問題。(2)“一對一”的聽寫。每一道選擇題和填空題的詞匯配音都來自配套光盤或者磁帶,地道標準,學習者根據系統發音回答相應的問題,就好像跟著老師“一對一”地聽寫單詞,而且可以反復多次地聆聽。這種形式的練習能夠有效地激發學習者的學習動機,維持其學習興趣。(3)針對不同水平學習者的梯度測試題型。每一個學習單元的測試都提供了難易程度不同的題目形式——填字游戲、選擇題、填空題。學習者剛剛學習完新單詞時,由于記憶不深刻,可以先通過填字游戲來熟悉單詞的拼寫,然后通過選擇題來熟悉詞匯發音與其漢語意思的關聯。經過上述兩種練習,學習者對單詞的拼寫、發音和含義有了較好的理解后,再通過填空題綜合復習和鞏固單詞拼寫、發音和含義。(4)及時、靈活的反饋。系統能及時為學習者提供學習反饋。提交所有題目答案之后,可以看到每道題目的正誤,以及答錯題目的正確答案。
綜上所述,單詞智能練習憑借較為標準的單詞發音、難度梯度題型和及時靈活的反饋等特點,可以幫助學生復習單詞和強化單詞記憶。這種學習基于行為主義學習理論,通過練習和即時反饋強化學生對詞匯音、形、義的綜合掌握。
場景對話功能基于建構主義和情境學習理論,高度重視情境學習在英語學習中的作用,主要體現在:(1)促進學習者學以致用,學習者可以在該系統中使用新掌握的單詞,與機器人進行交流,加深記憶。(2)標準發音,促進記憶。該系統提供的“觀看對話”模塊中,有標準的英語單詞發音,學習者在觀看對話的時候,字幕的提示能夠促進學習者記憶單詞。(3)創設情境,激發動機。在情境對話模塊中,系統能模擬課本中的真實對話情境,吸引學習者注意力,有效激發學習動機,提高學習興趣。
為了讓學生在實際參與人機對話之前熟悉對話內容,我們設計了多人對話觀摩程序,使之能夠表現多個角色之間的對話,簡稱為“多人轉”?!岸嗳宿D”的功能是由多個虛擬人物來扮演課本中的人物角色,并進行課本中的對話,但這種對話不是原封不動地照抄課本內容,也不是像通常的教學錄像那樣播放固定不變的一段對話錄像,而是針對每一句話給出了語義相同的多種表達方式。虛擬人物會隨機選擇某種表達方式來進行對話,這樣一段對話中,所有句子表達方式的排列組合就可以很多,使得學生每次觀看“多人轉”時都有一種新鮮感。
“希賽可”系統具有自適應界面,使用終端包括傳統的多媒體計算機、筆記本電腦、方便攜帶而且性價比高的平板電腦和智能手機,適應了我國數字校園和智慧校園建設的最新發展趨勢。
為了檢驗“希賽可”系統的教學效果,我們從2010年7月到2012年12月底,在4所實驗學校領導和師生的積極配合下,共進行了11個學期的準實驗研究。準實驗研究的基本思路為:每所學校的每位老師負責兩個班的教學工作,其中一個作為實驗班,另外一個為對照班。兩個班的教學內容、進度和方法完全一致,唯一不同的是,實驗班每周有一節課在多媒體機房,通過國際互聯網訪問“希賽可”智能英語學習系統進行學習。通過調查問卷、訪談等方法來了解學生與教師對英語學習的感受、對智能英語教學系統的感受和認識。最后,通過分析歷次考試成績來比較實驗班和對照班的英語學習成效。
通過這些準實驗研究,我們獲得了豐富的測驗、調查和訪談數據,數據分析結果表明[29][30][31][32]:對于學生而言,“希賽可”系統可以提高英語學習成績,增進學習興趣。實驗班的成績,特別是所練習的詞匯成績在逐漸改善,改善程度高于對照班;前測平均成績較低的實驗班(北京、河南和寧夏)的改善程度已經改變其顯著性差異狀態;詞匯成績的改善程度高于常規考試成績的改善程度。通過調查問卷和訪談發現:這種應用智能教學系統的混合式學習對于學生來說沒有困難和壓力(也不需要很多計算機專業知識),可以幫助復習所學知識,提高學習效率和考試成績,人機交互方便,提供了更多的學習材料和更加專業的教學方式,超過80%的學生希望在將來繼續使用這個系統。學生改善最明顯的三個問題是:記不住單詞、英語發音不好和聽力差。對于教師而言,“希賽可”系統減輕了教學負擔,促進了專業成長。系統自動判分準確無誤,反饋快速及時、個性化,減少了教師大量布置作業、批改作業的工作,教師可以騰出時間去做更多計算機還無法做的事情,促進其專業發展。
綜合考慮成本、效益和效果,“希賽可”智能教學系統在中學英語課程中的深度整合,相比傳統單一的學校老師授課、市場化的家教輔導或者小班教學等方式而言,具有較大的優勢。我們設計的多種差異性樣本、長時期的準實驗研究方法,其信度從多個方面得到了充分驗證:實驗學校地理位置和經濟條件呈現多樣性(東部、中部、西部);實驗學校的硬件裝備有好有壞;實驗班老師的教育信息技術應用經歷各不相同;實驗班學生的學齡跨度從七年級到高二;教學內容幾乎涉及從七年級到高二各個學期。這種跨地區、跨學齡、跨年度的教育技術在語言教學中的實證研究,可以驗證某一教學措施(比如智能技術與課程整合)的效果,排除其他因素的干擾,具有一定的學術價值。
我們應用這種方法得出結論:智能網絡教學系統支撐下的混合式中學英語學習對于學生和教師的正面影響,不僅為“信息技術與課程的高度整合”這一政策導向提供了實證范例,也提供了方法手段。
(三)語文:“科大訊飛”語音評測和學習系統
在我國強調傳統文化傳承的今天,語文教學對于中小學生至關重要。盡管漢語是我們的母語,但是因為我國幅員遼闊,地區差異巨大,不少學校教師還存在發音不標準的問題,要個性化地檢測和訓練每個學生的漢語發音,對于學校和班級教學來說難度較大。因此,科大訊飛信息科技股份有限公司(以下簡稱“科大訊飛”)開發了漢語語音評測和學習系統。這是一家專業從事智能語音及語言技術研究、軟件及芯片產品開發、語音信息服務及電子政務系統集成的國家級骨干軟件企業,是我國眾多軟件企業中為數極少掌握核心技術并擁有自主知識產權的企業之一,其智能語音合成和識別技術連續多次在國際評測比賽中獲得第一名的優異成績。憑借其世界領先的語音技術,“科大訊飛”開發了中小學語言能力評價與學習系統,可以發現漢語、英語等語言學習的問題,推薦個性化語言學習資源,提升學生口語交際與表達能力。中小學漢語能力評價與學習系統主要包括語言能力評價、語言學習及系統管理三大模塊,系統功能列表如表1所示。
語言能力評價模塊內容覆蓋全面,題型靈活多樣,評價科學合理,分為套題類型和單題專項評價兩大類型。
套題類型又分為三種。第一種滿分100分,包括四項內容。第一項單音節字詞50個,共10分;第二項多音節詞語25個,共20分;第三項短文一篇200個音節,共30分;第四項話題表述(故事復述、看圖說話、命題說話三個類型中任選一題作為考試題型),共40分。第二種滿分20分。第一題聽力選擇,共5題,每題2分,共10分。第二題命題說話,準備一分鐘,說話一分鐘,共10分。第三種滿分100分。第一項短文一篇200個音節,共30分;第二項一篇七言古詩詞,共10分;第三項看圖說話,共30分;第四項故事復述,共30分。
單題專項評價共三種類型:故事復述、看圖說話、命題說話,老師可任意選擇一個作為測查題型。
語言學習模塊由淺入深地提供基礎學習、同步課程、話題表述、配音秀四種不同的學習形式,其具體功能如下。
基礎學習:參照語文新課標要求,提供普通話聲韻調學習資源,分等級進行普通話字詞語音教學,針對性糾正學習者語音問題,幫助學習者掌握語音規律,有效提高其普通話水平。
同步課程:依據課文示范朗讀,進行跟讀訓練。系統指示光標自動契合學習者的朗讀節奏,學習者朗讀結束后,系統實時評價語音水平,診斷語音問題。
話題表述:結合語文新課標,按照九年一貫制教學思路,系統設計語言交際訓練任務,分學段逐級提高學生口語表達能力。通過故事復述、看圖說話、命題說話三個子項測查、訓練學生的話題表述能力。在“故事復述”中,系統會結合語文新課程標準納入一些家喻戶曉的故事,學生選擇自己感興趣的故事在系統中聽,聽完后用自己的語言進行復述,復述完成后系統會自動評分。“看圖說話”讓學生在充分觀察圖畫、思考圖意的基礎上進行口頭表達訓練,突出看、思、說三大主體環節?!懊}說話”則測查學生在無文字憑借的情況下根據自己選擇的話題進行即興表達。
配音秀:實現全新的互動娛樂式語言學習。為經典電影、經典動畫配音,感受作品魅力,塑造人物角色,豐富想象,錘煉語言,讓學習者在輕松歡快的環境中提升語言技能。
系統管理模塊包括用戶管理、任務管理及統計分析。系統采用超級管理員、省、市、縣(區)、學校五級用戶分級管理;任務管理支持教師新建、刪除及分發任務;統計分析功能可以幫助教育主管部門、教師和學生自己從多個維度了解中小學生的語言能力水平及存在的問題。
“科大訊飛”語音評測和學習系統在多個省市的中小學校得到了廣泛應用,語言評測在采取“未優化的評測引擎+普通評測員”對照模式時,人機等級一致率通常可超過80%,而在采取“優化的評測引擎+國家級評測員”對照模式時,人機等級一致率通常接近100%。
四、結論
智能教學系統能夠模仿人類教師或者助教,幫助學生學習某門學科、某個領域或者某個知識點的知識。其評價方法主要包括客觀性和主觀性兩個維度。客觀性評價是指這樣的系統能否改善學生的學習效果及其改善幅度,主觀性評價是指從用戶體驗角度(包括有用性和易用性、滿意度、效果、態度、動機、認知負荷等方面)收集用戶的反饋。結合三個典型的中小學學科——數學、英語和語文,我們介紹了選擇智能教學系統時要注意的指標。當然,要選擇一個合適的智能教學系統,除了這些教育方面的性能指標,還要綜合考慮價格、市場占有率、售后服務等多方面的因素。
參考文獻
[1]邱雪蓮,齊振國,李京澳.人工智能在基礎教育領域的發展路徑探究[J].數字教育,2018,4(05):52-56.
[2]賈積有.人工智能賦能教育與學習[J].遠程教育雜志,2018,36(1):? 39-47.
[3]HAZEWINKEL M.Encyclopedia of Mathematics[M].Berlin:Springer, 2001.
[4]COHEN J.A Power Primer[J].Psychological Bulletin(S0033-2909), 1992,112(1):155-159.
[5][8]COHEN J.Statistical Power Analysis for the Behavioral Sciences(2nd ed)[M].New Jersey:Lawrence Erlbaum Associates,? 1988.
[6]AARON B,KROMREY J D,FERRON J M.Equating R-based and D-based Effect-size Indices:Problems with a Commonly Recommended Formula[C]//Florida Educational Research Asscociation. The Annual Meeting of the Florida Educational Research Association,Orlando,1998.
[7]HEDGES L V,OLKIN I.Statistical Methods for Meta-analysis[M].Orlando:Academic Press,1985.
[9]SAWILOWSKY S.New Effect Size Rules of Thumb[J]. Journal? of Modern Applied Statistical Methods(S1538-9472),2009,8(2):467? -474.
[10]DAVIS F D. Perceived Usefulness, Perceived Ease of Use, and User Acceptance of Information Technology[J].MIS Quarterly(S0276-7783),1989,13(3):319-340.
[11][17][21]HWANG G J,YANG L H,WANG S Y.A Concept Map-embedded Educational Computer Game for Improving Students’ Learning Performance in Natural Science Courses[J].Computers & Education(S0360-1315),2013,(69):121-130.
[12][18][22]HWANG G J,CHEN C H.Influences of an Inquiry Based Ubiquitous Gaming Design on Students’Learning Achievements, Motivation,Behavioral Patterns,and Tendency towards Critical Thinking and Problem Solving[J].British Journal of Educational Technology(S0007-1013),2017,48(4): 950-971.
[13][19][23]HWANG G J,CHIU L Y,CHEN C H.A Contextual Game-based Learning Approach to Improving Students’Inquiry-based Learning Performance in Social Studies Courses[J].Computers & Education(S0360-1315),2015(81):13-15.
[14]CHU H C,HWANG G J,TSAIJ C C,et al. A Two-tier Test Approach to Developing Location-aware Mobile Learning Systems for Natural Science Courses[J]. Computers & Education(S0360-1315),2010,55(4):1618-1627.
[15][20]PINTRICH P R,SMITH D A F,GARCIA T,et al.A Manual for the Use of the Motivated Strategies for Learning Questionnaire (MSLQ)[C]//National Center for Postsecondary Research. National Center for Research to Improve Post-? secondary Teaching and Learning, Ann Arbor University of Michigan,1991.
[16]WANG L C,CHEN M P.The Effects of Game Strategy and Preference‐Matching on Flow Experience and Programming Performance in Game‐Based Learning[J].Innovations in Education and Teaching International(S1470-3297), 2010,47(1):39-52.
[24]王洪江,黃潔.面向自適應學習系統的開放學習者模型研究[J].數字教育,2017,3(02):23-28.
[25]賈積有,于悅洋.學習活動指數LAI及在線學習活動指數OLAI的具體分析[J].中國遠程教育,2017,(4):15-21.
[26]JIA J,YU Y.Online Learning Activity Index (OLAI) and Its Application for Adaptive Learning[C]//CHEUNGS,et al.Blended Learning-new Challenges and Innovative Practices.ICBL,City University of Hongkong,2017:213-224.
[27]賈積有,張必蘭,顏澤忠,等.在線數學教學系統設計及其應用效果研究[J].中國遠程教育,2017,(03):37-44.
[28]ZHANG B,JIA J.Evaluating an Intelligent Tutoring System for Personalized Math Teaching[C]//IEEE.Proceedings of International Symposium on Educational Technology,Hongkong, China, June 27-29,2017:126-130.
[29]JIA J,CHEN Y,DING Z,et al.Effects of a Vocabulary Acquisition and Assessment System on Students’Performance in a Blended Learning Class for English Subject[J].Computers & Education(S0360-1315),2012,58(1):63-76.
[30]JIA J.Effects of an Intelligent Web-based English Instruction System on Students’Academic Performance[J].Journal of Computer Assisted Learning(S0266-4909),2013,29(6):556-568.
[31]JIA J,CHEN Z.The Effect of Smart Phones’Application in Regular University English Class on Students’Learning Performance[C]//IEEE.Proceedings of the Fourth International Conference of Educational Innovation through Technology,Wu-han,Oct.16-18,2015:131-136.
[32]JIA J,CHEN Z.Blending Smart Phones into Regular Classroom Learning[C]//Peking University.Proceedings of International Conference on Blending Learning,Beijing,China,2016:337-347.
(責任編輯 孫志莉)