(1.中國科學技術大學 大數據分析與應用安徽省重點實驗室,安徽合肥 230027;2.科大訊飛股份有限公司,安徽合肥 230088)
個性化教育體現了公平、尊重和差異性教育,目標是實現每一位學習者的心智發展,是教育的追求。個性化教育強調通過調查、測試、考核和診斷,根據學習者的能力和潛在特征,為每位學習者量身定制學習目標、學習計劃。2010年7月頒布的《國家中長期教育改革和發展規劃綱要》指出:“實施個性化教育,是促進教育改革創新的一個重要抓手,是實施素質教育的重要措施,是教育貫徹以人為本科學發展觀的具體體現”[1]。然而,常見的教學模式為大班教學,在師生數量失衡的情況下,學生難以實現個性化學習、自主學習,個性化教育難以在日常教學中開展。隨著移動互聯網的快速發展,在線學習逐漸進入學生的日常學習中,在此背景下,累積了海量的學生在線學習和答題歷史數據。伴隨這些數據的不斷累積,個性化教育的開展迎來了新的機遇。因此,如何利用現有的海量學生在線學習和答題歷史數據,實現學生自主學習和個性化學習,從而突破師生數量失衡的現狀,推動個性化教育的開展,具有重要的現實意義。
信息技術革命與經濟社會發展的交融,帶來了數據的爆炸式增長,2010年,全球產生數據1.2x109TB。Intel預測,到2020年,這一數字將上升至44ZB(1ZB=10億TB)。在現今的社會,大數據的應用越來越彰顯其優勢,占領的領域也越來越廣闊,如線上交易、物流配送、O2O等各種利用大數據獲得發展的領域正在協助企業不斷發展新業務,創新運營模式[2]。與此同時,在線教育平臺也在不斷涌現,由孟加拉裔美國人Khan創立的可汗學院、由吳恩達和Koller創辦的Coursera、網易公開課、學堂在線等大規模在線開放課程(Massive Open Online Courses,MOOC)正在全球范圍內廣泛流行。伴隨平臺不斷被使用,大量的教育數據隨之產生,這為教育領域帶來了新的機遇和挑戰。如何利用人工智能技術挖掘教育大數據,并從中產生有價值的信息,進而揭示教育的規律,指導教師、學生等教育主體來優化教與學的方式方法,是目前非常有價值的研究課題。
最近,Chen[3]從理論層面介紹了一些以學生為中心的教學與評估方法,通過改善師生關系、引入新概念、減少課程時間、每周評估測試等方法來提高學生的學習積極性。Bienkowski[4]采用教育數據分析學生閱讀在線課程資料,挖掘出導致學生學習成績表現不良的信息,并給出一些干預性指導,確保學生以最高效的方式學習,改善學生出勤率、輟學率,提高學習成績,改進教學。然而,國內基于大數據推進個性化教育方面的應用研究相對較少,僅有少數研究從理論層面提出了如何打造智能教育應用生態系統、推進教育走向個性化[5][6][7][8][9]]。這主要源于當前主流教學模式為大班教學,在師生數量嚴重懸殊的情況下,個性化教育難以開展。已有學者證實了大班教學模式會導致個性化教育難以開展[10][11]:
①個性化學習難以實現:我國的教育總體上呈現出了重共性、輕個性的局面,像工業流水線上生產機器一樣,培養的學生都是一個模子出來的“標準件”,極大地壓抑了學生的個性發展,在統一的模具下培養出來的學生其獨特的才華有可能被活生生地消磨乃至消滅。在大班教學中,師生數量嚴重失衡,教師沒有精力根據每個學生學習情況進行有針對性的培養,學生的個性化學習難以實現。
②課下自主學習難以實現:教師和學生不僅需要在課堂上“下工夫”,更需要在課堂外“用勁”。在傳統的課后練習和自學中,學生在沒有很好地了解自身能力的情況下,盲目地做簡單題、難題、偏題,課下的自主學習難以實現。
最終,本研究通過挖掘試題之間的相互關系,構建試題推薦系統,來解決上述問題。具體而言,本研究首先基于人工智能技術對試題進行表征,挖掘試題之間的隱含關系,構建試題關聯網絡;之后,進一步構建試題推薦系統,自動為學生推薦合適的試題,并為其選擇做題路徑,幫助學生課下自主學習,實現個性化學習,達到個性化教育的目的。
試題題面表征是指通過人工智能技術詞嵌入(Word Embedding)[13]將試題題面文本轉化為密集、連續的向量,方便對試題進行后續處理。聚類技術是指通過無監督的數理統計方法對已有的數據(如試題)進行聚簇分析,挖掘它們之間的共性。本研究基于試題題面表征結合聚類技術得到試題類簇,利用頻繁模式挖掘技術,挖掘學生歷史答題序列得到試題難度序列,然后結合試題類簇和試題難度序列等構建試題關聯網絡。在此基礎之上,實現了試題推薦系統。
本研究以智學網中的試題題面信息和學生答題信息為主要數據基礎,結合人工智能技術,設計試題關聯網絡。試題關聯網絡構建技術路線圖如圖1所示。具體而言,首先通過人工智能里的詞嵌入技術將收集到的試題題面文本轉化為試題向量,實現對試題的表征,之后再基于這些試題向量對試題進行聚類,將試題分為若干簇;另一方面,通過統計分析以及頻繁模式挖掘技術挖掘學生歷史答題序列,分別得到學生答題得分率和頻繁答題路徑。由此,可以找到相同簇下試題之間的難度和序列關系,按照試題難度由易到難、答題順序由前向后的原則便建立了試題關聯網絡。圖 2是一個構建好的試題關聯網絡樣例,為了便于讀者直觀理解,該圖只展示了每道試題所關聯的知識點信息,而沒有給出試題的題面信息。例如,對于考察了“數列通項公式”和“等差數列的通項公式”的兩道試題,首先,由于這兩道試題考察知識點相似,因此它們的題面文本相似,對兩道試題進行試題表征后再聚類會將其聚類到同一簇中。同時,通過頻繁模式挖掘技術,發現學生做完“數列通項公式”的試題之后會緊接著做“等差數列的通項公式”的試題,并且學生在“等差數列的通項公式”試題上的得分率低于“數列通項公式”試題,這樣就找到了兩道題目之間的難度和序列關系,從而將“等差數列的通項公式”試題定義為“數列通項公式”試題的后繼節點。重復以上過程,便可構建出按照知識點劃分的、難度可把握的試題關聯網絡,如圖2所示。

圖1 試題關聯網絡構建技術路線圖

圖2 試題關聯網絡樣例
在試題關聯網絡的基礎上,通過學生歷史答題序列來評估學生能力水平,構建試題推薦系統。具體而言,學生回答試題后根據答案的正確與否更新學生對該試題考查知識點的掌握程度,之后推薦系統根據學生知識點的掌握程度向學生推薦難度合適的試題。重復上述過程,最終試題推薦系統自動為學生推薦個性化答題路徑,實現學生自主學習和個性化學習,達到個性化教育的目標。基于試題關聯網絡的個性化學習推薦效果如圖3所示,箭頭中的“答對”表示學生答對該試題,箭頭中的“答錯”表示學生答錯該試題,箭頭“開始答題”和“答題結束”分別表示學生開始和結束做題。從圖3可以看到,學生選擇從“數列”知識點開始答題,然后試題推薦系統給學生推薦“數列通項公式”相關的試題;學生答對后,試題推薦系統繼續給學生推薦難度更大的“等比數列通項公式”試題,之后重復此過程,直到學生答錯“等比數列和的最值問題”試題,此時試題推薦系統給學生推薦比其簡單但知識點相關的“數列通項公式的單調性”試題;再重復此過程,直到學生答題結束。通過這樣的做題模式,學生做題變成了一種自主的個性化學習方式,每次答題都能得到及時的調整。當學生做錯試題時,可以推薦做簡單的試題恢復自信心,并鞏固薄弱知識點;當做對試題時,可以了解知識的掌握程度,并繼續做更難的試題,直到較好地掌握該知識為止。

圖3 基于試題關聯網絡的個性化學習推薦效果圖
試題推薦系統的開發和應用,可以有效破解個性化教育面臨的難題,個性化學習成為現實。根據每個學生的答題結果,試題推薦系統可以分析學生能力水平,根據學生的表現給學生自動推薦不同答題路徑。學生也可以根據自己的做題情況調整學習計劃。試題推薦系統可以自動為學生推薦合適的試題。課下學生只需登陸網上賬號,使用試題推薦系統,即可練習符合自身學習水平的試題。學生的學習變得更加自主化,進而達到個性化教育的目標。
本研究選擇在黃岡中學廣州學校使用試題關聯網絡推薦系統,以驗證其實際教學效果。
從2017年9月開始至今,本研究選取黃岡中學廣州學校七年級到高三的69個班級的學生作為研究對象,在其數學、物理、化學三門學科的教學過程中使用試題關聯網絡推薦系統,參與學生共計3773名。
教學開始前,試題關聯網絡推薦系統的管理人員向學生和教師詳細介紹如何使用試題關聯網絡推薦系統。隨后,在每周講課結束后,教師根據本周課堂教學內容,指定試題關聯網絡中的試題,學生在線進行自適應練習;試題關聯網絡推薦系統則針對不同學生的錯題情況自動推薦關聯試題,以此實現課下自主學習和個性化學習。
教學結束后,抽取學生在線做題記錄及系統使用前、后兩次測試成績展開對比研究,同時進行推薦系統使用效果滿意度調查,以此驗證并分析該推薦系統的使用效果。
在對比研究中,抽取69個班級學生使用系統前、后的兩次考試成績進行對比分析發現,經過一學期的試題關聯網絡推薦系統應用,大部分學生的成績都有提高,其中,大約 70%的學生成績明顯提高,且提高幅度為7%,其余30%的學生成績變化不太明顯。在調查研究中,從上述69個班級中隨機抽取一個班級(共56名學生)為代表,通過問卷調查了他們對試題關聯網絡推薦系統的使用效果滿意情況,以此進一步驗證該系統的使用效果。該調查問卷主要從推薦試題的難易程度、推薦試題的合適程度、試題解析的詳細程度、推薦錯題的價值、查看并補全薄弱知識點的效果、提高學習興趣的程度這 6個維度反映學生總體使用效果滿意度。問卷采用李克特五點量表,5分表示很滿意,4分表示比較滿意,3分表示一般,2分表示不太滿意,1分表示很不滿意。具體調查結果(即56名學生從不同維度給出的評分平均值和標準差)如表1所示。

表1 試題關聯網絡推薦系統使用效果滿意度調查結果
從表1可以看出,在推薦試題的難易程度、合適程度、試題解析詳細程度等6個維度上,被試學生的滿意度均處于中等偏上水平(均值均高于中間值3)。這一結果表明,學生不僅認可系統推薦試題的難易程度和合適程度,還認為推薦系統的錯題價值和試題解析質量均非常高,可以很好地查看并補全薄弱知識點,更可以提高學習興趣。綜上所述,試題關聯網絡推薦系統可以幫助學生更好地實現自主學習和個性化學習,提升學習效果。
目前,個性化教育已經成為未來教育的發展趨勢,國內對于個性化教育的研究正在從概念、理論層面逐步向實際應用轉變。本研究以教育大數據為數據基點、以人工智能為技術基點,研究試題之間的相互關系,構建試題關聯網絡和試題推薦系統,來破解個性化教育在國內實施的難題。實踐證明,本研究基于試題表征構建的試題推薦系統能夠有效地揭示試題之間的內在關聯,自動為學生推薦個性化答題路徑,實現了學生課下自主學習和個性化學習,有效地推進了個性化教育的發展。
[1]國務院.國家中長期教育改革和發展規劃綱要(2010-2020年)[OL]. [2]中國大數據.大數據時代——價值與漏洞并存的時代[OL]. [4]Marie B, Feng M , Barbara M. Enhancing teaching and learning through educational data mining and learning analytics:An issue brief[OL]. [5]王亞飛,劉邦奇.智能教育應用研究概述[J].現代教育技術,2018,(1):5-11. [6]吳曉如,王政.人工智能教育應用的發展趨勢與實踐案例[J].現代教育技術,2018,(2):5-11 [7]萬海鵬,汪丹.基于大數據的牛頓平臺自適應學習機制分析——“教育大數據研究與實踐專欄”之關鍵技術篇[J].現代教育技術,2016,(5):5-11. [8]劉淇,陳恩紅,朱天宇,等.面向在線智慧學習的教育數據挖掘技術研究[J].模式識別與人工智能,2018,(1):77-90. [9]劉淇,陳恩紅,黃振亞,等.面向個性化學習的學生認知能力分析[J].中國計算機學會通訊,2017,(4):28-34. [10]柳麗平.中學實施個性化教育問題研究[D].太原:山西大學,2013:1-57. [11]劉小蘭,楊立國.個性化教育困境的原因探析——基于個人理論的視角[J].衡陽師范學院學報,2014,(5):157-159. [12]Mikolov T ,Chen K, Corrado G, et al. Efficient estimation of word representations in vector space[J].International Conference on Learning Representations,2013,(1):1-12.