馮翔 王亞飛 吳永和
?
人工智能教育應用的新發展*
馮翔1王亞飛2吳永和3[通訊作者]
(1.華東師范大學 上海數字化教育裝備工程技術研究中心,上海 200062;2.科大訊飛股份有限公司 訊飛教育技術研究院,安徽合肥 230088;3.華東師范大學 教育信息技術系,上海 200062)
人工智能在教育領域的應用已有四十多年的歷史,隨著近年來人工智能在各領域不斷取得重大突破,教育人工智能也將迎來新一輪發展。文章首先梳理了人工智能發展的脈絡;進而分析了教育人工智能的典型應用領域以及未來趨勢,提煉總結教育人工智能應用模型以及核心服務能力,分析深度學習技術對于實現若干核心服務能力的作用;最后指出教育人工智能所面臨的機遇和挑戰。文章從多個維度闡述了當前教育人工智能的發展情況,以期為設計人工智能教育應用提供借鑒。
深度學習;人工智能教育應用模型;人工智能教育應用核心服務;人工智能民主化;教育數據隱私保護
人工智能(Artificial Intelligence,AI)被廣泛認為是繼信息技術革命之后的新一輪生產力革命,它將對諸多行業和領域產生巨大和深遠的影響,而教育就是其中一個需要被高度重視的領域。在這種背景下,《“互聯網+”人工智能三年行動實施方案》提出要鼓勵開展人工智能基礎知識和應用培訓;《新一代人工智能發展規劃》提出要利用智能技術加快推動人才培養模式、教學方法改革;《高等學校人工智能創新行動計劃》與《教育信息化2.0行動計劃》強調要發展智能教育。由此可見,將AI應用于教育領域已成為未來一段時間需要重點關注的問題。
通常,AI在教育領域的應用被稱為Artificial Intelligence in Education(AIED)[1]。國外一些政府和研究機構高度關注AIED的發展,美國國家人工智能研究和發展戰略計劃[2]、英國機器人和人工智能報告[3]、斯坦福報告[4]中都有相關的闡述。培生的報告從教學模型和應用領域闡述了人工智能教育應用的發展路徑,強調需要從政府層面進行規劃設計,圍繞人工智能教育應用進行一個生態系統建設,而不能局限于單一應用[1]。國內外的這些規劃及報告將推動AIED的發展。
因為人工智能技術無法滿足日益膨脹的幻想需求,歷史上人工智能的發展也經歷了數次“寒冬”。以史為鑒,面對當前人工智能的快速發展態勢,在具體實施過程中,我們需要對其在教育領域的應用進行分析,回答能做什么、要做什么、有哪些關鍵技術以及要注意什么。為此,本研究梳理了當前人工智能和教育應用的發展現狀、應用領域、核心服務能力、關鍵技術模型以及機遇與挑戰。
在1956年達特茅斯會議上,人工智能這一術語首次被提出。在1956~1969年間,一些研究成果使得人們對于人工智能研究產生了巨大的期望,如Herbert[5]開發了幾何定理證明器,James[6]的SAINT程序能夠求解大學一年級課程中典型的閉合式微積分問題,Tom[7]的ANALOGY程序能夠求解出現在智商測試中的幾何類推問題。
然而,AI早期的問題求解主要是一種通用的搜索機制,試圖串聯基本的推理步驟來尋找完全解,但這種方法難以應對現實世界復雜的領域問題。因此,20世紀70年代,基于知識的專家系統開始發展起來。這種系統聚焦于特定領域,用領域大量的相關知識作為基礎,允許更大量的推理步驟,因此可以更好地處理特定領域中的問題,在業界得以廣泛應用。
然而,人們逐漸認識到,專家系統面臨著“知識工程瓶頸”問題,即依靠人把知識總結出來再教給計算機是相當困難的。于是,機器學習這一技術分支出現了,其目的就是讓機器自己學習知識。
從2000年前后開始,大數據集在機器學習中發揮了重要作用[8]。如Halvey[9]認為很多應用中的“知識瓶頸”可以通過足夠的數據來解決;Hays等[10]討論了馬賽克模糊處理照片補全的問題,他們發現使用1萬張照片,算法性能會很差,而如果增加到200萬張照片,算法會表現出極好的性能。
人工神經網絡是機器學習中一種重要的計算模型。由于早期人工神經網絡感知機只有兩層網絡,難以表達復雜的問題,而多層的復雜神經網絡架構,又面臨計算難度驟增等問題,因此早期遭到包括Minsky等人工智能先驅的批評,其發展起起落落。2006年,Hinton[11]開啟了深度學習研究和應用的新時代。發展至今,人工智能在語音識別處理、視頻和圖像處理、物體檢測以及其它領域表現出了比傳統方法更好的效果[12]。
隨著“互聯網+教育”的發展,在線學習平臺上的用戶越來越多,數據量急速膨脹,依托傳統的分析方法難以有效識別學情。采用人工智能技術,可以有效分析、高效利用這些數據。Marius等[13]基于MOOC的學習數據,采用機器學習算法預測學生退課情況,該項研究中有3,475,485條點擊記錄。研究者將這些記錄條目屬性分為22類,依據這22類屬性基于主成分析算法、支持向量機算法綜合判定學生退課率,在基準方法上提高了15%的預測準確率。
一對一教學是理想的教學模式,因為其天然具備個性化服務的內涵。研究表明,在一定層面,AI能夠模擬出有效的一對一教學模式[14][15],其中典型的就是智能導師系統(Intelligent Tutoring System,ITS)。ITS能夠整合認知模型、學習者模型、資源推薦、學習路徑推薦等眾多的技術來實現針對學習者的個性化輔導。經歷幾十年的發展,ITS已經獲得了廣泛應用,VanLEHN[16]認為在某些情況下,ITS已經接近人類一對一教學的效果。Carnegie Learning’s Cognitive Tutor Mathematics Courese[14]已被2000所中學師生使用。隨著AI技術的進步,ITS中開始檢測學生情緒的變化并提供針對性的學習策略調整[17]。
人工智能的自然語言處理分支已被廣泛應用于學術寫作訓練領域。Simon[18]設計了一個針對民法學習的寫作課程分析工具。Ming[19]針對用機器學習的方法對漢字進行相似性對比,利用這些相似性數據自動生成漢字填空和多選試題。可以預見,未來大量的、重復性的工作將被人工智能取代。
吳永和等[20]提出了“人工智能+教育”應用的四種形態,包括智能校園、立體化綜合教學場、基于數據智能的在線學習教育平臺、智能教育助理。余明華等[21]深入了分析機器學習在智慧教育中的應用問題。本研究從實踐的角度探討如下幾個具體的應用。
(1)大規模自動化的課堂觀察和分析
①教學角度。在傳統課堂上,教師難以快速識別不同學生的需求。如教師無法實時判斷哪些學生掌握得好,哪些學生掌握得不好。有經驗的教師可以根據學生的面部表達進行部分判斷,但這中情況高度依賴教師本身的素養,因此這種教育近乎“藝術”,難以普及。
②教學評價的角度。典型的方式是通過對任課老師的聽課、評課進行評價,這一方式存在兩個問題:一方面,聽課這件事本身對該堂課會產生影響;另一方面,這種聽課行為無法做到大規模、持續地按需進行,難以積累大規模的有效數據。
以上兩個方面都對課堂觀察技術提出了高要求。隨著深度學習技術的應用,人工智能技術在人臉識別、情感識別、動作識別、語音識別等領域取得了突破性進展,這為智能課堂中大規模、自動化的課堂觀察和分析提供了基礎。
(2)用于家庭早教的人工智能教育機器人、智能音箱等
隨著人工智能在語言識別、語音合成、圖像識別等領域不斷取得突破,一批新型的早教機器人逐漸進入市場。這些機器人同互聯網進行緊密結合,不斷在用戶之間發生數據交互。可以預期,這樣的機器人最終將越來越了解兒童,其教育屬性將越來越明顯。
(3)萬物識知與科研科普
萬物識知與科研科普是一種新的在線學習和科研教學形態,該形態能夠將日常生活經歷和學習很好地結合起來。深度學習技術為這種教育模式提供了技術基礎,如Carranza等[22]采用深度學習的圖像識別方法對標本進行識別,準確率接近80%。這項研究重要而深刻的意義在于:①在生物、地理等自然領域,機器自動識別物種和地理現象的能力不斷提高,可能會極大地豐富這些領域的科研數據,這將解決野外工作者力量有限、不可遍及全球任何地方的問題;②用戶通過手機APP拍攝所見之物,當遇到不認識拍攝物的時候,系統可直接通過機器識別,開展以用戶興趣和主動服務為核心的科普和自學服務,此方式正好切中自主學習、探索學習的精神。
Self[23]認為教育方面、心理方面和社會方面的知識通常是含蓄的、不外顯的,ITS作為人工智能教育應用的典型代表,其科學目標就是使這些知識能以精確和外顯的形式計算化。從廣義角度來講,人工智能教育應用的科學目標也是類似的情況,即數據驅動的分析、預測和行動。
在人工智能的驅動下,教學測評評價、教學管理、教學場景、教育形式等方面呈現出新的教育產品和教育形態[24][25][26][27]。應用場景包括智慧教室、MOOC、ITS系統中的學習和其它各類數字化學習環境。然而無論哪種學習場景,人工智能教育應用的核心共性關鍵要素可以概括為四種:①關于學習者的模型,即獲取學生的學習經歷數據,據此數據進行實時或者離線分析,從而提供實時或者離線的學習反饋和提示。在學習者模型中,關鍵的識別內容包括認知水平、情感和情緒、學習狀態等。②關于領域的模型,即對學生所學知識主題的感知處理,自動構建符合學生需求、知識水平、情感狀態的學習內容并做出相應的干預。③關于教學法的模型,即從人類教學過程或者機器對抗學習過程中提煉的、關于教學方法方面的知識。教學法模型是教師(包括智能導師系統)、學習者和學習資源這三個要素之間的粘合劑。④關于自動化的模型。自動化可能貫穿于前述①-③的各環節中。如在學習者模型中,依賴于機器學習的自動化方法將持續地為學習者進行建模,這個過程不是靜態的,而是在線動態的;在領域模型方面,機器學習算法可以持續地對學習資源進行知識建模、分類;在教學法模型中,系統可以自動批改學生主觀題的內容[18],還可以自動出題[19]等。
人工智能的教育應用千差萬別,但是也總離不開前述四個要素。而其底層更是存在若干共性關鍵服務,這些服務應該是可以被復用的。一些學者從智能代理的角度闡述了這種復用,如吳永和[20]提出了面向學生學習智能代理、面向教師教學智能代理、面向資源服務智能代理、面向教育管理者智能代理、面向家庭智能代理、面向整個教育的智能代理等。本研究提煉了工智能教育應用的核心共性服務,如表1所示。
表1 人工智能教育應用的核心共性服務

如今,教育正朝著因材施教和個性化教學方向發展。因此,在本質上,研究者首要關注的任務是教學過程中的分類和聚類,包括對教師、學生以及學習資源的分類和聚類,而教師、學生以及學習資源這三類又都包含多種維度(如教師—教學風格、教學手段,學生—認知水平、學習風格、潛在學習需求,學習資源—認知水平、類型等),再根據分類結果進行相關的教學預測和行動。因此,分類是教育領域中人工智能的一個主要關注點。
深度學習在分類問題中發揮了重要的作用。深度學習是機器學習的一種方法,深度學習模型是含有多個隱含層的人工神經網絡,該網絡的輸入是特征向量,輸出可以是二元分類或者多元分類。深度學習算法優化求解人工神經網絡多個層級間的鏈接權重,從而對海量大數據中錯綜復雜的特征建模。在網絡的內部,每一層在前一層特征的基礎上進行新的表征提取,從而建立事物的抽象特征模型。本研究提煉深度學習對表1中若干核心共性服務的作用,如表2所示。
表2 深度學習在教育領域的作用
目前,深度學習架構和算法已經有很多在特定領域和基準測試中表現優異。將這些成果移植到教育領域中需要做如下關鍵工作:①確定教育領域的問題域;②確定該問題對應的輸入值特征向量;③確定是二元分類還是多元分類;④調優,由于深度學習中具有若干超參數,而目前超參數的選擇尚未形成完備的理論化方法作為指導,故需在特定問題域中結合經驗調整優化。
AI新突破和AI民主化[28]為快速推進AI在教育領域的深度融合應用提供了機會。近年來,深度學習在諸如計算機視覺、語音識別和自然語言處理等領域都取得了突破性進展,以深度學習為代表的AI技術快速進入大眾視野。在這樣的快速發展過程中,人們開始思考如何降低人工智能應用的門檻,并付諸于行動,這一行動被稱為AI民主化。目前,微軟認知服務、亞馬遜的機器學習服務、Google人工智能服務、OpenAI以及Github上出現了越來越多的開源深度學習包,為軟件工程師和研究人員提供了便捷,解決了傳統人工智應用開發門檻高的問題。
教育大數據的隱私保護缺乏科學化手段,導致圍繞數據的研究不能快速健康發展。我們通常靠行政流程來確保數據保密性,但行政審批手段是從管理的角度來確保數據保密,而不能從科學的角度來確保數據保密。在利用科學的方法進行隱私保密方面,國外已經有了比較成熟的技術和策略。如HarvardX-MITx Person-Course De-Identified dataset[29]應用K-anonymity[30]方法作為一種數據隱私保護技術,其目的是在保護用戶信息隱私的同時最大限度地提供有利于研究的信息。目前,我國教育領域還缺少這方面的應用經驗,這將在很大程度上影響教育大數據的開發、開放和研究。
雖然目前深度學習領域在不斷嘗試半監督甚至無監督等方法,來降低對大量標記訓練數據的依賴,但使用標記數據作為訓練集進行深度學習訓練依然是主要的方法。比如圖像識別領域的訓練,有很多是基于數據集ImageNet[31]來進行的。業界也認識到,領域對學習具有重要的作用,因此在教育領域開發相當數量的標記數據集,將成為未來人工智能教育應用研究的一項重要工作。
“人工智能+教育”將是教育信息化發展的高級階段。未來人工智能賦能的教育,將推動精細管理、精準測評、個性教學、因材施教走上新高度,在此過程中,關注和研究“人工智能+教育”的領域問題(包括應用領域、問題領域和技術領域的問題),以迎接由此而來的一系列挑戰等,是不可缺少的。本研究分析了人工智能的發展概況,探究了教育人工智能的典型應用領域,提煉了人工智能教育應用的核心服務,指出教育人工智能面臨的重大機遇是AI民主化,但關鍵的挑戰在于數據的隱私與開放以及可供訓練的語料數據集。
[1]Luckin R, Holmes W, Griffiths M, et al. Intelligence unleashed: An argument for AI in education[R]. London: Person, 2016:18-19、51.
[2]U.S.National Science and Technology Council. The national artificial intelligence research and development strategic plan[R]. Washinton, US:National Science and Technology Council, 2016:10.
[3]House of Commons. Robotics and artificial intelligence[R]. London: Parliament 2016:12-16.
[4]Stone P, Brooks R, Brynjolfsson E, et al. Artificial intelligence and life in 2030[R]. Stanford, CA: Stanford University, 2016:3.
[5]Gelernter H. Realization of a geometry theorem proving machine[A]. Proceedings of the Computers & Thought[C]. Cambridge, MA, USA: MIT Press, 1959:137-152.
[6]Slagle J R. A heuristic program that solves symbolic integration problems in freshman calculus[J]. Journal of the Acm, 1963,(4):507-520.
[7]Evans T G. A heuristic program to solve geometric-analogy problems[A]. Koller H R. Proceedings of the Spring Joint Computer Conference[C]. London: Cleaver-hume Press, 1964:327-338.
[8](美)斯圖爾特·羅素著,(美)彼得·諾維格著.殷建平譯.人工智能:一種現代方法(第3版)[M].北京:清華大學出版社,2013:6-16.
[9]Halevy A, Norvig P, Pereira F. The unreasonable effectiveness of data[J]. Intelligent Systems IEEE, 2009,(2):8-12.
[10]Hays J, Efros A A. Scene completion using millions of photographs[J]. Communications of the ACM, 2008,(10):87-94.
[11]Hinton G E, Osindero S, Teh Y W. A fast learning algorithm for deep belief nets[J]. Neural Computation, 2006,(7):1527.
[12]Lecun Y, Bengio Y, Hinton G. Deep learning[J]. Nature, 2015,521:436-444.
[13]Kloft M, Stiehler F, Zheng Z, et al. Predicting MOOC dropout over weeks using machine learning methods[A]. Proceedings of the Empirical Methods in Natural Language Processing (EMNLP)[C]. Doha, Qatar: Association for Computational Linguistics, 2014:60-65.
[14]Chaudhri V K, Gunning D, Lane H C, et al. Intelligent learning technologies part 2: applications of artificial intelligence to contemporary and emerging educational challenges [J]. AI Magazine, 2013,(4):10-12.
[15]Bloom B S. The 2 sigma problem: The search for methods of group instruction as effective as one-to-one tutoring [J]. Educational Researcher, 1984,(6):4-16.
[16]VanLehn K. The relative effectiveness of human tutoring, intelligent tutoring systems, and other tutoring systems [J]. Educational Psychologist, 2011,(4):197-221.
[17]Janning R, Schatten C, Schmidt-Thieme L. Improving automatic affect recognition on low-level speech features in intelligent tutoring systems[A]. Proceedings of the Design for Teaching and Learning in a Networked World[C]. Switzerland:Springer,2015:169-182.
[18]Knight S, Buckingham S S, Ryan P, et al. Designing academic writing analytics for civil law student self-assessment [J]. International Journal of Artificial Intelligence in Education, 2016,28(1):1-28.
[19]Liu M, Rus V, Liu L. Automatic Chinese multiple choice question generation using mixed similarity strategy[J]. IEEE Transactions on Learning Technologies, 2017,(99):1-11.
[20]吳永和,劉博文,馬曉玲.構筑“人工智能+教育”的生態系統[J].遠程教育雜志,2017,(5):27-39.
[21]余明華,馮翔,祝智庭.人工智能視域下機器學習的教育應用與創新探索[J].遠程教育雜志, 2017,(3):11-21.
[22]Carranza-Rojas J, Goeau H, Bonnet P, et al. Going deeper in the automated identification of herbarium specimens [J]. BMC Evolutionary Biology, 2017,(1):181.
[23]Self J. The defining characteristics of intelligent tutoring systems research: ITSs care, precisely[J]. International Journal of Artificial Intelligence in Education, 1998,10:350-364.
[24]Winebarger J,Stüker S, Waibel A. Adapting automatic speech recognition for foreign language learners in a serious game[A]. Proceedings of the 3rd Workshop on Games and NLP [C].Palo Alto, California, USA:AAAI Press, 2014:39-40
[25]Witt S M, Young S J. Phone-level pronunciation scoring and assessment for interactive language learning[J]. Speech Communication, 2000,(2):95-108
[26]Liu O L, Rios J A, Heilman M, et al. Validation of automated scoring of science assessments[J]. Journal of Research in Science Teaching, 2016,(2):215-233.
[27]科大訊飛.國家普通話智能測試系統[OL].
[28]Microsoft. Democratizing AI: For every person and every organization[OL].
[29]Mitx, HarvardX. HarvardX-MITx person-course academic year 2013 de-identified dataset, version 2.0[OL].
[30]SWEENEY L. K-anonymity: A model for protecting privacy[J]. International Journal of Uncertainty, Fuzziness and Knowledge-Based Systems, 2002,(5):557-570.
[31]Deng J, Dong W, Socher R, et al. Imagenet: A large-scale hierarchical image database[A]. Proceedings of the 2009 IEEE Conference on Computer Vision and Pattern Recognition[C]. Miami, FL, USA :IEEE,2009:248-255.
New Progress of Artificial Intelligence in Education
FENG Xiang1WANG Ya-fei2WU Yong-he3[Corresponding Author]
Artificial Intelligence (AI) in Education has been developing for more than 40 years. With the continuous breakthrough of artificial intelligence in various fields, Artificial Intelligence in Education will also usher in a new round of development. In this article, we first reviewed the developing process of AI. Then, analyzed the typical application fields and future trends of AI in education, concluded the application models and core service abilities of AI in education. Moreover, we argued that the significant role of deep learning technology in fulfilling some of the core services abilities. Finally, the opportunities and challenges of AI in education were discussed. This research showed a panoramic picture of the current application of AI in Education, expecting to offer references for future education enhanced by AI.
deep learning; AIED models; AIED core service; democratizing AI; educational data privacy protection
G40-057
A
1009—8097(2018)12—0005—08
10.3969/j.issn.1009-8097.2018.12.001
基金項目:本文為教育部在線教育研究中心2017年度在線教育研究基金(全通教育)課題“在線教育系統中學生反饋文本的情感分析技術與應用研究”(項目編號:2017YB126)、中央高校基本科研業務費華東師范大學青年預研究項目“課堂環境中基于面部表情識別的師生情感模式及應用研究”(項目編號:2017ECNU-YYJ039)、上海市科委科技攻關重大項目“上海數字化教育裝備工程技術研究中心能力提升項目”(項目編號:17DZ2281800)的階段性研究成果。
馮翔,副研究員,博士,研究方向為人工智能教育應用、教育大數據與學習分析、教育軟件和應用設計、教育信息化頂層設計,郵箱為xfeng@eec.ecnu.edu.cn。
2018年5月12日
編輯:小西