王成梁,戴 堅,留伊丹,王永固
(浙江工業大學 教育科學與技術學院,浙江 杭州 310023)
過往信息技術的發展與應用僅改變了傳統教育的表層模式,如通過計算機或移動設備向學習者提供學習內容,但該方式沒有從根本上改變教育形式。人工智能(Artificial Intelligence,AI)的飛速發展及其在教育領域的推廣應用讓教師教學和學生學習都發生了根本性改變,AI 技術也因此被認為是最有希望提升學生學習效果的技術之一[1]。
綜合多位學者的研究,人工智能輔助教育(Artificial Intelligence in Education,AIEDU)可以界定為人工智能相關技術、算法和概念在教育教學各個環節中的應用[1-3]。過去10 年中,AIEDU 在各種教育環境中都得到了廣泛應用,還有部分研究并不局限于具體教育環境與教育內容,開始深入到AIEDU 的個性化運用[4]和針對教學環境進行的算法創新[5]中。
隨著教學研究的不斷深入,AIEDU 領域成為跨學科研究的熱點,但是如果沒有全面了解AIEDU 研究領域的發展狀況,可能會對該領域眾多研究方向感到些許迷惘。尤其對于剛進入該領域的研究者而言,很難從錯綜復雜的研究現狀中找到該領域的發展主線與研究前沿。因此,本文從研究熱點(關鍵詞關系網絡)和演進路徑(時間線圖)出發,結合具體高被引文獻進行深入分析。文章主要關注以下問題:①國內、國際收錄AIEDU 研究論文的主要期刊有哪些?②國內、國際AIEDU 研究中出現頻次最高的關鍵詞有哪些?彼此間有何聯系?③國內、國際關于AIEDU 研究的研究熱點、演進路徑有何異同?
本文主要利用CiteSpace 和VOSviewer 文獻計量學工具進行知識圖譜繪制。CiteSpace 被形象地譯為“引文空間”,其原理是采用相似性算法在時間切片內獲取時區視圖和時間線視圖,從而在時間維度上清晰地勾勒出知識演進過程以及某個聚類中文獻的歷史跨度,了解該領域的發展進程與趨勢[6]。VOSviewer 采用基于概率論的數據標準化方法,在關鍵詞、共機構、共作者等領域提供了多種可視化視圖,具有制圖簡易、圖像美觀等特征。
國內研究選取CNKI 作為數據來源,檢索策略為SU='人工智能' * '教育',時間跨度為2010-2021 年,數據庫最后更新時間為2021 年10 月6 日,來源類別選擇CSSCI 與CSCD 索引學術期刊,獲得1 707 條文獻記錄。但是通過數據庫獲取的數據不經仔細篩查可能會存在一些重復或與主題不符的文獻數據,因此在分析前需要對數據進行預處理,避免數據本身的質量問題影響分析結果,保證可視化分析的有效性。本文主要采用潘瑋等[7]提出的數據清洗“DEAN”流程對文獻數據進行篩選,最終獲得703 篇有效文獻。通過對文獻年發文量進行統計,可以發現從2017年開始,該領域的發文量開始快速增長。
國外研究選取Web of Science 作為數據來源,檢索策略為TS=(("artificial intelligence" OR "AI" OR "deep learning" OR "machine learning")AND "education"),時間跨度為2010 年1 月-2021 年10 月,檢索時間截止為2021 年10月6 日,索引選擇SSCI 與SCIE,文獻類型選擇為Articles,獲得2 317 條文獻記錄。由于“深度學習(deep learning)”同時是教育學和AI 領域的關鍵詞,因此同樣需要進行數據預處理,處理方式與國內研究文獻類似,篩選后最終得到313 篇有效文獻。國內外人工智能輔助教育應用領域發文量如圖1 所示,其中左圖為國內發文量,右圖為國外發文量。

Fig.1 Number of articles published in the field of artificial intelligence assisted education applications at home and abroad圖1 國內外人工智能輔助教育應用領域發文量
對文獻所屬期刊進行統計,可以反映出哪些期刊是AIEDU 研究的主要陣地。國內教育技術學相關刊物是收錄該領域論文的主要刊物,其中刊文量最多的期刊是《中國電化教育》,達到95 篇,刊文量大于50 篇的期刊還有《電化教育研究》、《遠程教育雜志》和《現代教育技術》;國外發表該領域論文的刊物大部分屬于教育技術和計算機教育領域,與國內期刊情況較為類似,刊文數量大于等于10 篇的期刊有Sustainability、Education and Information Technologies、Educational Technology &Society、IEEE Access和Com-puters &Education,其中Sustainability刊文量最多,為22篇,說明近年來開源期刊的快速發展推動了該領域的研究,雖然目前學者們在實現開放獲取的最佳途徑上還存在分歧,但研究成果免費共享的想法卻得到了廣泛認同[8]。
對作者合作網絡進行分析,可以了解該研究領域學術群體的分布情況。703 篇文獻共計有3 314 名作者,運用VOSviewer 分析目前該研究領域最大的合作群體,結果如圖2 所示。由圖2 可知,該領域的核心作者是黃榮懷、曾海軍、楊現明、馬陸亭等,這些學者在教育技術領域深耕多年,往往能敏銳捕捉該領域的時事熱點,把握研究發展前沿,并發表高質量論文。

Fig.2 Author cooperation network knowledge graph of domestic artificial intelligence assisted education application research圖2 國內人工智能輔助教育應用研究作者合作網絡知識圖譜
對上述核心作者所屬單位進行分析發現,大部分作者屬于北京師范大學、華中師范大學和北京航空航天大學,這些學校均在人工智能教育研究方面有著獨特優勢,建立了以“人工智能+教育”為目標的學術機構或學術團隊,例如華中師范大學專門建設了人工智能學部,用于培養人工智能輔助教育應用領域的人才。黃榮懷作為研究人工智能輔助教育學術團體的核心學者,對該領域各方面的研究均有關注,包括但不限于技術應用導致的技術悖論和理論問題、國家與國際組織政策文件研究等[9]。
使用VOSviewer 進一步對國際人工智能輔助教育應用領域的作者進行合作分析,發現了313 篇文獻,共計990 名作者。國際作者合作網絡并沒有像國內一樣形成由若干個權威學者主導的研究中心,大部分學者的發文量較少,其中最大的學術合作群體知識圖譜如圖3所示。

Fig.3 Author collaboration network knowledge graph of international artificial intelligence assisted education application research圖3 國際人工智能輔助教育應用研究作者合作網絡知識圖譜
對比圖2 與圖3 發現,后者知識圖譜的密度遠高于前者,說明國際人工智能輔助教育應用研究更加開放,且學者之間的合作更加深入。此外,從研究內容來看,國內主要以理論研究為主,如杜靜等[9]注重人工智能教育的內涵定義和原則建構;國際研究較為注重實證分析類和應用開發類的研究,如Standen 等[10]以克服問題兒童學習障礙這個實際問題為導向,研究開發基于人工智能的自適應學習系統。
關鍵詞反映研究領域的聚焦點,高頻關鍵詞往往代表了該領域研究熱點。運用VOSviewer 軟件對國內文獻的關鍵詞進行分析,選擇其中頻次大于等于5 的關鍵詞進行可視化,結果如圖4 所示。圓節點越大,表示關鍵詞出現的次數越多;節點連線代表關聯強度,連線越粗表明二者出現在同一篇文獻中的次數越多;節點顏色不同代表聚類不同,即研究主題不同。

Fig.4 Keyword knowledge graph of domestic artificial intelligence assisted education application research圖4 國內人工智能輔助教育應用研究關鍵詞知識圖譜
分析圖4 可知,全圖圍繞“人工智能”這個核心關鍵詞展開,而“智能時代”“智能教育”“智慧教育”等組成了次級核心關鍵詞中具有鮮明特征的一類。有學者指出,將AI引入教育是一次根本性變革,過去教育技術的發展都未能使教育擺脫“工業化”的刻板印象,故產生“把機器制造得越來越像人,把人培養得越來越像機器”的現象,而AI 是推動“工業化”教育向“智慧型”教育轉變的關鍵[11]。
“深度學習”“大數據”“個性化學習”“自適應學習”“學習分析”等次級關鍵詞體現了AI 在教育領域的應用態勢,即技術應用為人才培養提供了獨特的方式方法[12]。深度學習作為一種基于大數據的先進算法,目前已經是機器學習領域一個新的研究方向,受到了諸多學者關注[13]。如今AI算法在在線教育大數據領域的運用已經非常普遍[14-16],基于人工智能的智能化測評、過程性評價也逐漸成為研究熱點[17-18],可見對于人工智能的應用研究,越來越多學者聚焦到提供個性化教學服務與因材施教的教學分析。華為政企業務教育業務部總經理曾偉經在與《中國教育網絡》的一次訪談中提到“教與學不止全面,更懂千人千面”,言外之意便是要尊重個體差異,在人工智能技術的支持下推進個性化教學[19]。現任科大訊飛執行總裁、公司董事吳曉如也在一次訪談中提出人工智能賦能教育的意義在于實施評估,并基于此給予精準、個性化的指導[20]。從上述分析討論可以看出,目前關于AIEDU 的研究已經呈現出一片繁榮景象。任何一種教育技術的研究都是為了更好地推動教育發展,在此目的背后,學術性的理論研究與企業中的應用研究都是不可或缺的。
進一步探究關鍵詞共現圖可以發現,AI 在教育領域的應用存在于諸多子領域,如高等教育、職業教育、教師教育和思想政治教育等。胡欽太等[21]提出人工智能的教育應用為解決高等教育評價模式陳舊、數據缺乏、指標呆板單一等問題提供了方法與途徑;徐曄[22]借助“生態系統即結構”(Ecosystem as Structure)理論模型,在AI 的視域下探索高等職業教育智能生態系統;李世瑾等[23]通過結構方程模型探索教師對人工智能教育的接受度,發現績效期望是提高AI 相關技術使用意愿最主要的因素。與前三者不同的是,AI 運用于思政教育研究并沒有得到學術界的普遍支持,部分學者反而認為這是“人工智能泡沫”,受到了一定程度的反對[24]。
從“教育倫理”“未來教育”“教育變革”等關鍵詞可以發現,隨著AI 與教育的不斷融合,教學模式變革成為學者關注的一個新焦點[25]。此外,教育倫理問題也逐漸受到重視,一方面是學者們對未來教育的展望,另一方面是其擔心技術的不當應用會導致“技術理性主義”,尤其是深度學習算法所需的大量數據極易侵犯他人隱私?;诖?,學者們呼吁在擁抱AI 技術的同時也要關注AI 變革教育的限度,回歸教育的育人本質,但也不能因噎廢食、一味抵觸,應該通過對AI 教育倫理與社會規范的思考,探尋教育中技術向善的可能性、合理性和有效性[22,26]。
使用VOSviewer 軟件對發表在外文期刊中的文獻進行關鍵詞分析,選擇頻次大于等于5 的關鍵詞進行可視化,結果如圖5 所示。由圖5 可知,“人工智能(artificial intelligence)”“機器學習(machine learning)”“教育(education)”“深度學習(deep learning)”“大數據(big data)”“系統(system)”等高頻關鍵詞構成了該領域的代表性術語。

Fig.5 Keyword knowledge graph of international artificial intelligence assisted education application research圖5 國際人工智能輔助教育應用研究關鍵詞知識圖譜
“人工智能(artificial intelligence)”和“機器學習(machine learning)”是全圖關鍵詞的核心。機器學習是人工智能的一個子領域,研究計算機如何模擬人類的學習行為,以獲取新的技能或知識,重新組織已有的知識架構不斷改善自身性能,在國際教育研究中被眾多學者頻繁使用[27]。其應用領域主要包括分析和預測、評估和評價、自適應系統和個性化以及智能輔導系統等[28],比較典型的應用如使用機器學習技術預測在高等教育體系中哪些學生更容易取得成功[29],同樣的方法也可以進行MOOCs 輟學預測。在預測、分析和評估過程中,還會涉及到教育數據挖掘(educational data mining)、學習分析(learning analysis)、深度學習(deep learning)等技術。以MOOCs 輟學預測為例,往往需要先使用深度學習算法構建輟學預測模型(model),并收集數據對模型進行訓練,形成穩定的模型之后方可預測個別學生的輟學概率[30]。與傳統神經網絡需要人工提取并整理特征信息、調整參數相比,深度學習神經網絡基于自動提取特征信息的預測往往具有更高的準確率,并具備自我完善的能力[31]。
不論是分析(analytics)、預測(prediction)還是分類(classification),想要達到最終目標都離不開數據支持,尤其是近年來深度神經網絡的發展,在提高準確率的同時,對模型所需數據體量也提出了更高要求。因此,教育大數據(big data)也逐漸成為學者們關注的一個新焦點和前沿教育研究的新趨勢。在此新領域中,Romero 和Ventura 是較為權威的學者,關注教育數據挖掘中的預測、分類和過程挖掘,對其中的關聯規則挖掘技術應用較多[32],研究背景大多為高等教育和在線學習。此外,10 余年來在線學習(online learning)和網絡化學習(e-learning)的推廣和普及為在線數據收集奠定了良好基礎,尤其是疫情推動下在線教育的飛速發展,更是大大提高了教育技術中數據收集的便利性和可靠性,使教育大數據分析成為可能[33]。此外,依靠大數據的人工智能技術還與個性化學習和精準教育(precision education)息息相關,許多實證研究已經表明,基于深度學習技術的學習表現分析和輟學預測可以個性化地為學習者或教師提供準確信息,從而達到精準教育、因材施教的目的[34]。
從圖5 中可以觀察到,高等教育(higher education)是AIEDU 研究的主陣地。有學者指出,AI在教育管理領域的應用將為高等教育機構內部架構帶來有效的變革,其使用前景主要包括調查教師如何豐富教育形式、學生如何學習以及高等教育機構如何作出準確且恰當的決定,在高等教育大眾化導致高校治理工作量迅速增加的時代背景下,這些應用顯得尤為重要[35]。
為了解國內人工智能輔助教育應用領域的研究路徑,本文采用CiteSpace 的Timeline 時間線功能進行可視化知識圖譜繪制,提取該領域的9 個主要聚類,結果如圖6所示。

Fig.6 Domestic network clustering knowledge graph圖6 國內網絡聚類知識圖譜
從圖6 中可以看出,該領域的研究在2017 年前后展現出截然不同的態勢。尤其是智慧教育概念的提出引起了大量學者對“AI+教育”新議題的關注,該年更是被稱為“人工智能產業化元年”[36]。2019 年后AIEDU 的研究趨于理智化、規范化。從關鍵詞的演進中,可以大致將時區分成若干階段:2010-2016 年研究關注面較為狹窄,AI 和教育的結合不夠緊密,主要關注一些比較淺層的教育應用,如教學軟件、文本統計等;2017-2019 年為該領域的研究爆發期,智能教育、高等教育、大數據等關鍵詞聚類都在該階段異軍突起,成為主流研究領域,深度學習等技術開始成為該領域的主要研究工具與方法,而且研究者開始關注新教育生態下的人才培養體系[37],研究整體呈現出向諸多領域并進深入的趨勢。
為了更加清晰地了解AIEDU 領域突然爆發的研究熱點,可以進一步使用CiteSpace 的Bursts(爆發詞)功能進行分析,結果如圖7 所示。發現大部分爆發詞集中在2017-2018 年,同時AIEDU 進入發文高峰期;2020-2021 年該領域的研究體現出教育和AI 深度融合的態勢,隨著技術在真實教育場景中的推廣應用,研究開始關注變革與倫理問題[38],并且出現了對教育本質的思考以及教育智能化進程的反思,逐步認識到AI 本質上只是一種工具、一類技術[39],在運用時需要警惕技術功利主義,恪守教育發展的本真邏輯[40]。此外,從前文描述性統計體現的發文趨勢也可以看到,在第3 階段該領域研究的增長態勢開始逐漸放緩,并逐步趨于理性化。

Fig.7 Domestic research on the burst period and intensity of burst words圖7 國內研究爆發詞爆發年限與爆發強度
對國際人工智能輔助教育應用領域的研究路徑進行分析,提取該領域的8個主要聚類,結果如圖8所示。

Fig.8 International network clustering knowledge graph圖8 國際網絡聚類知識圖譜
由圖8 可知,國際人工智能教育領域研究的階段性相較于國內并不顯著,但在研究方法上有比較明顯的側重點。結合聚類#0、聚類#1 和具體文獻可以看出,結構方程模型和技術接受模型(Technology Acceptance Model,TAM)被廣泛應用于接受度與使用意愿調查中[41-42],尤其是在疫情的背景下,相關技術在得到推廣的同時,AI 技術應用也掀起了社會科學研究熱潮[43]。
此外,同國內進行比較可以發現,國內更加關注“智能教育”“智能時代”“未來教育”等抽象概念,而國外偏重于定量的實證研究,聚類#2、聚類#3 主要體現了實證研究的類型和所需方法,回歸(regression)、分類(classification)等數據分析方法成為關鍵詞的典型代表,有學者選取2010-2020 年社會科學引文索引數據庫的教育與人工智能研究類別中的100 篇論文進行分析,發現其中實證研究論文多達63 篇,分析論文僅占37 篇,與國內理論分析和質性分析占主流的研究模式形成鮮明對比[44]。
國際研究還關注AI 技術在體育教育中的運用,從聚類#7 中可以看出,自2016 年開始,體育教育與AI 相結合的研究熱度不斷上升[45-46]。將體育視為一種特殊的教育,對運動員生理指標與運動負荷之間關系進行數據挖掘,可制定強度合理、效果顯著的運動訓練計劃[47]。也有研究將人工智能技術運用于如乒乓球等專業運動教學訓練中,形成數字化、智能化的教學過程,進而提高姿勢的準確性與回球的穩定性[48],尤其是動作識別、骨骼檢測等技術的精準度迅速提高,大大拓寬了人工智能在體育教育領域的應用前景。相較而言,國內對于體育教育與AI 相結合的研究還未形成顯著熱點。
為了更清晰地了解國際人工智能教育研究路徑的發展,對國際文獻數據進行Bursts(爆發詞)分析,結果如圖9所示。由于2010 年沒有該領域相關論文,因此爆發詞分析年份是2011-2021年。

Fig.9 International research on the burst period and intensity of burst words圖9 國際研究爆發詞爆發年限與爆發強度
對比分析圖7 和圖9 發現,與國內爆發詞相比,國際研究的爆發詞在時間上分布較為均勻,沒有出現某個年份突然有大量爆發詞的情況。爆發詞中強度最大的是“高等教育(higher education)”,這是由于高等教育是接觸教育技術較多的一個教育階段,不管是對學生還是老師而言,都更有機會利用AI 技術的優勢,提升教學以及學習效果[28]。從2020年開始興起的意愿(intention)研究成為近期研究熱點,在所篩選的文獻中,2021 年有11 篇以用戶意愿為核心的實證研究(基于上文的檢索式可以更便捷地找到以上文獻)。有學者基于計劃行為理論(Theory of Planned Behavior,TPB)探究了學生學習AI 的意愿,發現公眾對AI 的態度、自我效能感等變量都影響了學習AI 的意愿,為在學校推廣AI教育的研究人員和教師提供了依據[49]。
國內與國際AIEDU 的研究演變路徑和側重點上雖然存在一定差異,但是整體都呈現出不斷深入和細化的特點,且越來越關注研究的完整性,例如不以教育倫理為主題的研究,往往也會對倫理問題作一定論述[27]。歸納而言,國內與國際的研究都呈現出百花齊放、百家爭鳴、欣欣向榮的景象。
本文通過VOSviewer 和CiteSpace 軟件分析2010-2021年AIEDU 的研究脈絡、熱點及趨勢,系統回顧了該領域國內、國際的發展態勢,從國內、國際研究的分析和對比中可以發現:①國內、國際刊發該領域論文的主要刊物集中在教育技術學和計算機教育領域,國內具有高度集中性,國外開源期刊(如Sustainability、IEEE Access等)是刊發該領域論文的主力期刊;②國內、國際均在該領域形成了一個由若干領域內權威學者組成的研究學術網絡,但是國內團體有較強的中心性,分布在不同院校中的核心學者(如黃榮懷等)成為該領域學術共同體的中心;③從關鍵詞中可以發現,國內、國際研究的關注點各有特色:從研究教育類型來看,國內在不同教育類型(高等教育、職業教育、教師教育、思想政治教育)上均有研究,而國際更傾向于高等教育(higher education);從研究內容來看,國內學術理論研究和企業應用研究都有涉及,國外以實證型研究如基于算法和模型的預測(prediction)、分析(analysis)、分類(classification)研究為主;④從研究發展態勢看,國內外研究都以AI和教育為核心,呈放射狀演進,應用場景的創新與精準化在不斷深入,關鍵詞和時間線圖都體現出人工智能技術與教育的融合不斷加深。與此同時,越來越多國內、國際學者開始呼吁AI 應用于教育需要回歸教育本源,并展開了倫理探討和接受度研究;⑤從路徑分析和爆發詞出現的年份來看,國內2016 年才進入研究和發文的高峰期,而國際研究整體上沒有出現短時間研究熱度暴漲的情況,近年來發文量的增加也主要得益于開源期刊運動的發展。
有理由相信,AI 和教育相結合的研究會持續且動態地進行下去。因此,從科學文獻計量的視角出發,梳理得到的研究脈絡極具價值,能為該領域研究者提供研究方向與思路。具體而言:①可以幫助一些對人工智能輔助教育應用領域感興趣的學者建立該領域已有研究的清晰框架,深入了解該領域發展過程;②對高頻關鍵詞的聚類和演進分析可以幫助學者了解人工智能輔助教育應用領域的聚焦點與熱點,為學者在研究議題的選擇上提供參考;③分析了人工智能輔助教育領域內的核心論文與核心作者,可以幫助學者快速找到研究時想要參考的文獻;④對該領域期刊的相關分析,可在一定程度上為相關學者在投遞該主題論文時提供期刊選擇指南。
本文也存在一些局限性,國際研究選用的論文是從Web of Science 數據庫的兩大索引中篩選得到的,沒有將其他科學數據庫(如Scopus)納入考慮范圍,會導致分析數據不夠全面,因此接下來的研究會擴大文獻篩選范圍,更廣泛地了解研究動態與前沿熱點,為人工智能輔助教育應用領域提供更加全面、可靠的綜述分析。