王少青



摘 要: 人工智能新的浪潮正在教育領域引發深層次的變革,技術正在重塑教育的形態。教育人工智能的發展問題歸結為處理誰來研究、在哪研究、研究什么、研究成果等問題的4W模型。通過對2017—2019年公開的論文和專利等文獻的檢索與分析,反映出教育人工智能的學術研究和科技創新總體上成果頗豐,在關鍵技術上側重于學習算法的研究,而在應用領域更加關注智能機器人和教育游戲;相較于企業,高校的研究占據了主導地位。
關鍵詞: 教育人工智能 文獻分析 4W模型 產業發展
人工智能的概念是1956年在美國達特茅斯學院確立的,指讓計算機像人那樣思考、學習和認知,即用計算機來模擬人的智能[1]。大數據智能的出現、群體智能引起的關注、混合智能在人機一體化技術中的引入、跨媒體智能的興起、無人系統的迅速發展等都初步嶄露了新一代人工智能技術的鋒芒。
一、研究背景
人工智能已逐漸滲透到社會的各個領域,多個國家已將人工智能提升為國家戰略,出臺了相關政策和規劃,力爭搶占科技的制高點。2017年,國務院首次將人工智能寫入政府工作報告,同年發布了《新一代人工智能發展規劃》,部署了我國發展人工智能的重點任務。工業和信息化部隨即印發《促進新一代人工智能產業發展三年行動計劃(2018-2020)》,全力助推人工智能的發展。2018年,教育部印發《高等學校人工智能創新行動計劃》。旨在進一步提升高校人工智能領域科技創新、人才培養和服務國家需求的能力。人工智能新的浪潮正在教育領域引發深層次的變革,技術正在重塑教育的形態。在此背景下,研究如何應用新技術推動教育事業的發展具有重要意義。
二、發展概況與文獻綜述
2006年Hinton等人提出的深度學習技術拉開了新一代人工智能的序幕。ImageNet競賽代表了計算機智能圖像識別領域最前沿的發展水平,2015年基于深度學習的人工智能算法在圖像識別準確率方面第一次超越了人類肉眼,人工智能實現了飛躍性的發展。伴隨著機器視覺的研究獲得前所未有的成功,深度學習在語音識別、數據挖掘、自然語言處理等不同研究領域相繼取得突破性進展。2016年,微軟將英語語音識別錯詞率降低至5.9%,可與人類相比肩。如今,人工智能已由實驗室走向市場,無人駕駛、智能助理、新聞推薦與撰稿、搜索引擎、機器人等應用已經走進社會生活的各個角落。
教育人工智能領域已經涌現出一批相關研究,閆志明團隊概括了人工智能的內涵、技術與應用等內容,側重對美國政府兩個人工智能報告的解讀,分析了教育人工智能的內涵、關鍵技術與應用趨勢;探索了機器學習在教育中的應用[2];賈積有探討了人工智能教育應用的熱點問題[2];唐燁偉團隊分析了人工智能與STEM等課程的融合[4];吳永和團隊構筑了人工智能+教育的生態系統[5]。
三、文獻檢索
(一)理論模型
教育人工智能的發展問題可歸結為處理誰來研究、在哪研究、研究什么、研究成果等問題的4W模型(見表1)。
(二)數據來源
嘉興數字圖書館是以浙江省文化信息資源共享工程和全省公共圖書館的數字資源為基礎、應用先進的互聯網技術打破空間的約束、提供一站式的各類數字資源檢索和文獻服務的區域性數字資源統一平臺。嘉興數字圖書館擁有CNKI中國知網、研究成果(論文、著作、專利)[KH-1][KH*3/4D]國研網、Springerlink圖書等國內外近50種專業數據庫資源,涵蓋期刊、圖書、學位論文、視頻等多種類型,提供數字文獻資源的全文檢索、瀏覽和下載[6]。
(三)檢索范圍
1.檢索對象。長江三角洲地區是我國經濟最活躍、信息產業發展最快的區域之一。這里匯聚了眾多的高水平大學和科研院所,學術研究氣氛濃郁,科技創新環境優越;許多科技企業在此建立研發中心和產業孵化平臺。浙江大學等高校在信息技術領域具有扎實的人才培養基礎和深厚的學術研究背景;阿里巴巴等企業在IT行業也擁有顯著的影響力和創新能力。
2.檢索主題詞。人工智能的內涵十分豐富,算法模型、運算力和數據量是構成人工智能技術的三要素,深度學習、云計算和大數據三大核心驅動力共同促成了人工智能的突破性進展,語音識別、視覺分析、自然語言理解和情感識別等人工智能的關鍵基礎能力迅速提高,商業智能對話和推薦、智能穿戴設備、自動駕駛、語言翻譯、智能導航、新經濟預測等智能產品應用正快速進入到實用階段。因而,準確把握教育人工智能的關鍵技術和典型應用,適當控制檢索范圍有利于抓住核心問題,確保數據的采集過程具有良好的可操作性。
3.檢索文獻類型。常見的文獻類型有期刊論文、碩博學位論文、中文圖書、專利等。教育人工智能領域的人才培養、學術研究、技術和應用的創新等文獻數據中的信息蘊含著十分巨大的信息量。如何準確有效地提取出反映問題本質的關鍵信息并揭示出它們之間的內在聯系非常關鍵,在此基礎之上嘗試對教育人工智能的未來做一些合理的預測成為可能。
4.時間跨度。2017年起,發展人工智能產業呈現爆發式增長。三年來,圍繞這一新興產業的人才、資本、項目等資源要素紛紛聚集,新技術新產品等表現出向各應用領域全面滲透的態勢,分析這一時期教育人工智能產業的發展具有重要的現實意義。
(四)檢索方法
嘉興數字圖書館可使用高級檢索和專業檢索功能進行高度定制化的檢索方式。通過賦予專業檢索工具準確的通用字段、文獻類型和非通用字段等信息生成檢索式,可以按照使用者的意圖輸出精確的檢索結果。檢索式的編寫可參考專業檢索頁面的使用說明。
檢索舉例:檢索浙江大學2017—2019年教育人工智能領域發表的博士學位論文數量。
四、基于文獻分析的教育人工智能產業發展比較研究
(一)教育人工智能關鍵技術及典型應用文獻比較分析
從總體角度分析,深度學習和機器學習的文獻數量最多,分別占到了去重后文獻總數的49.49%和32.05%;智能導師、智能測評、智能代理和情感計算極少,加起來也不到文獻總數的2%。從文獻類型分析,期刊論文數量占有絕對優勢,專利數也比較可觀;博士論文數量和中文圖書相對較少,分別占文獻總數的2.47%和2.10%,但絕對數量還是較多的。從技術和應用角度分析,以人工智能關鍵技術為主題的文獻占有主導優勢,達到87%;而單從應用角度來看,智能機器人和教育游戲的研究較熱(見表2)。
(二)長三角地區部分高校教育人工智能領域文獻比較分析
浙江大學、上海交通大學、東南大學、中國科技大學和南京大學在調研的14所高校中公開的文獻數量總體上最多;合肥工業大學、華東師范大學、浙江工業大學分別在碩士學位論文數、期刊論文數、專利數3個分項指標中排到了前三位。寧波大學、浙江師范大學和浙江理工大學3所高校在教育人工智能領域的文獻較少(見表3)。
(三)部分企業教育人工智能領域文獻比較分析
從文獻類型角度分析,企業明顯熱衷于申請專利,而對發表論文并不積極,總體上的比例大約是8:1。從企業間的橫向比較來看,騰訊、百度和阿里巴巴這3家IT巨頭的專利申請量遠遠大于聯想、小米和科大訊飛,科研創新上的差距較為明顯(見表4)。
五、結束語
研究表明,教育人工智能的學術研究和科技創新總體上成果頗豐,在關鍵技術上側重于深度學習和機器學習算法的研究,而在應用領域更加關注智能機器人和教育游戲。浙江大學等一批重點高校既注重學術理論上的探索,又加強了技術成果的轉化,論文和專利數量都遠大于企業,在教育人工智能領域占據了主導地位。
產業發展的關鍵在人才,人才的培養是壯大人才隊伍的重要途徑,而高校又是培養人才的主陣地。一所高校在教育人工智能領域產出的文獻數量越豐富,可以說明該校在這一領域的研究越活躍,也能反映該校的師資力量在這一領域也越強,強大的師資是人才培養的有力保障。重點關注文獻產出豐富的高校,深入調研這類高校在各層次、各類型上培養人工智能專業人才的規模和方向,就能夠對人工智能專業人才的總體供給水平產生具體的認識。
參考文獻:
[1]潘云鶴,人工智能2.0與教育的發展[J],中國遠程教育,2018(5).
[2]閆志明等,教育人工智能(EAI)的內涵、關鍵技術與應用趨勢——美國《為人工智能的未來做好準備》和《國家人工智能研發戰略規劃》報告解析[J],遠程教育雜志,2017(1).
[2]賈積有,人工智能賦能教育與學習[J],遠程教育雜志,2018(1).
[4]唐燁偉等,基于教育人工智能支持下的STEM跨學科融合模式研究[J],中國電化教育,2017(8).
[5]吳永和等,構筑人工智能+教育”的生態系統[J],遠程教育雜志,2017(5).
[6]嘉興數字圖書館,〈http://www.jxelib.com/>.