


摘要:教育大模型智能體是新一代生成式人工智能技術,可以利用大語言模型進行任務分解和規劃,調用工具和知識庫,完成復雜多樣的教育任務,但也同時存在對其技術原理和新特征認識不深、應用現狀探究不夠全面、教育效能不明晰等問題。為此,文章首先從技術角度介紹了教育大模型智能體的開發情況,包括設計教育大模型智能體的技術架構、分析其主流開發框架與平臺的優缺點。之后,為呈現教育大模型智能體的應用現狀,文章引入國內外20個典型的教育大模型智能體進行比較分析,提煉出教育大模型智能體的新特征,總結了教育大模型智能體在教、學、管、評四大應用場景中發揮的作用,并介紹了不同場景下教育大模型智能體的應用案例。最后,文章結合教育大模型智能體應用面臨的機遇與挑戰,對其未來前景進行了展望。文章的研究推動了教育大模型智能體的開發與創新應用,有利于促進教育數字化轉型和教育高質量發展。
關鍵詞:教育智能體;大模型;教育大模型智能體;生成式人工智能
【中圖分類號】G40-057 【文獻標識碼】A 【論文編號】1009—8097(2024)11—0005—10 【DOI】10.3969/j.issn.1009-8097.2024.11.001
引言
2024年3月,教育部啟動人工智能賦能教育行動,并發布了四項具體行動,將促進新一代人工智能技術與教育教學深度融合,推動教育大模型落地應用,賦能教育高質量發展[1]。教育智能體是人工智能教育應用領域的重要研究方向,支持個性化學習的發展,但存在對話交互能力不強、開發成本高、知識動態更新難、通用性知識差等問題[2],已難以滿足高質量教育教學的需要。而大語言模型擁有海量的通用知識,能夠流暢地回答用戶幾乎所有的問題,有助于提升學生在閱讀、寫作、數學、計算機、語言等方面的知識技能[3],但存在可解釋性不足、師生過度依賴、偏見和“幻覺”等問題[4][5],難以適應復雜、多樣的教育任務。在此背景下,基于大語言模型的教育智能體——教育大模型智能體應運而生。
教育大模型智能體是新一代生成式人工智能技術,其充分利用大語言模型在自然語言理解與生成、邏輯推理、多模態感知、通用學科知識和自我學習等方面的強大能力,能夠自主規劃教育任務、感知多模態教育信息、調用知識庫與教育工具、完成復雜多樣的教育任務,并為人工智能教育教學的創新應用提供關鍵技術支撐。但與此同時,教育大模型智能體也還存在對其技術原理和新特征認識不全面、教育應用現狀探究不夠深入、教育效能不明晰等問題。為此,本研究嘗試先從技術角度剖析教育大模型智能體,之后從新特征、應用場景、應用案例三個方面呈現教育大模型智能體的應用現狀,最后結合教育大模型智能體應用面臨的機遇與挑戰對其未來前景進行展望,以期為深度賦能教育教學全過程提供新思路,推動教育高質量發展。
一 教育大模型智能體的開發
智能體是指能夠感知環境并自主采取行動以實現特定目標的實體[6]。教育智能體繼承了智能體的核心特性,并專門針對教育環境和任務進行設計與優化。在大語言模型出現之前,教育智能體經歷了智能導師系統、可視化的虛擬角色、智能會話機器人等外在形態的演變[7][8],但其本質仍然是一種教育軟件或硬件實體。劉清堂等[9]將教育智能體定義為由計算機生成、呈現于教學場景中的虛擬形象,其目的是促進學習者的認知學習。從技術演進來看,教育智能體經歷了基于邏輯規則、符號表示、自然語言處理、計算機視覺、大數據、深度學習、情感計算和人形機器人等技術階段[10][11]。當前,大語言模型的出現推動教育智能體進入自主智能和群體智能階段,教育大模型智能體以通用或教育大語言模型作為邏輯推理的核心“大腦”,使其能夠自主規劃、決策教育任務,使用教育工具執行子任務,感知多模態教學狀態,調用學科知識庫,自主或人機協同完成教學備課、協作學習、科學探究等復雜的教育任務。此外,通過多智能體協作與競爭,可以實現不同角色和功能的教育大模型智能體之間的信息交換和任務協調,形成具有群體智能的系統。例如,吳永和等[12]提出了基于多智能體協作的“眼-腦-手”三維能力框架,以實現觀察學生(眼睛)、數據分析與決策(大腦)、反饋和指導(雙手)的協同。基于上述分析,本研究認為教育大模型智能體包括基于通用大語言模型智能體開發框架構建的教育智能體(如Kimi+)和教育機構中的專屬垂域教育智能體(如EduChat)。
1 技術架構
教育大模型智能體繼承了人工智能領域大模型智能體的核心技術與特征。大模型智能體技術架構包括大語言模型、規劃、記憶、工具和行動等要素,具有自治性、反應性、主動性、社會性等特征[13]。大語言模型智能體的推理能力(也稱推理框架)是其規劃任務、決策過程、調用工具和執行行動的核心,經歷了思維鏈(COT)、思維樹(TOT)、ReAct(Reasoning and Acting)等推理框架的演變。其中,ReAct以有效模仿人類學習新任務、做出推理或決策的過程,成為目前主流的大語言模型智能體推理框架之一,其核心思想是將推理(如思維鏈)和行動(如調用工具)交替協同進行,即通過思考(下一步做什么?調用什么工具)、行動(調用工具執行任務)、觀察(任務執行的結果)的反復循環,使智能體在進行復雜內部推理的同時,還能通過觀察反饋的結果調整其行為以適應不斷變化的環境和需求。
本研究在參考大模型智能體技術架構的基礎上,結合ReAct推理框架,設計了教育大模型智能體的技術架構,如圖1所示。教育大模型智能體的技術架構包含智能體核心、教育任務規劃、知識與記憶、工具、行動五個模塊:①教育大語言模型(含多模態教育大語言模型)作為智能體核心,用于感知和理解師生輸入的教育任務,包括文本、圖片、音頻、視頻等多模態信息,驅動智能體檢索知識與更新記憶、思考與規劃教育任務、調用工具執行行動和觀察行動的結果。②教育任務規劃模塊包含規劃、決策和反思,其中規劃主要指復雜任務分解,是將輸入的教育任務分解為更小、更易執行的子任務;決策主要是行動計劃決策,用于決定任務執行的步驟和需要調用的工具;而反思是指自我反思改進,即反思行動的結果,優化子任務分解,調整任務執行步驟。③知識與記憶模塊包括短時記憶、長時記憶和混合記憶,其中短時記憶存儲教育提示語;長時記憶利用檢索增強生成(Retrieval-augmented Generation,RAG)技術,形成基于RAG技術的學科知識庫;混合記憶則記錄師生對話歷史數據。④工具模塊包括外部數據庫、教育大模型智能體可調用的插件和其他大模型,用于擴展教育大模型的能力和知識邊界,完成復雜多樣的教育任務。⑤行動模塊是基于更新的記憶和規劃、決策的結果,選調工具執行諸如學術論文檢索、代碼執行、接入考試數據庫生成試卷、調用數學大模型解答復雜計算題等行動。通過ReAct推理框架,教育大模型智能體首先讀取輸入的教育任務,更新教育提示語,檢索知識庫和對話歷史數據,然后通過推理分解復雜教育任務,決策行動計劃,最后調用工具執行行動,觀察行動結果,通過反思迭代改進,直至輸出任務最終結果,以此實現自主優化迭代,有效達成教育任務目標。此外,在輸入教育任務后,上述教育大模型智能體還可與外部多個不同類型的教育大模型智能體進行對話與協作,或與教育環境交互,協同完成更加復雜的教育任務。
2"主流開發框架與平臺
對相關文獻進行梳理,可以發現當前教育大模型智能體的主流開發框架有AutoGPT[14]、HuggingGPT[15]、AutoGen[16]、MetaGPT[17]、LangChain[18]、InternGPT[19],而備受關注的熱門開發平臺是Coze[20]、Dify[21]。本研究根據官網信息、Github文檔內容和已發表的相關研究成果,對以上開發框架和平臺的易用性、功能性進行對比分析,結果發現:
①開發框架方面,AutoGPT和HuggingGPT具有開發成本低、可擴展性良好、集成了社區大模型等優勢,適合用于開發自動化教育流程工具、學術研究工具和個性化學習助手等,但運行成本較高;AutoGen、MetaGPT、LangChain支持教育智能體定制開發,可用于開發多智能體交互式對話教學工具、多智能體學術科研工具、個性化學伴和教學助理等,但學習成本和開發技術門檻都較高;而InternGPT適合用于開發視覺交互的教育智能體和多模態交互學習環境下的視覺問題解答工具,但技術難度高,可擴展性和兼容性不足。
②平臺方面,Coze、Dify平臺支持零代碼或低代碼搭建智能體,技術門檻低,適合師生開發聊天機器人、個性化學習助手、教學助手、科研助手等智能體,具有可視化的編排界面,自定義技能、添加知識庫和數據庫、選擇多類型插件和定制工作流等優勢,缺點是未完全開源,難以實現私有化部署。
二"教育大模型智能體的應用現狀
自教育大模型智能體出現后,各國紛紛開始關注其相關技術的研發與教育應用,以提升教育的質量和效率。例如,瑞士洛桑聯邦理工學院開發的ChemCrow可用于化學教學和科研輔助,美國麻省理工學院開發的ProtAgents可支持生物與醫藥學科的教學和知識發現,我國華東師范大學開發的EduChat適用于情感支持和蘇格拉底式教學。為了呈現教育大模型智能體的應用現狀,本研究引入國內外20個典型的教育大模型智能體(分別是AudioGPT、AVIS、ChatEDA、ChatEvl、ChatLaw、ChemCrow、CodeHelp、CoQuest、EduAgent、EduChat、EvaAI、HypoCompass、Kimi+、MapCoder、MWPTutor、PeerGPT、ProtAgents、ResearchAgent、SurveyAgent、WebAgent)進行比較分析,以提煉教育大模型的新特征、總結其應用場景,并介紹不同場景下的應用案例。這20個典型的教育大模型智能體呈現出了多樣化的教育應用潛力,如ChatEDA、ChatLaw、MapCoder等可用于支持精準教學;EduAgent、PeerGPT、SurveyAgent等可用于支持協作學習和科學研究;ChatEvl、EvaAI可用于開展協同評價;WebAgent可實現自動化教務管理流程等。
1"新特征
智能導學系統(如AutoTutor、DeepTutor)依賴于領域專家構建的固定知識庫,主要通過文本、語音和面部表情來感知學生的學習情況,支持個性化學科知識學習,但知識擴展有限,開發成本高;而教育大模型智能體(如EduAgent、EduChat)能夠整合多模態信息感知師生狀態,支持多樣化教育任務,且跨學科知識易于擴展,開發成本低。基于此,本研究從多模態信息感知性、復雜教育任務適應性、跨學科知識擴展性和開發成本四個特征維度,對智能導學系統與教育大模型智能體進行特征比較(如表1所示),可以看出:智能導學系統更側重于個性化學科知識的學習和教學內容的適應性,而教育大模型智能體能處理更加復雜的教育任務,適應多樣的教育場景,具有更加先進的性能和巨大的教育應用潛力。基于此,本研究提煉出教育大模型智能體區別于智能導學系統的新特征:教育大模型智能體的多模態信息感知性強、復雜教育任務適應性高、跨學科知識擴展性廣且開發成本低。
2"應用場景
本研究梳理了國內外20個典型教育大模型智能體的開發框架、大語言模型、調用工具、優勢、不足和教育應用場景,以總結教育大模型智能體在教、學、管、評四大應用場景中發揮的作用,其中部分教育大模型智能體的基本情況如表2所示。
在深入分析國內外20個典型教育大模型智能體的基礎上,本研究總結出教育大模型智能體在教、學、管、評四大應用場景中發揮的作用,主要表現為驅動精準化教學、支持個性化學習、優化教育管理與服務和促進教育評價智能升級。
①教學場景:教育大模型智能體驅動精準化教學。教育大模型智能體含有細粒度的學科專業知識,具備學科專業知識的檢索與整合功能,能提供更加精準的教育反饋。此外,教育大模型智能體還可以通過調用工具感知多模態教學信息、接入學生學習數據庫,有效識別學生的學習需求與狀態,能為教師提供精準的教學決策,促進因材施教的真正落地,提高教育教學效果。例如,EduChat通過調用學科知識庫知識,可以實現多學科的蘇格拉底式教學;ChatEDA、ChemCrow支持個性化的學科知識學習和實驗過程模擬,可以提高學科專業知識的學習成效;AVIS通過調用圖像工具,可以構建圖像與知識相關聯的教學場景,提升學生的學習體驗。
②學習場景:教育大模型智能體支持個性化學習。教育大模型智能體通過提供解決復雜問題的工具,支持學生的個性化學習。例如,CodeHelp、MapCoder通過提供代碼執行器和結果分析工具,幫助學生在編程學習過程中獲得即時反饋和個性化指導,從而提升編程學習的效果;HypoCompass通過提供“以教代學”支架,引導學生與智能體扮演不同的角色開展協作學習,可以提升學生的編程能力;而CoQuest、SurveyAgent通過多智能體協作支持的高效學術研究調查和人機協同提出研究問題,可以有效引導學生發現研究空白,進而輔助學生的科研論文寫作。
③管理場景:教育大模型智能體優化教育管理與服務。教育大模型智能體通過API接口接入教育管理數據庫并自動挖掘、分析數據,可以為學校和教育機構提供數據驅動的精準反饋與決策,從而實現高效的管理。例如,EduChat可以為學生提供專業的課程咨詢、職業規劃和心理健康咨詢;WebAgent通過集成網頁自動化工具和大語言模型,可以實現線上教育管理任務流程的自動化處理,提高了教育管理的效率和服務的精度。
④評價場景:教育大模型智能體促進教育評價智能升級。教育大模型智能體利用RAG技術將學生的學習成績、學習過程記錄等轉為向量知識,自動評估學生的學習效果,可為教師提供精準的教學建議,并為學生提供個性化的學習反饋。例如,EvaAI可以通過多智能體協同自動化評分(如學生試卷自動評分、作業協同評分),提高教育評價的客觀性和效率。
3"應用案例
為進一步驗證教育大模型智能體的教育應用成效,本研究以探究式學習、編程學習和學術閱讀場景的實證研究案例為切入點,闡明教育大模型智能體在人機協同解決復雜問題、輔助個性化編程學習和支持人機協同提問等場景中應用的優勢與不足。
①探究式學習場景下的教育大模型智能體:在跨學科領域,為提升學生通過人機協同解決復雜問題的能力,翟雪松等[33]基于情境教學法,構建了基于AutoGen的多智能體協作探究框架,并開展了有60名學生與7個智能體(包括教師、學習者和5類學科專家角色)組成的教研團隊進行協作與探討的實證研究,結果表明:相較于對照組(僅使用大語言模型進行協作對話,n=30),實驗組(使用基于AutoGen的多智能體交互平臺開展協作,n=30)的提問策略更豐富、因果推理更具邏輯性、問題解決方案更具創造性,能夠有效提升學生探究式學習的廣度和深度。但是,基于AutoGen的多智能體也存在吸引力不夠、及時性不足等問題,難以在一線教學場景中有效地激發學生的學習興趣和動力,學生也難以找到問題改進的方向和策略。此案例通過實證研究,驗證了教育大模型智能體在提升學生跨學科探究式學習能力方面的有效性。
②編程學習場景下的教育大模型智能體:大語言模型輔助編程教學是大語言模型教育應用的重要形式,但存在錯誤率較高、學生濫用等不足。對此,Ma等[34]開發了基于GPT-4.0的教育大模型智能體——HypoCompass,并開展了有19名學生參加的編程學習實驗。在實驗中,HypoCompass提供“以教代學”支架,通過角色扮演,讓學生擔任編程教師,而系統內集成的多個智能體扮演有編程學習問題的虛擬學生,“編程教師”需根據“虛擬學生”給出的編程問題描述提出假設、提供問題解決方案并做出反饋。實驗結果表明,HypoCompass可以有效地提升學生的編程學習參與度與編程能力,但學生難以對包括編程在內的學科知識進行系統化建構,因而出現了系統化學科知識傳授不足的現象,這不僅影響了學生對知識的深入理解和長期記憶,而且阻礙了學生形成扎實的學科基礎和廣泛的知識體系。此案例驗證了在教育大模型智能體的輔助和支持下,學生的編程技能和學習參與度得到了提升;同時,案例中“以教代學”的人機協作策略可以為教育大模型智能體的教育應用提供參考。
③學術閱讀場景下的教育大模型智能體:學術問題的發現能力,是研究生科研能力培養的核心。基于此,Liu等[35]結合GPT-3.5、ReAct推理框架和Arxiv數據庫,設計了科研問題共創智能體——CoQuest,并開展了有20名研究生參與的學術閱讀主題教學實驗。CoQuest按照“思考-執行-觀察”的步驟進行決策,引入了研究者的心智模型,使得此智能體能夠模擬研究者的思維,向學習者解釋其生成研究問題的邏輯和推理過程,提升了反饋的可解釋性。實驗結果表明,CoQuest可以有效提升學生發現學術問題的能力。然而,在實際教學過程中,教師、學生和智能體CoQuest之間的協同作用不夠緊密,缺乏有效的組織和協調,可能導致智能體難以達到預期效果。此案例驗證了教育大模型智能體在學術閱讀主題式教學中提升學生科研能力的有效性,以及人機協同提出研究問題的方法和互動模式在即時反饋、支持學生自主學習方面的應用潛力。
三"教育大模型智能體的未來展望
1 教育大模型智能體應用面臨的機遇與挑戰
一方面,教育大模型智能體為科學探究、協作學習、社會情感學習和學生高階思維培養等帶來了重要的發展機遇:①教育大模型智能體可用于輔助科學探究,其通過調用學術工具快速檢索和總結文獻,生成文獻綜述,使巨量復雜的文獻信息更易于獲取、篩選和理解。②教育大模型智能體可以協助提出研究問題或研究假設,提升研究項目的質量,并能夠引導學生開展高效的協作學習,故將在協作學習中發揮重要作用。例如,在多智能體協作的學習場景,教育大模型智能體可以扮演主持人或總結者的角色,幫助組織、監督協作學習過程,對學習情況進行總結與評價,確保協作學習的成效[36]。③教育大模型智能體可以支持社會情感學習,通過監測學生的語言模式,提供情感支持,引導學生進行自我反思。當學生表達沮喪、壓力或困惑時,教育大模型智能體還能及時識別問題并向教師提供干預建議。④在培養學生的高階思維能力方面,教育大模型智能體也將發揮重要作用。例如,在學術閱讀、寫作、提問等場景中,教育大模型智能體可從不同角度啟發式引導學生理解復雜的概念、開展辯論或案例研究,促進更深入的分析,助力學生創新能力和批判性思維能力的培養[37]。
另一方面,教育大模型智能體存在個性化反饋能力不突出、教學場景的融合不深入、學科知識的傳授不足等挑戰。現有的教育大模型智能體未能充分融合學習者模型、專家模型和領域模型,故難以在認知、情感和元認知層面提供能夠激發學生學習動機、增強教學互動、改善學生情感體驗的個性化反饋信息[38]。當前,師生的人機協同素養不高,對于AI工具的教育價值與危害認識不足,對于教育大模型智能體這一新技術工具在教學一線開展規模化應用的效果也存在疑慮,導致未能將教育大模型智能體深入融入教學場景。此外,教育大語言模型在訓練數據的過程中也存在學科知識規模小、細粒度不夠、模型結構與學科知識特征未進行匹配與優化、長文本理解與邏輯推理不足等問題,導致教育大模型智能體在學科教學場景中的應用受限。
2 教育大模型智能體應用的未來前景
在教育數字化轉型的過程中,教育大模型智能體憑借其技術先進性和新特征,將成為引領教育思維方式、教育組織生態發展變革的新風向標[39],有助于突破傳統教育信息化建設所面臨的“天花板效應”[40]。教育大模型智能體在教育領域的應用,應牢牢把握學校數智化轉型背景下的“教育性”這一本質特征,以促進學生高階思維發展和教育全場景數智化發展為目標,驅動教、學、管、評四大應用場景的教育大數據集成為有價值的教育知識庫,為教育大模型智能體的發展提供可靠的數據與方法基礎[41]。
教育大模型智能體是在現有的技術基座之上,聯同智慧教育多元主體構建的教育大語言模型、教育工具庫、教育智能體等資源,面向教、學、管、評四大應用場景的新一代生成式人工智能技術,可作為學校數智化轉型的新驅動力。展望未來,可以結合學校實際,將教育大模型智能體與在線學習平臺、教學平臺和管理平臺深度融合,研發有溫度的個人助理、數智分身、課堂智能助手、具身教育機器人等智慧工具[42],實現不同教育主體之間的去中臺式互聯互通、多模態教育數據的智能化分布式管理;同時,可以通過相關培訓項目,提升師生人工智能素養,依托零代碼開發智能體的平臺設計教育大模型智能體,開展人機協同教學活動,最終以“人人都有一個智能體”的形態,推動教育大模型智能體與教育教學深度融合,真正實現學生的個性化學習、教師的差異化教學、學校的精準化管理,驅動學校實現從信息化到數智化的轉型。
四"結語
在教育數字化轉型和人工智能教育應用浪潮的推動下,教育大模型智能體將對教育教學實踐產生深遠影響。本研究從技術角度介紹了教育大模型智能體的開發情況,呈現了其應用現狀,并對其未來前景進行了展望,相關研究成果可為教育大模型智能體賦能教育教學全過程提供理論與實踐參考,并為人機協同教育發展提供新思路。后續將利用知識圖譜和多模態技術來優化教育大模型智能體,更大程度地發揮教育大模型智能體在教、學、管、評四大應用場景中的積極作用,以激活教育新質生產力,加快推動教育數字化轉型,實現教育高質量發展。
參考文獻
[1]教育部.教育部發布4項行動助推人工智能賦能教育[OL].
lt;http://www.moe.gov.cn/jyb_xwfb/xw_zt/moe_357/2024/2024_zt05/mtbd/202403/t20240329_1123025.htmlgt;
[2]D’mello S, Graesser A. AutoTutor and affective autotutor: Learning by talking with cognitively and emotionally intelligent computers that talk back[J]. ACM Transactions on Interactive Intelligent Systems, 2013,(4):1-39.
[3]Dijkstra R, Gen? Z, Kayal S, et al. Reading comprehension quiz generation using generative pre-trained transformers [A]. Proceedings of the Fourth International Workshop on Intelligent Textbooks 2022 co-located with 23d International Conference on Artificial Intelligence in Education (AIED 2022)[C]. Cham, Switzerland: Springer, 2022:4-17.
[4]Kasneci E, Sessler K, Küchemann S, et al. ChatGPT for good? On opportunities and challenges of large language models for education[J]. Learning and Individual Differences, 2023,103:102274.
[5]Zhao W, Zhou K, Li J, et al. A survey of large language models[OL]. lt;https://arxiv.org/abs/2303.18223gt;
[6]Minsky M. The society of mind[M]. New York, NY: Simon amp; Schuster, 1986:19-32.
[7]Veletsianos G, Russell G S. Handbook of research on educational communications and technology[M]. New York: Springer, 2014:759-770.
[8]徐振國,劉志,黨同桐,等.教育智能體的發展歷程、應用現狀與未來展望[J].電化教育研究,2021,(11):20-26、33.
[9]劉清堂,巴深,羅磊,等.教育智能體對認知學習的作用機制研究述評[J].遠程教育雜志,2019,(5):35-44.
[10][13]Huan X, Liu W, Chen X, et al. Understanding the planning of LLM agents: A survey[OL].
lt;https://arxiv.org/abs/2402.02716gt;
[11]王吉偉.AI Agent發展簡史,從哲學思想啟蒙到人工智能實體落地[J].大數據時代,2023,(12):6-19.
[12]吳永和,姜元昊,陳圓圓,等.大語言模型支持的多智能體:技術路徑、教育應用與未來展望[J].開放教育研究,2024,(5):63-75.
[14]Richards T B. AutoGPT: Build amp; use AI agents[OL]. lt;https://github.com/Significant-Gravitas/AutoGPTgt;
[15]Shen Y, Song K, Tan X, et al. HuggingGPT: Solving AI tasks with ChatGPT and its friends in hugging face[OL].
lt;https://www.arxiv.org/abs/2303.17580v1gt;
[16]Wu Q, Bansal G, Zhang J, et al. AutoGen: Enabling next-Gen LLM applications via multi-agent conversation[OL].
lt;https://arxiv.org/abs/2308.08155gt;
[17]Hong S, Zhuge M, Chen J, et al. MetaGPT: Meta programming for a multi-agent collaborative framework[OL].
lt;https://www.arxiv.org/abs/2308.00352v5gt;
[18]LangChain. Design agents with control[OL]. lt;https://www.langchain.com/agentsgt;
[19]Liu Z, He Y, Wang W, et al. InternGPT: Solving vision-centric tasks by interacting with ChatGPT beyond language[OL]. lt;https://arxiv.org/abs/2305.05662gt;
[20]扣子.搭建指南[OL].lt;https://www.coze.cn/docs/guides/welcomegt;
[21]Dify.Dify官方文檔[OL].lt;https://docs.dify.ai/zh-hansgt;
[22]Hu Z, Iscen A, Sun C, et al. AVIS: Autonomous visual information seeking with large language model agent[A]. 37th Conference on Neural Information Processing Systems[C]. New York: Association for Computing Machinery, 2024:867-878.
[23]He Z, Wu H, Zhang X, et al. ChatEDA: A large language model powered autonomous agent for EDA[OL].
lt;https://www.arxiv.org/abs/2308.10204v3gt;
[24]Bran A M, Cox S, Schilter O, et al. ChemCrow: Augmenting large-language models with chemistry tools[J]. Nature Machine Intelligence, 2024,(5):525-535.
[25][35]Liu Y, Chen S, Cheng H, et al. CoQuest: Exploring research question co-creation with an LLM-based agent[A]. CHI’ 24: Proceedings of the CHI Conference on Human Factors in Computing Systems[C]. New York: Association for Computing Machinery, 2024:1-25.
[26]Dan Y, Lei Z, Gu Y, et al. EduChat: A large-scale language model-based chatbot system for intelligent education[OL].
lt;https://arxiv.org/abs/2308.02773gt;
[27]Lagakis P, Demetriadis S. EvaAI: A multi-agent framework leveraging large language models[A]. Generative Intelligence and Intelligent Tutoring Systems: 20th International Conference[C]. Cham: Springer, 2024:378-385.
[28][34]Ma Q, Shen H, Koedinger K, et al. How to teach programming in the AI era? Using LLMs as a teachable agent for debugging[OL]. lt;https://arxiv.org/html/2310.05292v3gt;
[29]Islam Md A, Ali M E, Parvez M R. MapCoder: Multi-agent code generation for competitive problem solving[OL].
lt;https://arxiv.org/abs/2405.11403gt;
[30]Ghafarollahia A, Buehler M J. ProtAgents: Protein discovery via large language model multi-agent collaborations combining physics and machine learning[J]. Digital Discovery, 2024,(7):1-21.
[31]Wang X T, Chen J J, Li N, et al. SurveyAgent: A conversational system for personalized and efficient research survey[OL]. lt;https://www.arxiv.org/abs/2404.06364v1gt;
[32]Gur I, Furuta H, Huang A, et al. A real-world webagent with planning, long context understanding, and program synthesis[OL]. lt;https://www.arxiv.org/abs/2307.12856v4gt;
[33][37]翟雪松,季爽,焦麗珍,等.基于多智能體的人機協同解決復雜學習問題實證研究[J].開放教育研究,2024,(3):63-73.
[36]Chan C, Chen W, Su Y, et al. ChatEval: Towards better LLM-based evaluators through multi-agent debate[A]. Proceedings of the Twelfth International Conference on Learning Representations (ICLR)[C]. Vienna: OpenReview, 2023:1-15.
[38]王靖,巴安妮,吳寶鎖.智能教學反饋的目標、機制與架構[J].現代遠程教育研究,2023,(3):102-112.
[39]教育部.數字化引領教育變革新風向——一年來國家教育數字化戰略行動發展觀察[OL].
lt;http://www.moe.gov.cn/jyb_xwfb/s5147/202401/t20240129_1113155.htmlgt;
[40]劉革平,秦渝超,嚴潔穎,等.元宇宙促進教育強國建設的價值邏輯、現實限度和未來路向[J].西華大學學報(哲學社會科學版),2024,(3):1-12、121.
[41]劉明,吳忠明,楊簫,等.教育大語言模型的內涵、構建和挑戰[J].現代遠程教育研究,2024,(5):50-60.
[42]廖劍,許邯鄲,劉明,等.數智分身:人工智能時代教師本位人機共教模式[J].現代遠程教育研究,2024,(4):85-93.
Development, Application Status and Future Prospect of Large Language Model Agents for Education
LIU Ming1""""YANG Min1,2[Corresponding Author]""""WU Zhong-Ming1""""LIAO Jian1
(1. Faculty of Education, Southwest University, Chongqing, China 400715;
2. College of Information, West Yunnan University, Lincang, Yunnan, China 677000)
Abstract: Large language model agents for education is a new generation of generative artificial intelligence technology, which could utilize the large language model to decompose and plan tasks, invoke tools and knowledge bases, and complete complex and diverse educational tasks. However, there are also problems such as shallow understanding of its technical principles and new features, incomplete exploration of application status, and unclear educational effectiveness. Therefore, this paper discussed the development situation of large language model agents for education from a technical perspective, including the design of its technical architecture and the analysis of the advantages and disadvantages of its mainstream development framework and platform. Then, in order to present the application status of large language model agents for education, this paper introduced 20 typical large language model agents for education at home and abroad for comparative analysis, extracted new features of large language model agents for education, summarized the roles of large language model agents for education in four application scenarios of teaching, learning, management, and evaluation, and introduced the application cases of large language model agents for education in different scenarios. Finally, combined with the opportunities and challenges of large language model agents for education, this paper looked forward to its future prospects. The research of this paper could promote the development and innovative application of large language model agents for education, which was conducive to promoting the digital transformation of education and the high-quality development of education.
Keywords: agents for education; large language model; large language model agents for education; generative artificial intelligence