999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于大模型的教學智能體構建與應用研究

2024-08-12 00:00:00盧宇余京蕾陳鵬鶴
中國電化教育 2024年7期

摘要:隨著生成式人工智能的快速發(fā)展,基于大模型的智能體已經逐步具備了多模態(tài)感知、檢索增強生成、推理與規(guī)劃、交互與進化等能力。該研究提出基于大模型的教學智能體的基本概念與框架,以“大模型”為技術核心,重點構建“教育任務設定”“教育任務規(guī)劃”“教育能力實現與拓展”“教育內容記憶與反思”“交互協作與動態(tài)進化”多個功能模塊,支持與多類型對象交互并實現動態(tài)進化,涵蓋人機交互、多智能體交互以及環(huán)境交互。基于所提出的框架,研究以項目式學習任務為應用場景,闡述了教學智能體作為“助教智能體”和“同伴智能體”,在個性化驅動問題提出、項目方案共同設計、項目作品協作完成、項目作品多角色評價多個環(huán)節(jié)的作用及相關支撐技術。最后,研究進一步探討了教學智能體的發(fā)展方向與未來展望。

關鍵詞:教學智能體;大模型;生成式人工智能;項目式學習

中圖分類號:G434 文獻標識碼:A

* 本文系北京市教育科學“十四五”規(guī)劃2021年度重點課題“人工智能驅動的新一代智能導學系統構建研究”(課題編號:CHAA21036)研究成果。

一、引言

隨著生成式人工智能的快速演進,多模態(tài)大模型日益彰顯其在多模態(tài)內容理解和生成方面的優(yōu)勢。多模態(tài)大模型(下文簡稱“大模型”)指能夠處理并理解文本、圖像、視音頻等多種模態(tài)數據輸入的人工智能模型。以GPT-4為代表的人工智能模型均屬于多模態(tài)大模型。大模型通常具有超大規(guī)模參數,支持通過提示工程與微調等方式進行推理與決策制定,并在自然語言處理與視音頻分析等多任務上表現出卓越性能。為進一步釋放大模型的應用潛力,人工智能領域的研究者開始嘗試構建基于大模型的智能體。智能體又被稱為自主智能體(Autonomous Agent),指可感知環(huán)境并反作用于環(huán)境,以實現其自身目標的自適應系統[1]。自20世紀開始,設計與實現智能體已成為人工智能領域研究的主要目標之一,但該項研究長期受限于核心模型的智能化水平。大模型的出現,為構建和實現智能體提供了可行的技術路徑,而智能體與外部環(huán)境的交互能力也可以促進大模型的下游任務適配。因此,基于大模型的智能體構建在人工智能領域和多個垂直領域受到日益重視[2],但在教育領域尚缺乏系統設計與全面論述。

在教育領域,國內外學者對智能體的研究尚處于起步階段。早期研究關注面向知識共享及其組織管理模式優(yōu)化的智能體構建[3],也有研究嘗試設計可以與學習者互動的教育智能體,以實現以學生為中心的個性化在線學習[4]。近年來,研究者從認知學習的作用機制[5]與社會線索設計[6]等角度對智能體開展研究,強調學習主體的高階意義加工和交互創(chuàng)新[7]。隨著大模型等生成式人工智能技術日趨成熟,研究者嘗試構建基于大語言模型(Large Language Model,LLM)的通用智能體,利用其作為用戶交互助手進行數學公式的格式轉化[8]。此外,研究者嘗試利用多個通用智能體,模擬教師和學生之間的課堂交互,實驗結果表明在教學方法、課程和學生表現等維度與真實課堂環(huán)境具有高相似度[9]。

當前教育領域研究多停留在對通用智能體的教育應用嘗試,尚缺乏明確定義和體系化架構設計。因此,本研究提出“教學智能體”概念,旨在充分利用生成式人工智能對環(huán)境感知、推理規(guī)劃、學習改進、行動決策等方面的自主適應能力,在課堂教學、課后輔導、教師研修、家校合作等多種教育場景下,為教育各利益相關方提供教與學的智能化服務。本研究將基于生成式人工智能領域的最新技術進展,結合當前教育領域的實際需求,開展教學智能體設計與實現路徑研究。

二、基于大模型的智能體

(一)基本概念

在人工智能領域,智能體需要能夠感知其外部環(huán)境并做出行動,以對外部環(huán)境產生影響。通常情況下,智能體與外部環(huán)境間的感知與行動不斷循環(huán),形成密切交互,以完成具體任務目標。圖1為基于大模型的智能體的基本框架,其中大模型是智能體的基礎支撐與核心。對于給定的任務,智能體首先通過環(huán)境感知能力,采集信息以了解外部動態(tài)變化的環(huán)境。進而,智能體可通過推理規(guī)劃方式,基于邏輯思維分步求解給定任務中的具體問題。在此過程中,記憶檢索機制支持存儲與讀取過往經驗,有助于提升推理規(guī)劃的質量。同時,智能體也可以利用海量數據找尋客觀規(guī)律進行學習改進,從而提升自身性能,并存儲于記憶中。在此基礎上,智能體通過權衡推理規(guī)劃中的行動利弊,做出合理決策并選取執(zhí)行工具,將決策轉化為對外部環(huán)境的實際作用和影響,以完成任務目標。與傳統人工智能領域的智能體相比,基于大模型的智能體具有以下多項核心能力。

(二)核心能力

1.多模態(tài)感知與生成

多模態(tài)感知與生成通過整合視覺、語音、文本等多種數據通道,以單獨或組合的方式實現外部信息獲取,從而賦予智能體理解并解析自身所處環(huán)境的能力。依托視覺與語言的理解與生成能力,智能體可以實現視覺問答(Visual Question Answering,VQA)與文本生成圖像(Text-to-Image Generation)等多種圖文感知與生成任務[10]。例如,視覺問答任務要求智能體基于圖像信息,回答“計數”“屬性識別”“物體檢測”等場景理解類問題。在此基礎上,基于外部知識的視覺問答任務(Outside Knowledge VQA)則要求智能體回答無法僅通過圖像信息理解的問題,并鼓勵其通過外部知識庫檢索與圖像理解相結合的方式生成答案[11]。當前,智能體的多模態(tài)感知與生成能力已經拓展至視頻領域,支持對連續(xù)圖像幀進行解讀與構建,從而較為準確地解答針對視頻內容的提問或生成邏輯合理的高畫質視頻。此外,對于具身操作的實體機器人或虛擬環(huán)境角色,多模態(tài)感知可以支持其實現實時環(huán)境交互的信息更新,輔助智能體完成任務規(guī)劃、路徑規(guī)劃、推理與決策等復雜任務。

2.檢索增強生成

為緩解大模型生成與事實相悖的“幻覺”、數據更新不及時等問題,檢索增強生成(Retrieval-augmented Generation,RAG)技術開始逐步被廣泛采用。檢索增強生成技術可基于知識庫檢索器,為大模型提供與待解決問題相關且可靠的外部知識。該技術主要包括三個基本步驟,即索引建立、問題檢索與內容生成[12]。索引建立步驟需要基于指定任務信息構建知識庫,其知識資源類型可以涵蓋文檔、網頁、知識圖譜等形式,并利用語言模型的詞嵌入等方法抽取資源的文本語義特征,然后將特征在線或離線存儲于知識庫。問題檢索步驟將用戶提問內容作為檢索請求,抽取其文本語義特征,檢索得到知識庫中與之匹配的數據內容,作為提問的輔助信息。內容生成步驟中,大模型基于用戶提問信息與檢索得到的輔助信息,通過數據增強或構建注意力機制等方法,完成問題答案的生成[13]。卡內基梅隆大學團隊基于檢索增強生成理念,為智能體提供了接口文檔查詢功能。通過查詢液體處理器的接口文檔,該智能體可以基于用戶的文字指令,借助紫外可見光譜測量工具與Python計算工具,實現對液體處理器的精準控制,可用于科學實驗的自動設計、規(guī)劃與執(zhí)行[14]。

3.推理與規(guī)劃

智能體的任務規(guī)劃致力于將復雜任務拆解為多個可執(zhí)行的子任務,主要依托的是大模型的推理能力。通過構建能夠激發(fā)大模型推理能力的提示信息(Prompt),智能體可以自主完成多步驟推理,將復雜任務拆解為多個可執(zhí)行的子任務,從而自主規(guī)劃用于完成任務目標的具體行為序列。目前已有多種被證實有效的提示信息構建方法,包括典型的基于單路徑推理的思維鏈(Chain of Thought,CoT)、基于多路徑推理的自我一致性思維鏈(Self-consistency,CoT-SC)、思維樹(Tree of Thought,TOT),以及融合行為反思的規(guī)劃方法ReAct等。

思維鏈[15]作為最早被提出的推理方法之一,旨在激發(fā)大模型在推理過程中使用多步驟思考,從而引導大模型單路徑執(zhí)行具體任務。在此基礎上,自我一致性思維鏈[16]考慮到大模型生成內容的隨機性,通過多次重復執(zhí)行單路徑推理思維鏈的方式,構建多組并列的思維鏈,最終選取一致性最高的結果作為答案。思維樹[17]則進一步細化推理過程并整合以上兩者優(yōu)勢,構建樹形結構的問題解決方案。樹形結構中的每一條路徑代表一種解決方案,每一個節(jié)點代表一個中間步驟。思維樹依據不同的問題屬性,分解任務推理的中間步驟,力求每一步均以相對可靠的小步驟執(zhí)行,從而在當前節(jié)點上生成下一步可能的解決方案。思維樹通過設置針對每個節(jié)點獨立的質量評估機制或多節(jié)點間的投票機制,為后續(xù)搜索算法提供啟發(fā)式的路徑選擇依據。最終,依據不同的樹形結構,使用廣度優(yōu)先或深度優(yōu)先搜索算法選取最佳的問題解決路徑。ReAct[18]規(guī)劃方法則進一步在推理過程中整合了任務執(zhí)行的反饋信息,使智能體實現自主與外界的資源交互、任務規(guī)劃更新、異常情況處理等功能。在具體任務規(guī)劃過程中,ReAct規(guī)劃方法由思考(Thought)、行動(Action)與行動結果觀察(Observation)三個基本行為組成。通過循環(huán)執(zhí)行這一行為組合,生成包含多輪推理步驟的最終解決方案。ReAct方法在問題回答、事實驗證、文本游戲、網頁導航多種語言與決策任務中,均表現出較好的性能,其生成的任務軌跡也具有可解釋性與可信度。

4.交互與進化

智能體可通過與外部環(huán)境、人類以及其它智能體的交互,開展協作并完成復雜任務,進而實現自主進化。在與外部環(huán)境的交互中,智能體可以基于自身數據、可用工具、庫存資源、環(huán)境描述等信息,自主設置任務并探索外部世界。在探索過程中,智能體可以基于機器語言的自檢機制,構建技能庫積累技能,實現復雜且有意義的自主進化行為。例如旅行者Voyager作為大模型驅動的智能體,在沙盒生存游戲中實現了自主的世界探索和技能進化[19]。

在與人的交互中,智能體支持用戶自定義集成多種大語言模型與工具,開展自主規(guī)劃與人機協作,從而有效解決編程、數學、操作實驗、在線決策、問答等多領域多類型任務。例如,智能體可通過自動解題方式解決復雜數論問題,且當問題解答錯誤時,可通過人機協作方式,獲取人工反饋提示,改進并更正自動解答中的錯誤[20]。智能體可基于用戶輸入的指令完成有機合成、藥物發(fā)現以及材料設計等任務,在測試中實現一種驅蚊劑與三種有機催化劑的自動合成,并通過人機協作引導人類發(fā)現新型發(fā)色團[21]。

多個不同的智能體間也可以開展交互與協作,推進復雜任務的解決與自我進化。例如通過構建“規(guī)劃、執(zhí)行、感知、學習”(Plan,Execute,Inspect,and Learn,PEIL)引導機制,可實現基于多智能體的任務規(guī)劃與工具執(zhí)行、視覺感知與記憶管理、主動學習與方案優(yōu)化,并在視覺問答與推理問答等任務中表現出卓越性能[22]。同時,多智能體之間的辯論式交互,可用于提升其復雜推理問題的解決能力,并已在常識性機器翻譯與反直觀的算數推理任務中展現有效性[23]。此外,智能體還可以通過角色分工與多智能體間協作,模擬和實現特定業(yè)務流程及其任務目標。例如,MetaGPT多智能體協作框架可以為多智能體賦予角色分工(例如產品經理與軟件開發(fā)工程師)并設定工作流,通過引入人類作業(yè)機制,實現多角色智能體的串聯工作及其之間的數據流轉,從而實現軟件開發(fā)的自動化流程[24]。

此外,智能體的記憶機制在交互與進化中起到重要作用,支持了智能體的交互歷史回顧、知識獲取、經驗反思、技能積累與自我進化。斯坦福大學提出的生成式智能體(Generative Agents)在沙盒游戲引擎構建了虛擬小鎮(zhèn)場景,可實現虛擬個體的動態(tài)行為規(guī)劃以及模擬可信的人類行為[25]。該生成式智能體構建了一套記憶流機制,可將感知到的虛擬環(huán)境信息與個體經歷存儲在記憶流中。智能體可以基于個體記憶作出行為決策,同時可以用于形成長期的行為規(guī)劃與高層次的反思,為后續(xù)行為決策作記憶儲備。例如,在有關“是否參加派對”的行為決策中,智能體首先從記憶流中檢索相關的記憶記錄,依據每條記錄與決策任務的時效度、相關度以及重要程度,加權求和計算每條記憶的綜合得分,排名靠前的記憶將作為決策依據,被納入到提示信息中,輔助其行為決策。

(三)實現方式

智能體將大模型作為核心控制器,強調智能體與信息之間的動態(tài)交互、推理與規(guī)劃能力的整合、記憶與反思機制的建立、工具使用與執(zhí)行任務能力的實現,以及與外部交互過程中能力的不斷進化。這些特性共同賦予智能體高階信息理解與加工能力,使其在決策方式上更加接近人類,并表現出對復雜情境的理解和處理能力[26]。為支持基于大模型的智能體落地實現,目前已經有多個工程框架被開發(fā)并開源,例如支持單智能體實現的LangChain[27]與AutoGPT[28],以及支持多智能體協作的AutoGen[29]、BabyAGI[30]與CAMEL[31]。這些框架為研究人員和開發(fā)者提供了重要資源,便于開發(fā)和測試智能體的多場景應用。

在上述實現框架中,LangChain與AutoGen分別是應用較為廣泛的單智能體和多智能體框架。LangChain可提供結構化的大模型應用流程,便于智能體的工程落地,其技術組成模塊包括模型I/O、檢索、智能體、鏈與記憶等。LangChain支持豐富的工具與工具包調用,并可以實現檢索增強生成、ReAct規(guī)劃等多項智能體核心能力。AutoGen則支持用戶依據需求,靈活定義多智能體之間的交互模式與人機協作模式,例如由一位智能體主持、人工參與多智能體交互的動態(tài)群組討論模式,或由兩個智能體分別負責編碼與執(zhí)行調試的協作編碼模式等。AutoGen可支持多智能體的交互記憶讀寫,可通過調用Python第三方工具包實現工具的使用(例如調用Matplotlib繪圖庫完成數學制圖),并且支持將任務轉化為機器語言解決,例如利用代碼分步執(zhí)行任務,并通過智能體間的代碼執(zhí)行與調試(Debugging)確保程序的成功運行。

LangChain與AutoGen均為智能體實現提供了可行方案,還可以通過配合使用發(fā)揮二者各自優(yōu)勢。例如,可以利用AutoGen靈活構建并實現智能體的交互框架與基于機器語言的任務執(zhí)行,并利用LangChain協助連接外部豐富的工具庫(例如ArXiv、Office365、Wolfram Alpha等)以及自定義工具(通過用戶提供工具功能描述、方法實現代碼、輸入輸出格式等信息實現),從而拓展智能體的能力邊界。

三、基于大模型的教學智能體構建

基于當前教育領域大模型的快速演進和發(fā)展[32],本研究提出構建基于大模型的教學智能體。如圖2所示,教學智能體以“大模型”為核心,其主要功能模塊包括“教育任務設定”“教育任務規(guī)劃”“教育能力實現與拓展”“教育內容記憶與反思”。同時,教學智能體支持與多類型對象交互并實現動態(tài)進化,涵蓋人機交互、多智能體交互以及環(huán)境交互。

(一)教育任務設定

“教育任務設定”模塊涵蓋教育場景設定、教育需求設定與教育角色設定等關鍵信息的提供。其中,教育場景的設定為智能體提供教育任務的背景信息,例如以學生為主體的項目式學習場景、在線自主學習場景、傳統課堂教學場景等;教育需求設定為智能體提供對教育任務的具體目標描述,例如為項目式學習提供策略性支架、評價學習者問題解決能力、協調小組協作學習等;教育角色設定為智能體賦予教育任務中需扮演的特定角色信息,例如教師助教、學生學伴、研修助手、家庭助理等。教育角色的設定有助于智能體更有效地與教育用戶互動,提供個性化交互體驗,提高輔助效果。多個教學智能體之間還可通過扮演不同教育角色,以分工協作、辯論對抗、人機協同等形式,滿足特定教育場景下的關鍵教學需求。

(二)教育任務規(guī)劃

基于所設定的教育任務信息,教學智能體可以實現自主任務規(guī)劃,其基本步驟與順序分別為“任務方案思考”“方案分解規(guī)劃”與“執(zhí)行結果感知”。首先,“任務方案思考”步驟基于所設定的教育場景、需求和角色等關鍵信息,結合相關的教育標準或框架、教育資源與輔助工具,進行整體方案的推理和生成;“方案分解規(guī)劃”步驟將所生成的整體方案,分解為多個可實現、可管理的子任務,包括規(guī)劃具體的教學活動、教學資源、教學工具、教育評價方式等。教學智能體還可以根據教師或學習者的反饋實時調整各子任務,確保教育任務規(guī)劃的適應性與有效性。規(guī)劃的子任務執(zhí)行完成后,“執(zhí)行結果感知”步驟負責獲取執(zhí)行結果以及多維度交互信息。通過引入評價反饋機制,基于任務執(zhí)行結果,智能體可以自主推理判斷或人工評價子任務完成質量。若發(fā)現問題或未達成規(guī)劃目標,則重新開始“任務方案思考”步驟,直至達成目標后方可退出循環(huán)機制。利用上述教育任務規(guī)劃流程,智能體能夠迭代優(yōu)化教育任務執(zhí)行過程與策略,滿足高效個性化教育需求。

(三)教育能力實現與拓展

教學智能體可以實現和拓展多項基本能力,以執(zhí)行所規(guī)劃的具體教育任務。首先,教學智能體可以調用外部專業(yè)教學工具及其運行環(huán)境,包括但不限于數學計算工具、教育教學軟件與協作學習工具。例如,教學智能體可以調用數學計算工具Wolfram Alpha[33],通過基于自然語言或數學公式的交互,解答多學科所需的精確計算問題。這些外部工具可以為教學智能體提供大模型不具備的專業(yè)能力,從而幫助其完成所規(guī)劃教育任務中的專業(yè)問題解決。

教學智能體可以通過檢索增強生成等方式,避免輸出錯誤教育信息,拓展其知識與能力邊界。教育服務的提供通常需要具備高準確度與可解釋性,因此需要為智能體提供實時更新且可靠的信息源。例如,智能體可以從國家教育資源公共服務平臺、專業(yè)教育學術期刊以及教育新聞網站等渠道,獲取和整合最新教育資源和實時教育數據,實現檢索增強生成教育內容,并能清晰解釋其提供內容的依據,確保所提供教育服務的時效性和準確性。

此外,教學智能體在對教育場景要素感知與理解后,可以自動生成包括教學文本對話、視音頻教學資源等形式的教育內容和制品,為所設定的教育角色提供全流程支持。例如,當教育任務執(zhí)行涉及編程與邏輯推理時,可借助大模型的代碼生成與調式能力,將任務翻譯為Python等機器語言并輔助學習者完成編程任務。對于需要具身操作的教育任務,教學智能體可以基于物理環(huán)境感知能力,自動生成操作流程并根據教育用戶指令完成軟硬件實時控制。

(四)教育內容記憶與反思

教學智能體的教育內容記憶主要用于存儲與讀取教育任務規(guī)劃與執(zhí)行過程中的重要數據,支持智能體的自我反思。具體而言,教育內容記憶可以存儲所有步驟的教育任務規(guī)劃及各步驟執(zhí)行的基礎性數據,例如教育任務解決方案數據、智能體與學習者的交互問答數據、外部工具調用的過程與結果數據、軟硬件控制與操作數據等。基于所存儲的基礎性數據,智能體可以通過大模型的自我提問或歸納總結等方式,反思加工得到教育知識與經驗等高階信息。例如,教學智能體可以通過反思,得到所服務學習者的個性化特征及其教學交互效果等信息。結合試錯機制或交互反饋,教學智能體還可以總結失敗或低效率的教學經歷,再次遇到類似教育任務時,作為教學策略自主優(yōu)化與改進的參考依據。此外,智能體所存儲的豐富教育記憶與反思,還可以作為重要的參考知識與資源,支持其教學能力的拓展。

基于權限維度劃分,教育內容記憶可分為公有記憶與私有記憶。公有記憶指教學智能體所積累的教育知識與教學資源,包括學科知識圖譜、教學法知識、課程標準、教學材料、教輔材料等;私有記憶則為與教育用戶及其角色密切相關的個體信息,例如個體學習者的歷史交互與學習評價數據、個體教師的教學視頻、教學方案與教學評價數據等。教學智能體需要合理使用不同權限的記憶數據,尊重教育用戶隱私,建立相應的教育數據使用規(guī)范。

(五)交互協作與動態(tài)進化

教學智能體可通過與不同角色的教育用戶、其它智能體及教育環(huán)境進行交互,實現教育任務的協作規(guī)劃與執(zhí)行,促進自身的動態(tài)進化。在與教育用戶的交互中,教學智能體能夠充分理解不同角色的教育用戶意圖,從而提供多種形式和模態(tài)的人機交互服務。例如,針對學習者在線自主學習場景,提供多類型支架式智能導學交互服務,支持推薦文本、視頻和音頻教學資源在內的多模態(tài)教學內容,實時提供進度評價與反饋信息。在與其它智能體的交互中,智能體可以依據不同智能體的角色扮演及教育任務,實現督促引導、討論交流、分工協作甚至有序辯論對抗等交互模式。例如,開展多智能體的辯論式交互,實現復雜教育任務的科學拆解與合理規(guī)劃。另外,可以將教育對象引入多智能體交互過程中,實現人機協作模式下的教育目標達成。例如,在協作組卷過程中,依據教師提供的學科、知識點、區(qū)分度等需求信息,不同智能體可分別作為出題者、被試者以及批閱者完成組卷,并最終交由教師審核組卷質量。在與教育環(huán)境的交互中,智能體在充分感知和理解教育場景與環(huán)境要素的基礎上,可以充分利用外部軟硬件工具及其人機交互能力,實現具身操作與人機協同。例如,智能體可通過對實驗儀器狀態(tài)的實時感知與機械臂的精準控制,協同學習者完成物理、化學等學科類的復雜實驗操作或科學探究類的實踐過程。

教學智能體在與教育用戶、其它智能體及教育環(huán)境的交互中,通過對過程性與結果性數據、反饋信息進行持續(xù)采集與分析,可以逐步形成教育經驗與反思性知識。這些經驗與知識可以被智能體記憶存儲與讀取,并用于未來教育任務的規(guī)劃與教育能力的執(zhí)行,從而實現其問題解決能力的動態(tài)提升與進化。例如,通過反思人機交互過程信息、總結科學儀器控制流程,教學智能體可以更高效地規(guī)劃科學實驗步驟,并為學習者提供實驗操作的實時支架與科學探究的協作服務。

四、基于大模型的教學智能體應用

基于前述所提出的框架,本研究以項目式學習場景為例闡述教學智能體的應用。項目式學習是培養(yǎng)學生核心素養(yǎng)與高階能力的有效教學模式[34],在典型的項目式學習過程中,學習者通常需要教師與同伴的持續(xù)支持以完成項目作品。教學智能體可以通過項目式學習任務設定,為項目式作品的完成進行具體任務規(guī)劃,支持與項目式學習相關內容的記憶與反思,提供多模態(tài)項目資源生成、檢索增強生成式的學習支架、高質量代碼生成與反饋等多種能力的實現與拓展,同時支持人機交互與多智能體交互模式。如圖3所示,教學智能體可以擔任“助教智能體”與“同伴智能體”兩類教育角色,在不同項目環(huán)節(jié)中具有不同的任務設定、拓展能力與個體記憶,從而表現出能力與功能差異,為學習者提供多種交互支持。我們以信息科技或人工智能課程中常見的“垃圾分類”跨學科主題為例,闡述教學智能體在項目式學習各個環(huán)節(jié)中的作用。

(一)個性化驅動問題提出

項目式學習需要基于真實情境提出驅動問題,使學習者能真實地感到解決該問題的迫切性和可行性,從而激發(fā)其進行深入探究與完成項目的內在動力。因此,在驅動問題提出環(huán)節(jié),“助教智能體”可以首先依據預設的學習情景,建立驅動問題引導框架。在此基礎上,“助教智能體”能夠與學習者開展多模態(tài)形式的在線討論,并依據學習者的特點與學習意圖,采用個性化對話路徑與交互策略,最終引導學習者自主提出項目的驅動問題。“助教智能體”可以利用前述LangChain開源技術框架中的智能體模塊(Agents Module)實現此主要功能,通過將預設的引導框架作為每一輪對話的目標問題,并將學習者作為每一輪任務規(guī)劃中必選的咨詢工具,實現主動向學習者提問并開展討論。

例如針對“垃圾分類”這一環(huán)保主題,“助教智能體”可以為學習者創(chuàng)設真實情景,調用外部ERNIEViLG多模態(tài)大模型[35]的圖片生成能力,繪制“海洋垃圾漩渦”“難以降解的塑料垃圾”等情景圖片。同時,“助教智能體”基于大模型的對話能力,與學習者進行垃圾治理迫切性的在線討論。結合學習者的具體反饋,“助教智能體”可以繼續(xù)提出垃圾治理的可能必要步驟和方法,從而引導學生自主思考并明確具體要開展的項目活動,例如“如何宣傳垃圾分類環(huán)保理念”或“如何制作一個智能垃圾桶用于垃圾分類”。

(二)項目方案共同設計

為解決學習者提出的個性化驅動問題,教學智能體可以搭建學習者與智能體間的動態(tài)討論小組,基于其教育任務規(guī)劃能力幫助學習者確定具體解決方案,并對方案進行分解規(guī)劃。小組討論可以依據項目目標與學習者風格,采用“智能體領導”或“學習者領導”兩種模式開展。在“智能體領導”模式下,教學智能體可以利用前述的AutoGen開源技術框架,構建多個“同伴智能體”,模擬和扮演人類小組成員在項目式學習過程中的不同角色,開展人類學習者與多個“同伴智能體”間的多角色交互。在此過程中,“助教智能體”主要負責基于小組對話歷史內容及項目目標,選擇每一輪的發(fā)言者(人類學習者或“同伴智能體”),并將發(fā)言內容廣播給所有小組成員,從而在多輪發(fā)言與信息傳達中實現項目實施方案的協同設計。在“學習者領導”模式下,學習者則可直接自主選擇與不同“同伴智能體”展開對話。

具體而言,在“智能體領導”模式下,為解決驅動問題“如何宣傳垃圾分類環(huán)保理念”,教學智能體可以首先利用其任務規(guī)劃能力,將驅動問題的解決方案分解為“了解垃圾分類規(guī)則”“搜集各類典型垃圾示例”“制作宣傳素材和載體”等多個可執(zhí)行的子任務。基于所規(guī)劃的子任務,教學智能體可構建多個“同伴智能體”與學習者針對具體項目方案開展討論,提供策略性支架,并對學習者的意見進行實時理解與及時反饋,逐步引導學習者共同完成項目方案的設計。例如針對“制作宣傳素材和載體”這一子任務,多個“同伴智能體”在小組討論中,可以提出海報、網頁或微信小程序等不同宣傳形式的解決方案。如果學習者基于自身興趣和專長提出支持網頁形式,“助教智能體”則選擇具備相關能力的“同伴智能體”發(fā)言,基于制作“垃圾分類宣傳網站”展開方案設計和討論,幫助學習者明確如何設計和搭建宣傳網站。隨后,“助教智能體”可以在小組內廣播得到的方案,并選擇其他“同伴智能體”細化建議,例如需要首先明確“垃圾分類”的規(guī)則并將其展示在網站重要位置。

(三)項目作品協同完成

基于所設計的項目方案,教學智能體可以構建相應的“同伴智能體”,與學習者協同完成項目作品的制作。項目作品的制作首先需要進行相關素材和信息的采集。例如在 “了解垃圾分類規(guī)則”子任務中,需要學習者搜集當地最新的垃圾分類標準。由于世界各地垃圾分類標準不同且更新變化,“助教智能體”可采用RAG方式為學習者提供準確的內容生成。如圖4所示,“同伴智能體”利用LangChain框架提供的多種函數快捷實現RAG流程。首先,“索引建立”步驟通過智能體自動爬取或人工篩選互聯網上的政府環(huán)境部門官方網站資源,利用LangChain中的文檔加載(Document Loaders)方法收集可靠的信息,并利用其文本切分(Text Splitter)方法將長文本切分為語義相關的短句。在此基礎上,“問題檢索”步驟選取大模型抽取文本特征向量,并利用Chroma向量數據庫進行存儲,構建“垃圾分類標準”的特征檢索知識庫。進而,利用基于問答的檢索方法(Retrieval QA)抽取用戶提問的文本特征,并基于特征相似度檢索與提問信息最為相關的向量數據庫中的信息。最后,“內容生成”步驟將檢索得到的信息與用戶提問信息輸入提示模版(Prompt Template),構建完整的提示信息,利用大模型最終生成最新且正確的各地垃圾分類規(guī)則。

在相關素材收集完成后,“助教智能體”可以進一步協助學習者制作“垃圾分類宣傳網站”。在此過程中,學習者可以通過多模態(tài)方式與智能體交流,為其展示手繪的網站前端設計樣稿,或用文本與智能體溝通網站后端設計理念。“助教智能體”可以調用多個外部網頁設計腳本語言庫,自動生成對應的網頁代碼。同時,教學智能體可利用AutoGen框架內嵌的機器語言執(zhí)行環(huán)境,直接執(zhí)行生成的代碼,并將執(zhí)行結果與錯誤提示反饋給“助教智能體”,指導其進一步自動修改和完善代碼。學習者也可以基于已生成的頁面,通過頁面截屏或自然語言方式反饋修改意見,從而“助教智能體”可依據反饋內容進一步調整優(yōu)化網站。

(四)項目作品多角色評價

在項目作品展示與評價環(huán)節(jié),“助教智能體”與“同伴智能體”可以從各自角度,分別開展項目作品的教師評價與同伴評價。智能體根據個性化驅動問題與項目方案,預先生成相應的過程性與結果性評價量規(guī)。在學習者匯報展示人機協同制作的項目作品過程中,“助教智能體”與“同伴智能體”可依據各自記憶模塊存儲的不同過程性信息及相應評價量規(guī),從教師與外組同伴角度對匯報內容進行項目實施的過程性評價。例如針對“垃圾分類宣傳網站”項目作品,智能體可以根據學習者在小組討論和網站制作過程中的貢獻程度,進行客觀評價。同時,智能體還可以利用其環(huán)境交互能力,實現對網頁的點擊訪問,對網站的設計進行交互測試與量化統計,例如從網頁的元素數量、色彩選擇、多媒體使用等角度,得到對該項目作品的結果性評價。此外,智能體可以基于其多模態(tài)感知能力,將學習者匯報內容以視頻形式輸入,對學習者項目匯報的語言流暢度、內容邏輯性、闡述完整度等方面進行評價。

基于本輪項目作品的評價信息,“助教智能體”與“同伴智能體”可以結合各自存儲的記憶,從學習者的知識掌握、技能獲取、交互有效性等方面進行反思提問,促進其教育任務規(guī)劃、教學與交互能力的同步提升。從而在下一輪的項目式學習中,智能體面對新的學習者群體,可以更有效地開展相同主題下的項目式學習,實現智能體教育能力的進化。

五、總結與展望

基于大模型的教學智能體是生成式人工智能在教育領域重要的未來研究方向和應用落地形式之一,也是解決教育領域人機協同模式的核心技術路徑。本研究提出的教學智能體架構,以大模型及其多種能力為核心,結合教育領域的多場景需求和多角色服務特點,致力于啟發(fā)和幫助未來高智能化教育系統的設計和實現。在此基礎上,詳細論述了項目式學習場景下,教學智能體的角色、功能及其與學習者的協作實踐路徑。教學智能體的研究目前仍處于起步階段,本文針對其未來發(fā)展提出以下研究展望:

1.設計和研發(fā)教學智能體亟需受到重視,以確保教育領域可以充分利用生成式人工智能等前沿技術,快速提高各類教育產品和服務的智能性與交互性。需要重視多智能體技術的應用,利用智能體模擬和扮演不同教育關鍵角色,實現“討論-實踐-反思”等多種模式的高效教學交互過程。同時,需要充分發(fā)揮智能體與人類各自的智慧優(yōu)勢,實現更為合理有效的人機協同教育模式。

2.與通用領域或其它垂直領域智能體相比,教育領域智能體構建具有領域自身的特殊需求和特點,需要充分考慮教育場景與教學對象的復雜性,設計專有教育大模型及其核心教育能力。教育大模型需要深入理解教育資源、教學對象以及教學過程,具備相關教育理論與學習科學理論的支撐。

3.教學智能體的設計需要充分考慮其對學習者價值觀和倫理觀念的影響,確保智能體的行為符合社會的道德標準和教育目標。在教育任務執(zhí)行過程中,教學智能體需要具備持續(xù)學習和自我優(yōu)化的能力,在與教育利益相關方的互動中不斷積累經驗,提高其教育服務的可靠性與可信性,提供包容性的教育資源和教學策略,避免偏見和歧視。

參考文獻:

[1] Franklin S,Graesser A.Is it an Agent,or just a Program :A Taxonomy for Autonomous Agents [A].International Workshop on Agent Theories, Architectures, and Languages [C].Berlin,Heidelberg:Springer Berlin Heidelberg,1996.21-35.

[2] Xi Z Chen W,Guo X,et al.The Rise and Potential of Large Language Model Based Agents:A Survey [DB/OL].https://arxiv.org/abs/2309.07864,2023-09-19.

[3] Soller A,Busetta P.An Intelligent Agent Architecture for Facilitating Knowledge Sharing Communication [A].Rosenschein S J,Wooldridge M.Proceedings of the Workshop on Humans and Multi-Agent Systems at the 2nd International Joint Conference on Autonomous Agents and Multi-Agent System [C].New York:Association for Computing Machinery,2003.94-100.

[4] Woolf B P.Building Intelligent Interactive Tutors: Student-centered Strategies for Revolutionizing e-Learning [M].Burlington:Morgan Kaufmann,2010.

[5] 劉清堂,巴深等.教育智能體對認知學習的作用機制研究述評[J].遠程教育雜志,2019,37(5):35-44.

[6] 劉清堂,巴深等.視頻課程中教育智能體的社會線索設計研究[J].電化教育研究,2020,41(9):55-60.

[7] 劉三女牙,彭晛等.數據新要素視域下的智能教育:模型、路徑和挑戰(zhàn)[J].電化教育研究,2021,42(9):5-11+19.

[8] Swan,M.,Kido,T.,Roland,E.,Santos,R.P.D.Math Agents:Computational Infrastructure, Mathematical Embedding, and Genomics [DB/OL].https:// arxiv.org/abs/2307.02502,2023-07-04.

[9] Jinxin S,Jiabao Z,et al.CGMI:Configurable General Multi-agent Interaction Framework [DB/OL].https://arxiv.org/abs/2308.12503,2023-08-28.

[10] Durante Z,Huang Q,et al.Agent AI:Surveying the Horizons of Multimodal Interaction [DB/OL].https://arxiv.org/abs/2401.03568,2024-01-25.

[11] Marino K,Rastegari M,et al.Ok-vqa:A Visual Question Answering Benchmark Requiring External Knowledge [A].Robert S.and Florian K..Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition [C].Piscataway:IEEE Computer Society,2019.3195-3204.

[12] Gao Y,Xiong Y,et al.Retrieval-augmented Generation for Large Language Models:A Survey [DB/OL].https://arxiv.org/abs/2312.10997,2024-01-05.

[13] Li H,Su Y,et al.A Survey on Retrieval-augmented Text Generation [DB/OL]. https://arxiv.org/abs/2202.01110,2022-02-13.

[14] Boiko D A,MacKnight R,Gomes G.Emergent Autonomous Scientific Research Capabilities of Large Language Models [DB/OL].https://arxiv.org/ abs/2304.05332,2023-04-11.

[15] Wei J,Wang X,et al.Chain-of-thought Prompting Elicits Reasoning in Large Language Models [J].Advances in Neural Information Processing Systems,2022,35:24824-24837.

[16] Wang X,Wei J,et al.Self-consistency Improves Chain of Thought Reasoning in Language Models [DB/OL].https://arxiv.org/ abs/2203.11171,2023-03-07.

[17] Yao S,Yu D,et al.Tree of Thoughts: Deliberate Problem Solving with Large Language Models [J].Advances in Neural Information Processing Systems,2024,36:1-11.

[18] Yao S,Zhao J,et al.ReAct:Synergizing Reasoning and Acting in Language Models [DB/OL].https://arxiv.org/abs/2210.03629,2023-03-10.

[19] Wang G,Xie Y,et al.Voyager:An Open-Ended Embodied Agent with Large Language Models [A].Colas C,Teodorescu L,Ady N,Sancaktar C,Chu J.Intrinsically-Motivated and Open-Ended Learning Workshop@ NeurIPS2023 [C].Cambridge,MA:MITPress,2023.

[20] Wu Q,Bansal G,et al.Autogen:Enabling Next-gen LLM Applications via Multi-agent Conversation Framework [DB/OL].https://arxiv.org/ abs/2308.08155,2023-10-03.

[21] Bran A M,Cox S,et al.ChemCrow:Augmenting Large-language Models with Chemistry Tools [DB/OL].https://arxiv.org/abs/2304.05376,2023-10-02.

[22] Gao D,Ji L,et al.AssistGPT:A General Multi-modal Assistant that Can Plan, Execute,Inspect,and Learn [DB/OL].https://arxiv.org/ abs/2306.08640,2023-06-28.

[23] Liang T,He Z,et al.Encouraging Divergent Thinking in Large Language Models through Multi-Agent Debate [DB/OL].https://arxiv.org/ abs/2305.19118,2023-05-30.

[24] Hong S,Zheng X,et al.Metagpt:Meta Programming for Multi-agent Collaborative Framework [DB/OL].https://arxiv.org/abs/2308.00352,2023-11-06.

[25] Park J S,O’Brien J,et al.Generative Agents:Interactive Simulacra of Human Behavior [A].Follmer S,Han J,Steimle J,Riche N H.Proceedings of the 36th Annual ACM Symposium on User Interface Software and Technology [C].New York:Association for Computing Machinery,2023.1-22.

[26] Wang L,Ma C,et al.A Survey on Large Language Model Based Autonomous Agents [J].Frontiers of Computer Science,2024,18(6):1-26.

[27] LangChain.LangChain [EB/OL].https://python.langchain.com/docs/get_ started/introduction,2023-11-12.

[28] Auto-GPT.Auto-GPT [EB/OL].https://docs.agpt.co/,2023-12-29.

[29] AutoGen.AutoGen [EB/OL].https://microsoft.github.io/autogen/,2023-12-28.

[30] BabyAGI.BabyAGI [DB/OL].https://github.com/yoheinakajima/ babyagi,2023-12-28.

[31] Li G,Hammoud H,et al.Camel:Communicative Agents for “mind” Exploration of Large Language Model Society [J].Advances in Neural Information Processing Systems,2024,36:1-34.

[32] 盧宇,余京蕾等.多模態(tài)大模型的教育應用研究與展望[J].電化教育研究,2023,44(6):38-44.

[33] Wolfram.WolframAlpha [EB/OL].https://www.wolframalpha.com/,2023-11-11.

[34] 馬寧,郭佳惠等.大數據背景下證據導向的項目式學習模式與系統[J].中國電化教育,2022,(2):75-82.

[35] Zhang Z,Han X,et al.ERNIE:Enhanced Language Representation with Informative Entities [A].Korhonen A,Traum D,Màrquez L.Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics [C].Stroudsburg:Association for Computational Linguistics,2019.1441-1451.

作者簡介:

盧宇:副教授,博士生導師,研究方向為人工智能及其教育應用。

余京蕾:在讀博士,研究方向為人工智能及其教育應用。

陳鵬鶴:講師,博士,研究方向為人工智能及其教育應用。

Design and Application of Pedagogical Agent with Foundation Model

Lu Yu1,2, Yu Jinglei1, Chen Penghe1,2

1. School of Educational Technology, Faculty of Education, Beijing Normal University, Beijing 100875 2. Advanced Innovation Center for Future Education, Beijing Normal University, Beijing 100875

Abstract: With the rapid development of generative artificial intelligence, agent with foundation model has gradually acquired the capabilities of multimodal perception, retrieval and augmentation generation, reasoning and planning, interaction, and evolution. In this study, we propose the basic concept and framework of pedagogical agent with foundational model, with foundation model as the core, focusing on the construction of “educational task setting”, “educational task planning”, “educational capability realization and expansion”, “educational content memory and reflection”, “interactive collaboration and dynamic evolution”. It also supports interaction with multiple types of objects and dynamic evolution, covering human-computer interaction, multi-agent interaction, and environment interaction. Based on the proposed framework, this study takes the project-based learning task as an application scenario, and describes how the proposed pedagogical agent can be used as “assistant agent” and “peer agent” in personalization-driven problem posing, co-design of the project plan, collaborative completion of the project work, and multi-role evaluation of the project work. Finally, this study further discusses the future development and outlook of pedagogical agent.

Keywords: pedagogical agents; foundation model; generative artificial intelligence; project-based learning

責任編輯:趙云建

主站蜘蛛池模板: 国产女人喷水视频| 日韩在线第三页| 日韩一区精品视频一区二区| 国产玖玖视频| 色亚洲激情综合精品无码视频| 亚洲日本在线免费观看| 国产全黄a一级毛片| 99久久性生片| 国产福利影院在线观看| 欧美激情二区三区| 婷婷午夜天| 最新加勒比隔壁人妻| 日本欧美午夜| 在线视频一区二区三区不卡| 毛片久久网站小视频| 在线国产毛片| 波多野结衣一区二区三区AV| 国产菊爆视频在线观看| 一级毛片免费不卡在线 | 亚洲免费福利视频| 婷婷丁香在线观看| аv天堂最新中文在线| 国产色网站| 亚洲人在线| 97成人在线观看| 欧美三级视频网站| 免费看av在线网站网址| 九九热精品视频在线| 中文字幕亚洲专区第19页| 天天干天天色综合网| 亚洲日产2021三区在线| 亚洲福利网址| 国产性精品| 亚洲一道AV无码午夜福利| 无码内射在线| 国产精品99在线观看| 国产在线视频福利资源站| 欧美日韩v| 久久99精品久久久久纯品| 日韩经典精品无码一区二区| 91麻豆精品国产高清在线| 国产91高跟丝袜| 高清免费毛片| 亚洲国产精品国自产拍A| 亚洲av日韩综合一区尤物| 99re66精品视频在线观看| 国产欧美视频在线观看| 国禁国产you女视频网站| 国产在线观看99| 亚洲精品欧美重口| 国产导航在线| 亚洲三级视频在线观看| 成人欧美日韩| 亚洲国产精品成人久久综合影院| 久热中文字幕在线观看| 黄色网站在线观看无码| 青青热久免费精品视频6| 国产一区二区网站| 99热6这里只有精品| 再看日本中文字幕在线观看| 国产午夜在线观看视频| 中文字幕av一区二区三区欲色| 3D动漫精品啪啪一区二区下载| 99久久这里只精品麻豆| 亚洲91精品视频| 又猛又黄又爽无遮挡的视频网站| 国产91小视频| 国产SUV精品一区二区| aa级毛片毛片免费观看久| 亚洲中文无码av永久伊人| 婷婷色婷婷| 成人午夜天| 国产成人AV大片大片在线播放 | 亚洲成人网在线观看| 亚洲最新网址| 高潮爽到爆的喷水女主播视频| 午夜爽爽视频| 亚洲欧洲自拍拍偷午夜色| 在线亚洲小视频| 日本午夜三级| 日韩一区二区在线电影| 2021精品国产自在现线看|