摘要:課堂教學智能分析是人工智能技術賦能循證教研的新趨勢,通常以報告的形式呈現(xiàn)給一線教師,但其往往包含巨大認知負荷且數(shù)據(jù)呈現(xiàn)復雜,使得一線教師難以把握問題關鍵點并用于教學改進,以數(shù)據(jù)“賦能”為出發(fā)點,卻反而給教師帶去了數(shù)據(jù)“負能”。該文基于思維鏈提示邏輯,提出了教研AI智能體賦能課堂教學分析報告解讀的構建框架,實現(xiàn)從數(shù)據(jù)解析到反饋生成的循環(huán),并以此為導向模塊化構建了基于開源大語言模型(LLMs)的智能體框架,個性化開發(fā)教研AI智能體。通過63份真實報告數(shù)據(jù),驗證了“基于思維鏈提示的回復”相較于“基于LLM的普通回復”的有效性,結果表明前者在多項評價維度上均表現(xiàn)出更高的評分,尤其是在準確性、邏輯性和專業(yè)性方面具有顯著提升。該文通過聚焦智能體在教研中的垂直應用,探索從數(shù)據(jù)負能到賦能轉變的新路徑。
關鍵詞:大語言模型;智能體;思維鏈提示;課堂教學智能分析;循證教研
中圖分類號:G434 文獻標識碼:A
* 本文系廣東省哲學社會科學規(guī)劃項目“教育數(shù)字化轉型下促進知識建構的人機智能協(xié)同方法與適應性干預研究”(項目編號:GD24XJY35)、廣東省哲學社會科學創(chuàng)新工程特別委托項目“廣東省高校人工智能學科發(fā)展現(xiàn)狀與對策研究”(項目編號:GD24WTCXGC10)研究成果。
① 任光杰為本文通訊作者。
依托大語言模型的強大創(chuàng)生和推理能力,生成式人工智能(Generative Artificial Intelligence,GAI)為教育場景中的個性化教學、學習反饋和課堂評估提供新技術支持,在教育應用中展示出極大的潛力[1]。但隨著其應用的普及,教師們逐漸發(fā)現(xiàn)了一些局限性,例如,基于少量數(shù)據(jù)訓練的教學智能體由于規(guī)則簡單,依賴于預設的規(guī)則或算法[2],其反饋往往缺乏動態(tài)調整及涌現(xiàn)能力,生成的內容也較為固定[3]。研究者開始嘗試基于開源大語言模型構建專用的教育智能體[4],它能感知學習環(huán)境、提供動態(tài)反饋和為師生生成個性化教學內容[5],也有研究者深入討論了ChatGPT的四項核心能力在教育任務設定、內容記憶、交互協(xié)作等多個教學場景方面的潛在應用能力[6],并在此基礎上提出了基于大模型的教學智能體框架,這一框架能夠支持多模態(tài)數(shù)據(jù)的分析,輔助教學活動[7],上述研究為解決GAI教學應用的局限性做出了有益探索。針對教育領域通用大模型和多模態(tài)教育模型的創(chuàng)新應用,已有研究還提出了潛在風險與教育變革的展望,并為其未來發(fā)展提出了針對性的建議[8]。當前在教學智能體理論方法與技術框架方面的研究,為我們探索不同教育場景下的專用智能體構建提供了新思路和新方法。本研究將從一線教研場景中人工智能技術應用產生的實際“負能”問題出發(fā),研究專用的教研AI智能體構建框架與實踐效果,探索高質量的GAI賦能教育發(fā)展新路徑。
課堂教學智能分析報告(以下簡稱報告)是依托課堂智能分析技術可視化分析課堂教學中的問題,最近受到教研員和一線教師的廣泛喜愛,被應用于教研活動的循證支持。課堂智能分析技術是指基于人工智能技術對課堂教學過程的行為、語音、視頻、表情等多模態(tài)數(shù)據(jù)進行自動化識別、采集與分析,客觀解讀與評價教師教學行為和學生學習狀態(tài)[9],報告是其可視化表征的形式。
本研究依托G市“AI助推教師隊伍建設示范區(qū)”項目以及國家智能教育融合創(chuàng)新中心項目開展“人工智能教育應用的負能研究”,實地調研G市56所中小學的課堂智能分析技術應用實踐效果,關注課堂教學智能分析報告,例如CSMS[10]等,聚焦報告在賦能教研應用過程中所帶來的問題和困難,分析障礙因素和負能,嘗試提出GAI賦能教研高質量發(fā)展的解決方案。
從調研結果看,一方面,課堂智能分析技術相對成熟,能夠通過多模態(tài)課堂數(shù)據(jù)生成詳細報告,提供諸如師生互動、提問回答、學生情感等多維度的數(shù)據(jù)[11];另一方面,報告內容過于繁冗復雜,包含大量的學生行為數(shù)據(jù)、交互分析和學習成效評估圖表等,信息量巨大且數(shù)據(jù)呈現(xiàn)復雜,一線教師的認知負荷大,難以迅速把握關鍵點并據(jù)此凝練教學問題,提出解決方案,進而難以應用于教學改進。因此,每節(jié)課生成的報告反而給一線教師帶來了明顯的信息過載,一部分教師想到借助通用大語言模型進行報告解讀,但結論過于泛化,難以聚焦問題[12],導致包含豐富數(shù)據(jù)和價值的報告難以有效應用,并給教師帶來了日常工作壓力,以數(shù)據(jù)“賦能”為出發(fā)點的智能分析報告,卻反而給教師帶去了數(shù)據(jù)“負能”。以下為具有代表性的一線優(yōu)秀教師A的訪談記錄:
“我們備課組已常態(tài)化使用智能分析報告進行教研,對于報告中的數(shù)據(jù)大家很認可,但感覺報告并沒有真正應用于一線。我們對于報告最核心的需求在于快速知道自己教學問題所在,而報告中包含大量數(shù)據(jù),專業(yè)術語繁復,脫離了‘解決問題’的目標,更像是一種學習,帶來了不少負擔。
教師真正的成長是‘自我對話’,教研會中的碰撞通常只能得出較為表面的結果,難以對自己的課堂有更清晰的認識。智能分析報告在一定程度上促進了我去自我反思,是有助于我的教學成長和素養(yǎng)提升,但報告中的‘問題’泛泛而談,沒有對課堂總體情況有一個清晰的概覽,更難以聚焦學科和教學問題改進。”
從A老師的訪談記錄看,智能分析報告中的數(shù)據(jù)很有價值,但通常一線教師難以具備獨立分析數(shù)據(jù)的能力,進而無法充分發(fā)揮數(shù)據(jù)的意義和價值[13]。從教師專業(yè)發(fā)展的角度講,報告解讀要靠教師理解和吃透,才能讓教研從經驗走向數(shù)據(jù),從數(shù)據(jù)走向證據(jù),循證教研才能真實有效發(fā)生。因此如何幫助教師真正讀懂報告,改進教學成為工作的重難點。在研究初期,團隊致力于向教師普及基于開源大語言模型的生成式人工智能,如“文心一言”“智譜清言”等,通過上傳報告再提出問題的形式,幫助教師完成報告解讀,但這種方式效果并不理想,很大程度上受生成式人工智能的“通用性”限制,雖然為報告的初步解讀提供便利,但缺乏針對具體教學場景的深度定制,生成的回答空泛且不聚焦。這種“大一統(tǒng)”的解讀方法往往無法提供具體的、可操作性的教學建議,使得教師難以從報告中獲得實質性的指導。
基于上述研究實踐提出本文聚焦的“負能”問題:第一,課堂教學智能分析報告內容復雜,在支撐教師發(fā)現(xiàn)教學問題方面存在不足。第二,基于開源大語言模型輔助報告解讀,結論空泛不聚焦。針對上述問題,本研究提出基于開源大語言模型設計思維鏈提示,構建教研AI智能體框架,旨在幫助教師識別教學中的關鍵問題,提供個性化改進方案,逐步優(yōu)化教學活動。為減少“通用性”的限制,進一步提升智能體回答的專業(yè)性,本研究聚焦在專用智能體設計中融合思維鏈提示方法的研究,如何將思維鏈提示賦能報告分析,并以此構建基于開源大語言模型的教研AI智能體框架,是本研究的研究重點。

課堂教學智能分析報告往往包含多維度的數(shù)據(jù),例如師生互動、學生情感、提問模式等。教師需要以一種邏輯清晰、易于理解的方式來逐步解讀這些數(shù)據(jù),并分析出具體問題所在。思維鏈提示因其逐層遞進的思考特性,為解決當前復雜報告解讀困難的問題提供了有效路徑。提示詞是指基于自然語言的句子或片段(包含描述、命令、查詢和請求)[14],適當準確的提示詞使得使用者能夠獲得較為理想的預期結果[15]。思維鏈作為一種邏輯化的思維工具,能夠幫助個體從表面問題逐步深入,探討原因并提出可操作的解決方案[16]。本研究從宏觀的數(shù)據(jù)分析到具體問題聚焦,實現(xiàn)數(shù)據(jù)解讀到教學優(yōu)化的循環(huán),思維鏈提示方法包括兩個層次:一是,構建分階段引導機制,提升教師對報告的理解;二是,實現(xiàn)邏輯遞進式對話,提高教師的反思和調整能力,如圖1所示。
(一)分階段引導機制:擴展報告分析步驟與細化邏輯
分階段引導機制旨在實現(xiàn)對課堂互動、提問模式、學生情感表現(xiàn)等數(shù)據(jù)的多層次分析,以形成對課堂整體表現(xiàn)的全貌理解,進而識別并深入探討課堂中存在的核心問題,最終生成個性化的教學建議。整個引導過程被細化為五個有效階段:初步認知、問題識別、原因分析、決策支持和反饋優(yōu)化,通過逐步提示的形式幫助教師從復雜的課堂數(shù)據(jù)中提取有用信息,將復雜的教學問題分解為多個可操作的小步驟,逐步轉化為具體的教學改進措施。
初步認知階段將基礎數(shù)據(jù)進行歸納,幫助教師快速掌握課堂概況。問題識別和原因分析階段則聚焦于深層次問題,如識別學生的特定行為模式和情緒反應的原因。在決策支持階段,智能體基于數(shù)據(jù)生成可行的教學改進建議,并在反饋優(yōu)化階段接受教師的反饋進行調整和改進。以上五個階段共同構成從數(shù)據(jù)解析到反饋生成的循環(huán),具體提示示例如表1所示。整個過程通過遞進式對話和靈活的分層提問,使得教師能夠在不同的層次上獲取適合的支持,增強教學決策的科學性和精準性。


(二)邏輯遞進式對話:基于多層互動的反饋調整
邏輯遞進式對話指通過逐步提問的方式增強大語言模型與教師之間的互動,是教師與大語言模型之間的一種信息交換模式,更是一種動態(tài)的反饋調整機制,通過五個具體的互動層次:遞進引導、個性化反饋、靈活對話、反饋循環(huán)和自學習,逐步引導教師深入理解課堂數(shù)據(jù),最終形成對教學問題的全面理解。五個互動層次的協(xié)作流程如圖2所示。

遞進引導是互動的第一層,通過由簡入繁的方式逐步引導教師對課堂數(shù)據(jù)進行分析,形成鏈式對話路徑。首先展示課堂的總體數(shù)據(jù)表現(xiàn),在后續(xù)對話中逐漸引導教師關注更細化的信息,如“互動頻率是否達到預期?”或“學生在互動中的情感狀態(tài)如何?”這種逐層深入的問題設計,幫助教師逐步從數(shù)據(jù)的表面現(xiàn)象過渡到更復雜的原因分析,并在此過程中發(fā)現(xiàn)潛在的教學改進空間。通過多輪對話和層次性提問,實現(xiàn)一個層層遞進的對話鏈,從而為教師提供逐步深化的教學支持。
在個性化反饋層次,根據(jù)教師的反饋和關注點進行動態(tài)調整。每位教師的關注點可能有所不同,如某些教師可能更關注學生的情感表現(xiàn)。當教師對某一方面表現(xiàn)出特定關注時,調整后續(xù)的反饋和建議,以滿足教師的個性化需求。這種反饋調整增強了對話的互動性,也幫助教師在決策過程中能夠更加精準地聚焦于關鍵教學問題,從而有效提升教學效果。
靈活對話層次是指針對不同情境和學科需求的實時適應能力。通過動態(tài)調整對話路徑,實現(xiàn)從鏈式思維到圖式思維的發(fā)展。例如,適應教師在不同教學情境中的具體需求,確保提供的建議與情境密切相關,以語文學科為例,應更加關注學生的閱讀理解和情感反應,在理科學科中則應更側重于問題解決和互動頻次。靈活對話使大語言模型能夠有效適應教師的課堂需求,為教師提供情境化的教學建議,以支持不同學科的教學改進。
反饋循環(huán)層次是一個持續(xù)優(yōu)化的過程。教師在實施建議后可以繼續(xù)基于反饋跟蹤問題,以獲得進一步調整建議。反饋循環(huán)根據(jù)教師的教學反饋不斷優(yōu)化其建議內容,這種循環(huán)往復的過程確保了所提供的建議能夠隨著教師的實際情況不斷調整,使教師能夠在教學實踐中逐步提高質量,從而形成一個長期的改進過程,不斷提升反饋的有效性和針對性。
自學習層次則是通過累積教師的交互數(shù)據(jù),不斷優(yōu)化對話路徑和反饋策略。使大語言模型在與教師的多次交互中逐漸學習教師的特定需求和偏好,從而提升互動的精準度。如教師在多次對話中表現(xiàn)出對學生情感數(shù)據(jù)的強烈關注,則自動調整其對話結構,優(yōu)先展示相關數(shù)據(jù)。這種自學習能力使得模型在長期使用中能夠更加精確地滿足教師的需求,并提供更加個性化和高效的建議。自學習的實現(xiàn)依賴于智能體對歷史交互數(shù)據(jù)的分析,使得系統(tǒng)能夠在多變的教學場景中保持對教師需求的快速響應。
依托上述思維鏈提示設計構建教研AI智能體,包括用戶交互、思維鏈、長期記憶和語言模型四個模塊。模塊與模塊之間高效協(xié)同,共同構成從數(shù)據(jù)解析到反饋生成的閉環(huán),實現(xiàn)將課堂教學智能分析報告中的復雜信息轉化為可操作的教學建議,具體設計架構如圖3所示。

用戶交互模塊是教師與智能體互動的核心,該模塊包含兩個組件:對話組件和上傳組件。上傳組件支持教師上傳智能分析報告,智能體將自動生成思維鏈的反饋,涵蓋學生參與度、互動頻率、情緒分析等關鍵信息,提出關鍵問題并給出對應的改進建議。在對話組件中,教師可以直接輸入問題,通過自然語言與智能體進行多輪互動,以獲得針對性的教學反饋。此外,通過內嵌的自學習機制,智能體能夠不斷積累與教師的交互歷史,優(yōu)化對教師的回應,使得反饋內容更加符合個性化需求。該模塊不僅支持即時互動,還能在多輪對話中提供逐層深入的分析和引導,幫助教師更好地理解和應用課堂分析報告中的數(shù)據(jù),為教學改進提供實用建議。
思維鏈提示模塊是智能體的個性化核心,結合分階段引導機制和邏輯遞進式對話,通過多層次的推理和生成能力,幫助教師有效解構課堂數(shù)據(jù),識別關鍵問題并提供個性化的教學支持。智能體首先簡化數(shù)據(jù),幫助教師形成課堂整體認知,接著識別課堂問題并深入分析其原因,最終提供個性化改進建議并根據(jù)教師反饋不斷優(yōu)化。邏輯遞進式對話通過逐步提問增強互動,幫助教師從表面數(shù)據(jù)深入分析潛在問題。初期提問關注基本信息,后續(xù)提問引導教師探討更深層次的原因和改進措施。智能體根據(jù)教師需求調整對話,確保建議精準有效。通過反饋循環(huán)和自學習機制,智能體在長期交互中優(yōu)化建議,推動教學質量持續(xù)改進。
長期記憶模塊是多輪對話質量提升的保障,通過分析交互歷史和回復策略,支持智能體的自學習和內容優(yōu)化。歷史數(shù)據(jù)主要包括交互歷史、提問偏好、常模數(shù)據(jù)等,回復策略是指引入情境適應和知識拓展等。在實際應用中,教研AI智能體會對教師的提問歷史和偏好進行分析,結合常模數(shù)據(jù)和最佳案例生成個性化建議內容。在情境適應上,智能體能夠識別不同教學情境中的細微差異,提供符合實際需求的建議。在知識拓展方面,智能體會結合最新的教育研究和學科發(fā)展,提供具有前瞻性的教學建議。通過這些策略,智能體在與教師的長期交互中不斷積累經驗,使得回復內容更加精準和高效,有助于提升教師的教學效果。
語言模型模塊是智能體在深度融合大語言模型和計算平臺時的關鍵支持環(huán)節(jié)。首先,提示詞工程利用思維鏈模塊的分階段引導策略,通過遷移學習,多任務學習等微調方法,幫助大語言模型在分析課堂數(shù)據(jù)時層層解構關鍵信息(如學生提問次數(shù)、情緒反應等),實現(xiàn)對復雜數(shù)據(jù)的有序呈現(xiàn)。在微調過程中,針對教育場景的特定需求,模型通過引入領域數(shù)據(jù)和場景化任務進一步優(yōu)化,以確保對教育數(shù)據(jù)的深度理解和精準反饋。遞進式對話不僅增強了與教師的互動效果,也使得智能體在教師反饋的基礎上進行實時調整和內容生成,確保反饋的深度和針對性不斷提升。此外,計算平臺在提供計算資源和數(shù)據(jù)管理功能的同時,也為模型微調提供了支持。通過數(shù)據(jù)增強機制和數(shù)據(jù)管理系統(tǒng),計算平臺能夠擴展大語言模型的知識覆蓋面,同時確保數(shù)據(jù)質量的持續(xù)優(yōu)化[17]。數(shù)據(jù)增強機制通過不同情境、樣本和變量的引入,使模型在多種課堂情境中具備較強的泛化能力。數(shù)據(jù)管理系統(tǒng)則嚴格篩選和更新模型的訓練數(shù)據(jù),確保在復雜問題處理時保持高水平的準確性和一致性。這些微調與優(yōu)化措施相結合,使智能體在動態(tài)教學環(huán)境中表現(xiàn)出高度適應性和穩(wěn)定的反饋質量。
本研究基于上述智能體設計架構,開發(fā)了基于思維鏈提示的教研AI智能體,通過真實的一線課堂教學智能分析報告數(shù)據(jù)驗證有效性。
(一)實驗設計
依托56所G市中小學校,共收集70份報告,經篩選后確定合格報告樣本數(shù)量為63份,隨后對這63份報告進行“普通回復”和“基于思維鏈的回復”生成處理,分別獲得63份“普通回復”和“基于思維鏈的回復”文本數(shù)據(jù)作為評價樣本,其中“普通回復”為基于開源大語言模型(智譜清言)對報告的初步分析結果,而“基于思維鏈的回復”指的是教研AI智能體的分析結果。為建立客觀科學的回復內容檢驗標準,研究者參考了相關研究者對智能體回復的評價標準[18]及對教學反饋的評價標準[19],結合本研究中兩種回復的特點,整理出了適用的評價標準,如表2所示。

評價標準綜合了“教學分析能力”和“綜合語言能力”兩個方面的評價要點,劃分出9個方面的評價維度,包含對回復文本的準確性、邏輯性等具體層面的分析,結合兩點和三點李克特量表,通過計分制的方式獲取最后的評分。隨后,研究者與A專家合作,對63對“普通回復”和“基于思維鏈的回復”文本數(shù)據(jù)內容進行標注。操作程序如下:首先,研究者隨機抽取5對回復數(shù)據(jù),與A專家分別對每一對回復中兩個評價內容“教學分析能力”和“綜合語言能力”所包含的10個評價要點進行標注,計算得分。隨后與A專家比對標注和得分結果,對不一致的方面進行協(xié)商并達成共識。最后,研究者與A專家獨立對剩下的數(shù)據(jù)進行標注和評分。經一致性計算發(fā)現(xiàn),回復數(shù)據(jù)得分的一致性達到0.84,表明人工標注結果較為準確。在數(shù)據(jù)標注完成后,通過描述性統(tǒng)計、配對樣本t檢驗和效應量分析,對回復數(shù)據(jù)的多維度表現(xiàn)進行量化,以驗證思維鏈提示優(yōu)化的智能體在報告解讀上的相對優(yōu)勢。
(二)數(shù)據(jù)分析與結論
經計算得出,“普通回復”平均得分為7.8,“基于思維鏈的回復”平均得分為12.4,對兩種回復在9個細分維度上的具體量化分析結果如表3所示。可見,“基于思維鏈的回復”在其中7個維度上都有明顯更好的表現(xiàn),為進一步驗證上述維度差異的顯著性,對兩種不同回復的7個維度的得分數(shù)據(jù)采用了配對樣本t檢驗,結果顯示,兩種回復在準確性、多樣性、充分性、專業(yè)性、廣泛性、邏輯性6個維度上具有顯著差異,p值均小于0.05。為進一步量化這些差異的實際影響,本研究計算了效應量(Cohen’s d),得出在準確性、充分性、專業(yè)性、廣泛性和邏輯性維度上,效應量d值大于0.8,屬于大效應,而在多樣性和理解性維度上屬于小效應。

由此可見,思維鏈提示賦能的智能體在多項評價維度上均表現(xiàn)出更高的評分,尤其是在準確性、邏輯性、廣泛性和專業(yè)性方面,顯示出其在處理復雜課堂數(shù)據(jù)和提供教學反饋方面的優(yōu)勢。第一,準確性提升:智能體在反饋準確性上的評分從普通回復的0.54提升至1.14,反映了其在準確解讀課堂數(shù)據(jù)、提供可靠反饋方面取得了較大進步。第二,充分性和廣泛性提升:在充分性上,智能體的評分從“普通回復”的1.12 提高到1.59,顯示出其在提供全面證據(jù)和支撐論點方面的改進。廣泛性維度表現(xiàn)尤為顯著,從“普通回復”的0.39提升至1.67,表明智能體基于思維鏈賦能,能夠大幅度地提供更多拓展性信息,從多角度支持教師的課堂分析需求。第三,邏輯性和專業(yè)性提升:智能體的邏輯性評分從“普通回復”的0.47提高至1.65,表明思維鏈提示顯著增強了回復內容的邏輯連貫性和專業(yè)深度,使教師更好地理解報告內容的內在邏輯。專業(yè)性評分從“普通回復”的0.46顯著提高到1.43,顯示智能體在專業(yè)性反饋上的增強,使得教師能夠根據(jù)分析結果進行更具實踐指導意義的教學改進,在教學改進中形成更系統(tǒng)化的認知。
然而,在多樣性方面,“基于思維鏈提示的回復”雖然有所提升,但與“普通回復”的均值差距僅為0.15,且配對樣本結果不顯著,同時在親和性、簡要性、理解性維度上,基于思維鏈的回復未表現(xiàn)出顯著提升。分析其原因為:一是,思維鏈提示設計的側重性,思維鏈主要關注遞進邏輯和深度分析,而對于多樣性等維度并未進行針對性的優(yōu)化。二是,語言生成模型的限制,未對智能體的語言風格做調整,對于多樣化和易讀性強的反饋,還需要專門的語言風格調控與優(yōu)化機制。三是,數(shù)據(jù)集特征的影響,實驗所采用的數(shù)據(jù)樣本集中于具體的教學反饋情境,導致數(shù)據(jù)中的智能體表現(xiàn)缺乏多樣化、親和性和簡潔度的反饋訓練。
基于思維鏈提示的教研AI智能體在解讀報告和決策支持中具有較好的應用潛力,結合上述討論,還可以從以下幾個方向對AI 智能體的改進進行深入研究:
(一)數(shù)據(jù)集的多樣化和情境化
為推動教育專用大模型的發(fā)展,構建教育領域的專業(yè)數(shù)據(jù)集顯得尤為重要。未來研究可將教師行為與學生表現(xiàn)細化為不同的課堂情境數(shù)據(jù)[20],除當前應用較多的學科領域知識外,應涵蓋教學教研、教育評價以及教師專業(yè)發(fā)展等數(shù)據(jù),以支持多樣化的課堂分析需求,構建更具通用性和適應性的教研AI智能體,更有效地響應教師在多樣課堂場景中的不同需求。
(二)智能體的微調與優(yōu)化
結合遷移學習、多任務學習等微調方法,進一步優(yōu)化智能體的性能[21],使其更好地適應教育場景中教師專業(yè)發(fā)展的需求。例如,通過遷移學習,智能體可以高效利用已有的通用知識,將其轉化為適應教育領域特征的專業(yè)能力;通過多任務學習,智能體能夠在處理多個相關任務時實現(xiàn)知識共享和互相促進,從而提高學習效率和任務表現(xiàn)。此外,還可以結合自監(jiān)督學習等方法,增強模型的泛化能力和對特定場景的適應性。通過一系列優(yōu)化策略,智能體可以更好地解讀和分析教學報告、設計個性化教學方案,并提供專業(yè)化的決策支持,更有效助力教師教學能力提升和課堂效果優(yōu)化。
(三)多智能體協(xié)同應用
多智能體作為一種新型智能技術,具有動態(tài)交互和角色扮演能力,在教育領域中具有非常廣闊的應用前景[22]。例如,為多智能體設計特定具體的角色,如多專家型智能體,通過訓練精通專業(yè)領域的學科知識和技能,從而能夠提供高度專業(yè)化的問題回答和教學建議。此外,多智能體能夠模擬真實的教學場景,創(chuàng)設虛擬型學生,模擬不同學習風格、能力和需求的學生,與教師進行互動。讓教師在虛擬環(huán)境中練習應對策略,提高教師群體處理復雜課堂情境的能力,為教師提供豐富的互動體驗和個性化反饋,促進教師的教學技能和教研能力的提升。
綜上,通過持續(xù)的數(shù)據(jù)優(yōu)化和智能體設計改進,未來的教研AI智能體有望進一步推動教師專業(yè)能力的發(fā)展,探索從數(shù)據(jù)“負能”到“賦能”的轉變的新路徑。
參考文獻:
[1] 楊欣.基于生成式人工智能的教育轉型圖景——ChatGPT究竟對教育意味著什么[J].中國電化教育,2023,(5):1-8+14.
[2] Xi Z,Chen W,et al.The rise and potential of large language model based agents:A survey [EB/OL].https://arxiv.org/abs/2309.07864,2023-09-19.
[3] 鄭永紅,王辰飛,張務偉.生成式人工智能教育應用及其規(guī)制[J].中國電化教育,2024,(5):114-119.
[4] 劉邦奇,喻彥琨等.人工智能教育大模型:體系架構與關鍵技術策略[J].開放教育研究,2024,30(5):76-86.
[5] 劉邦奇,聶小林等.生成式人工智能與未來教育形態(tài)重塑:技術框架、能力特征及應用趨勢[J].電化教育研究,2024,45(1):13-20.
[6] 盧宇,余京蕾等.生成式人工智能的教育應用與展望——以ChatGPT系統(tǒng)為例[J].中國遠程教育,2023,43(4):24-31+51.
[7] 盧宇,余京蕾,陳鵬鶴.基于大模型的教學智能體構建與應用研究[J].中國電化教育,2024,(7):99-108.
[8] 盧宇,余京蕾等.多模態(tài)大模型的教育應用研究與展望[J].電化教育研究,2023,44(6):38-44.
[9] 張治,程抒一,王天蓉.基于計算教育學的人工智能課堂分析框架和技術實現(xiàn)[J].開放教育研究,2024,30(5):87-100.
[10] 李海東,許世紅,劉軍民.數(shù)字化賦能課堂教學評價與改進:打造教育教學研究新生態(tài)——廣東省中小學課堂大數(shù)據(jù)報告暨數(shù)據(jù)開源發(fā)布會綜述[J].課程教學研究,2023,(10):72-79.
[11] 蔡慧英,盧琳萌,顧小清.人機協(xié)同教研會促進教師教學反思能力的發(fā)展嗎 ——基于課堂視頻智能分析技術的實證研究[J].現(xiàn)代遠距離教育,2023,(1):40-49.
[12] 楊鑫.數(shù)字化教學思維:教師邁入數(shù)字化“深水區(qū)”的思維范式[J].中國電化教育,2024,(5):53-60.
[13] 張剛要,楊俊善.教師數(shù)字素養(yǎng)驅動數(shù)字教育發(fā)展的機理研究[J].中國電化教育,2024,(11):37-44.
[14] 方海光,王顯闖等.面向AIGC的教育提示工程學習提示單設計及應用[J].現(xiàn)代遠距離教育,2024,(2):62-70..
[15] 王一巖,劉淇,鄭永和.對話式人機協(xié)同學習:本質內涵與未來圖景[J].中國電化教育,2024,(11):21-27.
[16] Wei J,Wang X,et al.Chain-of-thought prompting elicits reasoning in large language models [J].Advances in neural information processing systems,2022,35:24824-24837.
[17] Yancheng Liang,Daphne Chen,et al.Learning to Cooperate with Humans using Generative Agents [EB/OL].https://arxiv.org/abs/2411.13934,2024-11-21.
[18] Zeidler,D.L.,Osborne,J.,S.et al.The Role of Argument During Discourse About Socioscientific Issues [A].Zeidler,D.L.(Ed.).The Role of Moral Reasoning on Socioscientific Issues and Discourse in Science Education [C].Dordrecht:Springer,2003.97-116.
[19] Xu J,Lu L,et al.Medgpteval:A dataset and benchmark to evaluate responses of large language models in medicine [EB/OL].https://arxiv.org/ abs/2305.07340.https://arxiv.org/abs/2409.03512,2023-05-12.
[20] 羅恒,廖小芳等.生成式人工智能支持的教師評語研究:基于初中數(shù)學課堂的實踐探索[J].電化教育研究,2024,45(5):58-66.
[21] From MOOC to MAIC:Reshaping Online Teaching and Learning through LLM-driven Agents [EB/OL].https://arxiv.org/abs/2409.03512,2024-09-05.
[22] 吳永和,姜元昊等.大語言模型支持的多智能體:技術路徑、教育應用與未來展望[J].開放教育研究,2024,30(5):63-75.
作者簡介:
王冬青:教授,博士,博士生導師,研究方向為人工智能教育應用、教育大數(shù)據(jù)與學習分析、計算機輔助教育測量與評價。
陳自力:在讀博士,研究方向為教育人工智能、智慧課堂、計算機視覺。
邵文豪:在讀碩士,研究方向為教育人工智能、學習分析、虛擬現(xiàn)實教育應用。
張粵芳:在讀碩士,研究方向為教育人工智能、教育大數(shù)據(jù)、智慧學習環(huán)境。
李贊堅:高級教師,研究方向為智慧教育和人工智能教育。
任光杰:博士,碩士生導師,研究方向為教育人工智能、計算機輔助教育測量與評價、虛擬現(xiàn)實教育應用。
From “Negative Energy” to “Empowerment”: Designing Chain of Thought Prompts Based on LLMs and Building AI Agents for Teaching and Research
— A Case Study in Intelligent Classroom Teaching Analysis
Wang Dongqing1, Chen Zili1, Shao Wenhao1, Zhang Yuefang1, Li Zanjian2, Ren Guangjie1
1.School of Information Technology in Education, South China Normal University, Guangzhou 510631, Guangdong 2.Guangzhou Educational Technology Center, Guangzhou 510091, Guangdong
Abstract: Intelligent analysis of classroom teaching represents a new trend in leveraging artificial intelligence (AI) to empower evidencebased educational research. Typically presented to frontline teachers in the form of reports, these analyses often impose a high cognitive load and involve complex data presentations, making it challenging for teachers to identify key issues and apply findings to improve teaching practices. What begins as an effort to “empower” teachers with data often results in a “data burden.” This study introduces a framework for enhancing the interpretation of classroom teaching analysis reports using Chain of Thought Prompting (CoT) logic, facilitated by AI agents. The proposed framework modularly constructs AI agents based on open-source large language models (LLMs), enabling the development of AI agents for Teaching and Resarch. Using 63 real-world reports, the study evaluates the effectiveness of “CoT-based responses” compared to “standard LLM-based responses”. Results indicate that CoT-based responses achieve higher scores across multiple evaluation dimensions, particularly in accuracy, logical coherence, and professionalism. By focusing on the vertical application of AI agents in educational research, this study explores a novel pathway to transition from data burden to data empowerment.
Keywords: large language models; AI agents; Chain of Thought prompting; intelligent classroom teaching analysis; evidence-based educational research
收稿日期:2024年12月12日
責任編輯:宋靈青