關鍵詞:多模態大模型;教學研究;CST2分析;差異化評課
【中圖分類號】G40-057【文獻標識碼】A【論文編號】1009—8097(2025)05—0052—10【DOI】10.3969/j.is.1009-8097.2025.05.006
當前,課堂智能分析已成為智能技術賦能教育的研究熱點之一[1]。2018年、2021年,教育部相繼發布開展人工智能助推教師隊伍建設行動試點工作的通知[2I[3],在重點推進的六項工作中就包括開展教師智能研修。基于人工智能技術的智能化評課是教師智能研修的重要環節,盡管深度學習技術已能夠對課堂教學實現自動化分析與識別,但也仍然存在訓練數據少、分析模型擴展難、量化結果解讀機械等不足,由此帶來了評課標準固定、靈活性不足、適切反饋缺乏等問題,難以適應現代教育對教師專業發展的需求。近年來,大模型技術受到廣泛關注,由于其算力規模不斷擴大,算法持續優化,在處理數據類型上從單一模態走向多模態融合,能夠理解課堂中的師生發言并識別師生表情姿態,通過提示詞靈活設計分析指標,因此在實施差異化的智能評課上具有巨大潛力。基于此,本研究嘗試借助多模態大模型對課堂音視頻的理解能力,設計兼顧文化背景、課型、學科、學段、教學主題、教師發展階段等多種因素的CST2差異化評課模型,開發基于多模態大模型的CST2差異化智能評課系統,并以一門科學課作為案例檢驗評課模型的應用效果,以期為實現智能化、差異化、多模態融合的評課提供新路徑。
一深度學習技術在實施差異化評課上的局限
評課是提高教學質量的重要手段,但基于觀察的傳統評課存在任務繁重、目標不清晰、專業性不強等問題[4],導致評課活動效果表面化,難以獲得深入、有效的反饋[5]。為應對這些問題,研究者提出基于數據的課堂分析方法或系統,并廣泛應用于師生言語與非言語行為的定量分析,如弗蘭德斯的課堂互動分析系統[、S-T分析方法[7]、基于信息技術的互動分析編碼系統ITIAS[8]等。
進入數字時代后,機器學習尤其是深度學習技術被廣泛應用于課堂教學研究,如采用多模態機器學習方法分析課堂的積極或消極氛圍[;使用深度學習識別師生在混合同步課堂情境中的行為,由此幫助教師進行課堂反思和總結[10];對學生的行為如舉手、站立、睡覺、打哈欠和微笑等進行追蹤識別[11];基于AI分析系統進行混合式聽評課教研[12];基于機器學習對本科STEM課堂中教師的展示、指導和管理三個行為類別進行識別[13]。其中,基于深度學習的課堂分析工具包括援用大數據分析的靠譜COP[14]、醍摩豆蘇格拉底AI教師行為數據分析系統、新學道教師行為數據分析系統等。利用深度學習技術對課堂數據進行標準化分析,在一定程度上有效促進了教學評價方式的革新并降低了評價成本[15]。然而,深度學習技術因訓練數據有限、單一模型只能處理單一指標、擴展新指標需額外的數據和開發成本,導致分析結果多為量化數值,僅能依據分值不同給出固定的文本解釋,存在評價標準固定、擴展困難、結果解釋機械且難理解等問題。鑒于課堂教學環境的多維動態特性[16],固定標準下的評價易引發教學模式同質化并與實際需求相脫節的現象[17]。近期,多模態大模型發展迅速,通過大規模文本、視頻和圖片數據訓練,該類模型不僅展現出廣泛的知識面和文本理解力,還能根據提示詞的不同深入解析音視頻內容,使靈活設定評課指標和評價細則、提供豐富貼切的教學反饋成為可能。
二CST2差異化評課模型
考慮到教學的復雜性,為提升智能評課系統對教師專業發展需求支持的適切性,本研究融合教師文化回應教學理論[18]、TPCK理論[19]、教師專業發展階段理論[20],構建了CST2差異化評課模型。這三個理論雖然都致力于提升教師的課堂教學質量,但關注的視角不同,因此具有較強的互補性。其中,文化回應教學理論注重課堂對文化背景的融入,突出不同國家、地區、學校在教學設計與內容上的特色;TPCK理論強調教師應整合技術、教學法和內容方面的知識,以適應現代教育環境;教師專業發展階段理論主要關注教師在不同職業階段的需求和發展路徑。依托上述理論,本研究提煉了包含文化背景(Culture Background)、課型(Class Type)、學科(Subject)、學段(Student GradeLevel)、教學主題(Teaching Topic)、教師發展階段(Teacher Development Stage)共六個核心要素的CST2差異化評課模型,從教師成長、教學技術與方法、文化適應性的角度出發,系統性地構建了一個全面支持差異化評課的框架,如圖1所示。


首先,文化回應教學理論強調,在教學中教師要充分了解學生所處的文化背景[21],因此本研究認為文化背景可從宏觀、微觀兩個層面影響教學: ① 在宏觀層面,國家政策影響教師的教學,如新課程標準可用于指導我國中小學課堂的教學實踐與教學評價,是實施差異化評價的重要引導; ② 在微觀層面,校本文化也會對教師的教學產生影響,如學校所具有的特定的精神環境、文化氣氛等,會間接或直接地影響教師的教學方法和學生的學習體驗[22]。
其次,TPCK理論強調教師不僅需要掌握學科知識,還需要了解如何通過與學科知識適配的教學方法和教學技術,將知識有效地傳授給學生[23]。因此,既要評估教師在特定學科領域的教學能力,也要關注教師對學科內容的理解和依據學情所選擇的教學方法。依據 TPCK 理論,課堂教學應針對課型、學科、學段、教學主題進行差異化評價: ① 課型方面,課堂教學的類型應根據教學目標、內容、方法和組織形式的不同進行劃分,如講授課重在知識傳授,討論課強調學生的思考與交流,實驗課注重實踐操作能力的培養。此外,不同課型的教學內容側重點也不同[24]。因此,需在評課中關注不同課堂類型的評價差異。 ② 學科方面,不同學科具有各自不同的特點和要求,這對課堂教學的設計、實施和評價有顯著影響[25]。例如,語文學科強調閱讀、寫作、口語表達和文學分析技能的培養;而科學學科強調實驗操作、觀察記錄和科學探究方法,鼓勵學生通過實驗和探索來理解自然現象。 ③ 學段方面,不同學段的學生在認知發展水平、學習需求等方面具有不同的特點,如小學生處于具體運算階段,更依賴直觀和具體經驗;而中學生逐漸過渡到形式運算階段,能夠處理更抽象的概念。因此,應充分尊重不同學段學生的認知學習規律,促進學生素養的提升[26]。④ 教學主題是指具體教學內容的主題。教師需要根據具體的教學主題,應用不同的教學方法和教學技術來達成教學目標[27]。對具體教學內容的評價,可以確保教學活動達到既定的教育標準和質量要求[28],是反映教師進行教學內容設計和整合能力的體現。
最后,教師專業發展階段理論強調:“教師的專業成長是一個持續不斷的過程,需要不斷地學習、反思和實踐。”[29]有研究發現,處于不同教師專業發展階段的教師群體,其課堂教學行為會呈現出群體性差異特征[30],如新手教師通常在教師素養方面表現優秀,但在教學內容和課堂操作兩個維度上還有待加強[31]。除此之外,教師因個人教學風格不同也在課堂教學各方面存在差異,因此每位教師在不同的成長階段所關注的重點和需求都有所不同。
基于上述分析,結合對六個核心要素的凝練整合,本研究將CST2差異化評課模型定義如下:CST2差異化評課模型是一種旨在提供差異化、科學化、循證化教學評價的模型,該模型在文化響應教學理論、TPCK理論和教師專業發展階段理論的指導下,綜合分析課堂的文化背景、課型、學科、學段、教學主題、教師發展階段六個核心信息,以助力實現對課堂教學的適應性評價,由此促進教師的差異性專業成長和教學質量的提升。與傳統評課模型相比,CST2差異化評課模型具有多維適應性、發展階段針對性、動態調整性三個關鍵特征,在評課時能夠從多個維度適應教育環境的多樣化,并根據教師的不同發展階段動態調整評價標準,由此促進教師的專業發展。
三基于多模態大模型的CST2差異化智能評課系統
1多模態大模型
近年來,ChatGPT、Llama、文心一言、星火、千帆等大模型憑借涌現的智能特性,引起了社會的廣泛關注,并在教育領域內的教、學、評、管、研等多個環節得到了深入應用[32][33],如利用大模型作為教師的數智分身[34],利用智能會話輔導進行伴隨式、個性化的教學輔助[3],利用多種大模型構建多智能體幫助學生學習復雜知識并解決問題[36]等。
然而,傳統大模型僅能處理文本這一單一模態信息,而缺乏對音頻、圖片、視頻等多種模態數據的處理,如何處理多模態信息由此成為大模型領域的研究熱點。當前,在音頻信息理解方面,多模態大模型采用的技術主要是將語音信號轉錄為文本或對音頻特征進行編碼以生成多層語義向量[37][38];而在視頻信息理解方面,多模態大模型中的視覺語言模型(Vision Language Model,VLM)能夠綜合圖文的含義來進行反饋,其主要方法包括通過大量數據進行圖像和文本的對齊與訓練[39]、使用目標檢測模型和光學字符識別(OpticalCharacterRecognition,OCR)等視覺專家模型來提取圖像中的對象與文本信息[40]、根據固定的像素塊大小提取局部圖像并提煉全局視覺區域[4I、利用通行的對比語言圖像預訓練(Contrastive Language-Image Pre-training,CLIP)模型從圖像中提取文本數據以供大模型推理[42]等。當前,主流的視覺語言大模型包括商業的ChatGPT-4V、ChatGPT-4o等,開源的IntemVL[43]、Yi-VL[44等。憑借對海量數據預訓練而獲取的廣泛知識面,以及對語音、文本、視頻的綜合理解能力,當前多模態大模型已具備綜合分析課堂教學音視頻并提供豐富教學反饋的能力。
2基于多模態大模型的CST2差異化智能評課系統技術框架
本研究以CST2模型為指導,設計了基于多模態大模型的CST2差異化智能評課系統技術框架,如圖2所示。該技術框架包括CST2分析、評課指標體系、數據采集、預處理、提示詞生成、多模態大模型、結果分析、系統前端顯示等模塊。
首先,需要通過CST2分析收集差異化評課信息,并據此生成評課指標體系。該指標體系包含若干評課指標,每個評課指標又含有指標細則和打分規則,以提升差異化評課效果。所有通用指標(如教學方法、教學效果等)和針對學科、課型等的差異化指標(如實驗課的實驗表現等)均可存放在評價指標池中,以方便在不同的評課指標體系之間共享。
接著,可通過數據采集從教室錄播系統獲取課堂實錄音視頻材料和教師的教案文檔。之后,通過預處理將音頻轉換為文字,形成課堂對話文本材料;按固定時間間隔從課堂視頻中截取幀,形成課堂圖像材料,并將處理前后的課堂數據均保存在對象存儲或數據庫中。
然后,需要通過提示詞生成過程,將預處理后的文本、圖片與評價指標體系下所有的評課指標細則融合為多模態大模型可理解的提示詞。Wang等[45]發現,設計多模態大模型的角色、工作流程和行為要求,有助于優化其性能和反饋質量。基于此,本研究設計了提示詞結構與結果生成流程,如圖3所示。其中,“角色設定”包括評課智能體的角色設定介紹、目標等;“評課任務流程”為智能體處理輸入、輸出的工作流程;“輸出要求與約束”對大模型輸出的內容進行限制并對格式進行規范;“指標體系及細則”包括對指標體系中指標項及評分細則的說明;“CST2差異化信息”為本堂課依據CST2模型提取的課堂背景信息;“課堂對話文本”為課堂音頻所轉的帶有時間戳的師生對話文本;“單幀圖像”為每隔一分鐘截取的帶有整分鐘時間戳的課堂圖像;“所有幀分析結果”融合了各個指標的單幀分析結果;“輸入輸出示例”包含了說明大模型輸入輸出格式規范的示例;“系統輸出文檔”則代表在網頁上以文檔形式可視化輸出所有評課結果,包含原始音視頻、各個指標打分結果、綜合總結和整體建議。
最后,結果分析主要將多模態大模型輸出的包括評課指標分數、評課解讀、循證時間戳等評課結果,解析為包含評分數據量化分析、打分依據字符段落、視頻時間戳鏈接等結構化數據,最后通過系統前端顯示對上述結果進行可視化。此外,評課數據的積累還可作為后續多模態大模型調優的數據基礎。
3基于多模態大模型的CST2差異化智能評課系統實現
依托上述技術框架,本研究研發了基于多模態大模型的CST2差異化智能評課系統,其界面如圖4所示。該系統實現了課堂視頻上傳、預處理、差異化評課指標及指標體系設置、基于多模態大模型的課堂音視頻分析、分析結果呈現等功能,在多模態大模型的接入上也提供了可靈活配置多種大模型的設置。

四基于多模態大模型的CST2差異化智能評課案例展示
為探究基于多模態大模型的CST2差異化智能評課系統在真實課堂評價中的效果,本研究選擇重慶市S 小學的一堂科學實驗課作為研究案例,利用CST2分析設計了該校科學實驗課專用的評課體系,并采用基于多模態大模型的CST2差異化智能評課系統對該堂實驗課進行評課。
首先,本研究通過對該堂實驗課的教案、課程標準、核心素養、教師發展階段、學生學段等信息的整理,形成了CST2差異化評課信息表,如表1所示。

之后,本研究將多年來S小學在教研活動中使用的課堂教學評價表作為通用評課指標體系;同時,將CST2 差異化評課信息與通用評課體系的信息一同輸入大模型并添加提示詞,使其對通用評課指標體系進行優化,由此得到CST2差異化評課指標體系。表2列出了通用評課指標體系與CST2差異化評課指標體系的具體指標,可以發現:CST2差異化評課指標體系新增了針對學科特點展開的實驗課專項指標,此外還對各一級指標和二級指標進行了符合差異化課堂信息的優化。


在確定差異化評課指標體系后,本研究再一次結合CST2差異化評課信息,由大模型生成指標細則和打分規則(參看如表3所示的通用評課指標描述、差異化評課指標細則和打分規則示例)。由于融合了CST2差異化評課信息,“定位準確”指標細則在教學目標方面,包含課堂教學主題維度的詳細內容和文化背景維度中新課標的相關內容;“精神狀態與情感表達”指標細則在教姿教態與情感表達方面,更加關注教師發展階段中真實的課堂表現力。此外,CST2差異化評課信息在其他指標細則中也均有體現,如課型、教師發展階段信息更多地體現在“設計合理”和“策略有效”兩個指標中。
然后,將CST2差異化評課信息、指標細則、打分規則等作為提示詞發送給多模態大模型,最終得到評課結果。采用通用評課指標體系(無細則)與采用CST2差異化評課指標體系(有差異化評課指標細則)的評價結果對比如表4所示,可以發現:相比前者,后者可以為多模態大模型提供更多與評課有關的知識,從而使反饋更加豐富合理。其中,對“定位準確”指標的評價結果解讀,結合了CST2差異化評課模型中文化背景維度下的學科核心素養,其評價更為具體且有針對性;而對“精神狀態與情感表達”指標的評價結果解讀,結合了課型維度下回顧學生先前調查結果的環節,其評價更為系統、客觀。

最后,為比較基于多模態大模型的CST2差異化智能評課系統的實際評課效果,本研究請四位評課專家觀看上課視頻和兩份評課結果并進行訪談。訪談對象為四名,均為省市級和區級賽課一等獎或二等獎的獲得者,具有豐富的評課經歷。本研究對訪談文本進行了整理與歸納,其要點如下:
① 經過CST2分析優化后的差異化評課指標體系對具體課堂更具適用性。有3名訪談對象認為CST2差異化評課指標體系的指向性更明確,符合本節課的實際情況。其中,訪談對象一認為CST2差異化評課指標體系既全面又具體,還提出了以前未曾關注過的評課角度,如情感投入和班級文化。另外,CST2差異化評課指標體系還關注創新與個性化教學維度,由此能夠明確區分出不同教師在教學上的優勢和不足。
② 相對通用評課標準的評課結果,CST2差異化評課結果更具操作性和指導意義。所有訪談對象都認為CST2差異化評課結果指出了課堂教學的優缺點,符合實際情況。其中,訪談對象二認為CST2 差異化評課結果逐幀評價細致、具體,且更有針對性。
③ 在基于多模態大模型的CST2差異化智能評課系統的改進建議方面,訪談對象一與訪談對象二均認為在大模型評價中,每個指標都有提及教師授課的優點與不足,文字敘述過多會導致教師在面對評課結果時有挫敗感,大模型的評價中立、客觀也顯得有些嚴苛,因為面面俱到導致亮點和關鍵點不突出,教師能夠有針對性地改進但無法發現自己的突出優勢。訪談對象三提出了更多的差異化評價需求,如對教學經驗較少的年輕教師,可重點提供基本教學技巧和方法;而對經驗豐富的老教師,則應更多地關注其在教學創新和學生能力培養方面的表現。
綜上所述,經過CST2優化后的差異化評課指標體系貼合實際課堂,更有針對性,且融入CST2信息的評課結果更細致具體,有助于教師改進教學。不過,由于該指標體系要求細致,部分教師覺得過于苛刻,后續可繼續優化其實現邏輯及提示詞框架,以突出每個教師的優勢,并為教師提供更多情感支持。
五結語
為解決傳統評課模型中存在的標準固定、難以適應多元教學情境、缺乏差異化等問題,本研究提出了依托教師文化回應教學理論、TPCK 理論、專業發展階段理論的CST2 差異化評課模型,并通過應用多模態大模型技術,實現了基于多模態大模型的CST2差異化智能評課系統。之后,在實驗學校進行應用后發現,相較于傳統評課模型,CST2差異化評課模型能根據具體教學情境和教師的不同發展階段,靈活地給出更有針對性的評課指標體系與評課建議,這為利用前沿人工智能技術賦能教學研究提供了新的思路與實施路徑。
然而,目前將多模態大模型應用于差異化評課仍處于初步探索階段,本研究的應用范圍也僅限于一所學校的一堂課例;由于研究資源的限制,模型優化主要依賴于提示詞工程的方式,尚未深入到特定領域的大模型調優;當前研究也尚未對純音頻特征進行分析,缺乏對教師音量、語速、普通話標準等教師基本素養的評價。因此,后續研究計劃以此次先導案例的反饋為基礎,進一步完善差異化評課的理論框架和技術實現方法,并在更廣泛的范圍內驗證其成效;同時,通過積累更多的數據進行訓練和模型微調,結合科大訊飛公司提供的“訊飛聽見”等語音分析程序接口,對教師的音量、語速、普通話標準性等純音頻特征進行分析,開發出更加注重差異化的評課大模型,以期為國家教育數字化戰略轉型提供智能化教研支撐,推動智慧教育生態體系的創新發展。
參考文獻
[1]穆肅,陳孝然,胡小勇.教師專業發展視域下智能教研平臺功能分析[J].現代遠距離教育,2024,(2):23-32.
[2]教師廳.教育部辦公廳關于開展人工智能助推教師隊伍建設行動試點工作的通知[OL].
[3]教師函.教育部關于實施第二批人工智能助推教師隊伍建設行動試點工作的通知[OL].
[4]王晴晴,楊曉哲.從傳統聽評課到課堂智能分析課堂研究新范式[J].上海教育,2022,(24):6-7.
[5]方潔.我國聽評課研究二十年:回顧與反思[J].西北師大學報(社會科學版),2014,(3):104-108.
[6]張海.弗蘭德斯互動分析系統的方法與特點[J].當代教育與文化,2014,(2):68-73.
[7]單迎杰.以S-T分析法分析教育技術專業課課堂教學問題[J].現代教育技術,2008,(10):29-31.
[8]顧小清,王煒.支持教師專業發展的課堂分析技術新探索[J].中國電化教育,2004,(7):18-21.
[9]Ramakrishnan A, Zylich B,Ottmar E,et al. Toward automated classroomobservation: Multimodal machine learning to estimate classpositive climate and negative climate[J].IEEETransactions onAfective Computing,2021,(1):664-679.
[10]Xu T,Deng W,Zhang S,etal.Research on recognitionand analysisof teacher-student behaviorbased onablended synchronous classroom[J]. Applied Sciences, 2023,(6):3432.
[11]Zho H,JiangFSiJ,etal.StuArt:Idividualedlasroomobsevationoftudents ithutomaticbhaviooio and tracking[A].ICASSP2023-2023 IEEE Intermational Conferenceon Acoustics,SpeechandSignalProcessing(ICASSP)[C]. Rhodes Island, Greece: IEEE,2023:1-5.
[12]趙楓,李恒才.基于AI分析系統的混合式聽評課教研的實踐[J].教育信息技術,2018,(12):53-56.
[13][30]UribeP,Schlotterbeck D,JimenezA,etal.AnautomaticteacheractivityrecognitionsystembasedonSpech Transcriptions[A]. 2021 XVI Latin American Conference on Learming Technologies (LACLO)[C]. Arequipa,Peru: IE, 2021:216-223.
[14]王陸,蔡榮嘯.課堂大數據視角下的提問傾向研究[J].電化教育研究,2016,(7):82-92.
[15]李如密.深度差異化:課堂教學評價的新趨勢[J].教育測量與評價,2018,(9):1.
[16]廖偉,劉淼,毛玉琳.循證式聽評課:為何循證、循何證、如何循證[J].中國教育學刊,2023,(4):86-91.
[17]閆寒冰,林梓柔,湯猛.關注差異的信息化教學課堂評價指標設計與應用[J].電化教育研究,2022,(8):92-100.
[18][21]陳銀河.文化回應性教學的內涵、價值及實現[J].教學與管理,2021,(6):10-12.
[19][23]KoehlerMJ,MishraP.Whathappens henteachersdesigneducationaltechology?Thedevelopmentoftechnological pedagogical content knowledge[J]. Journal of Educational Computing Research, 20o5,(2):131-152.
[20]陸偉,葆樂心.教師專業發展階段論對教師教育工作的啟示[J].中國成人教育,2014,(24):126-128.
[22]洪金祥.構建特色校園文化,助力特教教師專業成長[J].新課程,2020,(9):200.
[24]陳佑清,陶濤.\"以學評教\"的課堂教學評價指標設計[J].課程·教材·教法,2016,(1):45-52.
[25]陳麗霞,陳小軍.聽評課的五個視角[J].教學與管理,2015,(19):32-34.
[26]陳立新.基于核心素養聽評課問題與解決路徑探究——青藍工程聽評課教研活動反思[J].龍巖學院學報,2024,(2):117-122. [27]王榮生.聽王榮生教授評課[M].上海:華東師范大學出版社,2007:16.
[28]姚賽男.基于\"教學內容\"的評課視角與范式[J].教育理論與實踐,2010,(14):6-7.
[29]王琰春.西方教育評價觀的演進及對我國的啟示[J].教育與現代化,2003,(1):74-78.
[31]金星霖,周娜.中職新手教師的教學行為特點研究——對評課意見表的內容分析[J].中國職業技術教育,2018,(35):26-31. [32]劉明,郭爍,吳忠明,等.生成式人工智能重塑高等教育形態:內容、案例與路徑[J].電化教育研究,2024,(6):57-65. [33][34]廖劍,許邯鄲,劉明,等.數智分身:人工智能時代教師本位人機共教模式[J].現代遠程教育研究,2024,(4):85-93. [35]劉華,祝智庭.大模型支持的會話輔導系統開發:范式轉換、架構設計與能力訓練[J].現代遠程教育研究,2024,(3):11-19. [36]翟雪松,季爽,焦麗珍,等.基于多智能體的人機協同解決復雜學習問題實證研究[J].開放教育研究,2024,(3):63-73. [37]RadfordA,KimJW,XuT,etal.Robustspeechrecognitionvialarge-scale weaksupervision[A].Proceedingsofe40th International Conference on Machine Learning[C]. Hawai: JMLR.org, 2023:28492-28518.
[38]Ghosh S, Kumar S,SethA, et al. GAMA: Alargeaudio-language model with advanced audio understanding andcomplex reasoning abilities[OL].
[39]Ghosh A,Acharya A,Saha S,etal.Exploring the frontierof vision-language models: Asurveyofcurrent methodologies and future directions[OL].
[40]Jiao Q,ChenD,HuangY,etal.Enancing multimodallarge language models with visiondetectio models: Anempirical study[OL].
[41]WuJ, Zhong M,XingS,etal.VisionLLMv2:Anend-toend generalistmultimodal arge language modelforhundreds of vision-language tasks[OL].
[42]Radford A,Kim J W, Hallacy C,et al. Learning transferable visual models from natural language supervision[A]. Procedngs ofthe 40th Intermational Conference on Machine Learing[C].Cambridge,MA,USA: PMLR,2021:8748-8763. [43]Chen Z,Wu J,WangW,etalInternvl:Scalingupvision foundation models andaligning forgenericvisual-linguistic tasks[A].Proceedings ofthe IEEE/CVFConference on Computer Visionand PatternRecognition[C].Seatle,USA: IEEE, 2024:24185-24198.
[44]Young A, Chen B,Li C, et al. Yi: Open foundation models by 01.Ai[OL]. [45]WangL,Ma C,Feng X,etal.Asurveyonlarge language model based autonomousagents[J].FrontiersofComputer Science,2024,(6):186345.
Research on the CST2 Differentiated Lesson Evaluation Model and Its Application Based on Multimodal Large Models LIAO Jian1 HU Yu-Li1 ZHANG Qian2 CHEN Xiao-Lang1,3 LIU Ge-Ping1
(1.Faculty of Education, Southwest University, Chongqing, China 400715;
2.Xiamen Andou Primary School,Xiamen, Fujian, China 361006;
3.Primary School Attached to Southwest University, Chongqing, China 400700)
Abstract: Inrecent years,theuseof technologiessuch asnaturallanguage processng andintellgent audioand videoanalysis forautomatedlesson evaluationhasemergedasaresearchhotspot.However,theautomatedlessonevaluationsystemsupported by deep learning technologyoftensuffers from problemssuchasrigid standards,insuficientadaptability,andinadequate appropriate fedback in practical process, making it dificult toadapt to the complex and diverse teaching environment. Moreover, the evaluationresults frequentlyfail toprovide teachers’teaching withspecificand detailed guidance.Therefore, combined the semantic comprehensionand dynamic generation advantages oflarge model technology,this paperrefined the CST2 diferentiated lessn evaluation model that included six core elementsof cultural background,lessontype,subject, teachingstage,teachingtopic,andteachers’professional developmentstage.Guidedbythis model,thepaperdesignedthe technical frameworkoftheCST2diferentiated intellgentlesson evaluationsystembasedonmultimodal large models.Relying onthis technical framework,the paper developed the CST2 differentiated inteligent lesson evaluation system basedon multimodallarge model.Thissystemcouldestablishanevaluationindexsystemanddetailedrulescontainingthediferentiated informationofCST,and integrate multimodaldatasuchas teaching textsandteacherimages inclasroomaudioandvideoto generate more targeted classroom teaching evaluationresults.Subsequently,apilotcase studyofthissystem was conducted in SPrimary School.The results showed that this system could conduct evaluation of classroom teaching that was more in accordance with specificteachingsituationsand teachers'diferentiateddevelopment goals.The theoreticalmodelconstruction and practiceonhow multimodal large models toempower diferentiated intelligent lesson evaluation inthispaper was conduciv topromotingthein-depth integratedandinnovativedevelopmentofartificialintellgenceandeducationandteaching.
Keywords: multimodal large model; teaching research; CST2 analysis; differentiated lesson evaluation