999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

生成式人工智能支持的教師評語研究:基于初中數學課堂的實踐探索

2024-05-23 13:00:27羅恒廖小芳茹琦琦王志鋒
電化教育研究 2024年5期
關鍵詞:初中數學

羅恒 廖小芳 茹琦琦 王志鋒

基金項目:2021年度國家自然科學基金面上項目“細粒度的智能學習診斷及其可解釋性機制研究”(項目編號: 62177022)

[摘? ?要] 教師評語是形成性評價分析的重要數據來源,但現有教師評語生成的質量在社會性、客觀性和個性化方面存在一定的不足,生成式人工智能支持的教師評語為解決該問題提供了可能。生成式教師評語是指教師通過認知診斷技術得到的智能診斷數據與生成式人工智能平臺進行交互,從而讓生成式人工智能平臺模擬教師社會性語言,生成數據驅動的個性化教師評語。在初中數學課堂中的實證研究發現:生成式教師評語有效地提高了學生的自我調節學習能力(Cohen's d=1.08, p=0.000)和學習動機(Cohen's d=0.59, p=0.003),對學生的深度訪談結果表明,生成式評語能作為考試的一種總結反思工具,體現了教師對學生個性化的關注和鼓勵。研究結果為人工智能技術助力個性化、精準化教學提供了研究思路,為教育環境中持續評估和改進生成式人工智能技術的使用提供了建議。

[關鍵詞] 生成式人工智能; 教師評語; 智能評測; 個性化教學; 初中數學

[中圖分類號] G434? ? ? ? ? ? [文獻標志碼] A

[作者簡介] 羅恒(1983—),男,湖北武漢人。副教授,博士,主要從事教學設計、數字化學習研究。E-mail:luoheng@mail.ccnu.edu.cn。

一、引? ?言

作為教育生態變革的重要驅動力,人工智能技術在教育評價改革,實現規模化教育與個性化培養的有機結合方面的實踐應用廣受關注[1]。其中,由機器學習模型提供支持的人工智能生成內容(Artificial Intelligence Generated Content,AIGC)能夠自動化生成文本、圖像、視頻、音頻等多模態數據,具備很強的對話情境理解能力和啟發性內容生成能力。自2022年以來,生成式人工智能在文本生成方向的應用(例如, CTRL模型、ERNIE-GEN模型、GPT模型)紛紛涌現,引發了教育內容生產方式的變革[2]。生成式人工智能采用預訓練—提示(Pre-train-Prompt)的學習模式,借助概率對用戶輸入的文本上下文進行模式識別,根據句法規則生成文本內容,并結合用戶輸入的文本進行反饋強化學習,從而提供多輪次、流暢、自然的內容生成。生成式人工智能基于自然語言的對話能力,使其在教學評價與反饋中具備良好的應用潛力[3]。

教師評語作為教育評價的重要環節已經引發了越來越多的關注,評語通常是教師以描述性語言來概述學生學習情況,并以文本形式呈現給學生本人或其家長和教育行政部門[4]。中共中央、國務院于2020年10月印發了《深化新時代教育評價改革總體方案》,提出要“創新評價工具,利用人工智能、大數據等現代信息技術,探索開展學生各年級學習情況全過程縱向評價、德智體美勞全要素橫向評價”[5]。然而現有的教師評語反饋在社會性、客觀性和個性化方面存在一定的局限性。首先,評語反饋的社會性不足,現有的評語生成系統生成的文本內容不能實現和學生的交互,不具備多輪對話的能力。其次,教師評價的來源多為教師的主觀經驗,缺乏客觀性。最后,教師評語的撰寫容易陷入抽象化、模式化、空洞化、教條化的誤區,現有的教師評語生成的途徑大多是通過評語語料庫或者關鍵字生成的一些重復的短語,缺乏對學生學習過程和認知狀態的準確描述。

生成式教師評語為這三個局限性提供了解決方案。生成式教師評語是指教師通過認知診斷技術得到的學習分析數據與生成式人工智能平臺進行交互,從而讓生成式人工智能平臺模擬教師社會性語言,生成數據驅動的個性化教師評語。在生成式教師評語中,數據是核心指標,教師是設計者和監督者,學生是內容使用者。首先,在社會性方面,與其他自然語言處理模型相比,AIGC具有良好的語言生成能力,能夠更好地理解用戶的問題,并且AIGC具有連續多輪對話的能力,能夠在教師的監督下生成更加具有交互性的教師評語。其次,在客觀性方面,AIGC可以利用知識診斷數據實現對學習過程的科學描述,為學生提供數據驅動下更加準確客觀的學習狀態點評。最后,在個性化方面,AIGC的內容生成能力可以根據學生的學習數據提出針對性的改進建議和錯題練習,讓學生得到更加精準化和個性化的評價反饋。

2022年11月30日,OpenAI發布了ChatGPT,僅僅用了兩個月的時間,成為史上用戶增長速度最快的消費級應用程序。ChatGPT、文心一言和Bard等AIGC產品對教育領域的影響及應用引起了國內外學者的探討與關注,但目前的研究大多是從AIGC的基本原理、智能涌現、能力邊界以及工具價值等維度進行概念性論述[6-8],缺乏對AIGC在真實課堂中應用的實證研究。另外,現有的實證研究涉及的實踐應用主要是為學生個性化自適應學習賦能,包括編程代碼生成[9]、語言翻譯[10]、課程知識問答[11]和適應性學習[12]等,需要進一步探討AIGC在面對面課堂教學情境中的應用模式和路徑。本研究使用的AIGC平臺為基于飛槳深度學習平臺和文心知識增強大模型而研發的文心大模型4.0。

本研究在真實的初中數學課堂環境中進行,聚焦“如何通過AIGC支持的生成式教師評語促進數學學習”這一核心主題,探索人工智能技術支持下教師評語生成的新型方式,探討數智化時代提供個性化、精準化的教學評價的有效途徑,探究生成式教師評語對數學學習成績、自我調節能力以及學習動機的影響。基于此,本研究提出以下四個研究問題:

1. 如何依托認知診斷模型和AIGC平臺生成教師評語?

2. 生成式教師評語能否提高學習者的學習成績,為什么?

3.生成式教師評語能否發展學習者的自我調節學習能力,為什么?

4.生成式教師評語能否促進學習者學習動機,為什么?

二、文獻綜述

(一)教師評語的數據基礎

教師評語是教師對學生某一階段發展狀態的較為全面且富有個性的質性評價。Matsumura等提出,從形式上評語可以分為認知特征類評語和情感特征類評語[13]。認知特征類是一些可采納評語,如指出問題、提出建議、定位問題、給出解決辦法;情感特征類主要指稱贊、批評兩類評語。

反映學生學習過程的數據是生成更加準確、客觀的生成式教師評語的重要基礎。傳統的評語數據是教師根據主觀經驗生成的,隨著計算機技術的發展,教師只要在評語生成程序內輸入關鍵詞,就可以利用評語生成系統得到模板化的教師評語數據。而人工智能技術的廣泛應用使評語的數據生成更加智能和個性化[14]。本研究主要使用了認知診斷技術實現智能學習診斷,為評語的內容生成提供了數據基礎。認知診斷模型在項目反應理論的基礎上,基于學生的交互行為(如答題數據、測試數據)來挖掘學習者的潛在認知狀態(知識點掌握程度和熟練程度),進而預測學習者在特定學習任務中的表現[15]。常見的認知診斷模型有IRT 模型、DINA 模型和神經認知診斷模型。

(二)教師評語的內容生成

評語的內容生成是數據和社會性的語言整合的結果。評語是自然語言處理(Natural Language Processing)的子問題,自然語言理解和自然語言生成是評語生成過程中的重要組成部分。現有計算機生成的評語在語義表達的準確性、社會情感性等方面存在一定的局限性。讓計算機更好地理解教師意圖并根據學生數據信息來生成更加個性化和精準化的評語文本,是評語生成的技術難題之一。文心一言等AIGC產品的面世為個性化教師評語的生成提供了新的解決方案。

文心一言是對大語言模型(Large Language Model,簡稱 LLM)訓練的結果,因此,對文本具有更強的理解能力,在教師評語生成過程中表現出良好的潛力。相比較于傳統的聊天機器人,基于大規模語料庫訓練的文心一言能夠結合少量的提示詞,實現個性化數字資源高效創建、對話式人機協同學習、素質導向的教育評價[16]。基于文心一言的語言理解、對話交互、文本生成等方面的優勢,文心一言在本研究中扮演教師評語內容生產者的角色。

三、研究方法

(一)參與者與研究情境

本研究在湖北省W市某中學采用準實驗研究法開展了為期6周的教學實驗,在真實的初中數學課堂中檢驗生成式教師評語的效果。本研究選擇的兩個班級的學生在學習成績和師資配備上基本一致,其中一個班級為實驗班級(七年級18班),另一個班級為對照班級(七年級5班)。剔除無效被試后(無效被試為沒有填寫問卷或不認真作答的學生),共有117名實驗被試,其中,男生62人,女生55人,平均年齡12.9歲。

(二)教學干預:生成式教師評語

生成式教師評語的建構包括評語的數據生成和內容生成兩個階段。整體的生成路徑如圖1所示。首先,教師采集學生的個人信息、試題信息以及作答情況等測評數據,這些數據能夠反映學習者的學習過程和認知狀態。其次,利用本文作者自主搭建的智能學習診斷實驗平臺[17]對測評數據進行信息挖掘與建模。

在數據生成階段,智能學習診斷平臺使用神經認知診斷模型(Neural-cognitive Diagnostics),該模型綜合考慮學生因素、題目因素以及它們之間的相互作用。智能學習診斷平臺通過分析學生的答題記錄,提取學生學習過程中的各類特征,診斷學生對知識點和六種初中數學核心素養(數學抽象、 邏輯推理、數學建模、直觀想象、數學運算和數據分析)的掌握情況,從而得到學習者錯題和知識點的對應定位。具體的挖掘和分析過程如下:首先,用S= {s1,s2,…,sN}表示學生集合,E = {e1,e2,…,eM}表示試題集合,并以人工標注的方式將試題所考察的知識點情況存入一個矩陣Q,Q∈{0,1}(M×K)。其次,對于每個學生,將其編碼成一個維度為學生總數N的學生one-hot向量xs,通過與一個可訓練的學生知識掌握矩陣A進行乘積,得到該學生的知識掌握嵌入向量hs,其中hs∈(0,1)(1,K);而對于每道試題,先將試題one-hot向量xe與Q相乘,得到每道題所對應的知識相關度向量Qe,接著構造可訓練的矩陣B和D,以同樣的方式對試題知識點難度向量hdiff和試題區分度向量hdisc加以嵌入表征。得到學生和試題的向量表示后,構建交互函數并通過多層神經網絡:

x= Qe?莓(hs-hdiff)×hdisc

f1? = ?準(W1×xT+b1)

f2? = ?準(W2×f1T+b2)

y =?準(W3×f2T+b3)

其中,?準是激活函數,此處使用sigmoid函數,訓練以預測作答和實際作答結果的交叉熵作為神經網絡的損失函數,訓練結束后hs即為學生對某個知識點的掌握情況診斷。最終,通過對測評數據的挖掘,本研究得到了學生的個人信息、知識點掌握情況、核心素養情況和錯題定位等,這是教師與文心一言平臺進行交互的數據基礎。

圖1? ?生成式教師評語的生成路徑

在內容生成階段,教師根據智能診斷結果對文心一言進行提問。教師與文心一言互動的質量取決于提問設計,如何向其提問成為獲得有效反饋的關鍵[18]。本研究采用優化提問設計原則[19],優化提問指的是研究者在獲得“初始提問”的反饋信息后,基于初始提問進行優化后的提問。整體提示編寫框架參照White[20]提出的人物角色模式,具體提示編寫框架見表1。在教師的監督和多輪對話迭代下,最終生成的教師評語如圖2所示。

圖2? ?生成式教師評語示例

(三)研究過程

本研究采用準實驗設計來檢驗生成式教師評語對學生數學學習成績、自我調節學習和學習動機的影響。整體研究過程如圖3所示。參與者在第一階段和第三階段分別進行了自我調節學習、學習動機的前后測。第二階段,實驗組和對照組同步學習七年級數學第五章,并進行了四次測試,以監測成績變化。區別在于,對照組在每次測試后僅獲得含有排名和分數變化情況的成績單,教師會對班級整體考試情況進行口頭反饋,而實驗組除此之外,還會收到個性化的生成式教師評語。

圖3? ?總體實驗流程

(四)數據收集與分析

1. 數據收集

本研究收集了知識測驗成績、問卷數據和訪談數據。知識測驗試卷由10年以上授課經驗的教師開發,評估學生對數學知識的理解,涵蓋選擇題、填空題和解答題等24個題目,總分100分。學習動機問卷改編自McAuley[21]的IMI動機量表,包括興趣、能力、價值和壓力四個維度的11個題項。自我調節學習問卷改編自Barnard[22],包括目標設定、任務策略、時間管理、尋求幫助和自我評價等13個題項。問卷均以5分李克特量表來測量。共回收有效問卷117份,自我調節學習和學習動機問卷的Cronbach's α值分別為0.898和0.885,內部一致性較高。此外,本研究還在實驗組隨機選擇6名學生進行半結構化訪談,訪談圍繞生成式教師評語的使用感受以及對學生可能產生的影響等七個方面展開,通過諸如“你能簡要描述一下你對教師評語的使用感受嗎”“教師評語中哪些設計和點評給你留下了深刻印象”以及“階段測試后收到教師點評,你的學習有發生什么變化嗎”等問題展開。每個人訪談時長為5~8分鐘,錄音后對訪談進行部分轉錄,生成8131個中文單詞的文本內容進行定性分析。

2. 數據分析

在知識測驗與問卷調查的定量數據分析中,本研究首先使用描述性統計分析來了解參與者的學習成績、自我調節學習能力以及學習動機在均值上的差異。其次,在差異性分析方面,學習成績和問卷數據的K-S檢驗結果均滿足正態分布(p>0.05)和方差齊性檢驗。因此,本研究采用重復測量方差分析來分析知識測驗數據,采用配對樣本T檢驗來探究學習者在前測和后測時自我調節學習能力和學習動機的差異,采用獨立樣本T檢驗來探究兩組學生在自我調節學習和學習動機的后測差異。本研究采用IBM SPSS 21進行統計分析。

在訪談數據方面,改編自Chen等[23]的編碼方案,本研究從認知、元認知和情感三個方面對訪談記錄進行定性分析。本研究遵循了Braun等[24]提出的主題分析程序,對文本內容進行了定位、識別和分類,以便進一步分析和主題生成。最后識別出85個代碼,11個節點,其中認知反饋19個節點、元認知反饋45個節點和情感反饋21個節點。編碼主要由本研究的第一、第二作者使用NVivo 12進行分析,編碼過程中出現的任何有爭議的問題通過所有作者參加的每周會議解決。質性數據的分析在本文中主要用來支持對量化結果的三角互證和解釋解讀。

四、研究結果

(一)前測數據分析

由于本研究是在真實課堂中的準實驗研究,為減少無關變量的影響,本研究采用獨立樣本T檢驗分析對照組與實驗組的數學學習成績、自我調節學習能力和學習動機的前測是否存在差異。結果顯示,兩個組初始成績(測試1)(p=0.898≥0.05)、自我調節學習能力前測 (p=0.146≥0.05)和學習動機前測 (p=0.056 ≥0.05)均無統計學差異。

(二)學習成績差異

學生整體學習成績變化如圖4所示。實驗組在收到第一次和第二次生成式評語反饋后,學習成績有一定的提升且與對照組有顯著性的差異,但是實驗組在收到第三次評語反饋后,學習成績呈現下降的趨勢,兩組在第四次測試成績上不存在顯著性差異。

圖4? ?實驗組和對照組學習成績比較

為了進一步探究學習者的成績變化與組別以及時間的關系,本研究采用重復測量方差分析評估實驗組和對照組之間四次階段測試學習成績變化情況。經Shapiro-Wilk檢驗,各組數據服從正態分布且符合球形檢驗(p=0.144>0.05)。重復測量方差分析結果顯示,組別的主效應不顯著(F=1.45,p=0.23, ηp2=0.012);測量次數的主效應顯著(F=29.17,p<0.001,ηp2=0.202);測量次數與組別的交互效應顯著(F=11.10,p<0.001, ηp2=0.088)。

(三)自我調節學習和學習動機差異

圖5? ?實驗組和對照組自我調節學習和學習動機前后測比較

如圖5所示,對照組的自我調節學習和學習動機在前后測中沒有顯著性差異。實驗組在收到三次生成式評語反饋后,實驗組的自我調節學習能力均值提高0.23,標準差減少0.06,說明實驗組在收到三次生成式教師評語后,自我調節學習能力顯著提高(p=0.014),整體數據更加集中。實驗組的學習動機均值提高0.55,標準差增加0.21,結果表明實驗組學習動機在實驗期間得到了提高(p=0.000),但數據的波動性更大。

對實驗組和對照組的后測成績進行獨立樣本T檢驗,結果見表2,實驗組自我調節學習后測得分顯著高于對照組(MD=0.63, Cohen's d=1.08, p=0.000),證明生成式教師評語能顯著提升學生的自我調節學習能力。實驗組學習動機后測得分高于對照組(MD=0.43, Cohen's d=0.59, p=0.003),表明生成式教師評語同樣能顯著增強學生的學習動機。

表2? 兩組后測的自我調節學習和學習動機評估得分比較

五、研究討論

(一)對研究問題的討論

針對問題1,生成式教師評語的生成包括數據生成和內容生成兩個階段,分別體現了個性化教師評語的數據性和社會交互性的原則。生成式教師評語可以通過測評數據采集、信息挖掘建模、診斷結果輸入和智能評語生成四個步驟生成。首先,隨著人工智能技術在教師評語中的應用,教師評語的生成來源應不僅僅局限于教師的主觀經驗,而應更多地反映學習者的學習過程和認知狀態,使他們對自己的學業成就水平有一個客觀的認識,實現數據驅動的精準化形成性評價。另外,具有社會情感的交互是教師評語的重要評價指標[25],本研究要充分利用文心一言等AIGC應用在語義表達和語義理解上的優勢,生成更便于學生理解并更能體現對學生發展性關注的評價。教師在整個評語過程中起到主導和監督作用,通過多輪對話迭代,讓AIGC應用成為教師的智力支持和工作助手[26],大幅減輕教師工作負擔,助力精準化、個性化形成性評價。

針對問題2,生成式教師評語對學習成績的整體效果影響是一個有趣的發現。研究結果表明,生成式評語對學習成績有一定的促進作用,訪談數據編碼結果表明生成式教師評語中提供改進線索或試題練習對于提升學習者學習成績至關重要。有受訪者表示,相比較于知識點掌握情況診斷,他們對評語中提供的題目練習更感興趣,練習題目的數量、質量以及答案反饋也是影響生成式教師評語評價質量的關鍵因素。這個發現和Hattie等[27]的觀點一致, 他對74項教師評語研究進行元分析發現,最有效的評語形式是那些提供改進線索或強化策略給學習者的評語。在第一、二次評語反饋發放后,實驗組的學習成績提高,但是第三次評語反饋并未對實驗組的學習成績產生顯著的影響。一種可能的解釋是由于新奇效應,Huang[28]將新奇效應定義為對用戶來說新的、不熟悉的、意想不到的體驗。學生第一次和第二次收到生成式教師評語時,相比較于以前收到的籠統的、模板化的點評,生成式教師評語中含有學習者學習情況診斷、針對性錯題練習,這會引發學生的好奇心和感知可用性。然而,新奇效應是短期的,隨著生成式教師評語發放次數的增加,這種新奇效應會逐漸消失[29]。學生對評語內容的學習不僅僅靠自身的興趣驅動,教師更要引導學生關注評語的內容。

針對問題3,生成式教師評語發展了學習者的自我調節學習能力。生成式教師評語提供了學習者學習過程數據,反映了學習者的認知狀態,使學生從被動接受評價結果轉變為主動建構自我評估,這是自我調節的關鍵環節[30]。教師評語的反饋涉及自我調節學習過程的三個階段的循環,在計劃階段,教師評語會引導學生制訂學習計劃,受訪者提到,“我會根據老師的建議來計劃我下一步的學習方向,以前都沒注意到自己這個平行線的判定這個知識點掌握得不太好,我準備在課后多刷一些類似的題”。在表現階段,學習者會用已有的知識經驗和動機信念對評語內容進行解讀,評語會幫助學習者對以上的認知參與過程進行自我監控,從而對學習進行針對性的調整。在自我反思階段,學生會根據評語的內容評估自己的學習狀況,并進行反思,決定如何改變自己的行為,“評語讓我反思到自己在學習上面的不足,也能及時讓我知道自己的進步和退步”。同時,這也體現了技術賦能教育的深層目標,即通過新興信息技術,提升學習者的自我調節學習能力,實現學習者自主性學習、個性化學習的現實需求。

針對問題4,生成式教師評語能有效促進學習者的學習動機。教師評語中的反饋內容會提供與學生自己的考試結果相關的信息,從而吸引學生的注意。根據動機設計的注意、關聯、信心和滿意度(ARCS)理論[31],注意和關聯是誘導和維持學習動機的兩個基本設計特征。除此之外,生成式教師評語中含有很多鼓勵性的、表揚性的話語,有學習者提到“以前從來沒有老師給我們發過這種,感覺很震撼,老師把你考得好的和考得不好的都寫出來了,還給了我很多鼓勵,感覺很驚喜吧”。教師積極的評價語言,使被評價者感受到了教師的肯定與認可,這種積極的情感反饋對學生學習體驗和認知建構至關重要[32]。以AIGC為標志的生成式人工智能正在快速滲透到教與學的研究與實踐中,人類教育所呼喚的個性化知識問答與人性化情感陪伴已成為現實。在數字技術賦能教育評價的過程中,教師需要在彰顯教育教學過程中技術固有優勢的前提下,更好地發揮主導作用,通過多輪對話交互,激發技術的情感、動機、態度、審美等育人屬性,提升師生交互的親密性和歸屬感,從而提升學習者的學習動機。

(二)教學啟示

本研究結果對于生成式教師評語在教學實踐中的應用有以下幾點啟示:

首先,本研究提供了一個生成式人工智能輔助教師教學的應用實例,教師應充分認識到教師評語的重要價值并利用文心一言等AIGC的工具屬性來輔助教育評價的內容產出,使教師由主觀經驗式教學轉向數智驅動式教學。教師在日常教學過程中,可以更加關注學習者的學習過程和認知狀態,在評語中體現對學生發展性的關注,從而啟發學生去思考自己的學習表現,更好地改進自己的學習。其次,由于文心一言等AIGC平臺是基于對提示詞及邏輯關系的匹配來生成答案,具有不理解語義和真實世界的技術局限,同時也存在輸出信息不實、隱私和安全等問題,因此,教師提示詞的編寫和提問方式非常重要,建議教師在對文心一言進行提問時,編寫清晰而具體的指令,同時給模型思考的時間,不斷調整提示來訓練模型,充分發揮教師的監督作用,以求達到更優的生成效果。最后,生成式教師評語的使用對象是學生,因此,教師需要合理地引導學生來使用生成式評語,帶領學生認真閱讀評語的內容,并且及時講解評語中的個性化練習題目,實現迅速且高效的學習反饋。學生可以利用評語中的知識點和核心素養能力診斷情況來改進和調整自己的學習。

(三)研究局限性和未來展望

在未來,本研究的三個主要局限性應予以解決。首先,在研究設計上,目前評語數據生成的第一階段仍然需要教師對試題信息、作答數據進行標注,這是一個相當煩瑣的過程,希望后期能有更好的自動化采集學習者測評數據的方法。而且目前生成式評語的文本生成還是需要教師對文心一言等AIGC平臺進行提問,后期建議實現評語生成的集成自動化,減少教師的工作量。其次,在生成式教師評語對成績的影響上,本研究是針對初中數學課堂的為期六周的干預研究。本研究發現個性化教師評語未能持續有效地提升學習者的學習成績。因此,在后續的設計中,應該考慮研究延長實驗周期,增加教師評語反饋次數,以觀察教師評語對學習成績的影響。后續的研究還可以深入探究對成績的影響效果在學段、班級規模、學科等調節變量上的差異。最后,對于學習者學習動機和自我調節能力的測量,本研究僅采用問卷的方式來獲得學習者的相關數據,問卷測量固有的局限性可能會損害統計結果的可信度。因此,建議未來的研究可以使用不同的研究工具收集學習者多模態學習數據,從而更加準確地測量學習者的學習動機和自我調節學習能力。

六、結? ?語

本研究為文心一言等AIGC在教育教學中的實踐應用提供了實證證據,將人工智能技術和教師評語有機整合,創設了一種新型的數據驅動的、具有社會交互性的教師評語生成模式,構建了一種基于證據取向的評價模式。該評語生成模式兼具數據性和社會性的兩大特點,實現了人工智能技術賦能精準化、個性化的教育評價。研究結果表明,利用人工智能技術得到的個性化教師評語能夠在初中數學課堂中有效地進行評估和反饋,并提高學習者的數學學習動機和自我調節學習能力。

人工智能技術的賦能為智慧教育實踐提供了強大支撐,當人工智能越來越多地參與到教育中,教師作為教育活動的主導者和技術賦能教育高質量發展的關鍵變量[33],應該在個性化學習、教師負擔、教師自身成長等方面抓住生成式人工智能帶來的機遇,在學習目的、教學過程和設計、評價方式等方面積極應對生成式人工智能帶來的挑戰[34],推動教學模式從“師—生”二元結構轉變為“師—機—生”三元結構,在優化教學服務供給與學習需求匹配度、促進“師—機—生”協同與合作等方面提供支持,不斷適應雙腦協同、智力共生的學習評價新思維。

[參考文獻]

[1] 吳砥,郭慶,吳龍凱,等.智能技術賦能教育評價改革[J].開放教育研究,2023,29(4):4-10.

[2] ZHAO W X, ZHOU K, LI J, et al. A survey of large language models[EB/OL]. arXiv preprint, (2023-11-24)[2024-04-29]. https://doi.org/10.48550/arXiv.2303.18223.

[3] 劉邦奇,聶小林,王士進,等.生成式人工智能與未來教育形態重塑:技術框架、能力特征及應用趨勢[J].電化教育研究,2024,45(1):13-20.

[4] 郁曉華,戰曉瑜.教師評語知多少?——探析文本后面的情感價值[J].電化教育研究,2022,43(7):97-105.

[5] 中共中央國務院.深化新時代教育評價改革總體方案[EB/OL].(2020-10-13)[2024-04-29]. https://www.gov.cn/zhengce/2020-10/13/content_5551032.htm.

[6] 劉明,吳忠明,廖劍,等.大語言模型的教育應用:原理、現狀與挑戰——從輕量級BERT到對話式ChatGPT[J].現代教育技術,2023,33(8):19-28.

[7] 彭紹東.AIGC時代基于雙向賦能的人工智能教育創新框架[J].教育文化論壇,2023,15(4):12-26.

[8] 楊宗凱,王俊,吳砥,等.ChatGPT/生成式人工智能對教育的影響探析及應對策略[J].華東師范大學學報(教育科學版),2023,41(7):26-35.

[9] 孫丹,朱城聰,許作棟,等.基于生成式人工智能的大學生編程學習行為分析研究[J].電化教育研究,2024,45(3):113-120.

[10] LYU Q, TAN J, ZAPADKA M E, et al. Translating radiology reports into plain language using ChatGPT and GPT-4 with prompt learning: results, limitations, and potential[J]. Visual computing for industry, biomedicine, and art, 2023,6(1):1-9.

[11] 徐康,蔣凌云,黃海平,等.基于ChatGPT的留學生編譯原理課程實踐方法[J].軟件導刊,2023,22(9):227-231.

[12] RAMAZAN Y, GIZEM F Y K. Augmented intelligence in programming learning: examining student views on the use of ChatGPT for programming learning[J]. Computers in human behavior: artificial humans,2023,1(2):100005.

[13] MATSUMURA L C, PATTHEY-CHAVEZ G G, VALD?魪S R, et al. Teacher feedback, writing assignment quality, and third-grade students' revision in lower-and higher-achieving urban schools[J]. The elementary school journal, 2002,103(1):3-25.

[14] 李寧.基于數據挖掘的自動評語生成方法的研究[D].天津:天津財經大學,2012.

[15] LEIGHTON J P, GIERL M J. Defining and evaluating models of cognition used in educational measurement to make inferences about examinees' thinking processes[J]. Educational measurement: issues and practice, 2007,26(2):3-16.

[16] 盧宇,余京蕾,陳鵬鶴,等.生成式人工智能的教育應用與展望——以ChatGPT系統為例[J].中國遠程教育,2023,43(4):24-31.

[17] MA L, ZHANG X, WANG Z, et al. Designing effective instructional feedback using a diagnostic and visualization system: evidence from a high school biology class[J]. Systems, 2023,11:364-377.

[18] LIU P, YUAN W, FU J, et al. Pre-train, prompt, and predict: a systematic survey of prompting methods in natural language processing[J]. ACM computing surveys, 2023,55(9):1-35.

[19] 王麗,李艷,陳新亞,等.ChatGPT支持的學生論證內容評價與反饋——基于兩種提問設計的實證比較[J].現代遠程教育研究,2023,35(4):83-91.

[20] WHITE J, FU Q, HAYS S, et al. A prompt pattern catalog to enhance prompt engineering with chatGPT[EB/OL]. arXiv preprint, (2023-2-21)[2024-04-29]. https://doi.org/10.48550/arXiv.2302.11382

[21] MCAULEY E, DUNCAN T, TAMMEN V. Psychometric properties of the intrinsic motivation inventory in a competitive sport setting: a confirmatory factor analysis[J]. Research quarterly for exercise and sport, 1987,60:48-58.

[22] BARNARD L, PATON V, LAN W. Online self-regulatory learning behaviors as a mediator in the relationship between online course perceptions with achievement[J]. International review of research in open and distance learning,2008,9(2):1-11.

[23] CHENG K H, LIANG J C, TSAI C C. Examining the role of feedback messages in undergraduate students' writing performance during an online peer assessment activity[J]. The internet and higher education, 2015,25:78-84.

[24] BRAUN V, CLARKE V. Using thematic analysis in psychology[J]. Qualitative research in psychology, 2006,3(2):77-101.

[25] 陳惠英.個性化評語的作用及撰寫方法——以北京市普通高中學生綜合素質評價中的教師評語為例[J].教育測量與評價(理論版),2011(10):32-35.

[26] 沈書生,祝智庭.ChatGPT類產品:內在機制及其對學習評價的影響[J].中國遠程教育,2023,43(4):8-15.

[27] HATTIE J, TIMPERLEY H. The power of feedback[J]. Review of educational research, 2007,77(1):81-112.

[28] HUANG M H. Designing website attributes to induce experiential encounters[J]. Computers in human behavior, 2003,19(4):425-442.

[29] SHIN G, FENG Y, JARRAHI M H, et al. Beyond novelty effect: a mixed-methods exploration into the motivation for long-term activity tracker use[J]. JAMIA open, 2019, 2(1):62-72.

[30] ZIMMERMAN B J, SCHUNK D H. Self-regulated Learning and performance: an introduction and an overview. Handbook of self-regulation of learning and performance [C]. New York: Routledge, 2011:1-12.

[31] LI K, KELLER J M. Use of the ARCS model in education: a literature review[J]. Computers & education, 2018,122:54-62.

[32] DUIJNHOUWER H. Feedback effects on students' writing motivation, process, and performance[M].? Utrecht: Utrecht University,2010.

[33] 田小紅,季益龍,周躍良.教師能力結構再造:教育數字化轉型的關鍵支撐[J].華東師范大學學報(教育科學版),2023,41(3):91-100.

[34] 宋萑,林敏.ChatGPT/生成式人工智能時代下教師的工作變革:機遇、挑戰與應對[J].華東師范大學學報(教育科學版),2023,41(7):78-90.

Generative AI-supported Teacher Comments: An Empirical Study Based on

Junior High School Mathematics Classrooms

LUO Heng,? LIAO Xiaofang,? RU Qiqi,? WANG Zhifeng

(Faculty of Artificial Intelligence in Education, Central China Normal University,

Wuhan Hubei 430070)

[Abstract] Teacher comments are an important source of data for formative assessment. However, the quality of existing teacher comments has certain deficiencies in terms of sociality, objectivity and personalization, and generative AI-supported teacher comments provide the possibility of solving these problems. Since intelligent diagnostic data obtained by teachers through cognitive diagnostic technology interacts with the generative AI platform, the generative AI platform can simulate teachers' social language and generate data-driven personalized teacher comments. An empirical study in a junior high school mathematics classrooms finds that generative teacher comments effectively improve students' self-regulated learning ability (Cohen's d=1.08, p=0.000) and learning motivation (Cohen's d=0.59, p=0.003).? Through in-depth interviews with students, the results suggest that generative comments can be used as a summative and reflective tool for exams, reflecting the teacher's personalized attention and encouragement to students. The results provide research ideas for AI technology to facilitate personalized and precise teaching and learning, and provide recommendations for continuous evaluation and improvement of the use of generative AI technology in educational settings.

[Keywords] Generative Artificial Intelligence; Teacher Comments; Intelligent Assessment; Personalized Teaching; Junior High School Mathematics

猜你喜歡
初中數學
問題導學法在初中數學教學的應用
如何以學定教,提高初中數學教學效率
探究新課改視野下初中數學教學的創新
如何有效開展初中數學教研工作
關注動態生成,提高課堂效率
考試周刊(2016年79期)2016-10-13 22:21:41
初中數學列方程解應用題教學探微
考試周刊(2016年77期)2016-10-09 11:09:02
試分析初中數學二元一次方程和一次函數的教學
考試周刊(2016年77期)2016-10-09 11:07:28
初中數學教學中如何培養學生的思維能力
考試周刊(2016年77期)2016-10-09 11:06:46
例談數學教學中的“頓悟”
考試周刊(2016年77期)2016-10-09 11:00:03
初中數學高效課堂的創建策略
考試周刊(2016年76期)2016-10-09 08:59:50
主站蜘蛛池模板: 国产女人18毛片水真多1| 欧美日韩国产在线播放| 成人av专区精品无码国产| 日韩无码真实干出血视频| 亚洲成A人V欧美综合| 亚洲,国产,日韩,综合一区 | 美女免费精品高清毛片在线视| 黄色不卡视频| 老色鬼欧美精品| 国产精品无码久久久久久| 在线观看亚洲天堂| 国产男人的天堂| 日韩毛片免费| 天堂在线视频精品| 国产在线精品99一区不卡| 99激情网| 国产av无码日韩av无码网站| 国产99视频精品免费观看9e| 国产精品一区二区无码免费看片| 麻豆精品在线| 极品国产在线| 久久无码高潮喷水| 色久综合在线| 欧美午夜小视频| 99热这里只有精品免费国产| 久久综合九色综合97网| 国产在线一二三区| 99视频在线免费观看| 人人妻人人澡人人爽欧美一区| 国产91丝袜在线播放动漫| 欧美综合一区二区三区| 国产欧美日韩综合在线第一| 国产乱子伦无码精品小说| 日本不卡视频在线| 色婷婷电影网| 亚洲乱伦视频| 国产高清在线观看91精品| 天天躁日日躁狠狠躁中文字幕| jizz在线免费播放| 四虎成人免费毛片| 日韩资源站| 亚洲丝袜中文字幕| 午夜电影在线观看国产1区| 亚洲福利片无码最新在线播放 | 国产人成午夜免费看| 免费无码AV片在线观看中文| 国产精品专区第1页| 久久网综合| 亚洲一区无码在线| 午夜久久影院| 色噜噜久久| 国产精品久久久久鬼色| 91丝袜乱伦| 亚洲国产AV无码综合原创| 国产91小视频在线观看| 国产情侣一区二区三区| 亚洲区一区| 日本三级精品| 中文字幕无码av专区久久| 精品国产中文一级毛片在线看| 日韩精品久久无码中文字幕色欲| 亚洲天堂网在线视频| 在线免费不卡视频| 国产丝袜丝视频在线观看| 日韩高清欧美| 日韩国产亚洲一区二区在线观看| 国产精品乱偷免费视频| AV无码国产在线看岛国岛| 国产免费看久久久| 伊人久久精品无码麻豆精品 | 欧美国产在线看| 精品国产一二三区| 国产美女在线观看| 婷婷五月在线视频| 国产第四页| 美女扒开下面流白浆在线试听| 亚洲国产综合精品一区| 亚洲欧美激情小说另类| 中文字幕亚洲电影| 国产免费网址| 高清亚洲欧美在线看| 3D动漫精品啪啪一区二区下载|